带有协变量的学生 t 检验?

机器算法验证 假设检验 t检验 安乔娃 潜变量 预测器
2022-03-22 16:29:14

我正在使用学生 t 检验测试我怀疑可能存在一个潜在变量 对都有影响。我怎么能控制XYZXYZ

我正在使用 Python 进行数据分析。

2个回答

控制其他一些协变量的一种常见方法是通过回归。将 X 和 Y 值放入响应 (DV) 和 Y 组指示符(如果在 X 中,则为 0,如果在 Y 中,则为 1)作为 DV,以及您的协变量(如果变量可以,则为它的一些合适的代理) t 直接测量)作为另一个 DV。

你回归你的协变量和组指标。如果基于协变量的 X 和 Y 之间存在差异,这将通过回归进行“调整”,然后组指标系数的显着性将是计算后两组之间均值偏移的检验为协变量。

在此处输入图像描述

这有时被称为 ANCOVA(除非 Z 是一个因素,在这种情况下它通常被称为 ANOVA;您仍然可以使用回归来做到这一点)。

有些人会正式测试两个组线的并行性(通过包括协变量和组指标之间的交互)。我认为那是错误的(我们是否相信不交互的假设是完全正确的?我不相信——在这种情况下,假设检验是对我们已经知道答案的问题的嘈杂答案——他们肯定会) re 永远不会完全平行)......但不要特别在意。这里更好的问题是“它们是否足够接近平行以至于它不会严重影响我们希望做出的推论的属性?”。回答这个问题更接近于测量效应大小,因此残差显示 - 例如残差与协变量用符号或颜色区分组 - 可能更接近于解决这个问题。


但是,根据您在问题中“潜在”的含义,您实际上可能会追求更像工具变量的东西。(网站上有很多关于该主题的问题。)

通过 t 检验,您正在评估两组数据之间是否存在显着差异——例如两个随机变量的实现。使用 t 检验时,您正在进行假设检验,您无法控制任何变量。更具体地说,在进行假设检验时,您并没有在随机变量之间建立任何因果关系。XY

如果您想研究潜在变量的影响,您应该依赖回归分析。为了更深入地分析某些变量的作用和影响(这可能会导致您的分析出现偏差),您可以应用一些图形模型方法。ZXY

在这里你可以找到一个不错的关于回归的 IPython Notebook。