反对统计力量

机器算法验证 假设检验 相互作用 统计能力
2022-03-23 08:05:15

我在和同事吵架。我们有一些合并的时间序列数据(即涉及许多个体的纵向数据),并且我们正在尝试量化效果(例如,我们需要测量总体效果的均值和方差)。我怀疑数据确实由多个子组组成(或者更像是与另一个连续变量的交互效应),并且它们的均值和方差可能不同。这种预感是基于对数据的直观理解。例如,想象一下成年人对药物的反应与孩子不同。在这种情况下,年龄类似于我所指的持续交互术语。

我做了一个粗略的 Welch t 检验,将数据集沿着这个可疑的交互项的中间分成两半,发现这两个平均值(只是)在统计上显着不同。然而,我的同事坚持认为,统计能力胜过特异性,我们应该汇集和使用尽可能多的数据。我如何反对这一点?

2个回答

IIUC,您的交互项是一个隐藏的混杂因素在这种情况下,您确实应该根据该混杂因素计算您的效果。然后将使用后门调整的标准公式计算平均因果效应。

如果您有两个总体,则对一个均值进行建模是没有意义的。

我认为您应该将差异建模为固定效应(即作为协变量)。这意味着您估计了两种方法,但从拥有一个模型中获得了力量——两全其美?