Welch t 检验自由度的准确值

机器算法验证 t检验 自由程度
2022-03-31 19:01:12

维基百科定义了一个方程来近似韦尔奇 t 检验中的自由度,并且没有说明任何关于确切值的内容。为什么我们不能评估精确的df并且必须使用近似值是有原因的吗?此外,它还说:

近似的自由度被四舍五入到最接近的整数 [需要引用]

我们将不胜感激解释为什么我们应该四舍五入。

2个回答

简短回答:没有精确的自由度,因为此测试中的方差估计量不遵循精确的卡方分布。


更长的答案:Welch T 检验给出了Fisher-Behrens 问题的近似解(比较具有不同方差的两个样本的均值)。它使用学生化测试统计:

T=X¯1X¯2S12/N1+S22/N2.

此检验统计量中的分母是均值差估计量的平方根:

V^(X¯1X¯2)=S12N1+S22N2χN112N1σ12+χN212N2σ22.

该数量是独立卡方随机变量的加权和。它的精确分布相当复杂(最好通过它的矩生成函数来表示),但它不是精确的卡方分布。

该测试使用Welch-Satterwaite 近似,它通过单个缩放的卡方分布来近似该数量的分布。在这种近似中,自由度公式作为卡方分布对该量的真实分布的最佳近似而出现。如果没有这种对卡方分布的近似,就没有单一的精确自由度。相反,精确分布是具有上述权重和自由度的卡方随机变量的加权和。

@Ben 的回答非常清楚为什么不可能找到自由度的精确解决方案。

至于

近似的自由度被四舍五入到最接近的整数 [需要引用]

这似乎不寻常。文章的谈话页面上有一个部分质疑这是否正常,以及为什么要向下舍入而不是向上舍入。

这个 CV 问题更详细地讨论了报告非整数自由度,并给出了一些消息来源说它是“常规的”(主要是从手工完成计算的日子和t分布在仅给出整数 df 值的参考表中查找)。