维基百科定义了一个方程来近似韦尔奇 t 检验中的自由度,并且没有说明任何关于确切值的内容。为什么我们不能评估精确的df并且必须使用近似值是有原因的吗?此外,它还说:
近似的自由度被四舍五入到最接近的整数 [需要引用]
我们将不胜感激解释为什么我们应该四舍五入。
维基百科定义了一个方程来近似韦尔奇 t 检验中的自由度,并且没有说明任何关于确切值的内容。为什么我们不能评估精确的df并且必须使用近似值是有原因的吗?此外,它还说:
近似的自由度被四舍五入到最接近的整数 [需要引用]
我们将不胜感激解释为什么我们应该四舍五入。
简短回答:没有精确的自由度,因为此测试中的方差估计量不遵循精确的卡方分布。
更长的答案:Welch T 检验给出了Fisher-Behrens 问题的近似解(比较具有不同方差的两个样本的均值)。它使用学生化测试统计:
此检验统计量中的分母是均值差估计量的平方根:
该数量是独立卡方随机变量的加权和。它的精确分布相当复杂(最好通过它的矩生成函数来表示),但它不是精确的卡方分布。
该测试使用Welch-Satterwaite 近似,它通过单个缩放的卡方分布来近似该数量的分布。在这种近似中,自由度公式作为卡方分布对该量的真实分布的最佳近似而出现。如果没有这种对卡方分布的近似,就没有单一的精确自由度。相反,精确分布是具有上述权重和自由度的卡方随机变量的加权和。