我有两个样本 A 和 B。为了检查它们是否相同,我想应用 t 检验并查看均值的差异。t 检验的假设之一是 A 和 B 的分布是正态的。
一位同事说:
中心极限定理说样本分布的均值近似正态。考虑到这一点,您可以应用 t 检验。
为什么这个论证有效?我认为 A 和 B 的基本分布(绘制时)应该是正常的。而不是实际应用 t 检验的值(在这种情况下是指)。那么 t 检验假设什么?数据应该是正态分布还是手段?
我有两个样本 A 和 B。为了检查它们是否相同,我想应用 t 检验并查看均值的差异。t 检验的假设之一是 A 和 B 的分布是正态的。
一位同事说:
中心极限定理说样本分布的均值近似正态。考虑到这一点,您可以应用 t 检验。
为什么这个论证有效?我认为 A 和 B 的基本分布(绘制时)应该是正常的。而不是实际应用 t 检验的值(在这种情况下是指)。那么 t 检验假设什么?数据应该是正态分布还是手段?
好的,有几件事:
1) 双样本 t 检验不假设 A 组和 B 组的分布在原假设下是相同的,即使基础分布都是正态的。仅当您假设标准偏差相同时才会发生这种情况,这是一个很大的假设。双样本 t 检验检验在 null 下,两组的均值是否相同。但是,是的,经典的两样本 t 检验假设基础数据是正态分布的。之所以如此,是因为您不仅需要分子是正态分布的,而且方差也是 a的(缩放版本) 。话虽如此,t 检验对于正态性假设相当稳健。见这里。
2)确实在足够大的样本下,每组均值的潜在分布将接近正态。该近似值的好坏取决于每组的基本分布。
总体思路是这样的。如果和是独立的,的平均值和标准偏差和的平均值和标准偏差,并且各自的样本和很大,那么你可以得出结论
平均值为 0,标准差为 1 近似正常。因此可以使用临界值进行测试。此外,当很大时(如果样本量很大,则会发生这种情况)将接近因此,对于足够大的样本量,可以使用 t 检验。
有办法检查这一点。(标准的经验法则是每个组的样本量为 30 或更大,但我通常反对这些规则,因为在很多情况下该规则都失败了)。您可以检查它的一种方法(有点)是创建平均值的引导分布并查看。
3)虽然你可以做得比近似测试更好。当您测试方法是否不同时,您真正的问题是查看位置是否不同。Mann Whitney U 测试将(几乎)一直正确的测试。这并不测试均值是否不同,而是测试中位数是否不同。换句话说,它再次测试一个位置是否与另一个位置不同。它可能是一个更好的选择,并且总体上具有相当高的功率。
简短的回答:你的同事是对的。
最后,t 统计量只取决于两个样本的均值和方差。CLT 表示(在大多数情况下)即使潜在的人口分布不正常,这些也会迅速恢复正常。
因此,t 检验对于(大多数)偏离正态性的情况非常稳健。这已被许多模拟研究证实。请注意,顺便说一下,它对于偏离方差同质性一点也不鲁棒。