样本标准差为零的 T 检验。可能的?
由于这个问题得到了相当多的点击,当我在寻找类似信息时,我在谷歌上偶然发现了它,我将扩展上面的评论。
T 检验的目的
我们在测试时所做的是测量我们测量的平均值与基线平均值的标准偏差数量,同时考虑到平均值的标准偏差会随着我们获得更多数据而改变。
例如,如果我知道一个集合的标准偏差,并且我从该集合中绘制一个点,我们期望一个钟形曲线来定义我绘制的点的概率分布。
钟形曲线由 t 检验方程中的“s”定义。但是,当您从该集合中抽取更多样本时,就会发生有趣的事情。所有样本的平均值的标准差实际上小于集合的标准差。减少与 n 的平方根成正比,n 的平方根除以 t 检验方程中的 n 的平方根。
我喜欢想到的一个有用的例子是当你掷骰子时会发生什么。当你掷一个骰子时,你同样可能得到 1 到 6 之间的任何值,平均值为 3.5。该结果的标准差为 1.7078。现在,如果你掷两个骰子并取它们的平均值,它仍然是 3.5。但并非同样可能获得所有可能的平均值。实际上,您更可能获得接近 3.5 的平均值而不是接近 1 或 6 的平均值。(这是赌场在“掷骰子”游戏中利用的事实,因为 7 最有可能是两个骰子的总和)
1、2 和 3 骰子的平均值的概率分布如下所示。
1 个骰子的平均值的标准偏差是 1.7078,两个骰子的平均值是 1.207,3 个骰子的平均值是 0.986。这具有使 t 检验中的钟形曲线变窄的效果,从而导致更高的“t”值。如下所示
随着钟形曲线越来越窄,t 值向无穷大增加。
您在问题中看到的是标准偏差为零。这反映了无限窄的钟形曲线。结果 t 值将是无穷大,即您可以完全确信您有统计上的显着差异。如果您有一个无限大的样本量,这与您将看到的效果相似,因为这也会使钟形曲线无限窄。
现在正如 whuber 和 Nick Cox 在对原始问题的评论中指出的那样,您必须考虑您是否真的有零标准偏差。数据的舍入或其他形式的截断可能会给出零标准偏差,而实际上你有一些。如果您尝试测量的差异在您的测量误差范围内,则这是 t 检验未解决的问题。
我已经在这篇博客文章中扩展了正常曲线宽度与掷骰子的类比,我还有一本关于使用t 检验和 z 检验的不同示例的简短 Kindle 书。