假设检验中 的公式为
当增加时,值根据上式增加。但是为什么 t 表中的临界会随着(它是的函数)的增加而减少?
假设检验中 的公式为
当增加时,值根据上式增加。但是为什么 t 表中的临界会随着(它是的函数)的增加而减少?
这是两种不同的现象:
统计量
保持所有其他不变,如果增加,则值必须作为简单的算术问题增加。考虑分母中的分数,如果变大,则也会变大(尽管速度更慢),因为平方根是单调变换。的平方根是那个分数的分母,随着它变大,分数会变小。然而,这个分数又是一个分母。结果,随着分母变小,第二个分数变大。因此,值将随着变大而变大。(再次假设,和保持不变。)
这在概念上意味着什么?好吧,我们拥有的数据越多/样本量越接近总体规模,由于抽样误差(参见大数定律),样本均值与总体均值的偏差就越小。对于一个小的、有限的人口,这很容易看出,但虽然它可能不那么直观,但如果人口是无限的,情况也是如此。由于样本均值 () 不应与参考 (null) 值波动太远,我们可以更有信心观察到的样本均值与空值的距离是因为空值实际上并不是抽取样本的总体的平均值. 更准确地说,如果空值确实是从中抽取样本的总体的平均值,那么找到样本均值与空值相距甚远或更远的可能性越来越小。
分布
当您查看表时(例如,在统计书籍的背面),您实际上看到的是一个临界值表。也就是说,观察到的统计量必须大于该值才能使测试在该 alpha 处“显着”。(通常,这些是针对少数可能的 alpha 列出的:。)我怀疑如果您仔细查看这些表格,它们实际上是考虑统计量相关的自由度。请注意,的函数,对于两组 -test,或对于一组 -test(您的示例似乎是后者)。这与分布将随着自由度接近无穷大而收敛到标准正态分布这一事实有关。
从概念上理解这一点的方法是首先考虑为什么需要使用分布。您知道您感兴趣的参考平均值是什么以及您观察到的样本均值。如果从中抽取样本的总体是正态分布的(人们经常隐含地假设),那么我们知道平均值的抽样分布也将是正态分布的。那么为什么要打扰分布呢?答案是不确定总体的标准差是多少。(如果我们确定,我们真的会使用正态分布,即检验而不是检验。)所以我们使用我们的样本标准差,,作为未知人口值的代理。然而,我们拥有的数据越多,我们就越能确定实际上是近似正确的值。随着接近人口规模(和/或无穷大),我们可以确定实际上是正确的值。因此,分布成为正态分布。
好吧,简短的回答是,这就是数学的结果。长答案是做数学。相反,我将尝试改写 gung 的解释,即这是两个不同(尽管相关)的东西。
您已经收集了一个样本正态分布,并且想知道它的平均值是否与某个指定值不同。的假设有多大的“不同” 。因此,您提出 -statistic的公式。思考为什么随着而增加的最直观的思考方式可能是,当您有更多样本时,您对事情有所不同更有“信心”。
继续前进,该值遵循具有个自由度分布考虑这一点的方法是,分布会根据您的样本量而略有不同。您可以在下面看到具有 2、3、5 和 20 df 的分布图。 你会注意到较高的 df 在分布的中心有更多的质量,而在分布的尾部有更少的质量(我没有直观的理由来解释为什么分布会这样,抱歉)。关键-value 是曲线下面积等于您选择的任意值(传统上为 0.05)的 x 位置。这些值在图表上标记为点。所以对于绿色曲线(df=5),左边绿点左边的曲线下面积=0.025,右边绿点右边的曲线下面积=0.025,一共是0.05。
这就是为什么临界值随着自由度的增加而减小的原因——随着 df 的增加,临界值必须接近于零才能保持曲线下的相同面积。正如 gung 所提到的,当 df 变为时,曲线和临界值将接近标准正态分布的曲线和临界值。
所以现在你有了临界值和统计量,并且可以执行检验。如果您的统计量大于临界值,那么您可以声明如果确实为真,那么您将观察到您的样本小于 5%(或您选择的任意百分比计算时间的临界值。
为什么我们要从我们可以计算的许多任意值中计算出这个特定值?好吧,这就是似然比检验计算的结果。
如果您事先知道样本的方差,则 gung 提到的统计量(遵循正态分布)将不属于该计算,您将执行检验再次,这就是不属于math谷歌的第一个好结果:http: //math.arizona.edu/~jwatkins/ttest.pdf事实证明,即使不满足该假设,t 检验也有效,但这是题外话