我在课堂上听过好几次,当样本量较小或我们不知道方差时,t 分布允许我们更准确地建模数据。我想知道这是什么意思,为什么 t 分布在某种程度上被认为是“重新调整”。
关于什么是t分布重新调整?我知道 t 分布最初是为处理小样本量而开发的(我相信 Gossett 的论文中的 6 个),并且有一个修正尾部的概念。有人可以照亮修正吗?谢谢。
我在课堂上听过好几次,当样本量较小或我们不知道方差时,t 分布允许我们更准确地建模数据。我想知道这是什么意思,为什么 t 分布在某种程度上被认为是“重新调整”。
关于什么是t分布重新调整?我知道 t 分布最初是为处理小样本量而开发的(我相信 Gossett 的论文中的 6 个),并且有一个修正尾部的概念。有人可以照亮修正吗?谢谢。
如果数据呈正态分布,则以样本标准差为分母的检验统计量将具有 n-1 个自由度的分布。对于较大的 n,t 分布近似正态分布。但在小样本中,它会是对称的,尾巴比正常的要重。尾巴比标准法线重的事实可以被视为调整尾巴的法线。
按照惯例,通过除以而不是来计算样本方差作为总体方差的无偏估计量。
但是样本标准差不是总体标准差的无偏估计量,样本标准差的倒数作为总体标准差倒数的估计量更有偏。特别是,对方差的低估会使标准差倒数的估计值太大,而这并不能完全被高估的方差所抵消。
将感兴趣的值除以总体标准差将导致正态分布的统计量。
但是统计量将感兴趣的值除以样本标准差的估计值(即乘以它的倒数)。该结果的可能性远大于使用总体标准差的可能性,这有助于推动分布的较重尾部,并且这种类型的大失真更可能出现在小样本中。从某种意义上说,分布可以看作是对正态分布的调整,以考虑到这一点。