有人可以解释为什么 t 检验“发生”吗?当您不知道总体标准偏差(即您只知道样本的标准偏差)时,我被教导使用 t 检验,但我不确定为什么这会使其与 z 检验不同.
既然我们有 z 检验,为什么需要 t 检验?
我不认为我完全理解你的问题。您是在问为什么要使用 t 检验?
如果您了解为什么要使用 z 检验,那么您应该很清楚为什么要使用 t 检验。对于大样本,z 检验和 t 检验应呈现相似或相同的结果。但是,虽然 z 检验将假设正态分布,但 t 检验将考虑较小样本量下样本分布的不确定性。
z 检验本身实际上是假设原假设的似然与假设备择假设的似然之间的似然比检验。假设具有已知方差的基本正态分布并且只测试均值,代数简化为我们知道和喜爱的 z 检验 (DeGroot 1986, pp. 442–447)。
使用相同的最大似然程序,但将方差视为未知数,会创建一对不同的似然性及其比率,并让代数简化得出统计量: (DeGroot 1986, pp. 485–489)。所讨论的测试分布也会发生变化,因为上述统计量的分子是正态分布,而分母分布为平方正态的平方根,它是 a 的平方根卡方随机变量。Gosset(学生)表明,如果你有一个随机变量:
因此,不严谨地说,当数据的方差本身未知并且通过最大似然估计时,t 检验是 z 检验背后的相同似然比过程的自然结果。
不严格的答案是,当您有少量样本时,您想使用 t 检验,因为样本可能非常接近(相对于实际总体方差)。在这种情况下,t 统计量公式中的分母将异常小,因此 t 统计量本身将异常大。因此,当您拥有少量样本时,您更有可能获得较大的 t-stat 值,而不是获得相当大的 z-stat,因此您需要更大的值来拒绝使用t 检验比 z 检验在相同的显着性水平上。
根据经验,最重要的区别是样本量:如果小于应使用 t 检验,否则使用 z 检验。
这里给出了两个测试的基本假设和差异(和相似性)的一个很好的概述:http:
//www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html