为什么使用 az test 而不是 at test 与比例数据?

机器算法验证 物流 t检验 部分 z检验
2022-03-24 22:16:02

在测试两个比例之间的差异时,为什么我们使用 z 检验而不是 t 检验?

此外,是否有一种简单的方法可以对超过 2 个比例(以百分比的形式)之间的显着差异进行综合测试。是否有等效于单向方差分析的方法?我想你可以使用逻辑回归(假设你有 0 和 1 形式的比例的原始数据)还有其他选择吗?

2个回答

简短版本:您不使用 t 检验,因为明显的统计数据没有 t 分布。它确实(大约)具有 z 分布。

更长的版本:

在通常的 t 检验中,t 统计量都是以下形式:,其中的估计标准误差。t 分布来自以下方面:dssd

1)是正态分布的(平均值为 0,因为我们讨论的是下的分布)dH0

2),对于某些(我不想详细说明将是什么,因为我在这里涵盖了许多不同形式的 t 检验)k.s2χ2kk

3)是独立的ds

这是一组非常严格的情况。只有当你有正常数据时,你才能得到所有三个。


相反,如果将估计值替换为的标准误差的实际值( ),则该统计形式将具有分布。sdσdz


当样本量足够大时,由于中心极限定理,像之类的统计量(通常是移动均值或均值差)通常呈渐近正态分布*。d

* 更准确地说,标准版本的 ,将是渐近标准正态dd/σd

许多人认为这立即证明了使用 t 检验是合理的,但正如您从上面的列表中看到的那样,我们只满足派生 t 检验的三个条件中的第一个。

另一方面,还有另一个定理,叫做斯卢茨基定理,可以帮助我们。只要分母在概率上收敛到那个未知的标准误差(一个相当弱的条件),那么就应该收敛到标准正态分布。σdd/s

通常的一个和两个样本比例检验是这种形式,因此我们有一些理由将它们视为渐近正态,但我们没有理由将它们视为分布。t

在实践中,只要不太小**,一样本和二样本比例检验的渐近正态性就会很快出现(也就是说,对于这两个定理来说,通常非常小就足够了按原样“开始”并且渐近行为是小样本行为的良好近似)。npn(1p)n

** 尽管还有其他方法可以表征“足够大”,但这种形式的条件似乎是最常见的。

虽然我们似乎没有一个好的论据(至少我没有看到)可以确定 t 应该比 z 更好,作为任何特定样本的检验统计量的离散分布的近似值大小,然而在实践中,通过对 0-1 数据使用 t 检验获得的近似值似乎相当好,只要 z 应该是合理近似值的通常条件成立。

是否有一种简单的方法可以对两个以上比例之间的显着差异进行综合测试(以百分比的形式)

当然。你可以把它变成卡方检验的形式。

(实际上,类似于 ANOVA,您甚至可以构建对比和多重比较等。)

但是,从您的问题中尚不清楚,您的泛化是否将有两个具有多个类别的样本,或者具有两个类别的多个样本(或者甚至同时具有两个,我猜)。无论哪种情况,您都可以获得卡方。如果您更具体,我应该能够提供更具体的细节。

您可以使用z检验的原因是因为比例的标准差是比例本身的函数。因此,一旦您估计了样本中的比例,您就不必考虑额外的不确定性来源。因此,您可以使用正态分布而不是t分布作为您的抽样分布。要了解有关此的更多信息,请在此处查看我的答案z-测试与χ2- 比较两组感冒几率的测试

如您所述,如果您有 2 个以上的组,则可以使用逻辑回归。你必须知道nj但是,每个组中的 s。如果您只有一组观察到的比例,但不知道观察了多少次试验来生成这些比例,则您无法对这些比例是否不同进行适当的测试。