之间进行选择zz-test和吨t

机器算法验证 假设检验 正态分布 t检验 假设 z检验
2022-01-29 22:20:59

背景:我正在向同事进行假设检验的工作演示,并且理解其中大部分内容很好,但有一个方面让我自己陷入困境,试图理解并向其他人解释它。

这是我认为我知道的(如果有错误请更正!)

  • 如果方差已知,统计量将是正态的,如果方差未知,则遵循分布t
  • ,样本均值的采样分布近似正态(可能是 ,对于高度偏斜的分布可能高达n30300
  • 自由度t>30

在以下情况下使用测试:z

  1. 已知总体正态和方差(对于任何样本量)
  2. 总体正常,方差未知且(由于 CLT)n>30
  3. 人口二项式, ,np>10nq>10

在以下情况下使用检验:t

  1. 总体正常,方差未知且n<30
  2. 不了解总体或方差且,但样本数据看起来正常/通过测试等,因此可以假设总体正常n<30

所以我只剩下:

  • (?)的样本,不了解已知/未知的总体和方差。>30<≈300

所以我的问题是:

  1. 当采样分布看起来不正常时,您可以假设(不了解总体分布或方差的情况下)平均值的采样分布是正常的(即 CLT 已经开始)的样本量是多少?我知道有些发行版需要,但是有些资源似乎说 -test ...n>300zn>30

  2. 对于我不确定的情况,我假设我查看数据是否正常。现在,如果样本数据看起来正常,我是否使用 -test(因为假设总体正常,并且因为)?zn>30

  3. 我不确定的案例的样本数据在哪里看起来不正常呢?在任何情况下您仍然会使用 -test 或 -test,或者您是否总是希望转换/使用非参数测试?我知道,由于 CLT,在的某个值下,平均值的抽样分布将接近正常,但样本数据不会告诉我的值是多少;样本数据可能是非正态的,而样本均值遵循正态 /是否存在您要转换/使用非参数检验的情况,而实际上均值的抽样分布是正态的/但您无法分辨? tznntt

2个回答

@AdamO 是对的,您只需始终使用t- 如果您不知道先验总体标准差,请进行测试。您不必担心何时切换到z-测试,因为t-为您分配“开关”。更具体地说,t-分布收敛于正态分布,因此它是在任何时候使用的正确分布N.

这里还有一个关于传统线的含义的混淆N=30. 人们谈论的有两种趋同:

  1. 首先是检验统计量的抽样分布(即,t) 从正态分布(组内)原始数据计算收敛到正态分布为N尽管 SD 是根据数据估计的。(这t-distribution 会为您解决这个问题,如上所述。)
  2. 第二个是非正态分布(组内)原始数据的均值的采样分布收敛到正态分布(比上面更慢)为N. 人们依靠中心极限定理来为他们解决这个问题。但是,不能保证它会在任何合理的样本量内收敛——当然没有理由相信30(或者300) 是幻数。根据非正态性的大小和性质,它可能需要很长时间(参见@Macro 在此处的回答:当 OLS 残差不是正态分布时的回归)。如果您认为您的(组内)原始数据不是很正常,最好使用不同类型的测试,例如Mann-WhitneyU-测试请注意,对于非正态数据,Mann-WhitneyU-test 可能比t-test,即使 CLT 已经启动,也可能如此。(值得指出的是,正态性测试可能会导致您误入歧途,请参阅:正态性测试“基本上没用”吗?

无论如何,为了更明确地回答您的问题,如果您认为您的(组内)原始数据不是正态分布的,请使用 Mann-WhitneyU-测试; 如果您认为您的数据是正态分布的,但您不知道 SD 先验,请使用t-测试; 如果您认为您的数据是正态分布的并且您知道 SD 先验,请使用z-测试。

它可能会帮助您在这里阅读@GregSnow 最近的答案:在比较 R 中两个小组之间关于这些问题的比例时对 p 值的解释。

这件事没有什么可讨论的。用一个t-test 始终用于均值差异的非参数测试,除非需要更复杂的重采样工具(例如置换或引导程序)(在偏离正态性较大的非常小的样本中很有用)。

如果自由度真的很重要,那么t-test 将为零假设下的检验统计量分布提供临界值和标准误差的一致估计。否则,该t- 测试与测试大致相同z-测试。

参数模型参数测试的正态逼近,如总体比例测试,已经失效。当数据足够小以至于从生成的临界值之间确实存在区别时t或者z分布,你真的应该使用基于检验统计量的缩放二项分布的精确比例检验。重采样测试也以这种方式工作。在估计伯努利参数时,对样本大小和病例/对照的普遍性做出任意的经验法则假设是令人困惑且极易出错的。

一个概念z-test(“已知”方差)令人困惑,因为您从不“知道”方差,也没有花费太多来估计它。当成本很重要时,只有t-test 反映了它对自由度的影响。