@jbowman 给了你一个不错的选择。我想我可能会提供一些关于您关于测试与测试的适当性的明确问题的信息。 zχ2
z -测试:
检验的适当性有两个问题,都与假设的抽样分布是否正确有关。首先,检验使用正态分布而不是分布,这意味着标准差是已知的,没有抽样误差。第二,抽样分布是连续的,但数据是离散的;因为只有某些数据组合是可能的,所以只有某些结果实现的测试统计值是可能的,这可能与理论抽样分布不匹配。(我在这里在其他测试的背景下讨论这个问题:比较和对比、p 值、显着性水平和 I 型错误。) zzt
让我们在不同的背景下考虑第一个问题。如果您有两组具有正态分布的数据,并且您想查看均值是否相等,则需要计算均值和标准差。现在我们知道平均值会受到抽样误差的影响,这就是为什么我们需要进行测试而不是仅仅说这两个样本平均值不相同。然而,我们对标准偏差的估计也必须受到抽样误差的影响,我们必须以某种方式考虑这一事实。当我们这样做时,结果证明测试统计量(一种比例平均差)分布为。如果我们改用正态分布(即tz-test),这意味着我们假设我们对标准差的估计没有错误——完美。那么为什么在你的情况下可以使用原因是您的数据是二项式的(即已知“试验”总数中的“成功”数),而不是正常数据。在二项分布中,标准差是均值的函数,因此一旦您估计了均值,就无需担心额外的不确定性。因此,正态分布可以用作检验统计量的抽样分布模型。 z
尽管使用正态分布来理解检验统计量的长期行为在技术上是正确的,但出现了另一个问题。问题是正态分布是连续的,但由于您的数据是离散的,因此并非理论分布中的所有值都可以在您的数据集中找到。(再次,我在上面链接的答案中更详细地讨论了这个问题。)幸运的是,您的数据的可能结果与理论正态抽样分布之间的匹配会随着您的越大而变得更好。在您的情况下,无论真正的潜在概率是多少,您在每个组中都可能获得尽可能多的成功或少至没有成功。这意味着可能的组合数是N91×91=1,729,这是很多可能性。使用一个小数据集,您确实可以遇到我在链接答案中讨论的一些问题,但是使用,您不必担心太多。我相信检验对研究人员来说是一个有效的选择。 N=180z
χ2 -测试:
但是测试呢?我认为这也是一个有效的选择,但它不会是我的第一选择。(顺便提一下,上面讨论的第二个问题——离散数据和连续参考分布之间的不匹配——同样适用于 -test 和 -test,所以有这里没有优势。)χ2χ2zχ2-test 是它不假设列总计相对于行总计有什么特别之处;两者都被视为可能是其他可能的值。然而,这并不能准确地反映实验设置。180人,每组90人。在重复的相同研究中,唯一真正不同的是每组中感冒的人数。 -test 错误地将感冒次数和每组中的人数视为可能会发生变化,但 -test 做出了正确的假设。这就是为什么检验在这里有更大的力量。 χ2zz
对于它的价值,@jbowman 建议的置换测试也可以让您的设计的这方面正确,并且不会受到离散连续不匹配问题的影响。因此,它是最好的选择。但我想你可能想了解更多关于 - 和 -tests 在你的情况下的比较。 zχ2