卡方检验和等比例检验之间有什么关系?

机器算法验证 卡方检验 部分 列联表 z检验
2022-02-01 05:00:51

假设我有三个具有四个互斥特征的总体。我从每个群体中随机抽取样本,并为我正在测量的特征构建一个交叉表或频率表。我这样说是否正确:

  1. 如果我想测试总体和特征之间是否存在任何关系(例如,一个总体是否具有更高的某一特征频率),我应该进行卡方检验,看看结果是否显着。

  2. 如果卡方检验显着,它只表明总体和特征之间存在某种关系,而不是它们之间的关系。

  3. 此外,并非所有特征都需要与人口相关。例如,如果不同群体的特征 A 和 B 的分布显着不同,但 C 和 D 的分布没有显着差异,那么卡方检验可能仍然具有显着性。

  4. 如果我想测量一个特定的特征是否受到总体的影响,那么我可以对那个特征进行等比例的检验(我已经看到这称为 z 检验,或者prop.test()在 中R)。

换句话说,prop.test()当卡方检验表明存在显着关系时,使用 来更准确地确定两组类别之间关系的性质是否合适?

2个回答

两个比例相等的卡方检验与z-测试。具有一个自由度的卡方分布就是正态偏差的平方分布。您基本上只是在列联表的子集上重复卡方检验。(这就是为什么@chl 得到完全相同的原因p- 两个测试的值。)

首先在全局范围内进行卡方检验,然后深入到子集上进行更多测试的问题在于,您不一定会保留您的 alpha - 也就是说,您不会将误报控制在 5% 以下(或任何α) 在整个实验中。

我认为如果你想在经典范式中正确地做到这一点,你需要在一开始就确定你的假设(要比较的比例),收集数据,然后测试假设,以便每个测试总和的显着性总阈值到α. 除非您可以先验地证明存在某种相关性。

对比例相等的最有力的检验被称为巴纳德的优越性检验

非常简短的回答:

卡方检验(chisq.test()在 R 中)将列联表的每个类别中观察到的频率与预期频率(计算为边际频率的乘积)进行比较。它用于确定观察到的计数和预期计数之间的偏差是否太大而不能归因于偶然性。通过检查残差可以很容易地检查是否偏离了独立性(尝试?mosaicplot?assocplot,但还要查看vcd包)。用于fisher.test()精确测试(依赖于超几何分布)。

R 中的prop.test()函数允许测试组之间的比例是否具有可比性或与理论概率没有差异。它被称为一个z-test 因为测试统计数据看起来像这样:

z=(f1f2)p^(1p^)(1n1+1n2)

在哪里p^=(p1+p2)/(n1+n2), 和指数(1,2)请参阅表格的第一行和第二行。在双向列联表中H0:p1=p2,这应该会产生与普通的可比较的结果χ2测试:

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

对于使用 R 分析离散数据,我强烈推荐Laura Thompson的 R (and S-PLUS) Manual to Accompany Agresti's Categorical Data Analysis (2002)