理解χ2χ2和克拉默的五V结果

机器算法验证 r 卡方检验 p 值 规模效应
2022-03-18 03:19:39

我有两组买家,AB,我想测试他们购买产品的百分比之间的差异是否显着。

  • A 组:2520 人中有 271 人购买了该产品(10.8%),2249 人没有购买。
  • B 组:41,873,457 人中有 1,073,839 人购买了该产品(2.6%),40,799,618 人没有购买。

我曾经chisq.test()进行过一次χ2测试以回答我的群体中买家的百分比是否有显着差异(我会说 10.8% 和 2.6% 的差异足够大)。

library(vcd)
data <- rbind(x=c(271,1073839), n=c(2249, 40799618))
chisq.test(data)
#  Pearson's Chi-squared test with Yates' continuity correction
# 
# data:  data
# X-squared = 672.9477, df = 1, p-value < 2.2e-16
assocstats(data)
#                     X^2 df P(> X^2)
# Likelihood Ratio 382.03  1        0
# Pearson          676.22  1        0
# 
# Phi-Coefficient   : 0.004 
# Contingency Coeff.: 0.004 
# Cramer's V        : 0.004

所以p-value 表示存在显着差异,Cramer 的V说没有。根据Cramér的说法,比例差异如此之大(集团A的销售额超过4倍)怎么可能没有显着差异V?

3个回答

这里有一个基本的混淆:

  • p-你得到的价值来自χ2测试它告诉你得到一个的概率χ2如果零假设为真,则统计量比您的统计量更极端或更极端。它没有告诉你影响有多大。
  • 另一方面,克莱默V效应大小的量度。它告诉你影响有多大。它没有告诉你效果是否“显着”。

此外,克莱默V并不是真正适合您的效果大小的衡量标准,尽管它可能适用于许多人χ2分析。它假定行变量和列变量都不是固定的。在您的情况下,列是可以理解为自变量的两组,而行是购买或未购买的数量(这可以被认为是因变量)。也就是说,您对行和列的看法不同,因此您也需要一个效果大小的度量。通常有三种这样的度量:风险差异风险比优势比风险差异是人们最容易理解的,但优势比可以说是最好的衡量标准。对于您的数据,这些值是(注意分母在风险比和优势比之间有所不同):

## risk difference: 
(271/2520) - (1073839/41873457)
# [1] 0.08189482
## risk ratio: 
(271/2520) / (1073839/41873457)
# [1] 4.19342
## odds ratio: 
(271/2249) / (1073839/40799618)
# [1] 4.578221

你没有说你是如何获得你的 Cramér's V统计量的,而你给出了p- 为您的价值χ2统计,你不提供的价值χ2本身。但是,Cramér V的数学运算很简单:

V=χ2/nmin(rows-1, cols-1)

在您的情况下,这简化为:

V=χ2n

根据定义,V等于相应值(正如您在对问题的编辑中清楚地看到的那样,现在包括命令的输出ppχ2chisq.test

另外:鉴于您的样本量巨大,您发现显着差异一点也不奇怪。如果样本量足够大,所有差异都很显着。

当我检查你的工作时,我还获得了 Cramer's V 的 0.004。当你有两个大小非常不同的组时,这个统计数据,就像“方差解释族”中的许多一样,往往很低。群体成员(A 与 B)几乎不会与 B 不同,这意味着群体成员几乎没有机会解释购买行为的大部分差异。出于这个原因,在这种情况下,它似乎不是最有效的指标——至少,单独使用时不是。

还有其他方法。例如,使用常见的风险术语,风险比(A 到 B)为 4.2。B 组显示风险降低了 76%。优势比为 4.6。您可以查看其他效果大小指标,例如在此起点但是您可能需要准备好展示您选择的指标如何不涉及挑选最有利于您的事业的指标。