机器算法验证 - 理解χ2χ2和克拉默的五V结果 - 吾爱随笔录

理解χ2χ2和克拉默的五V结果

机器算法验证 r 卡方检验 p 值规模效应

2022-03-18 03:19:39

我有两组买家，A和B，我想测试他们购买产品的百分比之间的差异是否显着。

A 组：2520 人中有 271 人购买了该产品（10.8%），2249 人没有购买。
B 组：41,873,457 人中有 1,073,839 人购买了该产品（2.6%），40,799,618 人没有购买。

我曾经chisq.test()进行过一次 $\chi^{2}$ 测试以回答我的群体中买家的百分比是否有显着差异（我会说 10.8% 和 2.6% 的差异足够大）。

library(vcd)
data <- rbind(x=c(271,1073839), n=c(2249, 40799618))
chisq.test(data)
#  Pearson's Chi-squared test with Yates' continuity correction
# 
# data:  data
# X-squared = 672.9477, df = 1, p-value < 2.2e-16
assocstats(data)
#                     X^2 df P(> X^2)
# Likelihood Ratio 382.03  1        0
# Pearson          676.22  1        0
# 
# Phi-Coefficient   : 0.004 
# Contingency Coeff.: 0.004 
# Cramer's V        : 0.004

所以 $p$ -value 表示存在显着差异，Cramer 的 $V$ 说没有。根据Cramér的说法，比例差异如此之大（集团A的销售额超过4倍）怎么可能没有显着差异 $V$ ?

3个回答

这里有一个基本的混淆：

这 $p$ -你得到的价值来自 $\chi^2$ 测试。它告诉你得到一个的概率 $\chi^2$ 如果零假设为真，则统计量比您的统计量更极端或更极端。它没有告诉你影响有多大。
另一方面，克莱默 $V$ 是效应大小的量度。它告诉你影响有多大。它没有告诉你效果是否“显着”。

此外，克莱默 $V$ 并不是真正适合您的效果大小的衡量标准，尽管它可能适用于许多人 $\chi^2$ 分析。它假定行变量和列变量都不是固定的。在您的情况下，列是可以理解为自变量的两组，而行是购买或未购买的数量（这可以被认为是因变量）。也就是说，您对行和列的看法不同，因此您也需要一个效果大小的度量。通常有三种这样的度量：风险差异、风险比和优势比。风险差异是人们最容易理解的，但优势比可以说是最好的衡量标准。对于您的数据，这些值是（注意分母在风险比和优势比之间有所不同）：

## risk difference: 
(271/2520) - (1073839/41873457)
# [1] 0.08189482
## risk ratio: 
(271/2520) / (1073839/41873457)
# [1] 4.19342
## odds ratio: 
(271/2249) / (1073839/40799618)
# [1] 4.578221

你没有说你是如何获得你的 Cramér's V统计量的，而你给出了 $p$ - 为您的价值 $\chi^{2}$ 统计，你不提供的价值 $\chi^{2}$ 本身。但是，Cramér V的数学运算很简单：

V = \sqrt{\frac{^{χ^{2}} /_{n}}{min (rows-1, cols-1)}}

$V = \sqrt{\frac{^{\chi^2}/_n}{\min\left(\text{rows-1, cols-1}\right)}}$

在您的情况下，这简化为：

V = \sqrt{\frac{χ^{2}}{n}}

$V=\sqrt{\frac{\chi^{2}}{n}}$

根据定义，V值等于相应值（正如您在对问题的编辑中清楚地看到的那样，现在包括命令的输出）。 $p$ $p$ $\chi^{2}$ chisq.test

另外：鉴于您的样本量巨大，您发现显着差异一点也不奇怪。如果样本量足够大，所有差异都很显着。

当我检查你的工作时，我还获得了 Cramer's V 的 0.004。当你有两个大小非常不同的组时，这个统计数据，就像“方差解释族”中的许多一样，往往很低。群体成员（A 与 B）几乎不会与 B 不同，这意味着群体成员几乎没有机会解释购买行为的大部分差异。出于这个原因，在这种情况下，它似乎不是最有效的指标——至少，单独使用时不是。

还有其他方法。例如，使用常见的风险术语，风险比（A 到 B）为 4.2。B 组显示风险降低了 76%。优势比为 4.6。您可以查看其他效果大小指标，例如在此起点。但是您可能需要准备好展示您选择的指标如何不涉及挑选最有利于您的事业的指标。

其它你可能感兴趣的问题

上一篇不知道分布时如何采样下一篇为什么密度图和地毯图似乎不一致？