我有两组买家,A
和B
,我想测试他们购买产品的百分比之间的差异是否显着。
- A 组:2520 人中有 271 人购买了该产品(10.8%),2249 人没有购买。
- B 组:41,873,457 人中有 1,073,839 人购买了该产品(2.6%),40,799,618 人没有购买。
我曾经chisq.test()
进行过一次测试以回答我的群体中买家的百分比是否有显着差异(我会说 10.8% 和 2.6% 的差异足够大)。
library(vcd)
data <- rbind(x=c(271,1073839), n=c(2249, 40799618))
chisq.test(data)
# Pearson's Chi-squared test with Yates' continuity correction
#
# data: data
# X-squared = 672.9477, df = 1, p-value < 2.2e-16
assocstats(data)
# X^2 df P(> X^2)
# Likelihood Ratio 382.03 1 0
# Pearson 676.22 1 0
#
# Phi-Coefficient : 0.004
# Contingency Coeff.: 0.004
# Cramer's V : 0.004
所以-value 表示存在显着差异,Cramer 的说没有。根据Cramér的说法,比例差异如此之大(集团A
的销售额超过4倍)怎么可能没有显着差异?