比较两个大小不等的二进制变量

机器算法验证 卡方检验 二进制数据 群体差异
2022-03-21 23:26:46

我测量了来自两个不同群体的二元变量,现在我试图找出不同群体在这个变量方面是否存在差异。我可以使用卡方检验,但这需要两个总体具有相同的长度。是否有适合这些情况的测试?谢谢你。

4个回答

Chi Square 不需要相同大小的组。在 R 中,您可以使用 prop.test() 或 chisq.test()。

我经常使用大小不等的 A/B 直接邮件测试来执行此操作。例如,10 万捐助者分为 90% 和 10%:90% 的人收到一封电子邮件呼吁,10% 的人什么也没发送。二元结果是他们是否向上诉机构捐款。

关于 prop.test 与 chisq.test 的好处是 prop.test 将计算组相等假设的 p 值计算差异的置信区间

这个页面给出了一个带有两个组的 prop.test() 示例:http: //cran.r-project.org/doc/contrib/Lemon-kickstart/kr_prop.html

sexsmoke<-matrix(c(70,120,65,140),ncol=2,byrow=T)
rownames(sexsmoke)<-c("male","female")
colnames(sexsmoke)<-c("smoke","nosmoke")
prop.test(sexsmoke)

您可以进行两个样本 t 检验,可能在使用反正弦变换转换比例之后。

您实际上可以使用逻辑回归/ glm,将结果作为因变量,将组归属作为解释因素变量。

按样本量加权是如何计算预期值的。唯一需要担心的是关于期望值可以有多小的规则。