多重卡方检验

机器算法验证 分类数据 物流 多重比较 卡方检验
2022-03-06 05:14:54

我在 2 x 2 x 6 表中交叉分类数据。让我们称尺寸responseAB我使用模型对数据进行逻辑回归response ~ A * B对该模型偏差的分析表明,术语及其相互作用都很重要。

但是,从数据的比例来看,似乎只有 2 个左右的水平B对这些显着影响负责。我想测试一下哪些级别是罪魁祸首。现在,我的方法是对 2 x 2 表执行 6 次卡方检验response ~ A,然后调整这些检验的 p 值以进行多重比较(使用 Holm 调整)。

我的问题是是否有更好的方法来解决这个问题。有没有更原则的建模方法,或多重卡方检验比较方法?

4个回答

您应该研究“分区卡方”。这在逻辑上类似于在 ANOVA 中执行事后测试。它将允许您确定您的显着整体测试是否主要归因于特定类别或类别组的差异。

一个快速的谷歌出现了这个演示文稿,最后讨论了划分卡方的方法。

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf

无原则的方法是丢弃不成比例的数据,重新拟合模型并查看响应和 A 的 logit/条件优势比是否非常不同(控制 B)。这可能会告诉您是否有理由担心。汇集 B 的水平是另一种方法。在更原则的路线上,如果您担心导致辛普森悖论的相对比例,那么您可以查看响应 / A 的条件和边际优势比,看看它们是否反转。

特别是为了避免多重比较,我唯一想到的是使用分层模型来解释跨级别的随机效应。

我不确切地知道你的目标是什么,或者为什么它们是这样的。但我通常建议将注意力集中在预测和置信区间上,而不是假设检验。

事后测试可能适合您的问题。chisqPostHoc() 函数在 R 检验中用于卡方检验中所有群体对之间的显着差异。即使,我还没有使用它,但这个链接可能很有用。 https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html

另一种选择可能是 EnQuireR 包中的 chisq.desc() 函数。