泊松回归。
这是您可能正在描述的潜在表格的示例。
category
method 1 2 3 4
hand 101 210 590 99
machine 97 401 403 99
具有加性效应的泊松回归应产生与卡方过程相同的预期细胞计数。
以下是我们如何拟合模型并进行预期的细胞计数
tabl = xtabs(~method + category, data = d)
model_data = as.data.frame(tabl)
model = glm(Freq~method + factor(category), data =model_data, family = poisson)
model_data$expec = predict(model, type = 'response')
这是卡方检验
library(tidyverse)
model_data %>%
mutate(X = (Freq-expec)^2/expec) %>%
summarise(test_stat = sum(X))
>>>95.00335
这个测试有 3 个自由度,我不需要查看 p 值来告诉你这很重要(因为测试统计数据与卡方的平均值相差甚远)。
这是卡方检验本身。注意检验统计量
chisq.test(tabl)
Pearson's Chi-squared test
data: tabl
X-squared = 95.003, df = 3, p-value < 2.2e-16
所以在这里,我使用模型的预测来进行测试。另一种方法(我将其视为参数检验)是对泊松模型进行偏差拟合优度检验。为什么拟合优度测试与卡方相似的证据让我无法理解,但直接计算很容易证明结果并没有太大差异。
拟合检验统计量的偏差优度通过以下方式获得
model$deviance
>>>96.227
这足够接近。您可以模拟更多示例来检查偏差和卡方是否会产生相似的测试统计信息。
编辑:
事实证明,卡方检验是这些模型的似然比检验的近似值,它与拟合优度的偏差检验密切相关。该近似值是通过对某些项进行泰勒级数展开得出的,这解释了为什么偏差 GOF 检验统计量大于卡方。