是否有等效于卡方检验的参数?

机器算法验证 卡方检验 非参数
2022-04-04 15:24:27

我正在对一个大小为土豆的设备进行一些分析。为了评估这个设备的准确性,我比较了(1)一盒土豆的数据,按照这个设备的大小,和(2)同一个盒子的数据,用手大小。在这两种情况下,原始数据都由一组数字组成。两个数据集似乎都是(大约)正态分布的。

到目前为止,我的分析包括:

  • 将数据分成箱,并进行卡方检验
  • 进行t 检验以比较两个数据集的均值。
  • 进行Wilcoxon 符号秩检验,据我所知,它是t 检验的非参数等效项。

为了完整起见,我想执行与 chi-squared test 等效的参数有这样的事吗?我有一半的想法,单边方差分析测试可能是我正在寻找的,但我真的不确定。

1个回答

泊松回归。

这是您可能正在描述的潜在表格的示例。

         category
method      1   2   3   4
  hand    101 210 590  99
  machine  97 401 403  99

具有加性效应的泊松回归应产生与卡方过程相同的预期细胞计数。

以下是我们如何拟合模型并进行预期的细胞计数

tabl = xtabs(~method + category, data = d) 
model_data = as.data.frame(tabl)


model = glm(Freq~method + factor(category), data =model_data, family = poisson)

model_data$expec = predict(model, type = 'response')

这是卡方检验

library(tidyverse)

model_data %>% 
  mutate(X = (Freq-expec)^2/expec) %>% 
  summarise(test_stat = sum(X))

>>>95.00335

这个测试有 3 个自由度,我不需要查看 p 值来告诉你这很重要(因为测试统计数据与卡方的平均值相差甚远)。

这是卡方检验本身。注意检验统计量

chisq.test(tabl)


    Pearson's Chi-squared test

data:  tabl
X-squared = 95.003, df = 3, p-value < 2.2e-16

所以在这里,我使用模型的预测来进行测试。另一种方法(我将其视为参数检验)是对泊松模型进行偏差拟合优度检验。为什么拟合优度测试与卡方相似的证据让我无法理解,但直接计算很容易证明结果并没有太大差异。

拟合检验统计量的偏差优度通过以下方式获得

model$deviance
>>>96.227

这足够接近。您可以模拟更多示例来检查偏差和卡方是否会产生相似的测试统计信息。

编辑:

事实证明,卡方检验是这些模型的似然比检验的近似值,它与拟合优度的偏差检验密切相关。该近似值是通过对某些项进行泰勒级数展开得出的,这解释了为什么偏差 GOF 检验统计量大于卡方。