Durbin-Watson 测试和生物(非时间序列)数据

机器算法验证 r 回归 假设检验 自相关 德宾沃森测试
2022-04-02 12:01:47

我正在试验cabbages数据集和线性回归R我对模型“维生素 C 浓度作为卷心菜头重的函数”进行了 Durbin-Watson 检验,并得到了显着的自相关结果:

data(cabbages, package = "MASS")
lmtest::dwtest(VitC ~ HeadWt, alternative="two.sided", data=cabbages)

结果:

Durbin-Watson test

data:  VitC ~ HeadWt
DW = 1.2929, p-value = 0.003546
alternative hypothesis: true autocorrelation is not 0
  1. 在这种情况下,我应该如何解释这种显着自相关的结果?
  2. 这是否意味着线性回归不适合这个数据集?如果是,有哪些替代方案?
  3. 在这种情况下,Durbin-Watson 测试是否合适,因为它不是时间序列?

我阅读了有关 Durbin-Watson 测试的几篇文章(例如123)。我注意到,通常在计量经济学和时间序列分析的背景下提到它,但不清楚在什么情况下使用这个测试是合适的,在什么情况下不适合。

1个回答

(1) 观测值的排序存在一定的相关性。在这种情况下,(部分)原因是观察结果是按Cult(指示卷心菜种植者的因素)排序的。并且由于第一个中耕者大多带有阴性残留物,而第二个中耕者大多带有阳性残留物,因此诊断测试会发现这种模式。如果这是所有测试所寻找的,它可能看起来像“趋势”或“自相关”。

(2) 线性回归本身似乎工作正常。但重要的是要控制Cult而不只是控制HeadWt可能Date也可能是相关的。检查 MASS 书中关于数据的内容也很好(我的副本在办公室,因此我现在无法检查)。

(3) 否。如果您在“时间”或观察的某种其他类型的自然排序上具有相关性,则 Durbin-Watson 是合适的。即便如此,可能还有其他更合适的自相关测试。