我很困惑,只需要对计算我在 AIC 模型选择过程中使用的协变量的相对变量重要性值进行一些确认。我知道有这个讨论,但它并没有完全明确地确认我应该做什么。
Burnham 和 Anderson (2002) 描述了一种量化变量重要性的简单方法。
第168页:预测变量xj的相对重要性的估计最好通过对变量j出现的集合中所有模型的AIC权重求和来进行。
但是,要使用这种方法,每个变量必须有相同数量的模型;否则,某些变量将被过度代表或代表不足,从而导致相对重要性值有偏差。
第 169 页:在使用 AIC 权重之和评估变量的相对重要性时,重要的是要在包含每个变量 j 的模型数量上实现平衡。
这是否意味着如果我有一组模型,它们的模型权重来自 AIC 程序(这些不是按权重排序,只是我创建它们的顺序):
1 INTERCEPT
2 REPRO TIME
3 REPRO TIME R*T
4 REPRO TIME WR
5 REPRO TIME WR WR*R
6 REPRO TIME WR WR*T
7 WR
为了计算相对变量权重,我会将 TIME 在模型中的每个事件的权重相加,并对其他每个变量进行计算。然而,这并不完全正确对吧?因为包含每个变量的模型数量不平衡对吗?因此,为了纠正这一点,我会将这些权重的总和除以具有该变量的模型数量。(Kittle et al 2008 “the scale-dependent impact of wolf predation risk...”就是这样做的)。因此,例如,如果时间权重之和为 0.75,我会将其除以 5,因为它存在于 5 个模型中,同样,WR 将除以 4。
这似乎是一个愚蠢的问题,但它确实改变了我分析的结果和解释。因为例如,WR T 仅在 1 个模型中,并且它是在顶级模型之一中,因此它具有很高的模型权重,但 Time 和 Repro 也在这个顶级模型中,但也在其他 4 个候选模型中。因此,将 T 和 R 的权重除以 5 将 T 或 R 的重要性从 (0.999) 降低,使它们的 RVI 为 0.2,RVI 到 WR T 值为 0.7。是对的吗?
除此之外,我的下一个问题是——你是只对“最佳”(在 2AIC 或任何标准内)模型还是对所有 7 个模型进行此操作,而不管什么出现在顶部?我使用了 MuMIn 包并使用了重要性命令,但是当您使用获取最佳模型时,它会询问您是否要重新计算重要性,然后它会仅为顶级模型重新计算。哪个更适合使用?当只有 1 个模型是最好的时,这没有意义。然后我会假设它应该在所有模型上计算。