AIC 的相对变量重要性

机器算法验证 r 混合模式 模型选择 aic
2022-03-09 06:51:14

我很困惑,只需要对计算我在 AIC 模型选择过程中使用的协变量的相对变量重要性值进行一些确认。我知道有这个讨论,但它并没有完全明确地确认我应该做什么。

Burnham 和 Anderson (2002) 描述了一种量化变量重要性的简单方法。

第168页:预测变量xj的相对重要性的估计最好通过对变量j出现的集合中所有模型的AIC权重求和来进行。

但是,要使用这种方法,每个变量必须有相同数量的模型;否则,某些变量将被过度代表或代表不足,从而导致相对重要性值有偏差。

第 169 页:在使用 AIC 权重之和评估变量的相对重要性时,重要的是要在包含每个变量 j 的模型数量上实现平衡。

这是否意味着如果我有一组模型,它们的模型权重来自 AIC 程序(这些不是按权重排序,只是我创建它们的顺序):

1   INTERCEPT            
2   REPRO   TIME         
3   REPRO   TIME    R*T  
4   REPRO   TIME    WR  
5   REPRO   TIME    WR  WR*R 
6   REPRO   TIME    WR  WR*T 
7   WR

为了计算相对变量权重,我会将 TIME 在模型中的每个事件的权重相加,并对其他每个变量进行计算。然而,这并不完全正确对吧?因为包含每个变量的模型数量不平衡对吗?因此,为了纠正这一点,我会将这些权重的总和除以具有该变量的模型数量。(Kittle et al 2008 “the scale-dependent impact of wolf predation risk...”就是这样做的)。因此,例如,如果时间权重之和为 0.75,我会将其除以 5,因为它存在于 5 个模型中,同样,WR 将除以 4。

这似乎是一个愚蠢的问题,但它确实改变了我分析的结果和解释。因为例如,WR T 仅在 1 个模型中,并且它是在顶级模型之一中,因此它具有很高的模型权重,但 Time 和 Repro 也在这个顶级模型中,但也在其他 4 个候选模型中。因此,将 T 和 R 的权重除以 5 将 T 或 R 的重要性从 (0.999) 降低,使它们的 RVI 为 0.2,RVI 到 WR T 值为 0.7。是对的吗?

除此之外,我的下一个问题是——你是只对“最佳”(在 2AIC 或任何标准内)模型还是对所有 7 个模型进行此操作,而不管什么出现在顶部?我使用了 MuMIn 包并使用了重要性命令,但是当您使用获取最佳模型时,它会询问您是否要重新计算重要性,然后它会仅为顶级模型重新计算。哪个更适合使用?当只有 1 个模型是最好的时,这没有意义。然后我会假设它应该在所有模型上计算。

2个回答

这是我得到的一些进一步的建议/讨论:

AIC RIW 只能从平衡的候选模型集计算。如果你有 3 个变量(例如 repro、time 和 WR),那么平衡集(没有交互)是

repro
time
WR
repro + time
repro + WR
time + WR
repro + time + WR
intercept only

集合中的模型数量是解释变量数量的 2 次方(在这种情况下 = 8),具有 2 向交互作用,您的候选模型集还包括以下内容(即除了上述内容之外)

repro + time + repro*time
repro + WR + repro*WR
time + WR + time*WR
repro + time + WR + repro*time
repro + time + WR + repro*WR
repro + time + WR + time*WR

如果您想要 3 向交互,那么您也可以将其添加到上述所有模型中。

然后,每个变量的相对重要性权重是来自包含该变量的模型的所有 AIC 权重的总和。由于 AIC 权重在候选模型集中标准化为总和为 1,因此每个变量的 RIW 范围可以从 0 到 1。

不要将结果除以它包含的模型数量——它是总和。我只会将这些用于平衡的候选模型集;我不会将 RIW 用于较少数量的模型。

请注意,如果包含交互,则只能比较主效应的 RIW,并且只能比较交互的 RIW 。无法将主效应 RIW 与交互 RIW 进行比较(因为主效应出现在比交互更多的模型中)。

仅供参考:强解释变量的 RIW 约为 0.9,中等影响约为 0.6-0.9,非常弱的影响约为 0.5-0.6 及以下,算了。对于交互作用,强效应可能 > 0.7,中等 > 0.5。如果您不使用 RIW,那么只需查看您的模型表,看看当您添加特定变量时您是否在 AIC 中获得了一致的改进,以及改进了多少。强烈的影响通常会让您的 AIC 提高 >5、中等 2-5 和弱 0-2。如果您根本没有得到改善,那么它就没有任何解释。

如果您没有平衡的候选集,但确实有 AIC 权重(看起来确实如此),那么您可以简单地使用这些比率来确定一个模型相对于另一个模型的支持强度。例如,如果您有 AIC 权重为 0.7 的模型 1 和 AIC 权重为 0.15 的模型 2;那么模型 1 的数据支持是模型 2 的 4.6 倍(0.7/0.15)。您可以使用它来评估变量进出模型时的相对强度。但是你不需要做这些计算——并且可以简单地让读者参考表格。特别是如果你有一个占主导地位的模型;或者顶部的一系列模型都包含一个特定的变量。然后很明显,每个人都知道它很重要。

从第 169 页引述下来的两句话,Brunham & Andersen (2002) 解释了为什么需要平衡。

Burnham 和 Anderson (2002),第 169 页:这种平衡将每个变量置于平等地位。

换句话说,如果一个变量只在模型集中出现一次,而另一个变量在模型集中出现多次,那么您就妨碍了代表不足的变量。

例如,假设您有 5 个模型,变量 A 仅在一个模型中,变量 B 在 4 个模型中。

Model       AIC     w
A           12.0    0.579
B           14.5    0.166
B + C       15.0    0.129
B + C + D   16.0    0.078
B + D       17.0    0.048

请注意,模型 A 显然是仅基于 AIC 的最佳模型,但基于相对变量重要性 (RIV),变量 A 的 RIV 为 0.579,而 B 的 RIV 为 0.421。这表明变量 A 和 B 是否具有相似的相对重要性,但变量 A 是有缺陷的,因为它只包含在一个模型中。

我遇到过其他情况,RIV 值会根据Kittle 等人的模型数量进行调整。(2008)做到了。貌似MuMIn没有通过模型数量来调整RIV。