机器算法验证 - AIC&BIC号码解读 - 吾爱随笔录

AIC&BIC号码解读

机器算法验证解释 aic 比克

2022-01-28 20:57:35

我正在寻找如何解释 AIC（Akaike 信息标准）和 BIC（贝叶斯信息标准）估计的示例。

BIC 之间的负差异是否可以解释为一个模型相对于另一个模型的后验概率？我怎么能把它用语言表达出来？例如，BIC = -2 可能意味着更好的模型优于其他模型的几率约为？ $e^2= 7.4$

任何基本的建议都会受到这个新手的赞赏。

3个回答

$AIC$ 先验模型集的模型的可以重新调用为，其中模型集的最佳模型将具有。我们可以使用值来估计模型集中所有模型的证据强度 (在给定先验模型集的情况下，这通常被称为模型随着增加，减少，建议模型 $i$ $\mathsf{\Delta}_i=AIC_i-minAIC$ $\mathsf{\Delta}=0$ $\mathsf{\Delta}_i$ $w_i$

w_{i} = \frac{e^{(- 0.5 Δ_{i})}}{\sum_{r = 1}^{R} e^{(- 0.5 Δ_{i})}} .

$w_i = \frac{e^{(-0.5\mathsf{\Delta}_i)}}{\sum_{r=1}^Re^{(-0.5\mathsf{\Delta}_i)}}.$

i

$i$

Δ_{i}

$\mathsf{\Delta}_i$

w_{i}

$w_i$

i

$i$ 不太合理。这些值可以解释为模型是给定先验模型集的最佳模型的概率。与模型的相对似然计算为。例如，如果和，那么我们可以说模型的 8 倍。

w_{i}

$w_i$

i

$i$

i

$i$

j

$j$

w_{i} / w_{j}

$w_i/w_j$

w_{i} = 0.8

$w_i = 0.8$

w_{j} = 0.1

$w_j = 0.1$

i

$i$

j

$j$

请注意，当模型 1 是最佳模型（最小。Burnham 和 Anderson (2002) 将此称为证据比率。该表显示了证据比率相对于最佳模型的变化。 $w_1/w_2 = e^{0.5\Delta_2}$ $AIC$

Information Loss (Delta)    Evidence Ratio
0                           1.0
2                           2.7
4                           7.4
8                           54.6
10                          148.4
12                          403.4
15                          1808.0

参考

伯纳姆、KP 和安德森博士。2002. 模型选择和多模型推理：一种实用的信息论方法。第二版。斯普林格，纽约，美国。

Anderson, DR 2008。生命科学中基于模型的推理：证据入门。斯普林格，纽约，美国。

我不认为对 AIC 或 BIC 有任何简单的解释。它们都是采用对数似然并对其估计的参数数量施加惩罚的量。Akaike 在 1974 年开始的论文中解释了 AIC 的具体处罚。 Gideon Schwarz 在 1978 年的论文中选择了 BIC，其动机是贝叶斯论证。

您可能使用 BIC 作为贝叶斯因子的近似结果。因此，您不考虑（或多或少）先验分布。当您比较模型时，模型选择阶段的 BIC 很有用。要全面了解 BIC，贝叶斯因子，我强烈建议阅读一篇文章（第 4 节）： http: //www.stat.washington.edu/raftery/Research/PDF/socmeth1995.pdf 以补充知识：http://www .stat.washington.edu/raftery/Research/PDF/kass1995.pdf

其它你可能感兴趣的问题

上一篇校准多类增强分类器下一篇邦费罗尼还是图基？比较次数什么时候变大？