非技术类AIC的一句话解释

机器算法验证 r aic
2022-03-20 09:31:39

我需要一句话解释 AIC 在模型构建中的使用。到目前为止,我已经“简单地说,AIC 是对不同模型所考虑的观察到的变化量的相对度量,并允许对模型的复杂性进行校正。”

非常感谢任何建议。

R

4个回答

AIC 是一个有助于比较模型的数字,因为它包括模型与数据的拟合程度和模型复杂程度的度量。

最好的解释取决于“非技术类型”的确切含义。我喜欢到目前为止所提供的陈述,但我有一个小问题:他们倾向于使用“复杂”一词,而具体理解的含义可能会有所不同。让我提供这种变化:

AIC 衡量模型与数据集的拟合程度,同时调整该模型拟合任何数据集的能力,无论它是否相关。

这是一个将 AIC 定位在用于模型选择的技术中的定义。AIC 只是捕捉拟合优度(通过以额外解释变量的形式添加模型复杂性,或添加诸如“但仅在星期四下雨时”之类的警告)和简约性之间权衡的几种合理方法之一(更简单==更好)比较非嵌套模型。这是精美的印刷品:

  1. 我相信 OP 的定义仅适用于线性模型。对于概率之类的东西,AIC 通常用对数似然来定义。
  2. 其他一些标准经过调整(对额外解释变量的调整最少)、Kullback-Leibler IC、BIC/SC,甚至更奇特的标准,如 Amemiya 的预测标准,在应用工作的荒野中很少见. 这些标准在惩罚模型复杂性的程度上有所不同。一些人认为 AIC 倾向于选择过度参数化的模型,因为模型大小的惩罚非常低。BIC/SC 还会随着样本量的增加而增加惩罚,这似乎是一个方便的花花公子功能。R2
  3. 回避参与美国顶级信息标准的一个好方法是承认这些标准是任意的,并且在推导它们时涉及相当大的近似值,尤其是在非线性情况下。在实践中,从一组模型中选择一个模型可能应该取决于该模型的预期用途。如果目的是解释一个复杂问题的主要特征,那么简约应该是物超所值。如果预测是游戏的名称,那么节俭应该不那么珍贵。有些人甚至会补充说,理论/领域知识也应该发挥更大的作用。无论如何,您计划对模型执行的操作应确定您可能使用的标准。
  4. 对于嵌套模型,将参数限制为零的标准假设检验就足够了。

怎么样:

AIC 可帮助您找到使用最少变量的最佳拟合模型。

如果这在非技术方向上太过分了,请在评论中告诉我,我会想出另一个。