在参数估计中,通常报告每个参数的 95% CI。为什么我看不到带有 CI 的 AIC(或 deltaAIC)?
如果我引导两个潜在模型的拟合,并为每次迭代获得一个 deltaAIC,那么报告 95% CI 是否有意义?
编辑:我并不是要暗示 AIC 与参数估计相同。我在问为什么我们对待拟合优度估计(AIC、BIC 等)与使用 CI 报告的估计不同。
在参数估计中,通常报告每个参数的 95% CI。为什么我看不到带有 CI 的 AIC(或 deltaAIC)?
如果我引导两个潜在模型的拟合,并为每次迭代获得一个 deltaAIC,那么报告 95% CI 是否有意义?
编辑:我并不是要暗示 AIC 与参数估计相同。我在问为什么我们对待拟合优度估计(AIC、BIC 等)与使用 CI 报告的估计不同。
AIC 不是真实参数的估计量。它是模型拟合的数据相关测量。模型拟合就是这样,没有任何模型拟合比你拥有的更“真实”,因为它是你拥有的那个被测量的。但是,如果没有任何 AIC 可以作为估计量的真实参数,就不可能有置信区间 (CI)。
顺便说一句,我对理查德哈迪的回答没有异议。AIC 与其他一些量(例如 )一样,可以解释为估计“真实但不可观察”的东西,在这种情况下,人们可以争辩说 CI 是有意义的。就我个人而言,我发现将测量拟合质量的解释更加直观和直接,由于上述原因,人们不会有 CI,但我并不是说它没有办法很好地定义和使用。
编辑:作为对问题中添加的回应:“我并不是说 AIC 与参数估计相同。我问的是为什么我们要处理拟合优度估计(AIC、BIC 等)不同于使用 CI 报告的估计值。” - CI 的定义依赖于被估计的参数。它说,给定真实的参数值,CI 以概率捕获该值。只要您对那个真实的参数值不感兴趣,CI 就没有意义。
AIC 估计来自生成样本的数据生成过程 (DGP) 的新的、看不见的数据点的预期似然性。* 即使目标(估计值)不是参数,它也是一个有意义的数量。例如,它可以解释为点预测的预期损失。希望在点估计(AIC)周围有一个置信区间是很自然的。通过这种方式,我们不仅可以知道预期损失是多少,还可以知道它的不确定性。总而言之,虽然对于如何获得置信区间以及在什么条件下您的自举想法可能有效,我没有现成的答案,但我清楚地看到了追求它的意义。
*请参阅我们如何通过似然比检验选择最佳 GARCH 模型?,使用 AIC 进行模型选择的结果可以在总体水平上解释吗?,在交叉验证中使用 AIC/BIC 对基于似然的损失函数以及采用此想法的其他三个广告。