在哪些应用中,我们更喜欢模型选择而不是模型平均?

机器算法验证 模型选择 aic 比克 模型平均
2022-03-15 05:43:44

我想知道在哪些应用或场景(或试图回答什么样的问题)中,研究人员更喜欢使用模型选择(例如 AIC 或 BIC)而不是模型平均(例如贝叶斯模型平均)?一个例子:如果我手头的问题是什么是最合适的模型,那么我必须使用模型选择。另一个(不确定)示例:我想如果我们想要更少的偏差,模型选择也是首选。如果您有其他类似的示例,那就太好了。也欢迎论文或书籍推荐。

4个回答

模型规范是比模型选择(大多数人真正指的是特征选择)或模型平均更好的方法。这里有一些优点和缺点。

  • 模型规范需要更多关于非线性、非可加性(相互作用)和模型组件的前期思考来惩罚,但这种思考在下游计算和解释中得到了回报,并导致对不确定性的准确估计。模型规范的一个示例是包含合理数量的非线性基函数,以允许在不假设线性的情况下进行灵活建模,并指定贝叶斯模型中非加性效应的怀疑先验分布(或在频率论设置中惩罚的参数,引导通过交叉验证得到惩罚的最大似然估计)
  • 模型(特征)选择不像宣传的那样有效,你几乎总是会失望地发现“找到”的特征在未来的样本中没有复制,共线性几乎破坏了选择的能力,预测性能不如完全拟合具有适当惩罚的模型(例如,岭回归通常比lasso弹性网络预测更好)。特征选择导致示例模型不是模型。
  • 模型平均完成与精心预先指定的非常灵活的单一模型相同的事情,但需要更多的工作和解释困难。也就是说,如果被平均的模型域来自同一个族。有时,不同模型族的模型平均可以处理模型族的不确定性。例如,当 Y 为二进制并且您正在开发概率模型时,您可能不确定要使用的链接函数。或者在事件发生时间分析中,您可能会考虑比例风险模型与加速故障时间模型。但也应考虑在这些模型中的任何一个中明智地使用额外参数。例如,如果我在逻辑模型中包含大致正确的交互,我可以从基于优势比的逻辑回归模型中准确估计风险比。

单一模型比集成更容易解释。因此,它们通常更容易被非技术用户接受,并且更容易排除故障(例如,当预测偏离时)。

平均模型更难应用零假设显着性检验。在可发布性取决于 p 值的许多领域中,这是一个非常严格的标准。

模型平均更实用 在您没有资源选择模型且无需详细解释结果的应用程序中。模型选择不仅仅是比较 AIC,因为如果这就是您选择模型的全部,那么不要打扰,只需平均。

正确的选择是一个非常耗时且昂贵的过程。你可以让一个博士工作几个月来提出一个简约的规范,那就是几十万美元,加上持续的维护和将你的产品推向市场的机会成本。在某些情况下,这是可以负担的。一个例子是财务风险管理,其中错误的成本对公司来说可能是存在的,而且你让监管机构审查模型,他们也希望你解释结果的细节。一个反例是市场营销和销售,在这种情况下,您最好通过数据挖掘和实验来代替细致的模型选择。

(这仍然是一个非常粗略的想法,请持保留态度)

平均是对抗随机不确定性(即方差)的可行策略。OTOH,如果情况的主要问题是偏见,那么选择方法可能会起作用。

在实践中,由于仅使用有限数量的独立案例(对于我使用的数据,独立案例的数量通常是<< 数据中的行数)。

因此,与您的示例相比,我会以相反的方式进行争论(而是按照弗兰克·哈雷尔(Frank Harrell)引起您注意的规范方向):选择(对于低偏差)具有方差不确定性必须低的先决条件。