很多人都有很好的答案,这是我的 0.02 美元。
从统计学上讲,有两种方法可以查看“最佳模型”或“模型选择”:
1 尽可能简单但不简单的解释(Attrib. Einstein)
- This is also called Occam's Razor, as explanation applies here.
- Have a concept of True model or a model which approximates the truth
- Explanation is like doing scientific research
2 预测是兴趣,类似于工程开发。
- Prediction is the aim, and all that matters is that the model works
- Model choice should be based on quality of predictions
- Cf: Ein-Dor, P. & Feldmesser, J. (1987) Attributes of the performance of central processing units: a relative performance prediction model. Communications of the ACM 30, 308–317.
广泛(错误)的概念:
模型选择相当于选择了最好的模型
为了解释,我们应该警惕存在几个(大致)同样好的解释模型的可能性。简单性有助于传达模型中包含的概念以及心理学家所谓的泛化,即在与模型研究的场景非常不同的场景中“工作”的能力。因此,少数型号有溢价。
对于预测:(Ripley 博士)很好的类比是在专家意见之间进行选择:如果您可以访问大量专家小组,您将如何使用他们的意见?
交叉验证负责预测方面。有关 CV 的详细信息,请参阅 BD Ripley博士的此演讲 Brian D. Ripley 博士关于模型选择的演讲
引文:请注意,此答案中的所有内容均来自上面引用的演示文稿。我是这个演示文稿的忠实粉丝,我喜欢它。其他意见可能会有所不同。演讲的标题是:“在大型模型中选择”,由 Brian D. Ripley 博士于 2004 年 3 月 29 日至 30 日在帝国理工学院举行的纪念 John Nelder 80 岁生日的研讨会上发表。