我花了很多时间来开发用于验证传统频率统计领域中的预测模型的方法和软件。在将更多的贝叶斯思想付诸实践和教学时,我看到了一些需要接受的关键差异。首先,贝叶斯预测建模要求分析师认真考虑可能针对候选特征定制的先验分布,这些先验将模型拉向它们(即,针对不同的预测特征,通过不同的惩罚量实现收缩/惩罚/正则化)。其次,“真正的”贝叶斯方法不会产生单个模型,而是会获得整个后验分布来进行预测。
考虑到这些贝叶斯特征,过拟合是什么意思?我们应该评估它吗?如果是这样,怎么做?我们如何知道贝叶斯模型何时可用于现场使用?或者这是一个有争议的问题,因为当我们使用我们开发的预测模型时,后验将携带所有谨慎的不确定性?
如果我们强迫贝叶斯模型被提炼成一个单一的数字,例如后验均值/众数/中值风险,思维会发生怎样的变化?
后续问题::如果我们完全是贝叶斯,并且在查看数据之前花一些时间考虑先验,并且我们拟合了一个适当指定了数据似然性的模型,那么我们是否不得不对我们的模型在过度拟合方面感到满意? 或者我们是否需要做我们在常客世界中所做的那样,随机选择的主题平均可以很好地预测,但是如果我们选择一个预测非常低或预测值非常高的主题,就会出现回归是什么意思?