我的困惑源于阅读以下论文
http://www.bmj.com/content/351/bmj.h3868
它在其摘要中指出(他们后来展示了一项符合该主张的实证研究)-“过度拟合的模型倾向于低估低风险患者的事件概率并高估高风险患者的事件概率”
我对这个声明的一般性感到困惑。我看过许多将过度拟合描述为建模/捕获噪声的模型的卡通/数字,但对我来说,这种噪声如何必然会导致高估高风险患者的风险和低估低风险患者的风险并不直观。为什么过拟合模型不能以低估高危患者风险的方式捕获噪声?他们的说法有数学证明吗?
对于我的问题的第二部分,我想问一下,如果他们提出的说法是正确的,那么欠拟合模型的校准图是否会反过来(观察到的 v/s 预测的斜率<1;低估高风险风险,高估低风险风险?)。同样,我无法直观地预测为什么更简单的欠拟合模型必然会生成可预测的校准曲线。