我阅读了各种统计/生物统计教科书,包括 Casella 和 Lehmann 关于回归的书籍章节。大多数时候,教科书会在针对某个模型进行回归后报告参数显着性的p值。然后是随后的模型选择程序。
但是,这些书永远不会涉及交叉验证 (CV) 或谈论使用测试/训练拆分。我从机器学习书籍中学习了 CV 和Monte Carlo 交叉验证(MCCV),而且我很少看到有关 CV 的统计书籍。
为什么我们没有在统计数据中教授交叉验证?还是一般统计学家不这样做?或者以某种方式,模型选择过程变得优于使用测试数据进行模型选择?生物统计学家/执业统计学家通常在模型选择中使用 CV 吗?