在 Hastie、Tibshirani 和 Friedman (2013) The Elements of Statistic Learning 的第 7.2 节中,我们有目标变量和一个估计。损失记为,然后作者定义测试误差:
和预期的测试错误:
然后作者声明:
的估计将是我们的目标......
我的问题:为什么我们更关心而不是?
我会认为衡量预期损失的数量,无论使用什么训练样本,都会比一个特定训练样本的预期损失更有趣。我在这里想念什么?
另外,我在这里读过这个答案(基于我可能不正确的阅读)似乎同意我的观点,即是感兴趣的数量,但建议我们经常谈论因为它可以通过交叉验证来估计。但这似乎与教科书的第 7.12 节相矛盾,该节(再次通过我可能不正确的阅读)似乎表明交叉验证比。
我在这个问题上绕圈子,所以我想我会在这里问。