在第 7 章(第 228 页)的《统计学习要素》一书中,训练误差定义为:
而样本内误差定义为
这符号表示我们在每个训练点观察到 N 个新的响应值.
这似乎与训练误差完全相同,因为还计算了训练误差,即通过使用拟合估计计算训练集的响应. 我已经检查了这个和这个概念的解释,但无法理解训练误差和样本内误差之间的区别,以及为什么乐观并不总是 0:
那么错误如何和不同,在这种情况下对乐观的直观理解是什么?
此外,作者在声明中所说的“通常偏向下”是什么意思:
这通常是积极的,因为 err 通常作为预测误差的估计值向下偏斜。
同时描述乐观(统计学习的要素,第 229 页)