理解 Hastie 等人使用的方程

机器算法验证 回归 机器学习 自习 逐步回归
2022-03-10 07:12:18

我正在尝试从 Elements of Statistical Learning 重新创建图 3.6。关于该图的唯一信息包含在标题中。 在此处输入图像描述

我不清楚 Y 轴上的方程式究竟意味着什么。

我的理解是β是长度为 31 的向量,前 10 个元素 iid 为N(0,0.4)其他 21 个元素为 0。

然后β^(k)表示逐步回归中第 k 步的系数估计值。例如,在向前逐步中,在添加第一个系数之后,我们将有β^(k=1)这将是一个长度为 31 的向量,第一个元素是第一个系数估计值,其余 30 个元素为 0。然后,将依次估计剩余的 30 个系数,为每个新系数更新该向量。

在每一步k我们会计算E||β^(k)β||2通过计算||β^(k)β||2并在 50 次重复中取平均值。

在这种情况下,这个方程的正确解释是什么?

1个回答

这个答案改编自我上面的评论。

我认为您对问题的理解是正确的。您可以将方程解释为估计系数的均方误差k-th 模型与真实系数相比,即与真实系数的接近程度k-th 模型在系数估计方面来自真实模型。与评估预测相反,此指标将告诉您您对数据生成过程的建模程度。