我在线性回归背后的数学问题上苦苦挣扎。在以下几行中,我粘贴了《模式识别和机器学习》(第 46 页)一书中的文本,其中作者推导出回归函数。我想了解从等式(2)到最终结果的过程。有人可以为我提供一些有用的指针(和/或链接),我应该研究变分法中的哪些概念。
平均预期损失由下式给出
线性回归中损失函数的一个常见选择是由给出的平方损失。在这种情况下,预期损失可以写成
我们的目标是选择以最小化。我们可以使用变分法来做到这一点
求解,并使用概率的和乘积规则,我们得到
我在线性回归背后的数学问题上苦苦挣扎。在以下几行中,我粘贴了《模式识别和机器学习》(第 46 页)一书中的文本,其中作者推导出回归函数。我想了解从等式(2)到最终结果的过程。有人可以为我提供一些有用的指针(和/或链接),我应该研究变分法中的哪些概念。
平均预期损失由下式给出
线性回归中损失函数的一个常见选择是由给出的平方损失。在这种情况下,预期损失可以写成
我们的目标是选择以最小化。我们可以使用变分法来做到这一点
求解,并使用概率的和乘积规则,我们得到
我认为您不需要变分法。首先,为每个固定的定义损失,
并且它的最小值是
然后只是
我假设您的困难在于 Eq.2 和 Eq.3 之间的跳跃。您所需要的只是一个欧拉-拉格朗日方程,如方程(3)所示。在他们的符号将是你的,所以,例如。