使用变分法进行线性回归的损失函数

机器算法验证 回归
2022-04-10 11:49:03

我在线性回归背后的数学问题上苦苦挣扎。在以下几行中,我粘贴了《模式识别和机器学习》(第 46 页)一书中的文本,其中作者推导出回归函数我想了解从等式(2)到最终结果的过程。有人可以为我提供一些有用的指针(和/或链接),我应该研究变分法中的哪些概念。Et[t|x]

平均预期损失由下式给出

(1)E[L]=L(t,x(x))p(x,t)dxdt.

线性回归中损失函数的一个常见选择是由给出的平方损失。在这种情况下,预期损失可以写成L(t,y(x))={y(x)t}2

(2)E[L]={y(x)t}2p(x,t)dxdt.

我们的目标是选择以最小化我们可以使用变分法来做到这一点y(x)E[L]

(3)δE[L]δy(x)=2{y(x)t}p(x,t)dt=0.

求解,并使用概率的和乘积规则,我们得到y(x)

(4)y(x)=tp(x,t)dtp(x)=tp(t|x)dt=Et[t|x]

2个回答

我认为您不需要变分法。首先,为每个固定的定义损失,x

(2*)E[L|x]={y(x)t}2p(t|x)dt.

并且它的最小值是y(x)=Et[t|x]

然后只是

E[L]=E[L|x]f(x)dx

我假设您的困难在于 Eq.2 和 Eq.3 之间的跳跃。您所需要的只是一个欧拉-拉格朗日方程,如方程(3)所示。在他们的符号将是你的,所以,例如。f(x,y,y˙){y(x)t}2p(x,t)dxdf/dy˙=0