对深度学习书中的分布符号感到困惑

人工智能 机器学习 深度学习 符号
2021-10-28 11:14:52

在 Ian Goodfellow 的《深度学习》一书的第 5 章中,如下所示的损失函数中的一些符号让我非常困惑。

我试图理解x,ypdata表示样本(x,y)从原始数据集分布(或y是基本事实标签)。根据我的理解,公式 5.101 中的损失函数似乎是正确的。实际上,公式 5.101 是通过添加正则化从 5.100 推导出来的。

因此,符号x,yp^data在公式 5.96 和 5.100 中,我真的很困惑损失函数是否定义正确(有点错字错误)。如果不是这样,您能否帮我重构两个符号的含义,它们是否相似且正确?

在此处输入图像描述

在此处输入图像描述

在此处输入图像描述 非常感谢您的帮助。

1个回答

在同一本书的第 130 页,作者指出p^data由训练数据定义的经验分布。同样,在第 129 页,他指出pdata是生成集合的真实分布X={x(1),,x(m)}.

和有什么区别p^datapdata? 你可以想到p^data作为从集合计算的直方图Xpdata作为其中元素的真实分布X绘制。

下标x,yp^data在期待中Ex,yp^data表示期望是针对从经验分布中抽取的样本进行的p^data. 换句话说,您将优化目标函数J使用训练数据。看看这个问题以获取更多信息。

下标x,ypdata在公式的期望中5.101是一个错字。事实上,在这本书的网络版中,在第 151 页,期望的下标是 x,yp^data.