当我们阅读一本书时,理解符号对于理解内容起着非常重要的作用。不幸的是,不同的社区对模型和优化问题的表述有不同的符号约定。有人可以在这里总结一些公式符号并提供可能的原因吗?
我这里举个例子:在线性代数文学中,经典书籍是斯特朗的线性代数导论。书中最常用的记号是
其中是系数矩阵,是要求解的变量,是方程右侧的向量。本书选择这种表示法的原因是线性代数的主要目标是求解线性系统并找出向量是什么。给定这样的公式,OLS 优化问题是
在统计学或机器学习领域(来自《统计学习要素》一书),人们使用不同的符号来表示同一事物:
其中是数据矩阵,是要学习的系数或权重,是响应。人们使用它的原因是因为统计学或机器学习社区的人是数据驱动的,所以数据和响应对他们来说是最有趣的,他们用和来表示。
现在我们可以看到所有可能的混淆都存在:相同。在第二个等式中,不是需要解决的问题。同样对于术语:是线性代数中的系数矩阵,但它是统计数据。也称为“系数”。
此外,我提到并不是人们在机器学习中广泛使用的那种,人们使用的是对所有数据点进行汇总的半向量化版本。如
我认为这样做的原因是在谈论随机梯度下降和其他不同的损失函数时很好。此外,对于线性回归以外的其他问题,简洁的矩阵表示法也会消失。
任何人都可以对跨不同文献的符号进行更多总结吗?我希望这个问题的聪明答案可以作为人们阅读不同文学书籍的一个很好的参考。
请不要受限于我的示例 和。还有很多其他的。如