如何区分以下内容WW?
在哪里W∈Rd×DW∈Rd×D和(x)∈Rd×1(x)∈Rd×1
如何计算∂Y/∂W∂Y/∂W?
在这种情况下使用矩阵演算。您的方程看起来像是来自 OLS(最小二乘)理论。在那些你通过向量区分的 xx一些二次形式,如∂(x′A′Ax)∂x∂(x′A′Ax)∂x. 在我上面的链接中查找相关公式。
如果你真的想通过矩阵而不是向量来区分,你最终会得到tensors。张量很有趣,但到目前为止,我似乎还没有在统计中大量使用它们。顺便说一句,它们在物理学中无处不在。再次,按照我提供的链接。