为什么第二项是换位的,而不是第一项?

机器算法验证 方差 期望值 矩阵
2022-04-10 21:07:59

我数学不是很好。我只是有这个愚蠢的问题。为什么我必须在期望中转置第二项?

我的意思是为什么Var(X)=E[(xμ)(xμ)T)]而不是这个E[(xμ)T(xμ))]

3个回答

如果使用(xμ)是列向量的约定,即 (xμ)=[x1μ1x2μ2xmμm],那么(xμ)T是行向量,即(xμ)T=[x1μ1,x2μ2,,xmμm]
列向量和行向量的乘积形成一个矩阵,其中对应的成对乘积作为条目。行向量和列向量的乘积(点积)导致成对乘积的总和。

由于您的是一个方差-协方差矩阵,因此您需要具有列向量和行向量的乘积,即Var(X)(xμ)(xμ)T

当您将矩阵相乘时,相邻的维度需要匹配,因此您可以将 (n, k) 矩阵乘以 (k, m) 矩阵,或 (m, k) 乘以 (k, n),但不能以任何其他方式. 您会在哪里看到转置符号,这取决于数据是按行存储还是按列存储。如果您采用行向量的点积之类的东西,您将转置第二个元素,以便将 (1, n) 乘以 (n, 1),但如果数据具有 (n, 1) 的初始形状,您将做相反的事情。

对于任何列向量 (例如 )xxRn×1

  1. xTx是(一个 1x1 矩阵,因此“同构于”(*))一个标量。

  2. xxT是一个矩阵。(如果它是 1x1,那么它可以类似地被视为一个标量。)

(*) 在你的情况下,'is isomorphic to' 只是意味着'可以被视为'