如果是观察到的数据矩阵和那么是潜变量
在哪里是观测数据的平均值,并且是数据中的高斯误差/噪声,并且称为主子空间。
我的问题是,当使用普通 PCA 时,我们会得到一组正交特征向量以下为真
但在 PPCA 中,既不是标准正交也不是特征向量。那么我怎样才能从?
按照我的直觉,我在 MATLAB 中搜索了ppca,在那里我遇到了这一行:
收敛时,W 的列跨越子空间,但它们不是正交的。ppca 通过 W 的正交化获得分量的正交系数 coeff。
我稍微修改了 ppca 代码以获取W,运行它,在正交化之后,我确实从W得到了P。
为什么这种正交化给出了特征向量,沿着它可以看到大部分的方差?
我假设,正交化给了我一组跨越主子空间的正交/正交向量,但是为什么这个正交化的结果矩阵等于特征矩阵(我知道 pca 中的特征矩阵也是正交的)?我可以假设主要子空间仅由一组唯一的正交向量跨越吗?在这种情况下,两个结果将始终一致。