将 ISOMAP 残差方差与 PCA 解释方差进行比较

机器算法验证 r 主成分分析 matlab 降维 多方面学习
2022-03-26 13:35:40

我正在使用 Rprincomp函数(来自stats包)在数据集上运行 PCA,并且我想将其输出与非线性降维方法 ISOMAP 的输出进行比较,我在 matlab 下通过此工具箱使用该方法:http://isomap。 stanford.edu在同一个数据集上。

我感兴趣的是根据 PCA 和 ISOMAP 分别确定的数据集的内在维数,最终目标是检查非线性降维在该数据集上是否比 PCA 效果更好。

我得到了与princomp每个组件相关的标准偏差,而 ISOMAP 包返回残差作为流形维度的函数。我如何比较这两个数量?换句话说,ISOMAP 中的残差是如何定义的?

这应该是无关紧要的,但数据集是 5 个维度的 54 个点。

1个回答

原始的 Isomap论文 将“残差”定义如下(参考 42):

residual variance=1R2(D^M,Dy)

在哪里R是所有条目的 Pearson 相关系数D^MDY.D^M是 PCA 的欧几里得距离矩阵和 Isomap 的测地线距离矩阵。DY是低维嵌入的欧几里得距离矩阵,该矩阵随您用于嵌入的维数而变化。

编辑:这在数值上不同于从特征值导出的 PCA 的解释方差,我不知道它们两者之间是否存在直接联系。

编辑:我在这里询问残差和解释方差之间的联系。