我试图了解线性降维方法(例如 PCA)和非线性降维方法(例如 Isomap)之间的差异。
我不太明白在这种情况下(非线性)线性意味着什么。我从维基百科读到
相比之下,如果使用 PCA(一种线性降维算法)将同一数据集降维为二维,则结果值组织得不是很好。这表明采样这个流形的高维向量(每个代表一个字母“A”)以非线性方式变化。
做什么
采样这个流形的高维向量(每个代表一个字母“A”)以非线性方式变化。
意思是?或者更广泛地说,我如何理解这种情况下的(非线性)线性?
我试图了解线性降维方法(例如 PCA)和非线性降维方法(例如 Isomap)之间的差异。
我不太明白在这种情况下(非线性)线性意味着什么。我从维基百科读到
相比之下,如果使用 PCA(一种线性降维算法)将同一数据集降维为二维,则结果值组织得不是很好。这表明采样这个流形的高维向量(每个代表一个字母“A”)以非线性方式变化。
做什么
采样这个流形的高维向量(每个代表一个字母“A”)以非线性方式变化。
意思是?或者更广泛地说,我如何理解这种情况下的(非线性)线性?
一张图片胜过千言万语:
在这里,我们正在寻找二维中的一维结构。这些点位于 S 形曲线上。PCA 试图用线性一维流形来描述数据,它只是一条线;当然,一条线非常适合这些数据。Isomap 正在寻找非线性(即弯曲!)一维流形,并且应该能够发现潜在的 S 形曲线。
降维意味着您将每个多维向量映射到一个低维向量。换句话说,您用低维向量表示(替换)每个多维向量。
线性降维意味着低维向量的分量由对应的高维向量的分量的线性函数给出。例如,在减少到二维的情况下,我们有:
[x1, x2, ..., xn] -> [f1(x1, x2, ..., xn), f2(x1, x2, ..., xn)]
如果f1
和f2
是(非线性)线性函数,我们有(非线性)线性降维。