数据挖掘 - 当目标只是降低维度时，为什么经常在 t-sne 之前使用 PCA 来解决问题？ - 吾爱随笔录

例如：Matlab 的 t-sne 教程经常使用 PCA

https://www.mathworks.com/help/stats/tsne-settings.html

" 使用 t-SNE 处理数据

使用 t-SNE 获得数据集群的二维类似物。使用 Barnes-Hut 算法在这个大型数据集上获得更好的性能。使用 PCA 将初始尺寸从 784 减少到 50。 <- (1) 如果我们要在 PCA 之后使用 t-sne 将尺寸减少到 2，为什么我们在这里首先使用 PCA 将尺寸减少到 50？

Matlab 教程代码：https ://www.mathworks.com/help/stats/tsne-settings.html


rng default % for reproducibility 

Y = tsne(X,'Algorithm','barneshut','NumPCAComponents',50); 

figure gscatter(Y(:,1),Y(:,2),L)

1）见上面加粗的问题

2）你会用谷歌搜索什么来找到这个？

我在谷歌上搜索过“当目标只是降低维度时，为什么经常在 t-sne 之前使用 PCA 来解决问题？”