在最近的一项任务中,我们被告知在 MNIST 数字上使用 PCA 将维度从 64(8 x 8 图像)减少到 2。然后我们必须使用高斯混合模型对数字进行聚类。仅使用 2 个主成分的 PCA 不会产生不同的集群,因此该模型无法产生有用的分组。
然而,使用具有 2 个分量的 t-SNE,聚类分离得更好。当应用于 t-SNE 分量时,高斯混合模型会产生更多不同的簇。
具有 2 个分量的 PCA 和具有 2 个分量的 t-SNE 的差异可以在以下一对图像中看到,其中转换已应用于 MNIST 数据集。
我已经读到 t-SNE 仅用于高维数据的可视化,例如在这个答案中,但鉴于它产生的不同集群,为什么它不用作然后用于分类模型或作为降维技术一个独立的聚类方法?