- 根据 wiki,它被推荐用于
T-SNE
映射到 2-3 维。 - 如果我们想可视化数据,我可以理解这一点。
- 如果我们想减少特征的数量(即从 30 个特征减少到 5 个暗淡),是否建议这样做
T-SNE
?或者我们应该使用其他降维算法?
为什么建议使用 T SNE 降低到 2-3 暗度而不是更高的暗度?
数据挖掘
机器学习
可视化
降维
特纳
2021-09-20 17:53:09
1个回答
大警报!
T-SNE不是降维算法(如 PCA、LLE、UMAP 等)。它仅用于可视化,因此,超过 3 个维度没有意义。
T-SNE 不是一种参数化方法,因此您不会获得基于它来降低新数据集(验证、测试)维数的基本向量表示。这就是为什么它不能用于降维。
它仅根据它看到的数据随机计算,因此如果您在训练集上使用它,则无法对您的测试集进行相同的计算,因此无法使用 T-SNE 建模。
如果您看到 Sklearn 函数,对于 PCA 和其他维度算法,您会看到 fit()、transform() 和 fit_transform() 函数,但对于 T-SNE,您只有 fit() 和 fit_transform(),因为您将没有模型transform() 一个新的数据集。
我试图直观。如果您需要更多技术解释,请发表评论。
其它你可能感兴趣的问题