t-SNE 仅用于可视化吗?

数据挖掘 机器学习 可视化 降维 特纳
2021-10-06 12:32:31

我使用了 t-SNE 算法来可视化我的高维数据。但是,我想知道这是否是一种实用的推理方法?

4个回答

这是一种降维算法。推理是确定参数或标签的问题,一旦模型参数已被学习或估计,最适合给定输入的模型。

回答晚了,所以这里只是一个策略草图。

我认为您也可以将 t-SNE 用于半监督分类。

仅当您要预测的标签很少,并且如果您拥有具有简单决策边界的良好分离的集群时,它可能才有效。

确定 t-SNE 给你的这些集群的质心,然后你可以做一个类似于最近邻搜索的过程,根据新数据实例到集群质心的距离对它们进行分类。

如果“推理”是指聚类分析,我有一个可能有用的技巧 - 将输入属性插入 t-SNE 输出。

例如,假设您在客户数据集上应用 t-SNE,它会输出一些干净分离的集群。由于您可以确定每个客户在 t-SNE 图上的位置,因此您可以识别每个 t-SNE 集群中的客户。然后,您可以插入描述客户的参数并了解每个集群的客户特征。

这个技巧可以帮助您在应用更具可解释性的聚类算法之前验证 t-SNE 输出是否具有商业意义。

我引用了使用 Scikit-Learn 和 TensorFlow 进行动手机器学习

t-SNE 降低维数,同时尝试使相似实例靠近而不同实例分开。它主要用于可视化,特别是在高维空间中可视化实例集群(例如,在 2D 中可视化 MNIST 图像)。

在可视化您的数据时,您必须考虑维度的诅咒 https://en.wikipedia.org/wiki/Curse_of_dimensionality