数据挖掘 - t-SNE 仅用于可视化吗？ - 吾爱随笔录

数据挖掘机器学习可视化降维特纳

2021-10-06 12:32:31

我使用了 t-SNE 算法来可视化我的高维数据。但是，我想知道这是否是一种实用的推理方法？

4个回答

这是一种降维算法。推理是确定参数或标签的问题，一旦模型参数已被学习或估计，最适合给定输入的模型。

回答晚了，所以这里只是一个策略草图。

我认为您也可以将 t-SNE 用于半监督分类。

仅当您要预测的标签很少，并且如果您拥有具有简单决策边界的良好分离的集群时，它可能才有效。

确定 t-SNE 给你的这些集群的质心，然后你可以做一个类似于最近邻搜索的过程，根据新数据实例到集群质心的距离对它们进行分类。

如果“推理”是指聚类分析，我有一个可能有用的技巧 - 将输入属性插入 t-SNE 输出。

例如，假设您在客户数据集上应用 t-SNE，它会输出一些干净分离的集群。由于您可以确定每个客户在 t-SNE 图上的位置，因此您可以识别每个 t-SNE 集群中的客户。然后，您可以插入描述客户的参数并了解每个集群的客户特征。

这个技巧可以帮助您在应用更具可解释性的聚类算法之前验证 t-SNE 输出是否具有商业意义。

t-SNE 降低维数，同时尝试使相似实例靠近而不同实例分开。它主要用于可视化，特别是在高维空间中可视化实例集群（例如，在 2D 中可视化 MNIST 图像）。

在可视化您的数据时，您必须考虑维度的诅咒 https://en.wikipedia.org/wiki/Curse_of_dimensionality

其它你可能感兴趣的问题