我使用了 t-SNE 算法来可视化我的高维数据。但是,我想知道这是否是一种实用的推理方法?
t-SNE 仅用于可视化吗?
数据挖掘
机器学习
可视化
降维
特纳
2021-10-06 12:32:31
4个回答
这是一种降维算法。推理是确定参数或标签的问题,一旦模型参数已被学习或估计,最适合给定输入的模型。
回答晚了,所以这里只是一个策略草图。
我认为您也可以将 t-SNE 用于半监督分类。
仅当您要预测的标签很少,并且如果您拥有具有简单决策边界的良好分离的集群时,它可能才有效。
确定 t-SNE 给你的这些集群的质心,然后你可以做一个类似于最近邻搜索的过程,根据新数据实例到集群质心的距离对它们进行分类。
如果“推理”是指聚类分析,我有一个可能有用的技巧 - 将输入属性插入 t-SNE 输出。
例如,假设您在客户数据集上应用 t-SNE,它会输出一些干净分离的集群。由于您可以确定每个客户在 t-SNE 图上的位置,因此您可以识别每个 t-SNE 集群中的客户。然后,您可以插入描述客户的参数并了解每个集群的客户特征。
这个技巧可以帮助您在应用更具可解释性的聚类算法之前验证 t-SNE 输出是否具有商业意义。
我引用了使用 Scikit-Learn 和 TensorFlow 进行动手机器学习
t-SNE 降低维数,同时尝试使相似实例靠近而不同实例分开。它主要用于可视化,特别是在高维空间中可视化实例集群(例如,在 2D 中可视化 MNIST 图像)。
在可视化您的数据时,您必须考虑维度的诅咒 https://en.wikipedia.org/wiki/Curse_of_dimensionality