t-sne 维度有意义吗?

数据挖掘 降维 特纳
2021-09-19 00:32:19

t-sne 嵌入的维度有什么含义吗?与 PCA 一样,我们有这种线性变换方差最大化的感觉,但是对于 t-sne,除了我们为映射和最小化 KL 距离定义的空间之外,还有直觉吗?

1个回答

低维空间的维度没有意义。请注意,t-SNE 损失函数仅基于点之间的距离 (yiyj) 和这些距离上的概率分布 (pijqij):

δCδyi=4j(pijqij)(yiyj)(1+||yiyj||2)1

因此没有从整个高维空间到低维空间的投影,t-SNE 只找到从一组特定的高维点到一组特定的低维点的映射。因为从一个空间到另一个空间没有功能,所以轴也没有内在的意义。

你可以想象的事情来说明这一点:

  • 旋转或平移高维或低维空间不会影响点之间的距离。因此,t-SNE 不关心两个空间中的旋转或平移。因此,轴没有绝对的解释。
  • t-Student 分布有肥尾。这导致低维表示对于高维空间中远离的点的变化是不变的。这也导致高维空间中距离较远的点在低维空间中可能相当远、很远或非常远。从这个意义上说,它拉伸了低维轴的某些部分(在任意方向上)。

话虽如此,t-SNE 主要是一种可视化技术,其用于其他目的的降维效果并不明显(可能不适合聚类、特征提取或特征选择)。

还有: