T 分布随机邻域嵌入 (t-SNE) 是一种(获奖)降维技术,特别适用于高维数据集的可视化。
t-SNE 和随机邻域嵌入 (SNE) 有什么区别?
T 分布随机邻域嵌入 (t-SNE) 是一种(获奖)降维技术,特别适用于高维数据集的可视化。
t-SNE 和随机邻域嵌入 (SNE) 有什么区别?
实际上,我发现因为 t-Distribution 是一个长尾分布,它可以防止拥挤问题(这是 SNE 的缺点之一)。
您也可以从 17:48 到 20:12 观看本次讲座,以 t-SNE 的作者的一个很好的例子来听听原因。
tSNE产生的簇结构趋于分离,形状更稳定;并且更可重复。
我们在这里学习一个拓扑结构。因此,映射低维邻居是 SNE 的必要和基本目标。请注意,在较低维度中,我们没有太多空间来容纳所有邻居。请注意,我们可以维空间等距点。因此,基本的 SNE 算法所做的就是将所有等距点折叠到低维中的一个点。这种现象称为拥挤问题。
为了缓解这个问题,建议使用 t 分布。由于它有一个沉重的尾巴,它允许将那些遭受拥挤问题的点放置在一个有点远的地方(但不要太远)。