最不同的 MNIST 数字是什么?

数据挖掘 相似 距离 极简主义 表示 vae
2022-02-14 14:14:19

使用您想要的集合上的任何不同定义,MNIST 中最不同的两位数是什么?我在想,回答这个问题的合理方法是将这两组通过一些最先进的 VAE,然后检查潜在空间中的距离。相异性度量可以是到/到集群质心的距离(最简单)或每个点到每个其他集群中的每个点的距离((n2)),或其他一组差异度量之一。

有没有对此进行过任何研究(在某种程度上你甚至需要研究来回答这个问题)?有谁知道答案可能是什么?我已经看到了一些 VAE 的潜在空间的 TSNE 图,但它们并不是对距离或相异性的严格测量。

1个回答

不确定这是否构成“研究”,但我研究了使用 PCA 分解 MNIST 数据集以在 2D 中可视化:


pca = PCA(n_components=2)
pca.fit(ziptrain[:, 1:])
Z_train = pca.transform(ziptrain[:, 1:])

fig, ax = plt.subplots()
for digit in np.unique(ziptrain[:, 0]):
    x = Z_train[ziptrain[:, 0]==digit, 0]
    y = Z_train[ziptrain[:, 0]==digit, 1]
    ax.scatter(x, y, label=int(digit),
               alpha=1.0, edgecolors='none', marker='${}$'.format(int(digit)))

ax.legend()

这产生了以下情节:

使用 PCA 分解的 MNIST 数据

在视觉上我会说 1 和 0 是非常不同的。我相信您可以通过对它们进行聚类并测量与它们各自聚类的质心的笛卡尔距离来继续研究。

重要的是要注意,您对“不同”含义的定义将改变此类调查的结果,而这只是一种方法。