每个问题都需要自己的相似性/不相似性度量。想象一下,我们正在处理由实数向量组成的数据集。我想我们主要使用欧几里德距离,尤其是在低维中。不幸的是,我们经常不得不处理庞大的维度数据集,并且我们应用了不同的降维技术来使问题更容易解决。
我很高兴知道您对降维后使用的不同相似性/相异性度量的看法,以及它们如何影响分类/回归/聚类指标。
在 PCA 或其他距离测量之后使用欧几里得距离是否更好?为什么 ?
如果我更喜欢使用 AutoEncoder 来减少我的数据集维度,它是否存在一种特殊的方法来保证通过特定的相似性/不同性度量提供更好的结果?
是否存在一种对特定距离度量最优的降维技术 及时?