我昨天问了一个关于形成有效距离度量的问题(Link1)并得到了一些很好的答案;但是,我还有一些关于为高维数据形成适当距离度量的问题。
为什么三角不等式对于制定有效的距离度量如此重要?也许这个问题太宽泛了,但我脑子里还没有一个简单的例子。不确定你们是否可以想一个简单的场景来解释这一点?
正如我在上一篇文章 ( Link1 ) 中提到的,我认为余弦相似度与点积是一回事。我对吗?如果是这样,点积不是有效的距离度量,因为它不具有三角形不等式等属性。如果我们将点积测量的相似度转换为角度相似度,它会是一个合适的距离度量吗?
关于欧几里得距离,还有一篇文章(Link2)说它在高维度上不是一个好的度量。由于我的数据向量位于高维空间中,我想知道某些距离度量是否受到维数灾难的影响?
关于上面的 C 点,考虑到维度,分数距离度量会是更好的距离度量吗?(链接3)
非常感谢!一种