我正在研究knn分类算法。为什么欧几里得距离可以被认为是示例之间亲和力的一个很好的度量?
在一个维度(1 个属性)中,这似乎是正确的,但是如果我添加维度,欧几里德距离仍然可以被认为是衡量亲和力的好方法吗?为什么?
您可以将示例视为向量RpRp, 在哪里pp是特征的数量。如果它们之间的距离接近,两个示例将非常相似00(在极端情况下,如果两个示例相等,则它们的欧几里得距离为00)。测量距离的一种方法是使用欧几里得距离,但也可以使用其他距离,如余弦距离或LpLp指标。事实上,如果pp非常高,那么欧几里得距离不是一个好的度量,因为它往往会使距离过于均匀(参见本文)。
编辑:什么时候pp非常高:
看到这个非常高的问题的宏伟答案pp可能有。