加权 KNN 是如何工作的?

数据挖掘 分类 数据挖掘 k-nn
2022-02-22 11:38:22

我正在阅读有关为 KNN 使用权重的说明,并且遇到了一个我不太了解的示例。

假设我们有 K = 7,我们得到以下结果:

决策集 = {A, A, A, A, B, B, B}

如果这是标准的 KNN 算法,我们会选择A,但是注释给出了使用权重的示例:

按班级分布(权重与班级频率成反比)

A 类:95 %,B 类 5 %

这导致了B类。

我似乎无法弄清楚为获得 B 作为答案而遗漏的数学。

1个回答

我们可以将最近邻视为一个投票过程,我们在其中咨询我们的k最近的邻居。

我们给i-th 数据点一个投票权重wi.

在您的示例中,类中的每个数据点A有重量10.95以及类中的每个数据点B有重量10.05. 4班级投票A3班级投票B. 我们上课A分数40.954.21和班级B分数30.05=60. 班级B得分较高,因此我们将其分配给班级B.