数据挖掘 - 加权 KNN 是如何工作的？ - 吾爱随笔录

加权 KNN 是如何工作的？

数据挖掘分类数据挖掘 k-nn

2022-02-22 11:38:22

我正在阅读有关为 KNN 使用权重的说明，并且遇到了一个我不太了解的示例。

假设我们有 K = 7，我们得到以下结果：

决策集 = {A, A, A, A, B, B, B}

如果这是标准的 KNN 算法，我们会选择A，但是注释给出了使用权重的示例：

按班级分布（权重与班级频率成反比）

A 类：95 %，B 类 5 %

这导致了B类。

我似乎无法弄清楚为获得 B 作为答案而遗漏的数学。

1个回答

我们可以将最近邻视为一个投票过程，我们在其中咨询我们的 $k$ 最近的邻居。

我们给 $i$ -th 数据点一个投票权重 $w_i$ .

在您的示例中，类中的每个数据点 $A$ 有重量 $\frac1{0.95}$ 以及类中的每个数据点 $B$ 有重量 $\frac1{0.05}$ . 有 $4$ 班级投票 $A$ 和 $3$ 班级投票 $B$ . 我们上课 $A$ 分数 $\frac{4}{0.95}\approx 4.21$ 和班级 $B$ 分数 $\frac{3}{0.05}=60$ . 班级 $B$ 得分较高，因此我们将其分配给班级 $B$ .

其它你可能感兴趣的问题

上一篇术语预测器和特征之间有什么区别下一篇如果有重复，KNN 如何工作？