kNN 搜索中的类到底是什么?

数据挖掘 分类
2022-02-14 23:09:24

我正在尝试从头开始为项目创建 kNN 搜索。我想我有它的概念以及它是如何工作的,但我不明白到底什么是类。

我有一个矩阵XY在哪里X是元素的数量和Y他们的载体。因此,如果这些值是完全随机的,那么每个元素/行是一个不同的类,还是我以其他方式指定这些类?

2个回答

鉴于您的问题的上下文,我假设您指的是 k-NN 分类器。分类方法的思想是你有一组特征向量fi, 一般来说,fiRd 在哪里d是向量的维数。另外你有一堂课ci对于每个fi. 对看不见的特征向量进行分类fj你选择k最近的邻居(在某个距离下,通常是欧几里得距离),邻居中最常见的类别是您的预测。

所以,总而言之,算法的输入是特征向量fi和班级ci. 有关该算法的更多信息,请参阅此维基百科链接

下面的图像(来自维基百科)说明了一个典型的例子,在这个例子中,类是:红色三角形蓝色正方形,要预测的点是绿色圆圈每个特征向量都是一个二维点,即fi,fjR2. 在这种情况下,预测的类将是红色三角形

在此处输入图像描述

有关同时使用 Python 和 R 的解释,请参阅

除了 feynman410 的回答:

类是分类器想要预测的属性。例如,假设您想预测一个物体的颜色,结果该物体可以是红色、蓝色、紫色、绿色和黄色。然后每组具有相同颜色的对象形成一个类。现在为了预测对象的类别(在这种情况下是颜色),您的算法需要一些已经知道它们的属性和类别(颜色)的对象。因此还有“分类器”一词,意思是预测某物的类别。