我正在大学参加一门选修课,主要侧重于机器学习的基础。现在我们进行了第一个练习——这个任务实际上应该用任何语言来完成(我选择了 Python)。我们的老师没有很好地解释理论与实践之间的关系,所以我们所有人都很难跟上——所以我决定在这里发布这个问题。我不希望任何人给我一个解决方案,我只是不明白他想要什么,并且可能暗示如何解决这个问题。:
这是完整的练习:
欧式距离分类器
开发一个欧几里得距离分类器如下: 生成 1000 个随机点,对应于 3 个特征大小为 2 的类中的每个类,用于 3 类分类问题。为简单起见,分别考虑 N([0 1 2], I)、N([0 0 1], I) 和 N([1 0 0],I) 之后的类。
根据最小欧几里得距离分类器生成输出一个 1000 维向量,其第 i 个分量包含分配对应向量的类。
我知道我应该生成具有属于三个类别之一的两个特征的随机点 - 好的。但我不明白句子的第二部分。这些类通常以 [0, 1, 2]、[0, 0, 1] 和 [1, 0, 0] 的均值(?)向量分布?
- 我在正态分布中的第二个参数是什么
- 向量是否代表多元正态分布的位置/平均值?
- 你会如何处理这个问题?使用ak最近邻算法?
感谢您提供任何有用的答案!
最大限度