整数奇偶校验算法

数据挖掘 scikit-学习
2022-03-06 11:20:16

我仍然是机器学习的初学者,今天我想用 scikit-learn 做一个简单的测试,但我无法达到我的预期。我创建了一个数据集,其中一列是自然数,另一列是数字是偶数还是奇数,我的意思是,只有 0 或 1。然后我尝试了几种不同的算法,但我无法正确预测不同数字的输出比数据集中的那些。我的问题是:哪些算法可以用于此目的???我认为例如逻辑回归可以解决问题或 KNN 分类器,我开始学习机器学习,并对这个简单的事情不起作用感到非常失望......

最好的祝福

1个回答

像逻辑回归这样的基本线性模型永远不会很好地工作,因为它的假设对于您的数据集根本不正确。它假定每个输入中正或负的概率(好吧,实际上是对数几率)线性变化,但是,它与输入中的每个整数值交替变化。KNN 的假设同样不匹配。对于每个整数,其邻居具有相反的分类。这些将永远不会很好地应用于您的输入,因为您的输入与它们的用法不匹配。

但是,如果您将输入的奇偶校验(X mod 2)作为一个特征,他们应该都可以轻松地学习这个模型。

这是关于特征工程和理解你在应用算法时所采取的假设的非常简单的一课。