如何从各种算法中选择最好的机器学习算法?

数据挖掘 机器学习 深度学习 scikit-学习 机器学习模型 模型选择
2021-09-16 09:51:38

当我想为我的数据集找到一个模型时,我发现有很多算法可以使用。我知道如何通过分离监督和非监督算法以及我试图解决的问题的目的来最小化选择选择。

但在那之后,也有很多算法可供选择,甚至在我目前使用的scikit-learn库中,还有很多我不知道的算法。它们可能在我的问题中工作得更好,而且还有比机器学习算法更强大的深度学习算法。找了之后,累了,一个简单的项目花了我整整两周的时间,但我对最后的结果也不满意。

所以我该怎么做?

  • 我是否必须记住机器学习库中的所有算法,比如 scikit-learn?
  • 还是应该放弃学习机器学习算法而开始学习深度学习?
1个回答

有一个理论结果叫做“没有免费的午餐定理”,它证明了一般情况下不存在“最好的 ML 算法”。

  • 重要的是要了解一个算法是如何工作的,以便对它是否适用于一个案例有一个很好的直觉。没有这个只能通过反复试验随机尝试不同的方法,这需要更多的时间和更多的努力。
  • 根据您的描述,您的学习似乎集中在如何使用可用工具(即运行算法)上。如果你想真正擅长数据科学,你还需要良好的理论背景。
  • 数据科学非常广泛,没有人知道一切,因为这是不可能的。我的建议是在进入下一个主题之前专注于很好地理解一件事。成为某个特定领域的专家通常比对所有事情都一知半解要好。

有比机器学习更强大的深度学习算法

从技术上讲,深度学习方法也是机器学习。

还是应该放弃学习机器学习算法而开始学习深度学习?

在我看来,最好在转向深度学习之前对传统的机器学习方法有一个很好的理解。