机器学习和数据科学需要哪些数学主题?

数据挖掘 机器学习 数学
2022-03-13 10:04:20

我想开始学习ML&DS,但是我觉得我有点迷茫,所以我真的不知道该学什么,先决条件是什么,我的意思是我知道我应该学习线性代数,微积分和统计学,但不知道我需要的确切数量。如果有人能给我提供一个合适的开始路线图,以及我应该做什么的准确描述(从什么书开始,是看视频还是看书……等),我将不胜感激

2个回答

ML 和 DS 的领域非常广泛。一些主题与“经典”统计相关(需要良好的标准代数和矩阵计算知识),而其他领域则扩展到计算机科学和编程。例如,图像分类(或“计算机视觉”)之类的东西主要是在计算机科学界开发的,而其他预测模型(线性回归等)则广泛用于“经典”统计中。由于 ML/DS 中的领域/主题非常多样化,您最终需要根据自己的需求和兴趣专注于某些领域。

但是,一个很好的起点肯定是“统计学习简介”(可在线获得),它还附带 R“实验室”(也可以使用Python 实验室)。

如果您想更深入地研究某些主题,可以参考“统计学习要素”,它更正式,可以让您深入了解更多细节。

对于强化学习,您可以查看Sutton 和 Barto的介绍。

更多与神经网络相关的应用工作,也可以关注Keras 博客通常会提供各种论文和其他来源的链接,如果您有兴趣,可以按主题深入了解详细信息。

开始学习数据集、数据清洗、EDA(探索性数据分析)、可视化、线性代数和统计的一些基础知识。还可以学习 pandas、numpy 等库。这些是开始 ML 和 DL 之前的一些先决条件。

对于 ML,从回归和分类开始。一旦你掌握了它们。将所学知识应用到kaggle比赛中。你也可以在kaggle中免费学习课程。随着您的前进,您最终将学习接下来的步骤。

然而,O'Reilly 的 scikit learn、Keras 和 tensorflow 的动手机器学习对于初学者来说将是一本很棒的书,因为它以实用的方法涵盖了几乎所有主题。