为了真正理解机器学习,我需要学习什么?

数据挖掘 机器学习
2022-01-20 20:42:42

我毕业于本科数学专业,但主要关注代数(伽罗瓦理论、结理论等)。我现在从事一些不相关的工作,但现在我想学习机器学习。问题是,如果我想真正了解机器学习,我应该具备什么样的知识?

说,这是我能想到的一些事情,但显然我错过了很多,我假设。

  • “基础”(微积分、线性代数、离散数学、编码等)
  • 概率(但具体是什么领域?)
  • 统计数据(但是什么样的?)
  • 算法
  • 微分方程

但还有什么?或者我上面提到的哪些子领域特别重要(即贝叶斯统计)?

编辑:我目前正在考虑 ML 的研究生课程,并想知道这是否是我真正想做的事情/了解更多/准备自己。

3个回答

来自拥有以 AI/ML 为生的概率博士学位的人。概率论的基础知识,也许是 wikipedia/cousera/... 如果你从来没有上过课程的话,可能是非常基础的知识,然后是 Williams 的“Probability with Martingales”。这里的论文也会给你一个很好的感觉。

至于书籍,这本关于“经典”机器学习的书很好,而且免费。对于深度学习https://www.deeplearningbook.org/,这本也有概率论的基础知识。

对于强化学习http://incompleteideas.net/book/the-book-2nd.html对于应用方面,幻灯片来自https://web.stanford.edu/class/cs224n/http://cs231n.stanford.edu/

至于统计,我从来没有见过任何机器学习工作引用“纯”统计中的定理,如果有的话。当然是标准的本科微积分和线性代数。并在您使用 Python 的同时学习一些 Python 😁

我想最好从 ml 的一些专业开始,例如在 coursera 上,以便为您找到有趣的领域。有不同级别的复杂性,其中一部分不需要额外的知识。另一个优点是您将获得有关材料的有用建议。然后你可以加深一些研究领域,了解你还需要学习什么。我会推荐Andrew Ng的课程。

谈到算法,Donald Knuth 的“计算机编程艺术”是一个不错的选择,如果你想在未来自己开发机器学习方法,那么你可以在基础算法方面有很强的背景。

贝叶斯方法可能是一个额外的研究领域,这是一个有趣的领域,但这并不意味着您在所有可能的机器学习研究中都需要它)

机器学习主要是(如果不是全部)函数近似,除了你已经很难过的事情之外,你还必须了解推理统计、信息论(寻找 Kullback-Leibler 散度、互信息)等领域,其中反过来需要概率分布(高斯分布)和贝叶斯概率(条件概率)方面的知识。此外,在考虑降维和聚类技术时,大多数都是线性代数(特征分解和奇异值分解等分解方法)。