ML书籍的阅读策略

数据挖掘 机器学习
2022-03-05 03:43:10

我正在尝试阅读以下有关统计学习的书籍列表。我有 BSCS 和大约 4 年的图像处理和并行编程经验。我无论如何都不会成为该领域的专家,但我的目标是:

  • 不要成为脚本小子,使用工具和算法而不了解如何和为什么。
  • 能够阅读和消化统计学习的最新研究,特别是计算机视觉。

我在准备中学习的先决条件:

需要阅读的书籍:

  • Robert Tibshirani 等人的 R 中应用统计学习简介。
  • 统计学习的要素:Robert Tibshirani 等人的数据挖掘、推理和预测。
  • Shai Shalev-Shwartz 等人从理论到算法理解机器学习。
  • Christopher M. Bishops 的模式识别和机器学习
  • David JC MacKay 的信息论、推理和学习算法
  • Ian Goodfellow 等人的深度学习。
  • Stephen Boyd 等人的凸优化。

我正在寻找阅读策略。我特别感谢阅读过大部分书籍的用户的意见。

2个回答

除了最后一篇,我都读过了。如果您对计算机视觉很认真,那么您不会从这份阅读清单中得到太多。然而,如果你对这些书有兴趣,我会从 Goodfellow 的深度学习开始,它是相当独立的,也是唯一一本涵盖计算机视觉的书,足以让它为此目的而有所收获。您可以从这里扩展并阅读本书中您缺乏背景的其他材料。

如果您不太关心计算机视觉,您可以从其他书籍开始,它们通常按以下顺序阅读:

  1. R 中应用的统计学习简介
  2. 统计学习的要素
  3. Bishop 模式识别与机器学习

如果你完成了这些,你可以解决非常枯燥乏味的 McKay。Shai Shalev-Shwartz 等人。是一本不错的书,涵盖了其他书中的很多材料,但从经验风险最小化的角度来看,并涵盖了 Vapnik-Chervonenkis 理论。它在经典的定理证明推论方案中更具理论性和结构性。所采取的观点不太实用,但增加了其他书籍。

我不知道关于凸优化的书,但您可能可以按任何顺序阅读它。如果您想阅读所有书籍并且不在乎需要多长时间,您可以先阅读它,因为它听起来更基础。

我会直接从斯坦福的神经网络图像识别课程开始(http://cs231n.stanford.edu/syllabus.html)。他们有快速阅读和易于理解的幻灯片。他们对图像识别中使用的方法进行了概述,并对最新研究进行了详细描述(每年更新)。它们还涵盖了深度学习和梯度下降方法。我还建议你买一本关于统计的好书,其中解释了 CLT、参数与过度拟合困境和 CV。并参加 Kaggle 比赛。这将使您了解当前方法的实际局限性,了解图像识别中当前最先进的方法,并了解人们如何解决现实世界的问题。这是一个正在运行的图像识别 kaggle 比赛:https ://www.kaggle.com/c/airbus-ship-detection. 在斯坦福课程幻灯片和 Kaggle 比赛之后,您可能能够理解几乎所有关于图像识别和计算机视觉的科学论文。