建议阅读数据科学书籍的顺序

数据挖掘 机器学习 数据挖掘 图书
2022-03-03 18:06:30

我是一名本科生,目前正在学习数据科学。但是,由于我们通常不会在课堂上深入研究事物,因此我想花一些时间来复习基础知识并深入理解事物,以便进入更复杂的概念。当我做一些研究时,我偶然发现了这些书:

  • 数据挖掘:教科书,Charu C. Aggarwal 着
  • 统计学习的要素,作者 Jerome H. Friedman、Robert Tibshirani 和 Trevor Hastie
  • 模式识别和机器学习,Christopher M. Bishop
  • 机器学习:概率视角,作者:Kevin P. Murphy
  • 计算机时代统计推断:算法、证据和数据科学,作者:Bradley Efron 和 Trevor Hastie

如果您知道或遇到这些书,请您帮我选择阅读这些书的正确顺序,或者告诉我这些是否是多余的书,甚至建议一本书添加到列表中

任何帮助表示赞赏,谢谢。

2个回答

我想通常从 “Gareth James、Daniela Witten、Trevor Hastie 和 Robert Tibshirani 的统计学习简介”开始,然后,如果你想要更深入的了解,请转到 Jerome H. Friedman 的“统计学习的要素” 、罗伯特·蒂布希拉尼和特雷弗·哈斯蒂”。

我也非常喜欢由 Hastie 和 Tibshirani 教授的基于第一本书的视频课程(如果我没记错的话)——这是我心中真正的瑰宝。从我的角度来看,这是获得机器学习实践和理论背景的好方法。链接到 R-bloggers 上发布的课程: https ://www.r-bloggers.com/in-depth-introduction-to-machine-learning-in-15-hours-of-expert-videos/

多年来,我意识到,很好地理解统计学可以让你解决大量的业务问题,作为第一步,这也是非常重要的。您可以参加可汗学院概率与统计课程 https://www.khanacademy.org/math/statistics-probability

对于机器学习,您可以阅读“Gareth James、Daniela Witten、Trevor Hastie 和 Robert Tibshirani 的统计学习简介”。精彩的书。感觉就像一本小说,并且用 R 中的示例和代码编写得很漂亮。

我还推荐 Andrew NG 机器学习课程。

对于深度学习,我参加了 Andrew Karpathy 的 CS231 课程,但我更喜欢 Micheal Nielson 的这本精彩的免费在线书籍。 http://neuralnetworksanddeeplearning.com/

要更深入地了解业务问题,您可以参加 eDX 的课程分析 Edge https://www.edx.org/course/the-analytics-edge

对于 Rob J Hyndman 的时间序列预测书籍,在您继续解决它们之前是最好的 https://otexts.org/fpp2/

此外,我确实从 Analytics Vidhya 的博客中学到了很多东西。 https://www.analyticsvidhya.com/

最好的学习方式是参加黑客马拉松并亲自动手。