我是物理专业的硕士生。最近我对数据科学领域很感兴趣。我有python的初级知识,数学的本科水平的知识和物理学的硕士水平的知识。我现在想学习数据科学。我搜索了互联网,但无法得到一个好的答案。我愿意每天花 1 到 1.5 个小时。我应该采取哪些步骤来精通数据科学,即我应该读什么书,我应该学什么课程等等?
开始我的数据科学之旅
我也有物理学硕士学位,所以也许你可以联系!
要做的第一件事就是让你的 Python 基础更牢固。从Youtube挑选一个 Python 初学者教程,学习所有基础知识。这应该花费你不到一周的时间。
对于所有新手来说,一个好的起点是Kaggle。它是一个面向初出茅庐和经验丰富的数据科学家的平台,如果您是新手(为此目的有 Kaggle 教程),您可以从头开始学习数据科学,或者您可以参加 Kaggle 比赛,在那里您可以衡量您与其他人的对比人们。
另一个不错的选择是Youtube教程(如上所述)。实际上,您可以在数据科学/数据分析中想象的每个主题都有数百个教程。他们还将为您提供适当的指导方针和最佳实践,以供您在数据科学中遵循。
我推荐关注的一个频道是 Krish Naik(我个人也关注他的频道)。他拥有几乎所有数据科学主题的完整教程。他的频道是建立数据科学基础的好地方。基本上要遵循的策略是(他推荐相同的策略!)按照他的教程来很好地掌握基础知识,一旦你掌握了它们,你就可以继续前进。我个人也遵循了同样的策略,相信我会有很大帮助!
您可以关注的另一个渠道是 Codebasics。他也有一些很好的教程!
我没有读任何书,因为我更愿意从解释每一个小而愚蠢的事情的视频中学习。但这是个人喜好的问题。如果您从书本中轻松学习,请继续。
互联网上有大量的数据科学资料,无论是文章、视频还是竞赛。只需选择一两个平台即可开始,无需在收集材料或选择哪个平台上浪费太多时间!
干杯!
我也是 DS 世界的新手,但我觉得非常有帮助的一件事是我强烈推荐的就是“手工”做很多工作。您可以在 DS 或机器学习中使用的所有模型都在 pandas 和 sklearn 等 python 库中得到了完美的覆盖和实现。一开始我发现超级有用的是:尝试自己编写模型。例如创建一个简单的线性回归,创建一个感知器(最简单的神经网络)或一个基本的分类器,如 K-Nearest Neighbor,只使用基本的 Python 库,如 numpy。
这将真正帮助您了解模型的工作原理。