Python 和 R 的好教程?

数据挖掘 机器学习 r Python
2021-09-24 13:53:53

我想同时学习 Python 和 R,以便在数据科学项目中使用。

我目前失业,刚从大学毕业,正在四处寻找工作,并认为如果我能在我的个人资料下获得一些 Kaggle 项目会很好。

但是,我对这两种语言都知之甚少。过去使用过 Matlab 和 C/C++。但我还没有制作生产质量代码或开发任何一种语言的应用程序或软件。它一直是学术用途的肮脏编码。

我在一个大学项目中使用了一点 Python,但我不知道什么是包等基础知识,即没有使用标准 Python 教科书等阅读语言的复杂性。

早在 C/C++ 中就已经完成了一些编码(3-4 年前,然后切换到 Matlab/Octave)。

我想开始使用 Python Numpy Scipy scikit-learn 和 pandas 等,但仅仅阅读 Wikipedia 文章或 Python 教科书对我来说是不可行的。

R 也是如此,只是我对 R 的了解为零。

有没有人有什么建议?

4个回答

有一个在线数据科学“游戏”带您学习如何使用 Python 加载 csv 和使用 scikit 到机器学习算法,例如支持向量机。这是一个带有演示视频的博客文章,实际站点是探索数据科学就个人而言,我认为它的天才。

我发现视频教程/IPython notebook 格式确实帮助我进入了 python 生态系统。

在 SciPy 2013 上有两个涵盖 sklearn 的教程(第 1 篇教程的第 1 部分用于笔记本的 github存储库)。

来自 PyCon2012 和 PyData2012 的类似教程适用于 pandas,但我没有代表可以pandas tutorial在 youtube 上进行链接搜索,您应该可以找到它们。

既然你提到了 Kaggle,我想你会看到他们开始使用关于泰坦尼克号乘客数据集的 python 教程(我没有代表在这里提供链接,但搜索Getting Started with Python: Kaggle's Titanic Competition应该可以让你到达那里)。

现在真的有很多好的资源。如果您想远离教科书,O'Reilly Media 和 Packt Publishing 都提供了对许多重要主题的轻松但有效的阅读。这些书在实践中应用得更多。

就学习语言而言,Coursera、Udacity、Code Acadmey 和 Code School 都有很棒的教程。我建议看一下以下内容:

Coursera AI 和统计课程

Udacity 数据科学课程

我只能推荐Hadley Wickham 的Advanced R。我认为它同时内容丰富且易于阅读。您说您对 R 的了解为零,但我相信由于您已经具备其他语言的编程技能,这本书可以非常有效地补充任何经典的“R 初学者手册”(对于后者,请参见此处)。