可能重复:
Python 作为统计工作台
我刚刚开始进行数据分析和机器学习。从我正在阅读/已经阅读的书籍中,Python 和 R 似乎是我的最佳选择。
我想知道(以一般方式)每个人的优点和缺点,或者我是否应该同时使用两者。
到目前为止,我一直在学习 C#,但已经将 Python 自学到了能胜任的水平。我感兴趣的是编程和寻找解决方案。我想尽可能地研究新事物。
任何帮助将不胜感激。
可能重复:
Python 作为统计工作台
我刚刚开始进行数据分析和机器学习。从我正在阅读/已经阅读的书籍中,Python 和 R 似乎是我的最佳选择。
我想知道(以一般方式)每个人的优点和缺点,或者我是否应该同时使用两者。
到目前为止,我一直在学习 C#,但已经将 Python 自学到了能胜任的水平。我感兴趣的是编程和寻找解决方案。我想尽可能地研究新事物。
任何帮助将不胜感激。
一个好工人的工具箱里有好几种工具!
也就是说,您是否看到 C# 和 Python 之间添加到您的工具箱中的区别?
R 让您可以访问数以千计的统计例程和技术,以及出色的图形。它是统计界的标准。(老实说,我注意到机器学习社区中有更多的 Matlab,但是 Matlab 是一种丑陋的语言并且价格昂贵,所以如果我让任何人使用它,我会感到内疚。) R 是实际分析数据的最佳工具,除非在大量数据集的情况下。
与 C# 等相比,R 的弱点在于它的速度、处理大量数据集的能力以及它的开发环境。因此,如果您想从头开始编程,请使用您最喜欢的工具(C# 等)。
如果您主要处于数据分析模式,您可能会使用 Python 获取和预处理数据,然后将其输入 R 并从那里继续:探索、分析、绘图等。如果您想说,“我编写了自己的Support Vector Machine implementation with added Super Special Sprockets Mapping" 使用你最喜欢的编程工具(C#等),然后用 R 检查并显示你的答案。
我严重怀疑您是否会找到实现您在 R 包中找到的所有技术的 Python 库。但是,如果您想从头开始编写其他人真正没有做过的代码,那么具有杀手级 IDE 的良好编程语言是您的最佳选择。(另一方面,如果你想去机器学习网站下载一些代码,那些可怜的困惑的人很可能有 Matlab 代码,在我看来,这是令人作呕的、原始的和只写的。)