我是一名R
语言程序员。我也属于数据科学家,但他们来自 CS 以外的其他学科。
这在我作为数据科学家的角色中很有效,但是,由于我的职业生涯开始于R
其他脚本/网络语言的基本知识,我觉得在两个关键领域有些不足:
- 缺乏扎实的编程理论知识。
- 在更快和更广泛使用的语言(如和)方面缺乏具有竞争力的技能水平
C
,这些语言可用于提高管道和大数据计算的速度,以及创建更容易开发成快速的 DS/数据产品后端脚本或独立应用程序。C++
Java
解决方案当然很简单——去学习编程,这是我通过参加一些课程(目前是 C 编程)一直在做的事情。
然而,既然我开始解决上面的问题 #1 和 #2,我就会问自己“像数据科学这样的语言到底有多可行?C
”C++
。
例如,我可以非常快速地移动数据并与用户进行很好的交互,但是高级回归、机器学习、文本挖掘和其他更高级的统计操作呢?
所以。能C
胜任这项工作——有哪些工具可用于高级统计、机器学习、人工智能和数据科学的其他领域?C
或者我是否必须失去通过调用R
脚本或其他语言进行编程所获得的大部分效率?
到目前为止,我在 C 中找到的最好的资源是一个名为Shark的库,它提供C
/C++
能够使用支持向量机、线性回归(不是非线性和其他高级回归,如多项概率等)和其他候选名单(很棒但是)统计功能。