研究专家的数据分析代码很有帮助。我最近一直在阅读github,那里有很多人共享数据分析代码。这包括一些 R 包(当然可以直接从 CRAN 获得),还有一些可重复研究的例子,特别是使用 R(请参阅 github 上的这个 R 列表)。
- 谁是github上学习数据分析最佳实践的好人?
- 可选地,他们共享什么样的代码,为什么这很有用?
研究专家的数据分析代码很有帮助。我最近一直在阅读github,那里有很多人共享数据分析代码。这包括一些 R 包(当然可以直接从 CRAN 获得),还有一些可重复研究的例子,特别是使用 R(请参阅 github 上的这个 R 列表)。
哈德利·威克姆。他在 Github 上有几个探索性数据分析项目,你可以查看(例如,“data-baby-names”),并且鉴于 ggplot2/plyr/reshape 的出色表现,我默认(但不可否认)信任他的最佳表现实践,特别是关于他自己的包裹。
此外,您还可以提前了解他正在进行的其他项目!
我还关注John Myles White的 GitHub存储库。有几个面向数据的项目,但对 R 开发人员来说也很有趣:
迭戈·瓦莱·琼斯。他的Github,尤其是对墨西哥凶杀案的分析,真的很有趣。