研究专家的数据分析代码是有帮助的。我最近一直在仔细阅读github,那里有很多人共享数据分析代码。这包括一些R软件包(当然可以直接从CRAN获得),还包括一些可重现的研究示例,尤其是使用R时(请参见github上的R列表)。
- 谁是可以跟随github来学习数据分析最佳实践的好人?
- (可选)它们共享哪种代码,为什么有用?
研究专家的数据分析代码是有帮助的。我最近一直在仔细阅读github,那里有很多人共享数据分析代码。这包括一些R软件包(当然可以直接从CRAN获得),还包括一些可重现的研究示例,尤其是使用R时(请参见github上的R列表)。
Answers:
哈德利威克姆(Hadley Wickham)。他在Github上有几个探索性的数据分析项目,您可以查看(例如“ data-baby-names”),并且鉴于ggplot2 / plyr / reshape的出色表现,我对他的最佳表现有默认(但当然是盲目)信任习惯,特别是关于他自己的包裹。
另外,您可以尽早了解他正在从事的其他项目!
我还关注John Myles White的GitHub 存储库。有几个面向数据的项目,但对于R开发人员来说也很有趣:
迭戈·瓦莱·琼斯(Diego Valle Jones)。他的Github尤其是对墨西哥凶杀案的分析非常有趣。