我们经常听到计算机科学中的项目管理和设计模式,但是在统计分析中却很少见。但是,看来设计有效而持久的统计项目的决定性步骤是使事情井井有条。
我经常提倡使用R和在单独的文件夹(原始数据文件,转换后的数据文件,R脚本,图形,注释等)中文件的一致组织。采用这种方法的主要原因是,以后运行分析可能会更容易(例如,当您忘记了如何生成给定图时)。
统计项目管理的最佳实践是什么,或者您想根据自己的经验提出建议?当然,这适用于任何统计软件。(请给每个帖子一个答案)
我们经常听到计算机科学中的项目管理和设计模式,但是在统计分析中却很少见。但是,看来设计有效而持久的统计项目的决定性步骤是使事情井井有条。
我经常提倡使用R和在单独的文件夹(原始数据文件,转换后的数据文件,R脚本,图形,注释等)中文件的一致组织。采用这种方法的主要原因是,以后运行分析可能会更容易(例如,当您忘记了如何生成给定图时)。
统计项目管理的最佳实践是什么,或者您想根据自己的经验提出建议?当然,这适用于任何统计软件。(请给每个帖子一个答案)
Answers:
我正在整理一系列关于SO(如@Shane所建议),Biostar(此后为BS)和本SE的快速指南。我尽力确认每个项目的所有权,并选择第一个或被高度评价的答案。我还添加了自己的东西,并标记了特定于[R]环境的项目。
数据管理
编码
分析
版本控制
编辑/报告
作为旁注,Hadley Wickham提供了R项目管理的全面概述,包括可再现的示例和统一的数据哲学。
最后,Oliver Kirchkamp 在其面向R 的统计数据分析工作流中提供了非常详细的概述,说明了采用和遵循特定的工作流将如何帮助统计人员相互协作,同时确保数据完整性和结果可重复性。它还包括有关使用编织和版本控制系统的一些讨论。Stata用户可能会发现J. Scott Long的“使用Stata进行数据分析的工作流程”也很有用。
这没有具体提供答案,但是您可能需要查看以下相关的stackoverflow问题:
您可能也对John Myles White的最近项目感兴趣,以创建统计项目模板。
这与Shane的答案重叠,但是在我看来,有两个主要码头:
van Belle是成功的统计项目规则的来源。
只是我的2美分。我发现Notepad ++对此很有用。我可以为每个项目维护单独的脚本(程序控制,数据格式等)和一个.pad文件。.pad文件调用是与该项目关联的所有脚本。