情境: 为了回应先前有关可重复研究的问题,杰克写道
创建JASA归档文件时发现的一个问题是CRAN软件包的版本和默认值已更改。因此,在该归档文件中,我们还包括了所用软件包的版本。当人们更改其包装时,基于小插图的系统可能会崩溃(不确定如何在《纲要》的包装中包括额外的包装)。
最后,我想知道当R本身改变时该怎么做。例如,是否有生产虚拟机的方法,该虚拟机可以复制用于纸张的整个计算环境,从而使虚拟机不会很大?
题:
- 有什么好的策略可确保可重现的数据分析在将来(例如发布后的五,十年或二十年)可重现?
- 具体来说,使用Sweave和R时,有什么好的策略可以最大程度地提高重复性?
这似乎与确保可重现的数据分析项目将在其他人的计算机上运行时使用的默认值,软件包等略有不同的问题有关。