背景: 在回答关于可重复研究的较早问题时,杰克写道
我们在创建 JASA 存档时发现的一个问题是 CRAN 包的版本和默认值发生了变化。因此,在该存档中,我们还包括我们使用的软件包的版本。当人们更改他们的包时,基于小插图的系统可能会中断(不确定如何在 Compendium 的包中包含额外的包)。
最后,我想知道当 R 本身发生变化时该怎么办。有没有办法生产,比如说,一个虚拟机,它可以复制用于论文的整个计算环境,使得虚拟机不是很大?
问题:
- 有什么好的策略可以确保可重现的数据分析在未来(例如,出版后的五年、十年或二十年)是可重现的?
- 具体来说,在使用 Sweave 和 R 时,最大化持续再现性的好策略是什么?
这似乎与确保可重现的数据分析项目将在其他人的机器上运行的问题有关,但默认值、包等略有不同。