现在已经提出了几个问题,我一直在想一些事情。整个领域是否朝着着眼于原始数据和相关代码可用性的“可重复性”发展?
总是告诉我,可重复性的核心不一定像我所说的那样具有单击“运行”并获得相同结果的能力。数据和代码方法似乎假定数据是正确的-数据本身没有缺陷(在科学欺诈的情况下,通常证明是错误的)。它还关注目标人群的单个样本,而不是发现在多个独立样本上的可重复性。
那么为什么要强调能够重新运行分析,而不是从头开始重复研究呢?
在下面的评论中提到的文章可在此处获得。
现在已经提出了几个问题,我一直在想一些事情。整个领域是否朝着着眼于原始数据和相关代码可用性的“可重复性”发展?
总是告诉我,可重复性的核心不一定像我所说的那样具有单击“运行”并获得相同结果的能力。数据和代码方法似乎假定数据是正确的-数据本身没有缺陷(在科学欺诈的情况下,通常证明是错误的)。它还关注目标人群的单个样本,而不是发现在多个独立样本上的可重复性。
那么为什么要强调能够重新运行分析,而不是从头开始重复研究呢?
在下面的评论中提到的文章可在此处获得。
Answers:
可再现性研究是在某些研究领域中使用的术语,专门指进行分析以使
共享这些数据和代码后,其他研究人员可以:
可以在有关Sweave的技术讨论中看到这种用法。例如,弗里德里希·雷施(Friedrich Leisch)在Sweave的上下文中写道:“如果数据或分析发生变化,报告可以自动更新,从而可以进行真正可重复的研究。” 在CRAN可再现性研究任务视图中也可以看到,它指出:“可再现性研究的目标是将特定的说明与数据分析和实验数据联系起来,以便可以重新创建,更好地理解和验证奖学金。”
可再现性是科学的基本目标。这不是新的。研究报告包括方法和结果部分,其中应概述如何生成,处理和分析数据。一般规则是,所提供的详细信息应足以使具有适当能力的研究人员能够获取所提供的信息并复制研究。
可复制性也与可复制性和概括性概念密切相关。
因此,将“可重复性研究”一词用在Sweave之类的技术上,实际上是一个用词不当,因为它表明相关性比其涵盖的范围要广。另外,当向未使用过Sweave之类的技术的研究人员介绍Sweave等技术时,当我称此过程为“可重复的研究”时,这些研究人员通常会感到惊讶。
鉴于在类似Sweave的上下文中使用的“可再现性研究”仅与可再现性研究的一个方面有关,也许应该采用其他术语。可能的替代方法包括:
以上所有术语都更准确地反映了类似Sweave的分析所需要的内容。可重复的分析又短又甜。添加“数据”或“统计”进一步澄清了事情,但同时也使术语既长又窄。此外,“统计”具有狭义和广义的含义,并且当然在狭义的含义内,许多数据处理不是统计的。因此,术语“可重复分析”所隐含的广度具有其优点。
术语“可重复性研究”的另一个其他问题是类似Sweave的技术的目标不仅仅是“可重复性”。有几个相互关联的目标:
有一种观点认为,可重复的分析应促进正确的分析,因为有书面的分析记录可以检查。此外,如果数据和代码是共享的,它会建立问责制,从而激发研究人员检查其分析结果,并使其他研究人员能够记录更正。
可重现的分析还与开放式研究的概念非常吻合。当然,研究人员可以自己使用类似Sweave的技术。开放的研究原则鼓励共享数据和分析代码,以实现更大的重用性和责任感。
这并不是对“可复制”一词的批评。相反,它只是强调了使用类似Sweave的技术对于实现开放科学研究目标是必要的,但还不足以实现。
R
出版物中使用的代码,但作者拒绝这样做,并向我指出了该出版物。在您看来,您是否认为这是缺乏可重复性研究的开放性,还是足以使该方法在期刊中明确并让其他人自己编写代码就足够了?谢谢
以易于执行的形式访问数据和代码进行分析是可重复研究的必要条件。确认分析有效后,您可以在怀疑原始作者的地方替换您自己的代码/数据。我想说的是,我阅读的大多数包含统计数据的论文至少都有一部分方法模糊。我重现这些分析的尝试通常是不成功的(并且总是很费时),但是很难说这是由于欺诈,人为错误还是(更可能是)我以不同于作者的方式解决这些歧义。因此,具有论文的数据+代码并不能保证其结论是正确的,但是可以更容易地进行批判或扩展。
而且,“可重复的研究”在一定程度上是有问题的。因此,可再现的研究运动可以被视为鼓励比规范“更可再现”的研究,而不是要求研究达到最低限度。我猜想“发布数据和代码”现在很流行,因为这是一个相对简单且无威胁的步骤。