公开数据的托管选项


12

因此,您已经决定支持可重复研究的想法,并希望在线提供数据供人们查看和使用。问题是,您在哪里托管它?

我的第一个倾向当然是我在大学服务器上拥有的私有Web空间,但是这些事情实际上并没有那么持久-如果我离开,目录在消失之前会保持打开状态很短的时间。保持数据可供人们将来使用和使用的正确设置几乎是不正确的。

您是否使用GitHub或SourceForge之类的东西?还是其他服务?

有问题的数据是一些非常狭narrow的模拟结果的输出-因此,我不一定认为像InfoChimps或其他公共数据存储库之类的地方就是它的正确选择。更少的是“您可以使用此代码学习东西!” 以及更多“您可以复制本文中的图3”。


1
相关的内容,或重复的内容:stats.stackexchange.com/questions/10045/…–
Matt Parker

1
绝对相关-添加一些细节,以说明为什么我不认为它是重复的。
Fomite

@EpiGrad:您打算算什么日期?如果它是与您的研究项目相关的源代码,则可以将其附加到arXiv预印本上。
Piotr Migdal

@PiotrMigdal理想情况下,我希望数据能够持续几年,并且足够长的时间来进行通常的论文引文传播等工作。如果仅我的领域在使用它,我会将其附加到arXiv预印本上;)
Fomite 2011年

@EpiGrad那么也许一个好地方,搜索开放数据作为开放科学的一个方面- michaelnielsen.org/blog/open-science
Piotr Migdal

Answers:


4

一个简单的选项是github

我用它来共享数据和数据分析代码。这个问题列出了一些其他人在网站上共享代码和数据的好例子。

github的好处

  • 熟悉git即可轻松上传,为什么不使用git满足您的版本控制需求。
  • 您可以将要点用于简单的单个文件
  • 他人很容易将单个或多个文件下载为存档
  • 它有大量的免费存储空间
  • 可以在互联网上浏览源代码
  • 和更多...

当然,github并不是数据的完美选择。我可以看到使用更永久的机构存储库或其他一些专用工具进行更认真的归档的好处。


1
这实际上是我所采用的解决方案。机构存储库的部分问题在于,我所在的机构是不断变化的,对于一个大数据仓库而言,数据的重要性还不够。
Fomite


2

对于那些在学术界学习的人来说,一种可能性是使用通常由校园图书馆托管的校园数字存储库(对我来说,出版物出版的数据集的逻辑定位)。

DSpace是一个流行的(免费)数字存储库,据我所知,它可以托管数据集。但这是您机构中的某人必须提供的服务。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.