我应该使用什么程序在网络上传输20TB数据?


10

我需要将20TB的数据复制到雷电阵列上。数据存在的盒子没有雷电连接,因此我需要使用本地1GB网络。(是的,这将是永远的)。

我尝试使用Filezilla / sftp,但是当队列变得非常大时崩溃。rsync或scp是可行的方式吗?


2
您可以将驱动器从旧设备中取出并直接连接吗?

同意以上评论。物理传输具有最大的带宽。
任思远2014年

我喜欢Carbon Copy Cloner,它是一个基于rsync的不错的GUI实用程序。开发人员分叉了rsync并进行了许多改进。我无法说出速度与rsync和/或tar或其他速度的关系,但这是我进行任何类型的数据传输的必经之路,毫无疑问,我想知道一旦完成所有数据,我的数据就很好了。如果不是,CCC会告诉我。
2014年

Answers:


16

rsync是一个很好的方法(scp几乎与以前相同,但功能较少)。您可能要使用该-Z选项,它将启用zlib压缩。根据您的驱动器/计算机的速度,它可能比发送未压缩的速度(即,如果您的网络链接已饱和)更快。您可能还需要“存档模式”选项,-a该选项将保留符号链接,权限和创建/修改时间,以及递归复制目录。根据您要复制的内容,可能会-E保留扩展属性和mac资源派生。最后,--progress将向您显示进度信息。


11
如果出现中断,rsync还擅长重新开始复制​​。
李·乔拉莫

3
借用@LeeJoramo,能够在传输失败的地方继续接机非常重要。如此大的传输在某个时候失败,并且您想确保自己在此之前所取得的任何进步都不会丢失。
blahdiblah 2014年

6

尽管不像rsync那样普遍,但我过去使用的工具名为“ mpscp”-http: //www.sandia.gov/MPSCP/mpscp_design.htm

来自Sandia National Labs的文件复制工具运行在SSH上,该工具经过特别优化,可以使封闭系统之间的高速网络饱和(例如,在同一站点的两台超级计算机之间复制10 TB的数据,通过10Gb +或Infiniband连接)。它运作良好,但设置起来可能有些麻烦。在测试中,我很容易看到它的运行速度比rsync快2到3倍。


3

使用rsync并考虑将其与rsyncd一起使用。如果您在不使用rsyncd的情况下使用rsync,那么您将无法使用ssh,这意味着使用某种加密。您可能正在将数据从较旧的计算机复制到较新的计算机,并且较旧的计算机可能没有CPU负担,无法加密数据以进行足够快的传输以保持千兆位以太网链路饱和。使用这两种方法测试传输文件批次,看看哪种方法更快。

出于同样的原因,我建议在承诺使用rsync的压缩选项之前对其进行测试。压缩是另一种占用大量CPU资源的活动,当尝试使用较旧的硬件时,压缩可能无法跟上千兆位以太网的速度。rsync是一个具有15年历史的程序,当甚至在第一世界国家中的大多数人都通过拨号调制解调器访问Internet时,它便可以回写。网络带宽与CPU权衡之间的差异就很大。


没错,rsync默认使用ssh,但这不是唯一的选择。您可以使用rsh代替使用该-e选项。使用相同的选项,您可以更改ssh的选项以使用较少的cpu密集加密:-e 'ssh -c arcfour,blowfish-cbc'或类似方法。我不知道这是否会对现代计算机带来任何速度差异,但是快速基准测试可能是值得的,尤其是对于20 TB的文件。
Michael DM Dryden 2014年

3

这20Tb是打包在少量大文件(如视频,怪物数据库)还是数百万个小文件中吗?

如果有很多小文件,我将使用rsync来实现可重新启动性,或者使用管道tar流来提高效率(很多网络连接,如果失败则从头开始重新启动)

tar -cf - * | ( cd newhome; tar -xf - )

必须安装远程文件夹。

您可以将新阵列直接连接到其他接口吗?本地rsync不使用ssh,因此您可以删除该故障点。是的,Firewire 800比千兆以太网慢,但您无法将以太网加载到100%-火线可能会更快。仅供参考,如果盒子足够近,您也可以联网火线。在系统偏好设置->网络中添加接口。


0

另一种选择是尝试使用Bittorrent Sync(http://www.bittorrent.com/sync)。我已经使用它在WAN上在我们家庭成员之间同步家庭照片和视频,但是没有理由它不适用于本地网络。它使用对等连接,因此数据不会像尝试使用保管箱那样通过服务器传输(不是我认为您有20TB的保管箱空间或想要等待那么长时间才能上传那么多文件)数据!)

它还在多个平台上受支持,因此比rsync和tar具有更大的灵活性。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.