我正在尝试使用wget(或ncftpget)从NOAA FTP服务器下载一年的数据。但是,由于FTP的开销,它花费的时间比应该花费的时间长(我认为)。例如,此命令
time wget -nv -m ftp://ftp:email@ftp.ncdc.noaa.gov/pub/data/noaa/2015 -O /weather/noaa/2015
或类似地,通过ncftpget
ncftpget -R -T -v ftp.ncdc.noaa.gov /weather/noaa/ /pub/data/noaa/2015
产生结果。53分钟转移30M!
FINISHED --2015-01-03 16:21:41--
Total wall clock time: 53m 32s
Downloaded: 12615 files, 30M in 7m 8s (72.6 KB/s)
real 53m32.447s
user 0m2.858s
sys 0m8.744s
当我观看此传输时,每个文件的传输速度都非常快(500kb / sec),但是下载12,000个相对较小的文件的过程会产生大量的开销,并使整个过程变慢。
我的问题:
- 我是否正确评估了情况?我知道在不知道服务器的情况下很难说,但是FTP在传输大量小文件时真的吸收了这么多吗?
- 是否有wget或ncftpget的任何调整,以使它们与远程FTP服务器更好地兼容?还是某种并行性?