我有一台装有Intel(R)Pentium(R)CPU G640 @ 2.80 GHz和8 GB RAM的PC。我正在使用EXT3文件系统在其上运行Scientific Linux 6.5。
在这种设置下,sort -u对200 GB的文件进行刻录的最快方法是什么?
我是否应该将文件拆分为较小的文件(小于8 GB)sort -u,将它们放在一起,然后再次以不同的大小拆分sort -u,等等?还是有任何排序脚本,程序可以用有限的RAM来处理这么大的文件?
parallel我认为您将需要GNU ,而不是parallel某些系统上默认安装的moreutils 。
sort(1)可能耗尽空间/tmp; 如果是这样,您可以使用环境变量TMPDIR或标志为临时文件指定另一个区域-T=<tmpdir>
/tmp。