我需要获得1亿行文件的最后1000万行。
tail -n 10000000 $ in_file> $ out_file
但是上面的命令花了超过1天而且还在继续。我想我可以使用nice命令为进程分配更多优先级,但我想知道是否存在一种从根本上更好的方法。
硬盘还是SSD?
—
Makoto
1亿行是一个非常庞大的文件,不是吗?难道你不能把以前分成几个碎片的文件?这肯定会减少
—
鲁本斯
EOL
搜索,从而为您提供一些加速。固态硬盘也是一个非常棒的扩展镜头(:
大概是多长一行(或文件有多大,以字节为单位)?线条的尺寸是否合理均匀,还是有短线和长线要担心?如果标准工具不能及时完成工作,那么您可能需要自己编写。令人恼火的是,你可能需要扫描文件的尾端至少两次,但可能是不可避免的。
—
Jonathan Leffler