我有100,000个小文件网址可供下载。想使用10个线程和流水线是必须的。我将结果连接到一个文件。目前的做法是:
cat URLS | xargs -P5 -- curl >> OUTPUT
是否有更好的选择可以显示整个操作的进度?必须从命令行工作。
“想要使用10个线程,并且必须使用流水线操作。我将结果连接到一个文件。”所以订单没关系?
—
Bobby
订单不是问题。标记为gnu-parallel好主意。是否有可能使用并行并仍然在卷曲中获得流水线?
—
William Entriken
当你这样做时,难道你没有混合文件吗?除非您的Web服务器是单线程的,否则我不会看到如何避免两个进程同时写入您的输出文件。
—
rici
对我来说,莽撞,混乱都不是问题。
—
William Entriken