我有大量且不断增长的文本文件集,这些文件都非常小(少于100个字节)。我想比较每个可能的文件对,并注意重复的文件。我可以编写一个Python脚本来执行此操作,但是我想知道是否有一个现有的Linux命令行工具(或者可能是这些工具的简单组合)可以执行此操作?
更新(响应mfinni注释):文件全部在一个目录中,因此它们都有不同的文件名。(但是它们都有一个共同的文件扩展名,可以很容易地用通配符选择它们。)
我假设文件名不是重复的,只有内容吗?
—
mfinni 2010年
pixelbeat.org/fslint如果您正在链接上方查找内容,则可能会帮助您完成此操作。:)
—
Rajat 2010年