多年来,我在许多不同的机器上积累了很多照片。
我想我大多数时候都将它们保存在yyyy / mm /目录结构中,但是特别是对于一些较旧的图片,似乎有很多重复项。
识别重复项的最佳方法是什么?有好的工具可以做到这一点,还是我必须自己写点东西?
多年来,我在许多不同的机器上积累了很多照片。
我想我大多数时候都将它们保存在yyyy / mm /目录结构中,但是特别是对于一些较旧的图片,似乎有很多重复项。
识别重复项的最佳方法是什么?有好的工具可以做到这一点,还是我必须自己写点东西?
Answers:
许多程序可以根据图像内容查找重复项。一些资产管理应用程序会做到这一点,并且还有专门的程序。如果您的Google“检测到重复的图像”,您会看到很多选择。查看哪些适用于您的平台。
另一种解决方案是使用“忽略重复选项”简单地导入文件。免费的Picasa可以做到。
dupeGuru Picture Edition是适用于Windows,Mac OS X和Linux的可自定义的重复图像查找器。
dupeGuru有几种版本(标准版,音乐版和图片版),图片版使您可以通过位图块比较算法以及其他方法(例如EXIF原始图像时间戳或文件完全相同)来查找视觉上相似的图像。 。
它具有多种其他有用的功能,例如排除文件夹,对iPhoto / Aperture库的支持以及对如何检测重复项以及如何处理重复项的自定义功能。
Picasa具有重复的文件查找器,但是很难告诉您正在查看的内容。点击Tools
> Experimental
> Show Duplicate Files
。它可以工作,但要注意要删除的内容。
另一个选择是免费的 “快速复制文件查找器”:
我很喜欢这个就是它允许你决定你之前预览的图片并不需要重复。
只要文件相同,效果就很好,但是如果您要查找相似的照片(例如,相同的照片,但已调整大小,旋转或操作),则可能需要查看其升级版本:
我没有使用过该程序,但使用了非常相似的程序(不再制作),发现它非常有用。他们有免费下载,因此值得一试。
digikam(Linux,Windows和Mac)有一个标题为边栏的版本
“版本”选项卡显示照片的历史记录和保存的版本。使用右上角的三个按钮,您可以在简单的已保存版本列表,树形视图和组合列表之间进行选择,该列表显示版本以及对所选照片执行的操作。
和另一个标题搜索
快速搜索是搜索对话框顶部(左侧边栏)的自适应搜索框,它为您提供了一种简单的方法,即可以通过单个查询来搜索digiKam数据库。您可以在“搜索:”文本字段中输入任何参数,它将用于确定结果。例如,您可以输入字符串“ birthday”在整个数据库中搜索所有元数据文本字段中单词“ birthday”的出现,或输入“ 05.png”以搜索特定图像文件名“ 05.png”(无需在正则表达式中转义)。
(它还有一个高级设置,允许进行多个布尔搜索)
另一个标题为模糊
digiKam使用特殊技术(Haar算法)通过冗长的数字来表征每个图像,该技术可以通过比较此计算出的签名来比较图像。任何两个图像签名之间的数值差异越小,它们彼此之间就越相似。该技术在digiKam中具有三种实现:...
尽管生成“签名”并在大量图像上对其进行交叉检查可能是一个缓慢的过程。另请注意,有些人不喜欢它,因为它是一个KDE项目,并未与其他桌面环境完全集成,并且它尝试通过图像下载,目录/关键字,RAW开发,图像处理等方式成为一个完整的应用程序。包括在内。
在Mac上,使用PhotoSweeper(http://overmacs.com/)取得了出色的成功。它可以直接通过文件系统或通过流行的摄影软件(如Apple Photos和Adobe Lightroom)工作。它能够找到完全相同的图像或相似的图像文件。售价10美元,实在太便宜了。
DeDup-Image是一个bash脚本,即使元数据不同,它也可以自动查找和删除相同的图像/重复的照片。它始终保留最大的副本,该副本可能包含最多的元数据,并根据真实图像信息的SHA256-HASH删除所有其他找到的对象,而不包含任何元数据。由于脚本需要处理每个图像中没有元数据的变体,因此与只能搜索完全相同的文件的程序或脚本相比,它要慢一些并且占用大量处理器。