从Maildir删除重复的邮件


10

我的IMAP服务器的Maildir中有一堆重复的消息。删除它们的最佳方法是什么?

一些相关点:

  • 共享Message-ID通常是重复项的足够好定义。一个很小的脚本将删除重复消息中的所有消息,但所有消息都可以。
  • 有时有必要基于共享消息正文查找重复项。共享在这里的合理定义是什么?按位等效吗?换行,转义,字符编码方面的怪异差异怎么办?
  • 有时,“重复”消息之间会有一些有意义的区别。复查“重复”消息集之间差异的最佳方法是什么?差吗?

Answers:



3

对于Linux中的通用文件,我使用fdupes utils删除重复的文件。我发现它也适用于Maildir邮件。


1
fdupes似乎仅适用于精确的重复项,而OP(隐式地)询问的是更复杂的重复模式。邮件由于两次发送.forward或由于头原因稍有不同,因此,尽管邮件本身是重复的,但是包含两个副本的两个文件却可能不是。
Tripleee'2

0

Gnome的Evolution [图形邮件用户代理]具有内置功能,可以删除重复的邮件。如本帮助页面上所述,它可以归结为:

  1. 选择可疑消息(或仅选择所有消息)
  2. 转到菜单邮件,选择删除重复邮件

Voilà。

PS Evolution可以在本地(MailDir,MH,Mbox)或通过IMAP访问您的消息。


0

我今天发现的最好的东西是Kevin Deldycke的maildir-deduplicate

  • X-MIMETrack默认情况下,它忽略标头,并使用SHA224摘要比较标头。
  • 它会自动删除重复项而无需确认;但是,有一个试运行模式,它允许预览哪些重复项将被删除。

我敢打赌,有人可以从Rick Sanders的delIMAPdups.pl(他的IMAP工具的一部分)中得到一些幻想。


maildir-deduplicate 移到了新位置,所以我更新了链接。但是,您的信息现在已过期。
亚当·斯皮尔斯

我已对此进行了更新,以便不再引起误导的过时信息。
亚当·斯皮尔斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.