我有一个庞大的音乐库(全部为mp3),但是我的一些音乐几乎相同,但:
- 也许再过一两秒钟
- 与另一首歌曲约有97%
- 或另一个比特率。
有没有找到这些重复项的方法?如前所述,它们没有相同的大小,名称或SHA1-hash。
我有一个庞大的音乐库(全部为mp3),但是我的一些音乐几乎相同,但:
有没有找到这些重复项的方法?如前所述,它们没有相同的大小,名称或SHA1-hash。
Answers:
有一个名为Echoprint的开源声学指纹识别系统,您可能需要检查一下我是否要对大集合进行重复数据删除。我以前从未使用过它(只是偶然发现了它),但是能够在本地执行此操作听起来很棒。
使用MusicBrainz的Picard。它扫描音乐以生成“指纹”,然后将其与在线数据库进行比较以识别音乐(提取诸如艺术家,专辑等的所有信息)。
识别出歌曲之后,它可以将它们组织到自定义目录和名称结构中,您可以使用它来查找重复项。
与linux完全兼容。