1
Jaro-Winkler和Levenshtein距离之间的区别?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 6年前关闭。 改善这个问题 我有一个用例,需要对多个文件中的数百万条记录进行模糊匹配。我为此确定了两种算法:Jaro-Winkler和Levenshtein编辑距离。 当我开始探索两者时,我无法理解两者之间的确切区别。似乎Levenshtein给出了两个字符串之间的编辑次数,而Jaro-Winkler提供了0.0到1.0之间的归一化分数。我不了解该算法。 由于我需要使用任一种算法,因此我需要知道这两种算法之间的根本区别是什么。 其次,我想了解这两种算法之间的性能差异。