我有两个分区,正在寻找它们之间的编辑距离。
这样,我想找到从分区A到分区B所需的节点到不同组的单个转换的最小数量。
例如,从{0 1} {2 3} {4}
到的距离为{0} {1} {2 3 4}
2
搜索之后,我发现了这篇论文,但是a)我不确定他们是否考虑了在他们距离内的组的排序(我不在乎)b)我不确定它是如何工作的,c)没有参考。
任何帮助表示赞赏
我有两个分区,正在寻找它们之间的编辑距离。
这样,我想找到从分区A到分区B所需的节点到不同组的单个转换的最小数量。
例如,从{0 1} {2 3} {4}
到的距离为{0} {1} {2 3 4}
2
搜索之后,我发现了这篇论文,但是a)我不确定他们是否考虑了在他们距离内的组的排序(我不在乎)b)我不确定它是如何工作的,c)没有参考。
任何帮助表示赞赏
Answers:
该问题可以转化为分配问题,也称为最大加权二分匹配问题。
首先请注意,编辑距离等于需要从一组更改为另一组的元素的数量。这等于元素总数减去不需要更改的元素数目。因此,找到不更改的最小元素数量等同于找到不更改的最大顶点数量。
让和B = { B是分区 [ 1 ,2 ,。。。,n ]。同样,在不失一般性的前提下,令(允许的,因为 Ë d 我吨,...,乙ķ全部为空集。则不变的最大顶点数为:)。然后让乙升+ 1,乙升+ 2
其中是的置换[ 1 ,2。
这正是顶点为,...,A k,B 1,...,B k且边为权重为|对(A i,B j)的赋值问题。甲我 ∩ 乙Ĵ。可以在 O (| V | 2 log | V | + | V | | E中解决时间中解决。
看看本文的PDF
http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.0030160
我想您所需要的正是编辑距离的定义。“引用”分区将是(任意)两个分区之一,另一个分区就是另一个分区。还包含相关引用。
最好,罗布
可能不正确的周日凌乱的想法:
Wlog,令为具有更多集合的分区,P 2为另一个。首先,分配互不相同的名字ñ 1(小号)∈ Σ你套P 1。然后,通过以下规则找到集合P 2的最佳命名n 2(S ):
现在,你可以考虑你的元素的比特串WRT无论是分区,即和w ^ 2 = ñ 2(1 )·&⋯ ·&ñ 2(ñ )(与ñ Ĵ(我)= ñ Ĵ(小号),我∈ 小号∈ P Ĵ)。然后,期望量是,即位串之间的汉明距离。