在亚线性空间中编辑距离


19

使用输入大小为次线性的工作空间来计算相同长度的两个字符串之间的精确编辑距离最著名的复杂度是什么?我假设输入以某种只读格式存储。这是先前研究的问题吗?

为了使问题更具体一点,空间怎么样,其中是每个输入字符串的长度。Θ(n)n


编辑。根据David Eppstein的回答,似乎一个好问题是,是否可以在多项式时间和空间。任何下限也将很有趣。Θ(n)


1
关于编辑:我认为您误会了一些东西。戴维·普斯坦的回答显示了问题是可解的NL,因此也P.
埃米尔耶扎贝克支持莫妮卡

1
...实际上,原始的Wagner-Fischer算法已经做到了。
EmilJeřábek在2014年

3
我假设编辑版本的目的是要求同时具有亚线性空间和多项式时间的算法。
David Eppstein 2014年

@DavidEppstein是的,完全正确。我已再次编辑以进行澄清。
felix

顺便说一句,假设标准定价模型为每场比赛/删除/插入1,则如果编辑距离为l,则实现编辑距离矩阵中最短路径的路径与主对角线的距离最多为l,然后使用O(l)空间计算编辑距离。因此,如果sqrt(n)空间很小(即小于sqrt(n)),则可以计算出编辑距离。只有当它很大时,这似乎很难。当然,在这种情况下,可以争论的是,您应该少关心。
Sariel Har-Peled 2014年

Answers:


16

只是为了使事情顺利进行,而不是试图解决这个问题:存在一种明显的非确定性算法,该算法使用对数形式的许多位空间(通过动态编程矩阵搜索单个路径),因此根据Savitch定理,存在一种具有空间确定性的算法。它的时间必须为准多项式n O log n 的形式,而不是指数形式。Ø日志2ññØ日志ñ

http://arxiv.org/abs/1106.4412中的编辑距离有一些空间下限,但我认为它们与您的问题版本不符。


您如何验证找到的路径是最佳路径?
伦比克

1
二进制搜索或顺序搜索,查找可以找到路径的最小距离,即没有超出决策和搜索问题的标准等效范围。这不会影响时间或空间的形式。
David Eppstein 2014年

@David我认为您是正确的,所以我删除了我的答案。
SamiD 2014年

2
它甚至可以在日志空间中计算吗?
伦比克
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.