使用随机DFA分隔单词


15

有关DFA的有趣的开放问题之一,关于DFA 是否还有任何未解决的问题?是DFA的大小所需的分开长度的两个字符串。我很好奇,是否有关于随机DFA分离两个给定(非随机)字符串的功能的结果。n

显然,状态足够多的随机DFA很有可能会分隔字符串。具体地,如果,随机DFA与ø Ñ 状态永远也不可能重新访问相同的状态,一旦达到所述第一位置ùv不同,并因此分离üvu,vΣnO(n)uvuv

我们可以做得更好吗?理想情况下,什么是最小 ST,一个随机DFA与˚F Ñ 状态中隔离长度的字符串Ñ阳性概率(或概率也许1 / 2)?简短的搜索并没有得出很多有关随机DFA属性的结果;我只能找到http://arxiv.org/abs/1311.6830f(n)f(n)n1/2


正概率在这里并不是特别有用的条件,因为它只是对未解决问题的重述。高概率仍然可能很有趣。
2014年

1
“分离”是什么意思?接受一个,拒绝另一个?如果是这样,那么状态是否足以满足要求?O(n)
2014年

是的,分隔意味着正好接受一个。您是对的:最琐碎的分离参数实际上需要状态(我在上面写的是错误的),尽管如果不足以满足需求,我会感到惊讶。O(n2)
2014年

1
您难道不希望范围取决于单词之间的差异吗?似乎只有一个字母不同的单词会更难于随机区分,因为您需要在一个过渡中进行区分,而非常不同的单词会更容易。[概括地说,您可以忽略最长的公共前缀(从中可以达到随机状态);然后,不同的字母会将您发送到相同状态或不同状态;然后,如果状态不同,则需要查看重新同步和保持同步的概率(再次取决于单词而开始)...]
a3nm 2014年

是的,像开放性问题一样,我对最难区分的词语感兴趣。仅在几个地方不同的单词已经可以用状态分开,因此它们不太可能是困难的情况。O(logn)
2014年

Answers:


2

[编辑:此答案无效,请参阅注释。]

这只是一个非正式的想法,我不知道它是否有帮助,但是作为注释太长了。另外,我对随机DFA一点都不熟悉,所以也许我对您应该如何推断它们的概率有一个错误的直觉,但是希望这并非完全没有价值。

我会假设你的边界应该取决于有多少u差异。如果他们不这样做,似乎很明显,我认为最坏的情况是字符串只能通过他们的第一个字符不同(串在一组不同的X位置有被告知除了比串在一组不同的机会多Ÿ X位置,我想说的是,尽早消除差异会为您提供重新同步的机会)。vXYX

我还将研究单词被区分的可能性,即它们达到不同的状态。我猜您将需要根据您的随机DFA如何分配最终状态来适应被接受还是被拒绝。如果每个状态的最终概率为1/2,则当字符串以相同状态结束时,它们将不被区分;当字符串的状态为不同状态时,则它们被概率为1/2。

现在,我会考虑这个词从获得üv如下:w ^ = 1,如果ü = v W ^ = 0wuvwi=1ui=viwi=0,否则。我认为很明显是关于uv唯一值得考虑的事情。wuv

现在,定义的概率,我们是在相同的状态读取长度的前缀后üv,以及qp(i)iuv则不是。q(i)=1p(i)

我认为当w i + 11时,我们有。直观地说,我们在相同的状态看完之后+ 1个字母或者当我们阅读后,在相同的状态,或者当我们在两个不同的(随机)状态,我们画了两个过渡到随机状态,他们碰巧是同一个人。同样,我们有p i + 1 = 1p(i+1)=p(i)+q(i)/nwi+11i+1i w i + 1 0时:无论从何处开始,您都将绘制两个随机状态。p(i+1)=1/nwi+10

据此,我认为您可以在读取v之后计算出处于相同状态的概率。uv


不幸的是,显然uv唯一有趣的属性。看到这一点的最简单方法是,将任何非平凡w0 n区别开来的概率很零。实际上,无论n为何,只有两个状态就足够了。但是,如arxiv.org/pdf/1103.4513.pdf中所述,存在长度为n st no o log n )的单词u vwuvw0nnu,vno(logn) DFA可以区分。这与p i )的公式矛盾p(i)
2014年

1
需要说明的是,如果DFA转换是字符串索引的随机函数,则您的公式将是正确的;由于它们与索引无关,因此概率以相当复杂的方式关联。
2014年

恐怕我不明白你的反例。有一个 prba,具有两个状态,分别区分0 nw 0 n,好;也许有些长度为n的单词无法与o log n 状态区分开。但这与我声称w是唯一重要的东西或我的p i 公式相矛盾?>00nw0nno(logn)wp(i)有何?至于相关性,我发现您提到的可能有很多类似之处,但我还不明白为什么它会完全失败。如果您两次经历相同的状态,则存在相关性,但是是否有理由认为它会平均影响某个方向?
a3nm

如果,则将uv区分为正概率。但是,对于足够大的n和少量的状态,我们知道对于某些uv p n = 1。由于您的公式暗示如果p i < 1,p i + 1 = p i i / np(n)<1uvnp(n)=1uvp(i)<1,您的公式没有捕捉到某些 u v无法区分的事实。p(i+1)=p(i)+(1p(i))/n=p(i)(11/n)+1/n<1uv
2014年

啊...对,我明白。如果没有小的DFA可以区分两个单词,那么任何一个随机 DFA都不能区分它们。因此,我的方法确实存在问题,因为这些相关性,似乎最终应降至零的概率。抱歉,提供的答案不正确。q(i)
2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.