L_k-distinct的最小NFA大小的界限


18

考虑由Σ上的所有k个字母字符串组成的语言,使得没有两个字母相等:LkdistinctkΣ

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

这种语言是有限的,因此是有规律的。具体来说,如果|Σ|=n,然后|Lkdistinct|=(nk)k!

接受这种语言的最小非确定性有限自动机是什么?

我目前有以下宽松的上限和下限:

  • 我可以构造的最小NFA具有4k(1+o(1))polylog(n)状态。

  • 以下引理意味着2k个状态的下界:

LΣ为常规语言。假设有nP={(xi,wi)1in}使得xiwjL当且仅当i=j。然后,任何接受L的NFA至少具有n个状态。

  • 另一个(琐碎的)下界是log(nk),这是该语言最小DFA大小的对数。

我也对仅接受L_ {k-distinct}的固定分数(0<ϵ<1)的NFA感兴趣,如果自动机的大小小于\ epsilon \ cdot 4 ^ {k(1 + o( 1))} \ cdot polylog(n)Lkdistinctϵ4k(1+o(1))polylog(n)


编辑:我刚开始赏金在文本中有一个错误。

我的意思是我写k = O(log(n))时可以假设k = polylog(n k=polylog(n)k=O(log(n))

编辑2:

悬赏即将结束,因此,如果有人对赚钱的一种更简单的方式感兴趣,请考虑以下语言:

L(r,k)distinct:={w:w包含k不同的符号,并且没有符号出现超过r}

(即L(1,k)distinct=Lkdistinct)。

与注释中的构造相似的构造为提供了大小的自动机。O(ek2klog(1+r)poly(n))L(r,k)distinct

这可以改善吗?我们可以为该语言显示的最佳下限是多少?


2
您能否描述您的上限NFA?
mjqxxxx 2014年

由于我们仍在研究中,并且我还没有完成证明,因此我还不能写。相反,我将描述一个更简单的大小为:取一个完美的哈希族。每个这样的哈希都是一个函数。这意味着,对于个大小为每个子集,都存在一个函数,以便将子集的每个项目映射到不同的数字。散列后,得到的字母具有字母,因此大小为的自律可以接受语言。O((2e)k2O(log(k))log(n))(n,k)Hh:[n][k][n]khHk2kLkdistinct
RB

4
下限给出仅计算NFA经过精确的步后可以进入的状态数。我不认为我知道,让显著更好的界限比什么可以比通过看后会发生什么情况可以得到总规模的任何证明方法的步骤,对于一些。但是在这里,每就有一个NFA,它只能在正好是个状态之后才处于个状态之一。(2o(1))kk/2ttt(2+o(1))kt
2014年

3
证明(我之前的主张):最困难的情况是;选择大小分别为不同的随机子集(字母符号中的一个),并构造一个具有每个的状态的NFA,并通过第一个路径导致它符号都不同并且包含在,并且从中可以得到一个接受路径,前提是以下符号都不同并且包含在的补码中。一个计数参数将显示whp(在的随机选择上t=k/22kpoly(k,logn)SintitSiktSiSi的),该NFA实际上将接受所有所需的语言。
2014年

3
在先前的构造中,构建NFA的最简单方法是针对长度每个可能前缀和长度每个后缀都有一个状态。相反,可以使用相同的随机结构递归构建NFA的前缀部分和后缀部分(但现在分别仅在及其补码内),这将使总大小为。j<tj>ktSi(4+o(1))k
2014年

Answers:


2

这不是答案,而是我认为可以改善下限的一种方法。让我们削减问题后字母读。表示的家庭的元素集由和家族元件组由。表示在通过读取元素(以任何顺序)之后可以达到的状态,以及在通过读取元素(以任何顺序)之后可以达到接受状态的状态。仅当且仅当我们需要aa[n]Ab=ka[n]BASABTBSATBAB=。这已经为所需状态数提供了一个下限,我认为这可能会带来一些不平凡的事情。

从本质上讲,这个问题要求线形图(部分)已知的超图的顶点数量有一个下限。例如,Bollobas研究了类似的问题,并且有几种已知的证明方法可能有用。

2014年3月24日更新:实际上,如果上面的超图可以在个顶点上实现,那么我们还获得了长度为的非确定性通信复杂度协议,用于输入集大小为和集合不相交(实际上是两个问题是等效的)。瓶颈当然是当,为此,我只能在Eyal和Noam的书中找到以下内容:由标准概率论证明。不幸的是,我(尚未)找到关于此问题的足够好的下界,但假设以上内容很清晰,它将给出一个下界slogsaba=b=k/2N1(DISJa)log(2kloge(na))Ω(2klogn) 统一您提到的两个下限。


1
感谢@domotorp的回答。这似乎很像我用于原始问题下界的引理的证明,但是没有指定实际的和,因此没有可数的界限。您对上述问题的评论表明边界无法通过该方法进行改进,您认为这样做会更好吗?xiyi2k
RB

3
上面我的评论的全部要点是,这些技术不能给出以上的下限。这的确使这个问题对我很有趣。(2+o(1))k
Noam 2014年

@Noam:令k = 2,a = b = 1。由于每个必须不同,因此我们已经得到下界。lognSA
domotorp 2014年

1
@domotorp:隐藏一个因子:这是对最坏情况的分析,其中:从固定的和开始,随机选择一个子集在字母中,我们有。现在随机选择这样的集合,那么对于其中至少一个这样的集合发生的概率是。如果我们选择,那么对于所有不相交集和(大小为o(1)O(klogn)a=b=k/2ABSnPr[ASandBSc]=2kr2k1exp(r)r=O(log(nk))=O(klogn)ABk/2)。在此构造中,此类的总数为。SO(2kklogn)
2014年

2
@Noam:对不起,但我从未见过隐藏在,特别是因为的问题也是很有趣的恕我直言。但是RB询问是正确的。logno(1)k<<lognk=polylogn
domotorp 2014年

0

一些工作正在进行中:

我正在尝试证明的下限。这是一个我很确定会给出这样一个下限的问题:找到最小值使存在函数保留不相交性,即 iff。我很确定的下限几乎立即意味着我们的问题的下限。大致对应于NFA在读取输入的前符号后可以到达的节点集,而这组4ktf:{S[n],|S|=k/2}{0,1}tS1S2=f(S1)f(S2)=t2k22k=4kf(S)k/2k/2符号是。S

我认为这个问题的解决方案可能已经在通信复杂性文献(尤其是在处理不相交问题的论文中;也许一些矩阵秩参数会有所帮助)中或在有关编码的文献中(例如像这样)已经知道


2
我上面的评论表明,这种方法无法胜过(2+o(1))n
Noam 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.