Questions tagged «fl.formal-languages»

形式语言,语法,自动机理论

4
计算常规语法接受的单词
给定一种常规语言(NFA,DFA,语法或正则表达式),如何计算给定语言中接受单词的数量?“正好有n个字母”和“最多n个字母”都令人感兴趣。 玛格丽特·阿克曼(Margareta Ackerman)撰写了两篇有关NFA接受的单词枚举的相关主题的论文,但是我无法对其进行修改以有效计数。 似乎常规语言的受限制性质应该使对它们的计数相对容易-我几乎期望公式比算法更多。不幸的是,到目前为止,我的搜索没有发现任何内容,因此我必须使用错误的术语。

3
是否存在捕获上下文无关语言的正则表达式扩展?
在许多涉及上下文无关文法(CFG)的论文中,在那里出现的此类文法示例经常承认对其生成语言的简单刻画。例如: S→aaSbS→aaSbS \to a a S b S→S→S \to 生成,{a2ibi|i≥0}{a2ibi|i≥0}\{ a^{2i} b^i | i \geq 0\} S → a a S b S →S→aSbS→aSbS \to a S b S→aaSbS→aaSbS \to a a S b S→S→S \to 生成,然后{aibj∣i≥j≥0}{aibj∣i≥j≥0}\{ a^i b^j \mid i \geq j \geq 0 \} S → b S …

5
从Earley解析器恢复解析森林?
我最近在阅读Earley解析器,并认为它是迄今为止我见过的最优雅的算法之一。但是,从传统意义上讲,该算法是识别器,而不是解析器,这意味着它可以检测字符串是否与特定的CFG匹配,但不会为其生成解析树。我的问题是如何不恢复解析树,而是恢复给定输入字符串的所有可能解析的解析林。 在Grune和Jacob的“解析技术:实用指南”中,他们说明了可用于从Earley识别器的结果中恢复解析森林的算法,但是该算法基于Unger的解析方法,其运行时间为O(n k + 1),其中k是语法中最长产生式的长度。这意味着运行时不是语法大小的多项式。此外,Earley关于该算法的原始论文提出了一种用于恢复解析森林的算法,该建议是不正确的(例如,参见Tomita的本文的第762页),尽管许多消息来源仍将其作为恢复解析森林的适当方法。 。 我的问题是,是否可以在多项式时间内为给定的输入字符串恢复一个解析森林。我在这里找到了一篇论文,该论文提供了一种使用PDA模拟为任何解析生成立方大小的解析森林表示形式的算法,因此这似乎应该可行,但是我还没有找到任何方法来做到这一点。理想情况下,我希望不将输入语法转换为CNF(确实可以解决问题),因为生成的解析林将非常混乱。 谢谢你尽你所能的帮助!


1
半语言的复杂性
对于超过任何语言,定义 在的话,由所有的为其中有一个相等的长度,使得。Σ * 大号1 / 2 = { X ∈ Σ *:X Ý ∈ 大号,ÿ ∈ Σ | x | } 。大号1 / 2 X ý X ÿ ∈ 大号大号LLΣ∗Σ∗\Sigma^*大号1 / 2= { X ∈ Σ∗:x y∈ 大号,ÿ∈ Σ| x |}。L1/2={x∈Σ∗:xy∈L,y∈Σ|x|}.L_{1/2} = \{x \in \Sigma^* : xy\in L, y\in\Sigma^{|x|} \}.大号1个 …

1
多项式大小的DFA识别的语言
对于一个固定的有限字母表,正式语言超过是规则,如果存在一个确定性有限自动机(DFA)超过它接受准确。大号ΣΣ\SigmaLLLΣΣ\SigmaΣΣ\SigmaLLL 我对“几乎”规则的语言感兴趣,因为它们可以被大小自动增长的自动机系列识别,自动机系列的大小随词长的增长呈多项式增长。 形式上来说,如果对于每个单词,则DFA 家族可以识别形式语言,令,在如果接受(无论其他接受),然后让我将p常规语言定义为多项式大小的PTIME可计算 DFA系列识别的语言,即是多项式,使得全部LLL 瓦特∈ Σ * Ñ = | w | 瓦特大号甲Ñ瓦特甲我(An)(An)(A_n)w∈Σ∗w∈Σ∗w \in \Sigma^*n=|w|n=|w|n = |w|wwwLLLAnAnA_nwwwAiAiA_iP | A n | ≤ P (Ñ )ñ(An)(An)(A_n)PPP|An|≤P(n)|An|≤P(n)|A_n| \leq P(n)nnn。(这个名称是“ p-regular”,这是我编写的,我的问题是要知道是否存在另一个名称。请注意,就排列自动机而言,这与p-regular语言并不相同。) 这类p常规语言当然包括常规语言(对于所有都取,其中是一些识别常规语言的DFA);但这是它的严格超集:例如,众所周知,是上下文无关的,但不是常规的,但是它是p-常规(只需要计数次出现的和次出现的)。但是,由于我要求自动机必须是多项式大小的DFA,因此某些形式语言(实际上是一些无上下文语言)不是Ñ 甲{ 一个Ñ b Ñ | Ñ ∈ Ñ } 甲Ñ Ñ 一个Ñ bAn=AAn=AA_n = AnnnAAA{anbn∣n∈N}{anbn∣n∈N}\{a^n b^n \mid n \in \mathbb{N}\}AnAnA_nnnnaaannnbbbp-regular:例如,回文的语言不是p-regular,因为从直观上讲,当您阅读单词的前半部分时,您需要具有尽可能多的不同状态,因为您需要准确地将前半部分与后半部分匹配 …

6
确定复杂度下界的先进技术
你们中有些人可能一直在关注这个问题,该问题由于尚未达到研究水平而被关闭。因此,我正在提取问题的一部分,它是在研究水平上。 除了“简单”的技术(例如归结为排序问题或EXPTIME完全问题)之外,还使用了哪些技术来证明问题的时间复杂性的下限? 特别是: 在过去的十年中开发了哪些“尖端”技术? 是否可以应用抽象代数,分类理论或其他通常“纯”数学分支的技术?(例如,我经常听到提到排序的“代数结构”,而没有任何真正的解释。) 对于下限复杂度,什么是重要但鲜为人知的结果?

1
是否可以在线性时间内解析所有明确的语法?
当修改非规范的LR解析时,我想到了一种解析方法(具有无限大的表,这使其不切实际)能够在时间内准确解析明确的语法,我想知道是否有可能做得更好:Ø (ñ2)Ø(ñ2)O(n^2) 是否可以在线性时间内解析所有明确的语法? 我很确定我读过某个地方的情况,但是在搜索互联网时并没有出现这种情况。在这里提出了相同的问题,但据我所知没有给出任何答案。

2
协议分区号和确定性的通信复杂性
除了关系R的(确定性)通信复杂度 cc(R)cc(R)cc(R),所需通信量的另一基本量度是协议分区号p p (R )。这两个量度之间的关系是已知的,直到一个恒定因子为止。Kushilevitz和Nisan(1997)的专着给出了RRR pp(R)pp(R)pp(R) cc(R)/3≤log2(pp(R))≤cc(R).cc(R)/3≤log2⁡(pp(R))≤cc(R).cc(R)/3 \le \log_2(pp(R)) \le cc(R). 关于第二不等式,很容易得到(无限家族)关系与日志2(p p ([R )) = C ^ C ^ (- [R )。RRRlog2(pp(R))=cc(R)log2⁡(pp(R))=cc(R)\log_2(pp(R)) = cc(R) 关于第一个不等式,Doerr(1999)表明我们可以用c = 2.223代替第一个界限中的因子。如果有的话,第一个界限可以提高多少? c=3c=3c=3c=2.223c=2.223c=2.223 描述复杂性的另一个:改进常数2.223将导致正则表达式的最小大小的下限得到改善,该下限等于给定DFA描述某种有限语言的正则表达式的最小大小,请参阅Gruber和Johannsen(2008)。 2.2232.2232.223 虽然不直接相关的这个问题,Kushilevitz,Linial和斯基(1999),获得了关系与Ç Ç ([R )/(2 - Ö (1 ))≥ 日志2([R p ([R )),其中[R p (ř )是矩形分区号。RRRcc(R)/(2−o(1))≥log2(rp(R))cc(R)/(2−o(1))≥log2⁡(rp(R))cc(R)/(2-o(1)) \ge \log_2(rp(R))rp(R)rp(R)rp(R) 编辑:请注意,上述问题与布尔电路复杂度中的以下问题等效:最佳常数是什么,以便每个叶子大小L的布尔DeMorgan公式最多可以转换为等效的深度公式c log …

3
从类别理论的角度看常规语言
我注意到字母表上的常规语言可以自然地看作是一个姿势,甚至是一个格子。此外,串联与空语言一起在此类别上定义了严格的单项式结构,该结构通过连接进行分配(我不确定是否满足)。这在常规语言的理论或实践中是否有用?是否有一些不错的附加条件,例如我们可以将Kleene星定义为一个吗?εΣΣ\Sigmaϵϵ\epsilon 这是在Coursera的“编译器”课程中提出的一个问题的副本:https ://class.coursera.org/compilers/forum/thread ? thread_id = 311

4
使用下推自动机证明无上下文语言的抽水引理
可以通过考虑识别所研究语言的有限状态自动机,选择长度大于其状态数的字符串以及应用信鸽原理来证明常规语言的抽动引理。在对上下文无关语言泵引理(以及奥格登引理这是稍微更普遍的),但是,考虑研究语言的上下文无关文法,选择一个足够长的字符串,并期待在解析树证明。 鉴于这两个泵送引理的相似性,您希望可以通过考虑识别语言而不是语法的下推自动机,以与常规的类似的方式来证明与上下文无关的一个。但是,我没有找到关于这种证明的任何参考。 因此,我的问题是:是否有证据证明无上下文语言仅涉及下推自动机而不涉及语法?



5
一类特殊的语言:“循环”语言。知道吗
在有限字母Sigma上定义以下“循环”语言类。实际上,该名称已经存在,用来表示看起来似乎与DNA计算领域不同的事物。AFAICT,这是另一种语言。 语言L是所有的话圆形IFF在,我们有:Σ *wwwΣ∗Σ∗\Sigma^* k > 0 w kwww属于L如果且仅当对于所有整数,属于L.k>0k>0k > 0wkwkw^k 这类语言是否已知?我对常规的循环语言感兴趣,尤其是: 他们的名字,如果他们已经知道 在自动机(尤其是DFA)的情况下,问题的可判定性是否接受的语言是否符合上述定义

1
明确的上下文无关语言的等效性可以确定吗?
众所周知,对于一般的无上下文语言来说,等效问题是无法确定的。但是,我知道的所有有关这一事实的证据似乎都包含一些模棱两可的上下文无关文法。因此,我想问是否知道问题是否仍然不确定,同时又将自己局限于明确的上下文无关语言。就是说,给定先验地赋予两个明确的上下文无关文法,它们是否等价? 我发现这个问题有点令人着迷,因为众所周知,确定性上下文无关语言的等效性是可以决定的,尽管这种结果远非琐碎...另一方面,我可能一直有一些无法确定性的简单原因俯瞰。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.