Questions tagged «fl.formal-languages»

形式语言,语法,自动机理论

1
给定一个PDA M,使L(M)在DCFL中,构造一个DPDA N,使L(N)= L(M)
是否有可能构建一种算法,以将下推自动机连同输入作为该自动机接受的语言是确定性上下文无关语言并输出确定性下推自动机的承诺作为输入,而确定性下推自动机恰好接受所接受的语言由?L (M )N M中号MM大号(中号)L(M)L(M)ñNN中号MM 一个等效的问题是构造一种算法,该算法将下推自动机(如上所述,保证是确定性的)和确定性下推自动机。如果则输出为yes,如果则输出为no。L (M )N中号MM大号(中号)L(M)L(M)ñNN大号(中号)= L (N)L(M)=L(N)L(M) = L(N)大号(中号)≠ L (N)L(M)≠L(N)L(M)\neq L(N) 我相信解决第一个问题的算法将通过确定性下推自动机的等价性的确定性给出解决第二个问题的算法。我认为解决第二个问题将意味着解决第一个问题,因为我们枚举了所有确定性下推自动机,并对它们逐个运行算法,一旦得到一个yes实例,便输出该自动机。 我想知道是否有人对此有所了解?也许这是已知问题和/或已知解决方案?顺便说一句,我相信如果引入限制说PDA生成的语言是一个群体的单词问题,这是可以决定的。


1
概率自动机简介
我在哪里可以找到介绍概率自动机和他们认识到什么(某些职能从文字到)?对于概率确定性自动机(DFA)所识别的“规则语言”,是否存在概率自动机可识别的此类功能的标准术语?[0,1][0,1个][0,1] 我正在寻找一种方法,类似于研究DFA和常规语言的基本问题,例如表达性,闭包性和可判定性。 这个和这个似乎并不是我想要的。

1
复制语言的状态复杂度是多少?
设数字。考虑以下语言L n = {ñnn。大号ñ= {w w|瓦特∈ { 0 ,1 }ñ}Ln={ww|w∈{0,1}n}L_n = \{ \; ww \; \vert \; w \in \{0,1\}^{n} \; \} 换句话说,是长度为2 n的复制字符串的集合。大号ñLnL_n2 n2n2n 考虑下面的状态复杂度函数,使得s (n )是最小的下推自动机中识别L n的状态数。ssss (n )s(n)s(n)大号ñLnL_n 问题:您可以正式证明任何有意义的下界吗?s (n )s(n)s(n) 我的猜想: 。s (n )= 2Θ (n )s(n)=2Θ(n)s(n) = 2^{\Theta(n)} 已知UPPERBOUND: 。小号(Ñ )≤ p Ô 升ý(Ñ )⋅ …

2
分隔单词列表
正式语言中存在一个开放问题,称为分离问题;简单来说就是给定两个长度为不同字符串,“分离”它们需要多大的DFA,这意味着可以接受一个字符串而拒绝另一个字符串。nnn 这里有一些相关论文1,2。(我还有一些,但我没有足够的声誉来发布它们)。 这些都讨论了分离两个不同字符串的问题。我想知道在分隔字符串列表(即给定两个字符串列表和是否有任何工作,接受每个字符串并拒绝每个字符串都需要多大的DFA大小。这个问题等同于正则表达式高尔夫。B A BAAABBBAAABBB 我一直在处理一些基本问题,例如,其中一个列表的大小为还是所有字符串的长度都不同。111 我一直在搜索,但是没有找到任何有关此类问题的论文。在这方面有没有做过研究? 提前致谢。

2
最小化接受 -words(即无限单词)的自动机
最小化Büchi-Automata(或Müller-Automata)的标准方法是什么?从有限的字上转移通常的技术,即,如果被接受的状态中的“用尽”字是相同的,则将两个状态设置为相等,将不起作用。例如,考虑Büchi-Automoton接受具有无限数量的a的所有单词,a包含两个状态,即初始状态和最终状态,并且每次读取a都会输入最终状态,而每次a都会输入初始状态读取了不同的符号。通过上面的定义,这两个状态被认为是相等的,但是将它们折叠会产生由单个状态组成的自动机,从而接受每个单词。

1
可逆的图灵柏油?
这个问题是关于是否存在已知的可逆图灵tarpit,其中“可逆”在Axelsen和Glück的意义上是指“ tarpit”是一个更为非正式的概念(可能不是一个很好的词选择),但我会尽力解释我的意思。 我所说的“焦油” 一些计算模型被设计为以某种方式有用。其他人恰好是图灵完整的,实际上并没有任何特别有用的属性。这些被称为“ Turing tarpits”。例子包括Brainfuck语言,Rule 110细胞自动机语言和Bitwise Cyclic Tag语言(我喜欢它,因为它很容易实现并且任何二进制字符串都是有效程序)。 “ Turing tarpit”没有正式的定义,但是对于这个问题,我用它来表示一个相当简单的系统(就少量“规则”而言),“发生”是图灵完整的,没有其内部状态具有任何明显的语义含义。对我而言,最重要的方面是规则的简单性,而不是缺乏明显的语义。基本上,我们谈论的是斯蒂芬·沃尔夫拉姆(Stephen Wolfram)曾经写过的一本非常大的书,尽管他没有使用“ tarpit”一词。 我所说的“可逆” 我对可逆计算感兴趣。特别是,我对Axelsen和Glück所说的r-Turing完整的语言感兴趣,这意味着它们可以计算每个可计算的内射函数,并且只能计算内射函数。现在,从这个意义上讲,有许多可逆的计算模型,例如Axelsen的可逆通用图灵机或高级可逆语言Janus。(文献中还有许多其他示例;这是一个活跃的研究领域。) 应该注意的是,由于Bennett,Axelsen和Glück对r-Turing完整性的定义是与通常方法不同的可逆计算方法。在Bennett的方法中,允许系统产生“垃圾数据”,这些数据在计算结束时就被丢弃了。在这种情况下,可逆系统可以成为图灵完整的系统。但是,在Axelsen和Glück的方法中,不允许该系统生成此类“垃圾数据”,这限制了它可以计算的问题类别。(因此,“ r-Turing完成”而不是“ Turing完成”。) 注意:Axelsen和Glück纸位于付费专线后面。不幸的是-据我所知,目前还没有关于r-Turing完整性的任何非付费资源。如果有时间,我将尝试启动Wikipedia页面,但没有任何承诺。 我在寻找什么 上面提到的可逆计算的例子都相当“充满语义”。在大多数情况下,这是一件好事,但这意味着在每个时间步更新其状态所需的规则相当复杂。我正在寻找可逆计算的“目标”。也就是说,具有相当简单规则的任意系统或多或少会“恰好”成为r-Turing完整语言。我重申,对于我要寻找的内容没有正式定义,但是当我看到它时就会知道,而且我认为这是合理的事情。 我知道有很多事情符合要求,但并不完全符合要求。有几种可逆的细胞自动机已被证明是图灵完整的。 兰顿的蚂蚁(一种具有相当任意和非常简单的可逆状态转换功能的二维图灵机)只要其初始条件包含无限的重复模式,它也是图灵完备的。但是,对于这些系统,以不丢弃任何垃圾数据的方式定义从其状态到“输出”的映射并非易事。我对系统特别感兴趣,可以将其视为输入,对它执行一系列(可逆)转换,然后(如果终止)返回一些输出。 (我希望这个问题比我以前的有关可逆等效于lambda微积分的问题更容易回答。)

2
为什么线性化是安全属性,为什么安全属性是封闭集?
在南希·林奇(Nancy Lynch)的《分布式算法》(Distributed Algorithms)一书的第13章“原子对象”中,线性化(也称为原子性)被证明是安全性。也就是说,其相应的跟踪属性是非空的,前缀关闭的和限制关闭的,如第8.5.3节中所定义。非正式地,安全特性通常被解释为说某些特定的“坏”事情永远不会发生。 基于此,我的第一个问题如下: 线性化作为安全属性有哪些优势?文献中是否有基于此事实的结果? 在研究安全性和活动性的分类时,众所周知,安全性可以被描述为适当拓扑中的封闭集。在Amir Pnueli等人在1993年发表的论文《安全-进展分类》中。,采用度量拓扑。更具体地说,属性是字母一组(有限或无限)单词。属性由所有无限字,使得所有的前缀属于。例如,如果,则ΦΦ\Phi甲(Φ )σΣΣ\SigmaA(Φ)A(Φ)A(\Phi)σσ\sigmaΦ Φ = 一个+ b *阿(Φ )= 一σσ\sigmaΦΦ\PhiΦ=a+b∗Φ=a+b∗\Phi = a^{+}b^{\ast}A(Φ)=aω+a+bωA(Φ)=aω+a+bωA(\Phi) = a^{\omega} + a^{+}b^{\omega}。如果的某些最终特性则将最终特性定义为安全特性。度量无限字之间和被定义为0,如果它们是相同的,并且否则,在那里是他们同意的最长公共前缀的长度。使用此度量,可以将安全特性表征为拓扑上的封闭集。ΠΠ\PiΦ d (σ ,σ ')σ σ ' d (σ ,σ ')= 2 - Ĵ ĴΠ=A(Φ)Π=A(Φ)\Pi = A(\Phi)ΦΦ\Phid(σ,σ′)d(σ,σ′)d(\sigma, \sigma')σσ\sigmaσ′σ′\sigma'd(σ,σ′)=2−jd(σ,σ′)=2−jd(\sigma, \sigma') = 2^{-j}jjj 这是我的第二个问题: 如何在拓扑上将线性化描述为封闭集?特别是,基础集是什么,拓扑是什么?

2
局部自动机的状态数
确定性自动机A=(X,Q,q0,F,δ)A=(X,Q,q0,F,δ)\mathcal A = (X, Q, q_0, F, \delta)被调用kkk -local为k&gt;0k&gt;0k > 0如果对于每w∈Xkw∈Xkw \in X^k集合{δ(q,w):q∈Q}{δ(q,w):q∈Q}\{ \delta(q,w) : q \in Q \}包含至多一个元素。从直觉上讲,这意味着如果长度为k的单词导致一个状态,则该状态是唯一的,或者说与任意长度的单词不同wwwkkk&gt;k&gt;k> k,最后kkk符号确定其导致的状态。 现在,如果一个自动机kkk -本地,那么它不需要k′k′k' -本地一些k′&lt;kk′&lt;kk' < k,但它必须是k′k′k' -地方为k′&gt;kk′&gt;kk' > k造成一定的单词的最后一个符号|w|&gt;k|w|&gt;k|w| > k唯一确定状态(如果有)。 现在,我尝试连接状态数和自动机的kkk局部性。我猜想: 引理:设是ķ -local,如果| 问| &lt; k,则自动机也是| 问| -本地。A=(X,Q,q0,F,δ)A=(X,Q,q0,F,δ)\mathcal A = (X,Q,q_0,F,\delta)kkk|Q|&lt;k|Q|&lt;k|Q| < k|Q||Q||Q| 但是我没有证明,有什么建议或想法吗? 我希望通过这个定理推导出一些有关的自动机这是状态的数量不 -本地所有ķ ≤ ñ给出一个固定的ñ &gt; 0,但ķ …

2
生成语言的最小布尔电路
考虑一个非空语言长度的二进制字符串的ñ。我可以描述大号用布尔电路Ç与Ñ输入和一个输出,使得Ç (瓦特)为真当且仅当瓦特∈ 大号:这是公知的。大号LLñnn大号LLCCCñnnC(w )C(w)C(w)w∈Lw∈Lw \in L 然而,我想表示用布尔电路ç '与ñ输出和一定数目的输入,比如米,使得该组的输出值的Ç '每个的2 米可能的输入是完全大号。LLLC′C′C'nnn mmmC′C′C'2m2m2^mLLL 给定,如何找到最小尺寸的电路C ',复杂度是多少?关于第一类电路(C)和第二类电路(C ')的大小的已知界限或找到它们的复杂性之间是否存在任何关系?LLLC′C′C'CCCC′C′C' (观察到以下意义上的某种对偶性:给定,我可以通过评估电路轻松确定输入单词w是否在L中,但是一般来说,通过查找L在L中找到某个单词通常是NP难的给定C ′,给定C ′,同样很难确定L是否有输入单词w,因为我必须查看赋值是否产生w作为输出,但是很容易在其中找到某个单词通过评估任意输入上的电路获得L.)CCCwwwLLLLLLC′C′C'wwwLLLwwwLLL

1
在前缀和后缀下关闭明确的上下文无关语言。
令为上下文无关的语言。限定p p Ç (大号)是的前和后缀闭合大号,换句话说,p p Ç (大号)包含所有的大号前缀和后缀,并且因此的大号本身。我的问题是:如果L是上下文无关的并且具有明确的语法,那么p p c (L )是否也是如此?大号LLp p Ç (大号)ppc(L)ppc(L)大号LLppc(L)ppc(L)ppc(L)LLLLLLLLLppc(L)ppc(L)ppc(L) 我相信这种基本问题已经在语言理论的鼎盛时期得到了解决,但是我找不到合适的参考。

2
显着正则表达式自动机的分类
我正在尝试拟定用于将正则表达式转换为自动机的算法的分类法,以便对其特定领域中的复杂性进行一些实证测试。 我知道几个“较大”的名称,例如, 汤普森 汤普森,“正则表达式搜索算法”,1968年 格卢什科夫 “将正则表达式转换为自动机的新的二次算法”,Ponty等。1996年 安蒂米罗夫 “正则表达式和有限自动机构造的偏导数”,Antimirov,1996年 跟随 “跟随自动机”,Ilie等。等,2003; Champarnaud等人,“计算表达式的跟随自动机”。al,2002 赫罗姆科维奇 Hromkovic等人,“将正则表达式转换为小的无电子的不确定自动机”。2001年 及其区别性(无ε,确定性,尺寸,最小化等),但我知道这并不是详尽的清单。 我对算法的兴趣特别大,这些算法呈现出的时间复杂度与上述算法大不相同,并且/或者拓扑结构也大为不同。 如果您认识其他人,将非常感谢您提供详细描述构造算法的论文的链接(如果要实施,请务必阅读!) 编辑:根据要求添加了一些参考。



1
具有个头的有限状态自动机可以识别哪种语言?
DFA或NFA单头读取输入字符串,从左到右移动。对于具有多个磁头的有限状态机似乎很自然,每个磁头从左到右在输入中移动,但不一定与其他输入在同一位置。 让我们定义一个具有个头的有限状态机,如下所示:ķķk 甲K-头NFA是一个元组,其中:(Q ,Σ ,Δ ,q0,F)(问,Σ,Δ,q0,F)(Q, \Sigma, \Delta, q_0, F) 像往常一样,是一组有限状态,是一个有限字母,是初始状态,是一组接受状态。让表示包括空字符串在内的字符集。问问QΣΣ\Sigmaq0q0q_0FFFΣε:=&Sigma; ∪ { ε }Σε:=Σ∪{ε}\Sigma_\varepsilon := \Sigma \cup \{\varepsilon\} Δ &SubsetEqual; Q × (Σε)ķ× QΔ⊆问×(Σε)ķ×问\Delta \subseteq Q \times (\Sigma_\varepsilon)^k \times Q是过渡关系:过渡表示,如果机器处于状态,它可以读入,使得是头部的下一个字符(如果头部不移动,则为\ varepsilon),然后进入状态q。(p ,(σ1个,σ2,… ,σķ),q)(p,(σ1个,σ2,…,σķ),q)(p, (\sigma_1, \sigma_2, \ldots, \sigma_k), q)ppp(σ1个,σ2,… ,σķ)(σ1个,σ2,…,σķ)(\sigma_1, \sigma_2, \ldots, \sigma_k)σ一世σ一世\sigma_i一世一世iεε\varepsilonqqq 此类机器的运行(从开始状态开始并以接受状态结束的任何路径)都不会产生一个字符串,而是会产生ķķk不同的字符串(通过在运行过程中将字符串联而形成)。然后我们说,如果k个字符串相同,则运行有效。ķķk 机器的语言是字符串www的集合,因此存在一个有效的机器运行,其中沿着该行产生的ķķk字符串都等于www。 问题:此类机器可识别的语言类别是什么?已经研究过了吗? 第一个观察结果是,此类机器产生的类别比常规语言还要大。例如,语言 被以下具有状态的 NFA 识别: …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.