多项式大小的DFA识别的语言


23

对于一个固定的有限字母表,正式语言超过是规则,如果存在一个确定性有限自动机(DFA)超过它接受准确。大号ΣLΣΣL

我对“几乎”规则的语言感兴趣,因为它们可以被大小自动增长的自动机系列识别,自动机系列的大小随词长的增长呈多项式增长。

形式上来说,如果对于每个单词,则DFA 家族可以识别形式语言,令,在如果接受(无论其他接受),然后让我将p常规语言定义为多项式大小的PTIME可计算 DFA系列识别的语言,即是多项式,使得全部L 瓦特∈ Σ * Ñ = | w | 瓦特大号Ñ瓦特(An)wΣn=|w|wLAnwAiP | A n | P Ñ ñ(An)P|An|P(n)n。(这个名称是“ p-regular”,这是我编写的,我的问题是要知道是否存在另一个名称。请注意,就排列自动机而言,这与p-regular语言并不相同。)

这类p常规语言当然包括常规语言(对于所有都取,其中是一些识别常规语言的DFA);但这是它的严格超集:例如,众所周知,是上下文无关的,但不是常规的,但是它是p-常规(只需要计数次出现的和次出现的)。但是,由于我要求自动机必须是多项式大小的DFA,因此某些形式语言(实际上是一些无上下文语言)不是Ñ { 一个Ñ b Ñ | Ñ Ñ } Ñ Ñ 一个Ñ bAn=AnA{anbnnN}Annanbp-regular:例如,回文的语言不是p-regular,因为从直观上讲,当您阅读单词的前半部分时,您需要具有尽可能多的不同状态,因为您需要准确地将前半部分与后半部分匹配

因此,p常规语言的类是常规语言的严格超集,这是无上下文语言无法比拟的。事实上,看来你甚至可以通过基于多项式的最小程度的区分对正规语言获得的语言层次这是他们的 -regular。构造示例以表明该层次结构是严格的并不难;尽管我还不太清楚这之间的相互作用以及层次结构的替代定义之间的相互作用,这也将限制的计算复杂度。P ñPPAn

我的问题是:以前是否研究过我称为p-regular的此类以及相关的层次结构?如果是,请在何处以哪个名称命名?

(一个可能的链接是与现场,流式处理或在线算法。在用于语言识别问题流式处理算法的术语中,我对可以具有确定性的单程识别算法的语言的类(或层次结构)感兴趣,使用状态的多项式数(即对数内存大小),但在本文或相关论文中我没有找到此类的定义,但是请注意,在我对问题的措辞中,单词的长度是预先已知,这是不自然的流上下文:在流,你可以认为这是一个无限的机器人,一个特殊的“结束字”文号,以及约束可达状态的读取后数字符是多项式ñnn。我认为这种区分可能会有所不同,例如:二进制单词的语言,其值可以通过其长度整除,这对于固定长度很容易,但是(我猜想)在以前的意义上不能用无限自动机来表示,因为没有标识如果事先不知道长度,可以进行。)

(此p-regular类的动机是,一些问题,例如概率词的语言隶属度的概率,不仅在规则语言时而且在p-regular时似乎都是PTIME,我正在尝试以准确描述在哪些情况下这些问题是可以解决的。)


1
恩,我没有适当考虑可计算性的问题。感谢您指出了这一点。我只是添加了它们可计算的要求。希望没有使用可计算但高度复杂系列的p常规语言的恶劣情况?(An)(An)
2014年

1
好的,我删除了“无可争议”的注释。但是,即使有可计算的约束,您仍然可以得到一些奇怪的信息:选择并且是NEXP完全的(否则)。也许您可以进一步限制A n必须是多项式时间可计算的约束来限制它!An={1nnB}BAn=An
Marzio De Biasi 2014年

1
Marzio:啊,你是对的。出于我的动机,正确的概念是是可计算的PTIME,是的,所以我改成了这个……仍然令我有些困扰的是,计算A n的复杂性对结果类(因为这意味着这是必须在定义中进行的附加选择...)。这也使我一直在思考的层次结构变得复杂。An(An)
2014年

2
我看不出不可计算性出了什么问题,您定义的是一个非统一语言类,就像许多电路类一样。
domotorp 2014年

3
如果您加强对日志空间的统一性条件,那么所有这些语言都将在日志空间中可计算。根据给定的定义,所有p常规语言都为“ P统一L”(由P统一系列分支程序或具有ptime可计算建议的logspace TM识别)。
EmilJeřábek在2014年

Answers:


3

这个问题似乎没有被研究太多(一种可能性是试图找到一个与“附近”复杂度等级如P / poly等有关的关系);尽管这里有至少一个引用它的参考文献:

  • 多项式大小为 Gruber / Holzer的正则表达式的语言运算

    这项工作解决了有关保留正则性语言操作在多大程度上影响正则表达式描述复杂性的问题。在某种意义上,某些语言运算对于正则表达式是可行的,因为该运算的结果可以表示为操作数的大小多项式的正则表达式。我们证明,使用语言商,特别是规则集的前缀和后缀闭包,最多可以导致所需表达式大小的二次爆破。循环移位操作只能导致大小增加三次,在最坏的情况下至少需要二次膨胀。

正如AS所建议的那样,可能还有其他更自然的方法来研究类似所提出的问题。这是另一种基于大小为的单词的数量来研究常规语言的增长的方法,该方法与问题的确存在某种松散的关系,例如n


4
尽管此处没有明确说明,但以下论文的主要结果证明,单调NC ^ 1中不包含p-regular语言的类别。H. Gruber和J. Johannsen:“使用通信复杂度的正则表达式大小的最佳下界”,FoSSaCS 2008,LNCS 4962,第273-286页。hermann-gruber.com/data/fossacs08.pdf
Hermann Gruber

1
附录中涉及了此博士学位论文2010 有限自动机 / Kralovic的复杂度类,该类定义的内容与要求“小语言”的p11类似。似乎对该领域进行了全面的调查,并建立了相关概念的一般理论框架/摘要。但是,看不到与“ P尺寸DFA系列”的特定类别直接相关的许多定理。
vzn 2014年

1
@vzn:Kralovic论文的p11中的定义有点不同,因为它是关于语言家族的,而在我的问题中,各种语言都是固定长度的单词,仅来自一种主要语言。我不确定与您提供的Gruber和Holzer论文之间的联系,我看不出您如何认为自动机通常是保持规律性操作的结果。至于Gawrychowski等人,我同意这可能是切线相关的。
2014年

2
Gruber / Holzer引用似乎有助于“ P常规闭合”类型属性的P常规减少。同意你的定义似乎和其他任何东西都不一样。换句话说,其中一些问题/类之间可能存在减少,并且参考文献朝着这些方向发展;有人可能会寻找类似减少的操作,将您的def连接到先前研究/发布的类(同意defn并不暗示任何特定的还原操作)。也许您的问题的严格答案是“没有您的课程没有被完全研究过”
vzn 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.