给定长度的常规语言中单词数量的渐近性


28

对于常规语言,令为长度为中的单词。使用约旦规范形式(应用于的某些DFA的无注释转换矩阵),可以证明对于足够大的, 其中是复数多项式,是复数“特征值”。(对于小,我们可能具有形式的附加项,其中如果且为且Ç Ñ大号大号ñ 大号Ñ Ç Ñ大号= ķ Σ= 1个 P Ñ λ Ñ P λ Ñ Ç ķ [ Ñ = ķ ] [ Ñ = ķ ] 1 ñ = ķ 0Lcn(L)LnLn

cn(L)=i=1kPi(n)λin,
PiλinCk[n=k][n=k]1n=k0除此以外。这些对应于特征值为的大小至少为 Jordan块。)0k+10

这种表示似乎暗示着,如果是无限的,则渐近地,对于某些,。然而,这显然是错误的:对于语言超过的偶数长度,所有单词但。这表明对于某些以及所有,对于足够大的,或。Flajolet&Sedgewick证明了这一点Ç Ñ大号Ç ñ ķ λ Ñ Ç λ > 0 大号{ 0 1 } Ç 2 Ñ大号= 2 2 Ñ ç 2 Ñ + 1大号= 0 d { 0 ... d 1 } c d m + aLcn(L)CnkλnC,λ>0L{0,1}c2n(L)=22nc2n+1(L)=0da{0,,d1}Ç d + Ç 一个d + ķ 一个 λ d + 一个一个cdm+a(L)=0mcdm+aCa(dm+a)kaλadm+a (定理V.3),他将证明归于Berstel。

Flajolet和Sedgewick提供的证明有些技术性。实际上,由于技术如此之浅,以至于他们只绘制草图。我尝试使用Perron-Frobenius理论进行更基本的证明。我们可以将DFA的过渡图视为有向图。如果有向图是原始的,则结果几乎直接来自Perron-Frobenius定理。如果有向图是不可约的,但对于索引是不可约的,则通过考虑DFA 的“ 第次方”(每个过渡对应于符号),我们得到相同的结果。最困难的情况是有向图是可约的。我们可以简化为强连接组件路径的情况,然后通过估计形式的总和来获得结果 [R [R Σ 1 + + ķ = ķ Π= 1个 λ 中号rrr

m1++mk=mi=1kλimi.
(每个这样的总和对应于一种接受单词的特定方式,它以某种特定方式经历了不同的组成部分。)然后,可以通过指出最大的项来估计该总和,该最大的项对应于。对于每个重复次的特征值,我们得到的额外因子。 ř Θ - [R - 1milogλirΘ(mr1)

证明有其粗糙的边缘:在可约的情况下,我们需要将渐近项到传递到上述总和,然后我们需要估计总和。Cλim

Flajolet和Sedgewick的证明也许更简单,但基础性较小。它的起点是的有理生成函数,它涉及极数(!)的归纳。基本思想是,由于贝斯特尔(一个中等适度的)定理,最大模量的所有特征值都是单位根(如果通过其模量归一化)。选择合适的并看一下长度的单词,所有这些特征值都变为实数。考虑部分分数展开,我们得到,如果最大模数的特征值“幸存”,则它确定渐近线,形式为d d + 一个ç Ñ ķ λ Ñcn(L)ddm+aCnkλn。否则,我们找到一个新的有理生成函数,该函数仅与该长度的单词相对应(使用Hadamard乘积),然后重复该参数。上述数量一直在减少,因此最终我们找到了所需的渐近线;在此过程中可能必须增长,以反映归纳步骤中发生的所有事情。d

是否有的渐近性质的简单且基本的证明?cn(L)


您指的是哪个“渐近性质”,即最右上角的那个?
拉斐尔

正是那个财产。
Yuval Filmus

对于可归约的情况,是否没有简单的组合边界(可能是通过考虑路径的子集和路径的多集而获得的)?
安德拉斯·萨拉蒙

有容易的界限,但是您可能会丢失多项式因数。有一个多项式多项式的和,我们可以使用最大项来估计它。但是,这不会给我们正确的渐近线,因为其他术语会很快衰减。也许可以用积分进行估算,但这已经有些混乱了。
Yuval Filmus

1
通常,寻找问题的替代性或更基本的证明可能非常困难,并且主要是理论上的练习……是否还有其他动机/背景/应用?建议迁移到cstheory。
vzn13年

Answers:


3

您所勾画的论点似乎与理查德·斯坦利(Richard Stanley)对《枚举组合学》(第1卷)中的转移矩阵法的处理是一致的(链接:pp 573;印刷:pp 500)。

他从生成函数开始,然后通过考虑有向图以及允许和禁止的因素来解包。然后,他将抽象为免费的monoid,并在其中使用您给出的总和的精炼版本来证明:

BABB(λ)=(IB(λ))1

在研究了一些应用程序之后,他还通过讨论与水平凸多胺有关的Hadamard产品来结束本节。


您能指出斯坦利的书中给出渐近估计的一个定理吗?
Yuval Filmus 2014年

我在Stanley中找不到任何直接明确的参考,但是Flajolet和Sedgewick确实在第V.6节中承认了他对他们对转移矩阵方法的处理的影响。特别地,推论V.1包含了先前的定理(V.7,V.8),这些定理似乎与您的推理一致。它们似乎也遵循Stanley的概述,从第V.5小节开始,其中命题V.6对应于Stanley定理4.7.2和推论4.7.3
JSS

我特别在寻找的是渐近分析。由传输矩阵方法给出的给定长度的单词数的确切公式是我理所当然的。
Yuval Filmus 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.