如何证明一种语言是上下文无关的？

26

有许多技术可以证明某种语言不是上下文无关的，但是如何证明一种语言不是上下文无关的？

有什么技术可以证明这一点？显然，一种方法是展现该语言的上下文无关语法。是否有系统的技术来查找给定语言的无上下文语法？

对于常规语言中，有系统的方法来得到一个正规文法/状态自动：例如，迈希尔-尼罗德定理提供了一种方法。上下文无关的语言是否有相应的技术？

在这里，我的动机是（希望）建立一个参考问题，其中包含一系列试图证明给定语言不受上下文限制时通常有用的技术。由于这里有很多问题是特殊情况，因此，如果我们能记录面对此类问题时可以使用的通用方法或通用技术，那就太好了。

— DW
source

请允许我留下我通常的笔记：在为手头语言提供上下文无关的语法时，您需要正确性证明，这可能会使方法变得笨拙。

— 拉斐尔

为了使它成为一个适当的参考问题，我们可以向问题转储者抛出，您能否添加一个有关语法和自动机的答案，也许每个例子都包含一个？谢谢！

— 拉斐尔

在将材料移到此处之前，请注意，Rick Decker和babou 在一个重复的问题上收集了一些典型的与上下文无关的成语。

— 拉斐尔

13

在许多示例中有效的实用方法（但并非总是如此，我知道）正在尝试查找语言中字符串的嵌套结构。必须在字符串的不同部分中同时生成“嵌套依赖项”。

我们还有基本的工具箱：

串联：如果可以将语言分成两个连续的部分，请使用此产生形式 $S\to S_1S_2$
并集：分成不相交的部分 $S\to S_1 \mid S_2$
迭代： $S\to S_1S \mid \varepsilon$

例子1

这是嵌套的示例（谢谢Raphael）。

$L=\{b^ka^l(bc)^ma^nb^o \mid k,l,m,n,o\in {\Bbb N},k\neq o,2l=n,m\ge 2 \}$

将替换为。现在我们可以将置于条件中。 $n$ $2l$ $n$

将替换为（混淆？是“哦”而不是“零”）。应用工会工具。我们在这里使用。同样，如果且，其中是一个新变量。替换通过。 $k \neq o$ $k > o \text{ or } k < o$ $o$ $k > o$ $k>o$ $k=s+o$ $s>0$ $s$ $k$ $s+o$

$L_1 =\{b^{s+o}a^l(bc)^ma^{2l}b^o \mid l,m,o,s\in {\Bbb N},s>0,m\ge 2 \}$

一些简单的重写。

$L_1 =\{bb^sb^o a^l bcbc(bc)^m (aa)^{l}b^o \mid l,m,o,s\in {\Bbb N} \}$

现在，我们看到了嵌套结构，并开始构建语法。

，，（参见：级联和迭代这里） $S_1 \to TV$ $T\to bU$ $U\to bU \mid \varepsilon$

（我们在两侧生成） $V \to bVb \mid W$ $o$ $b$

$W \to aWaa\mid X$

，， $X\to YZ$ $Y\to bcbc$ $Z\to bcZ\mid \varepsilon$

例子2

$K =\{ a^kb^lc^m \mid l=m+k\}$

第一个“显而易见的”重写。

$K =\{ a^kb^{m+k}c^m \mid m,k\ge 0\} = \{ a^kb^mb^kc^m \mid m,k\ge 0\}$

在语言学上，这称为“跨序列依赖”：交织（通常）强烈表示无上下文无关性。当然，，我们就得救了。 $k,m,k,m$ $m+k=k+m$

$K =\{ a^kb^{k+m}c^m \mid m,k\ge 0\} = \{ a^kb^kb^mc^m \mid m,k\ge 0\}$

与制作，， $S\to XY$ $X\to aXb\mid \varepsilon$ $Y\to bYc\mid \varepsilon$

类似地 $K'= \{ a^kb^lc^m \mid m=k+l\} = \{ a^kb^lc^lc^k \mid k,l\ge 0\}$

与制作， $S\to aSc \mid X$ $X\to bXc\mid \varepsilon$

最后的评论：这些技术可以帮助您提出一种与上下文无关的候选语法，希望能识别您的语言。可能仍需要正确性证明，以确保语法确实可以识别您的语言（仅此而已，仅此而已）。

— 亨德里克·扬
source

11

可以使用CFL的一个特征，即Chomsky-Schützenberger定理。

戴克语言

让为字母。我们定义戴克 -language 的由上下文无关文法与由下式给出 $T$ $D_T \subseteq (T \cup \hat{T})^*$ $T$ $G = (\{S\}, T \cup \hat{T}, \delta, S)$ $\delta$

。 $\qquad\displaystyle S \to aS\hat{a}S \mid \varepsilon, \quad a \in T$

乔姆斯基-舒岑贝格定理

是如果上下文且仅当有 $L \subseteq \Sigma^*$

字母表， $T$

一个正则语言和 $R \subseteq (T \cup \hat{T})^*$

同态 $\psi : (T \cup \hat{T}) \to \Sigma^*$

以便

。 $\qquad \displaystyle L = \psi(D_T \cap R)$

请注意，同态性扩展到单词（逐个符号），然后扩展到语言（逐个单词）。

例

考虑。用 $L = \{ a^n b^n c^m \mid n,m \in \mathbb{N}$

（和，规范地）， $T = \{ [, \langle\}$ $\hat{T} = \{ ], \rangle\}$
并且 $R = \mathcal{L}([^* ]^*\langle^* \rangle^*)$
$\psi(x) = \begin{cases} a, &x = [ \\ b, &x =\ ] \\ \varepsilon, &x = \langle \\ c, &x =\ \rangle \end{cases}$

该定理暗示是上下文无关的，特别是因为 $L$

。 $\qquad\displaystyle D_T \cap R = \{[^n ]^n \langle^m \rangle^m \mid n,m \in \mathbb{N}\}$

例子2

表明，是上下文无关。 $L = \{ b^k a^l (bc)^m a^n b^o \mid k,l,m,n,o \in \mathbb{N}, k \neq o, 2l = n, m \geq 2 \}$

这里，我们需要对一种类型的括号的，一个用于，一个用于，和另一用于将模拟那个原因。我们用 $a$ $bc$ $b$ $b$ $k \neq o$

， $T = \{ [, \langle, \vdash, < \}$
和 $R = \mathcal{L}(<^+>^+\vdash^* [^* \langle\langle^+ \rangle^+\rangle ]^* \dashv^*) \cup \mathcal{L}(\vdash^* [^* \langle\langle^+ \rangle^+\rangle ]^* \dashv^*<^+>^+)$
$\psi(x) = \begin{cases} b, &x \in \{\vdash, \dashv, <\} \\ a, &x = [ \\ aa, &x =\ ] \\ bc, &x = \langle \\ \varepsilon, &\text{else} \end{cases}$

and apply the theorem. In order to see that $L = \psi(D_T \cap R)$ , we don't need more than the fact that matching symbols (e.g. $[$ and $]$ ) have to occur equally often in any $w \in D_T$ . Adding this contraint to the regular expressions we defined $R$ by, we get

$\qquad \begin{align*} D_T \cap R = &\{<^p>^p \vdash^o [^l \langle^m \rangle^m ]^l \dashv^o \mid p \geq 1, o \geq 0, l \geq 0, m \geq 2\} \\ &\cup\ \{\dots\} \end{align*}$

and therewith

$\qquad\begin{align*} \psi(D_T \cap R) &= \{ b^{p+o} a^l (bc)^m a^{2l} b^o \mid p \geq 1, o \geq 0, l \geq 0, m \geq 2 \} \\ &\quad \cup\ \{ \dots \} \\ &= \{ b^k a^l (bc)^m a^n b^o \mid k,l,m,n,o \in \mathbb{N}, k > o, 2l = n, m \geq 2 \} \\&\quad \cup\ \{ \dots \} \\ &= L \;. \end{align*}$

To grammars and automata

If we want to have an automaton or grammar in the end, we have some more work ahead of us.

Towards an automaton, construct the NPDA for $D_T$ and an NFA for $R$ . The former is standard and we have algorithms for the latter, provided the language is given in a suitable representation (see also here). Intersection both is another standard construction and $\psi$ can be applied to every transition individually.
Towards a grammar, build one for $R$ (again, should be standard), take the one for $D_T$ and intersect them. Then apply $\psi$ to the rule set (symbol for symbol).

Arguably, this is easy since algorithmic; the complexity lies in finding suitable $T$ , $R$ and $\psi$ . I don't know if this approach is (often) simpler than constructing PDA/grammars directly but it may allow to focus on the important features of the language at hand. Try for yourself!

— Raphael
source

It is undecidable whether any given language is context-free.

— reinierpost