与上下文无关的语法的前后集是否始终与上下文无关？

14

令 $G$ 为上下文无关的语法。如果您可以通过将次数乘以零或多次到的开始符号上来获得的一串和的句子，则可以说它是一种句法形式。让是该组中的句型。 $G$ $G$ $G$ $S$ $\operatorname{SF}(G)$ $G$

让，并让是的一个子 -我们称之为一个片段的。现在让 $\alpha \in \operatorname{SF}(G)$ $\beta$ $\alpha$ $\beta$ $\operatorname{SF}(G)$

$\operatorname{Before}(\beta) = \{ \gamma \ |\ \exists \delta . \gamma \beta \delta \in \operatorname{SF}(G) \}$

和

$\operatorname{After}(\beta) = \{ \delta \ |\ \exists \gamma . \gamma \beta \delta \in \operatorname{SF}(G) \}$ 。

是和上下文无关语言？如果不含歧义怎么办？如果明确，是否也可以使用明确的上下文无关语言来描述和吗？ $\operatorname{Before}(\beta)$ $\operatorname{After}(\beta)$ $G$ $G$ $\operatorname{Before}(\beta)$ $\operatorname{After}(\beta)$

这是一个后续到我先前的问题，后一个较早的尝试，使我的问题比较容易回答失败。否定的答案将使我正在研究的总体问题很难回答。

— 亚历克斯·十·布林克
source

8

首先让我们对“ 和“ 有所了解。考虑一个包含的推导树；这里的“包含”意味着您可以切除子树，以使是树前的子词。然后，之前（之后）集合是树的左（右）部分的所有潜在前沿： $\operatorname{Before}(\beta)$ $\operatorname{After}(\beta)$ $\beta$ $\beta$ $\beta$

tree with before and after sets
^{[ 来源 ]}

因此，我们必须为树的水平线（垂直线）部分建立语法。这似乎很容易，因为我们已经对整棵树有了语法。我们只需要确保所有的句子形式都是单词（更改字母），过滤掉不包含那些词（因为是固定的，这是常规性质），并删去之后（之前）的所有内容，包括。这种切割也应该是可能的。 $\beta$ $\beta$ $\beta$ $\beta$

现在要正式证明。我们将按照概述的方式转换语法，并使用闭包属性进行过滤和剪切，即，我们将执行非构造性证明。 $\mathrm{CFL}$

令为上下文无关文法。不难发现是上下文无关的；构造像这样： $G = (N, T, \delta, S)$ $\operatorname{SF}(G)$ $G'=(N',T',\delta',N_S)$

$N' = \{N_A \mid A \in N\}$
$T' = N \cup T$
$\delta' = \{\alpha(A) \to \alpha(\beta)\mid A\to\beta \in \delta \} \cup \{N_A \to A \mid A\in N\}$

用用于所有和所有。显然 ; 因此相应的前缀闭包和后缀闭包也是上下文无关的¹。 $\alpha(t)=t$ $t \in T$ $\alpha(A)=N_A$ $a\in N$ $\mathcal{L}(G')=\operatorname{SF}(G)$ $\operatorname{Pref}(\operatorname{SF}(G))$ $\operatorname{Suff}(\operatorname{SF}(G))$

现在，对于任何是和正则语言。由于在使用常规语言的交集和右/左商下是封闭的，因此我们得到 $\beta \in (N\cup T)^*$ $\mathcal{L}(\beta(N\cup T)^*)$ $\mathcal{L}((N\cup T)^*\beta)$ $\mathrm{CFL}$

$\qquad \displaystyle \operatorname{Before}(\beta) = (\operatorname{Pref}(\operatorname{SF}(G))\ \cap\ \mathcal{L}((N\cup T)^*\beta))\,/\,\beta \in \mathrm{CFL}$

和

。 $\qquad \displaystyle \operatorname{After}(\beta) = (\operatorname{Suff}(\operatorname{SF}(G))\ \cap\ \mathcal{L}(\beta(N\cup T)^*))\,\backslash\, \beta \in \mathrm{CFL}$

¹ 被下右（左）商关闭 ; ，对于产量前缀表示类似。后缀关闭。 $\mathrm{CFL}$ $\operatorname{Pref}(L) = L / \Sigma^*$ $\operatorname{Suff}$

— 拉斐尔
source

我开始写一个答案，然后意识到我的证明和你的一样。我不得不把它这种方式（压缩，以适应这里）：形成文法

加入了新的终端

（一metavariable）为每个非终端

和一生产

。然后的句型

是通过所识别的词语

即由元变量的。这是CFG与常规语言的交集，因此是常规的。CFG的前缀集是CFG（使用PDA并使每个状态都变为最终状态）。

G^{'}

$G'$

\hat{A}

$\hat A$

A

$A$

A \to \hat{A}

$A\to\hat A$

G

$G$

G

$G$

又是一个CFG。

B e f o r e (γ) = {γ ∣ γ β \in L (P r e f i x (\hat{G}))}

$\mathrm{Before}(\gamma) = \{\gamma \mid \gamma\beta\in L(\mathrm{Prefix}(\hat G))\}$

— 吉尔（Gilles）'所以

1

@Gilles，对此有3条评论：1）句子形式通常（正确地）包含语言。2）“使每个州都处于最终状态”-无效；您还将接受非单词的前缀。3）严格切断“后缀”的最后一步似乎很棘手。：/您是否有比我更严格但更紧凑的证明？

— 拉斐尔

1）无关紧要（将

更改为每个端子都具有一个非端子）。2）糟糕，我切断得太多了：将可以到达最终状态的每个状态都设为最终状态。3）一次在一个终端

上执行一次；在PDA中，通过将

改为final来标记可以从其达到最终状态的状态。是的，要使其更加严格，还需要更多扩展。

G

$G$

b

$b$

b

$b$

— 吉尔（Gilles）“所以

9

是的，和是上下文无关的语言。这就是我要证明的方式。首先，引理（症结）。如果为CF，则： $\mbox{Before}(\beta)$ $\mbox{After}(\beta)$ $L$

$\mbox{Before}(L,\beta) = \{ \gamma \ |\ \exists \delta . \gamma \beta \delta \in L \}$

和

$\mbox{After}(L,\beta) = \{ \gamma \ |\ \exists \delta . \delta \beta \gamma \in L \}$

是CF。

证明？对于构造一个非确定性有限状态变换器该扫描一个字符串，输出它看到每个输入符号，并且同时搜索非确定性为。每当看到的第一个符号它fork非确定性，并停止输出符号，直到它完成看到或它看到看到一个符号，从偏离，在任一情况下停止。如果看到 $\mbox{Before}(L,\beta)$ $T_{\beta}$ $\beta$ $T_{\beta}$ $\beta$ $\beta$ $\beta$ $T_{\beta}$ $\beta$ 完全，它在停止时接受，这是它唯一的接受方式。如果看到与的偏差，则拒绝。 $\beta$

引理可以jiggered处理情况下，可以与自身重叠（如 -不断寻找即使在扫描之中的前）或出现多次（实际上，原非determinisic分叉已经可以解决这个问题）。 $\beta$ $abab$ $\beta$ $\beta$

这是相当明显，，并且由于紧凑型荧光灯的下有限状态转导闭合时，因此是CF. $T_\beta(L) = \mbox{Before}(L,\beta)$ $\mbox{Before}(L,\beta)$

也可以使用类似的参数，也可以使用字符串反转来完成，CFL也可以在反转时关闭： $\mbox{After}(L,\beta)$ $\mbox{Before}(L,\beta)$

$\mbox{After}(L,\beta) = \mbox{rev}(\mbox{Before}(\mbox{rev}(L),\mbox{rev}(\beta)))$

实际上，现在我看到了逆向参数，从开始会更容易，因为用于此的转换器更易于描述和验证-在寻找同时输出空字符串。当找到它将不确定地进行分叉，一个分叉继续寻找的其他副本，另一个分叉从输入到输出逐字复制所有后续字符，并一直接受。 $\mbox{After}(L,\beta)$ $\beta$ $\beta$ $\beta$

What remains is to make this work for sentential forms as well as CFLs. But that is pretty straightforward, since the language of sentential forms of a CFG is itself a CFL. You can show that by replacing every non-terminal $X$ throughout $G$ by say $X^\prime$ , declaring $X$ to be a terminal, and adding all productions $X^\prime \rightarrow X$ to the grammar.

I'll have to think about your question on unambiguity.

— David Lewis
source