帕里克定理

在理論計算機科學中，帕里克定理指出，对于上下文无关语言，如果只关心其中每个终止符号出现的次数，而不考虑它们的顺序，那么存在正则语言与其对应^[1]。这个定理可用于确定具有给定数量终止符号的字符串是否能为上下文无关语法接受^[2]。1961年罗希特·帕里克第一次证明了它^[3]，论文于1966年再次发表^[4]。

定义及形式化表述[编辑]

令 $\Sigma =\{a_{1},a_{2},\ldots ,a_{k}\}$ 为一个字母。定义单词的帕里克矢量 $p:\Sigma ^{*}\to \mathbb {N} ^{k}$ 为函数^[1]

$p(w)=(|w|_{a_{1}},|w|_{a_{2}},\ldots ,|w|_{a_{k}})$ ，其中 $|w|_{a_{i}}$ 表示词 $w$ 中 $a_{i}$ 出现的次数。

一个子集 $\mathbb {N} ^{k}$ 是线性的，如果它形如

存在向量 $u_{0},\ldots ,u_{m}$ ，使得 $u_{0}+\langle u_{1},\ldots ,u_{m}\rangle =\{u_{0}+t_{1}u_{1}+\ldots +t_{m}u_{m}\mid t_{1},\ldots ,t_{m}\in \mathbb {N} \}$ 。

一个子集 $\mathbb {N} ^{k}$ 是半线性的，如果它为有限多线性子集的并。

帕里克定理的形式化表述如下。令 $L$ 为上下文无关语言。令 $P(L)$ 为 $L$ 单词的帕里克矢量集，即 $P(L)=\{p(w)\mid w\in L\}$ 。则 $P(L)$ 是半线性的。

两种语言可以等效互换，如果他们的帕里克矢量集相同。若 $S$ 为任意半线性集，则对单词的帕里克矢量位于 $S$ 中的语言，可等效于某些正则语言。因此，每一个上下文无关语言都可等效于某些正则语言。

重要性[编辑]

帕里克定理表明，有些上下文无关语言可能只有歧义语法^{[需要更深入解释]}。这样的语言称为固有歧义语言。从形式文法的角度看，这意味着某些有歧义的上下文无关文法无法转换为明确的上下文无关文法。

参考文献[编辑]

^ ^1.0 ^1.1 Kozen, Dexter. Automata and Computability. New York: Springer-Verlag. 1997. ISBN 3-540-78105-6.
^ Håkan Lindqvist. Parikh's theorem (PDF). Umeå Universitet. [2017-08-25]. （原始内容 (PDF)存档于2021-05-06）.
^ Parikh, Rohit. Language Generating Devices. Quartly Progress Report, Research Laboratory of Electronics, MIT. 1961.
^ Parikh, Rohit. On Context-Free Languages. Journal of the Association for Computing Machinery. 1966, 13 (4).

[kozen-1] 1.0 ^1.1 Kozen, Dexter. Automata and Computability. New York: Springer-Verlag. 1997. ISBN 3-540-78105-6.

[2] Håkan Lindqvist. Parikh's theorem (PDF). Umeå Universitet. [2017-08-25]. （原始内容 (PDF)存档于2021-05-06）.

[3] Parikh, Rohit. Language Generating Devices. Quartly Progress Report, Research Laboratory of Electronics, MIT. 1961.

[4] Parikh, Rohit. On Context-Free Languages. Journal of the Association for Computing Machinery. 1966, 13 (4).

[1]

[2]

[3]

[4]