Нормальная форма Куроды — различия между версиями

Версия 13:42, 4 января 2015

Определение:

Грамматика представлена в нормальной форме Куроды (англ. Kuroda normal form), если каждое правило имеет одну из четырех форм:

[math]AB \rightarrow CD[/math]
[math]A \rightarrow BC[/math]
[math]A \rightarrow B[/math]
[math]A \rightarrow a[/math] или [math]A \rightarrow \varepsilon[/math]

Где — нетерминалы, — терминал.

Данная грамматика названа в честь Куроды (англ. Sige-Yuki Kuroda), который изначально назвал ее линейно ограниченной грамматикой.

Определение:

Грамматика представлена в нормальной форме Пенттонена (англ. Penttonen normal form), если каждое правило имеет одну из трех форм:

[math]AB \rightarrow CD[/math]
[math]A \rightarrow BC[/math]
[math]A \rightarrow a[/math] или [math]A \rightarrow \varepsilon[/math]

Где — нетерминалы, — терминал.

Также грамматику Пенттонена называют односторонней нормальной формой (англ. one-sided normal form). Как можно заметить, она является частным случаем нормальной формы Куроды: когда [math]A = C[/math] в первом правиле определения. Для каждой контестно-зависимой грамматики существует слабо эквивалентная ей грамматика в форме Пенттонена.

Лемма (об удалении терминалов):

Для любой грамматики может быть построена грамматика такая, что:

все правила в [math]P'[/math] имеет вид [math]\alpha \rightarrow \beta[/math] где [math]\alpha \in (N')^+[/math] и [math]\beta \in (N')^*[/math] или [math]A \rightarrow a[/math], где [math]A \in N', a \in T[/math],
[math]L(G') = L(G)[/math]

Кроме того, если G контекстно-свободна или контекстно-зависима, то и будет соответственно контекстно-свободной или контекстно-зависимой.

Доказательство:

Каждому терминалу [math]a[/math] поставим в соотвествие новый символ [math]a'[/math], которого нет в [math]N \cup T[/math], такой что [math]a' \neq b'[/math] для разных терминалов [math]a[/math] и [math]b[/math].

Пусть .

Пусть [math]\alpha = x_1x_2...x_n[/math] — часть правила, тогда [math]\alpha' = y_1y_2...y_n[/math], где [math]y_i = \{x_i[/math], если [math]x_i \in N[/math]; [math]x_i'[/math], если [math]x_i \in T\}[/math] для [math]1 \lt = i \lt = n[/math].

Построим грамматику [math]G' = (N', T, P', S)[/math], где .

Покажем, что [math]L(G') = L(G)[/math].

Пусть [math]w \in L(G)[/math]. Тогда в G существует вывод .

Согласно конструкции [math]P'[/math], в [math]G'[/math] существует вывод .

Для [math]0 \lt = i \lt = n - 1[/math] в переходах [math]w_i' =\gt w_{i + 1}'[/math] используем правило [math]\alpha' \rightarrow \beta'[/math], так как правило [math]\alpha \rightarrow \beta[/math] было использовано при выводе [math]w_i =\gt w_{i + 1}[/math].

Для [math]0 \lt = j \lt = m - 1[/math] в переходах [math]v_j =\gt v_{j + 1}[/math] используем правила вида [math]a' \rightarrow a[/math].

Заменяем разрешенные в [math]w'[/math] символы на новые и получаем, что [math]w \in L(G')[/math]. Тогда [math]L(G) \lt = L(G')[/math].

Пусть [math]x \in L(G')[/math]. Тогда в [math]G'[/math] существует вывод [math]S =\gt * x[/math]. Мы можем поменять порядок применения правил в этом выводе: сначала применяем только правила вида [math]\alpha' \rightarrow \beta'[/math], а потом только правила вида [math]a' \rightarrow a[/math].

Из построения: после применения правила вида [math]a' \rightarrow a[/math] полученное [math]a[/math] не может быть использовано при применении правил из [math]P'[/math].

Изменение порядка вывода не меняет язык, то есть в [math]G'[/math] существует вывод: , где для и в переходе было использовано правило вывода [math]\alpha' \rightarrow \beta'[/math] и для [math]1 \lt = j \lt = s[/math] было использовано правило [math]a' \rightarrow a[/math], чтобы получить [math]y_j \rightarrow y_{j + 1}[/math].

Получаем вывод в [math]G[/math]: .

Тогда [math]L(G') \lt = L(G)[/math].

Таким образом, [math]L(G') = L(G)[/math].

Очевидно, что если грамматика была неукорочивающейся, то она такой и останется.

Лемма (об удалении длинных правил):

Для любой грамматики может быть построена грамматика такая, что:

любое правило из [math]P'[/math] имеет вид: [math]\alpha \rightarrow \beta[/math], где [math]\alpha \in (N')^+[/math] и [math]\beta \in (N')^+[/math] и [math]|\alpha| \lt = |\beta|[/math], или [math]A \rightarrow a[/math], или [math]A \rightarrow \varepsilon[/math], где [math]A \in N'[/math] и [math]a \in T[/math]
[math]L(G') = L(G)[/math]

Доказательство:

Сначала по [math]G[/math] построим грамматику [math]G'' = (N'', T, P'', S)[/math], как в доказательстве леммы 1. По [math]G''[/math] построим грамматику [math]G'[/math], в которой:

[math]N' = N'' \cup \{D\}[/math], где [math]D[/math] — новый символ,
[math]P'[/math] получаем из [math]P''[/math] заменой всех правил вида , где [math]|\alpha| \gt |\beta|[/math] на правила вида , и добавлением правила [math]D \rightarrow \varepsilon[/math].

Теперь все правила в [math]P'[/math] имеет требуемую форму.

Покажем, что [math]L(G') = L(G)[/math].

Заметим, что замена правила [math]\alpha \rightarrow \beta[/math] на не меняет язык грамматики, потому что дополнительная буква [math]D[/math] запрещается при добавлении перехода [math]D \rightarrow \varepsilon[/math], а других правил для [math]D[/math] нет.

Тогда получаем, что , аналогично обратные изменения не меняют язык, то есть .

Определение:

Грамматика имеет порядок n, если и для любого ее правила .

Лемма (об уменьшении порядка грамматики):

(Уменьшение порядка грамматики) Для любой грамматики порядка , такой что: любое правило из имеет вид , где и и или или , где и может быть построена грамматика порядка такая, что .

Доказательство:

Разделим [math]P[/math] на три подмножества: ,

,

.

Очевидно, что [math]P = P_1 \cup P_2 \cup P_3[/math].

Построим [math]G'[/math] следующим образом:

Если правило [math]p \in P_2[/math], то оно имеет вид , где [math]\alpha' \in N^*[/math] и [math]\beta' \in N^*[/math].

Полагаем [math]N_p = \{ A_p, B_p \}[/math], , где [math]A_p, B_p[/math] — дополнительные символы не из для разных правил [math]p[/math] и [math]q[/math] из [math]P_2[/math].

Если правило [math]p \in P_3[/math], то оно имеет вид [math]A \rightarrow CDE\beta'[/math], где [math]\beta' \in N^*[/math].

Полагаем [math]N_p = \{B_p \}[/math], , где [math]A_p, B_p[/math] — дополнительные символы.

Тогда , .

Из построения очевидно, что [math]G'[/math] имеет порядок [math]n - 1[/math].

Покажем, что L(G') = L(G).

Сначала докажем, что L(G) <= L(G'). Это следует из того, что:

все правила из P_1 применимы к обеим грамматикам,
шаг вывода \gamma_1AB\alpha'\gamma_2 => \gamma_1CDE\beta'\gamma_2, благодаря правилу p = AB\alpha \rightarrow CDE\beta' \in P_2 в G, может быть использавано в G' с помощью трех шагов:

\gamma_1AB\alpha'\gamma_2 => \gamma_1A_pB_p\alpha'\gamma_2 => \gamma_1CB_p\alpha'\gamma_2 => \gamma_1CDE\beta\gamma_2, с использованием правил из P_p и вывода \gamma_1A\gamma_2 => \gamma_1CDE\beta'\gamma_2 на основе правила p = A\alpha \rightarrow CDE\beta' \in P_3 в G, которое может быть применено в G' с помощью трех шагов вывода: \gamma_1A\alpha1'\gamma_2 => \gamma_1A_pB_p\alpha'\gamma_2 => \gamma_1CB_p\alpha'\gamma_2 => \gamma_1CDE\beta\gamma_2. Таким образом, любой вывод в G может быть преобразован в вывод в G'.

Чтобы показать обратное включение, рассмотрим вывод w \in L(G') в G', который содержит применение правил вида AB \rightarrow A_pB_p для какого-то правила p = AB\alpha' \rightarrow CDE\beta' \in P_2 (Заметим, что другие два правила из P_p могут быть применены только если правило AB \rightarrow A_pB_p было применено в этом выводе ранее). Данный вывод имеет вид: (1) S =>* \gamma_1AB\alpha'\gamma_2 => \gamma_1A_pB_p\alpha'\gamma_2 =>(q_1) \gamma_1'A_pB_p\alpha'\gamma_2' => \gamma_1'CB_p\alpha'\gamma_2' =>(q_2) \gamma_1B_p\alpha'\gamma_2 => \gamma_1DE\beta'\gamma_2 =>* w \in T^*, где q_1 — последовательность правил, примененых после AB \rightarrow A_pB_p и до A_p \rightarrow C, которая осуществляет \gamma_1 =>* \gamma_1' и \gamma_2 =>* \gamma_2', где q_2 — последовательность правил, осуществляющих \gamma_1'C =>* \gamma_1 и \gamma_2' =>* \gamma_2.

Или (2) S =>* \gamma_1AB\alpha'\gamma_2 => \gamma_1A_pB_p\alpha'\gamma_2 =>(q_1') \gamma_1'A_pB_p\alpha'\gamma_2' => \gamma_1'A_pDE\beta'\alpha'\gamma_2' =>(q_2') \gamma_1A_p\gamma_2 => \gamma_1C\gamma_2 =>* w \in T^*, где q_1' — последовательность правил, которая осуществляет \gamma_1 =>* \gamma_1' и \gamma_2 =>* \gamma_2', где q_2' — последовательность правил, осуществляющих \gamma_1' =>* \gamma_1 и DE\beta'\gamma_2' =>* \gamma_2.

Таким образом, существует вывод: S =>* \gamma_1AB\alpha'\gamma_2 => \gamma_1CDE\beta'\gamma_2 => (q_1) \gamma_1'CDE\beta'\gamma_2' => (q_2) \gamma_1DE\beta'\gamma_2 =>* w \in T^*, который получается из (1) заменой правил P_p на применение p = AB\alpha' \rightarrow CDE\beta \in P. Аналогично, в случае (2) мы можем заменить применение P_p на p. Кроме того, это верно и для применения P_q, где q \in P_3.

Таким образом, для r \in P_2 U P_3 мы можем заменить все применения P_r на r, то есть получаем вывод w, который состоит только из правил из P. Тогда w \in L(G) и L(G') <= L(G).

Теорема:

Любую грамматику G можно преобразовать к грамматике G_K в нормальной форме Куроды, так что L(G) = L(G_K).

Доказательство:

По лемме 1 построим из G грамматику G', затем по лемме 2 построим из G' грамматику G, Тогда G удовлетворит требованиям леммы 3. Пусть G имеет порядок n. Нсли n = 2, то G в нормальной форме Куроды и G_K = G. Если n >= 3, построим G порядка n - 1 из G по лемме 3.

Понятно, что G удовлетворяет условиям леммы 3, будем повторять процесс, пока не получим грамматику порядка 2, которую и примем за G_K.

@@ Строка 83: / Строка 83: @@
 {{Определение
-|definition=Грамматика имеет '''порядок n''', если |\alpha| <= n и |\beta| <= n для любого ее правила \alpha \rightarrow \beta.
+|definition=Грамматика имеет '''порядок n''', если <tex>|\alpha| <= n</tex> и <tex>|\beta| <= n</tex> для любого ее правила <tex>\alpha \rightarrow \beta</tex>.
 }}
@@ Строка 90: / Строка 90: @@
 |about=об уменьшении порядка грамматики
 |statement=(Уменьшение порядка грамматики)
-Для любой грамматики G = (N, T, P, S) порядка n >= 3, такой что: любое правило из P' имеет вид \alpha \rightarrow \beta, где \alpha \in (N')^+ и \beta \in (N')^+ и |\alpha| <= |\beta| или A \rightarrow a или A \rightarrow \varepsilon, где A \in N' и a \in T
+Для любой грамматики <tex>G = (N, T, P, S)</tex> порядка <tex>n >= 3</tex>, такой что: любое правило из <tex>P'</tex> имеет вид <tex>\alpha \rightarrow \beta</tex>, где <tex>\alpha \in (N')^+</tex> и <tex>\beta \in (N')^+</tex> и <tex>|\alpha| <= |\beta|</tex> или <tex>A \rightarrow a</tex> или <tex>A \rightarrow \varepsilon</tex>, где <tex>A \in N'</tex> и <tex>a \in T</tex> может быть построена грамматика  <tex>G' = (N', T, P', S)</tex> порядка <tex>n - 1</tex> такая, что <tex>L(G') = L(G)</tex>.
-может быть построена грамматика  G' = (N', T, P', S) порядка n - 1 такая, что L(G') = L(G).
+|proof=
-|proof= Разделим P на три подмножества:
+Разделим <tex>P</tex> на три подмножества:
-P_1 = \{ \alpha \rightarrow \beta | \alpha \rightarrow \beta \in P, |\alpha| <= 2, |\beta| <= 2 \},
+<tex>P_1 = \{ \alpha \rightarrow \beta | \alpha \rightarrow \beta \in P, |\alpha| <= 2, |\beta| <= 2 \}</tex>,
-P_2 = \{ \alpha \rightarrow \beta | \alpha \rightarrow \beta \in P, |\alpha| >= 2, |\beta| >= 3 \},
-P_3 = \{ \alpha \rightarrow \beta | \alpha \rightarrow \beta \in P, |\alpha| = 1, |\beta| >= 3 \}.
-Очевидно, что P = P_1 U P_2 U P_3.
-Построим G' следующим образом:
+<tex>P_2 = \{ \alpha \rightarrow \beta | \alpha \rightarrow \beta \in P, |\alpha| >= 2, |\beta| >= 3 \}</tex>,
-* Если правило p \in P_2, то оно имеет вид AB\alpha' \rightarrow CDE\beta', где \alpha' \in N^* и \beta' \in N^*.
- Полагаем N_p = \{ A_p, B_p \}, P_p = \{ AB \rightarrow A_pB_p, A_p  \rightarrow C, B_p\alpha' \rightarrow DE\beta'}, где A_p, B_p {{---}} дополнительные символы не из N: {A_p, B_p) пересечь {A_q, B_q} = 0 для разных правил p и q из P_2.
-* Если правило p \in P_3, то оно имеет вид A \rightarrow CDE\beta', где \beta' \int N^*.
- Полагаем N_p = \{B_p \}, P_p = \{A \rightarrow CB_p, B_p \rightarrow DE\beta'\}, где A_p, B_p {{---}} дополнительные символы.
-Тогда N' = N U (объединение по P из (P_2 U P_3) N_p), P' = P_1 U (объединение по P из (P_2 U P_3) P_p).
+<tex>P_3 = \{ \alpha \rightarrow \beta | \alpha \rightarrow \beta \in P, |\alpha| = 1, |\beta| >= 3 \}</tex>.
-Из построения очевидно, что G' имеет порядок n - 1.
+Очевидно, что <tex>P = P_1 \cup P_2 \cup P_3</tex>.
+Построим <tex>G'</tex> следующим образом:
+* Если правило <tex>p \in P_2</tex>, то оно имеет вид <tex>AB\alpha' \rightarrow CDE\beta'</tex>, где <tex>\alpha' \in N^*</tex> и <tex>\beta' \in N^*</tex>.
+Полагаем <tex>N_p = \{ A_p, B_p \}</tex>, <tex>P_p = \{ AB \rightarrow A_pB_p, A_p  \rightarrow C, B_p\alpha' \rightarrow DE\beta'\}</tex>, где <tex>A_p, B_p</tex> {{---}} дополнительные символы не из <tex>N: \{A_p, B_p\} \cap \{A_q, B_q\} = 0</tex> для разных правил <tex>p</tex> и <tex>q</tex> из <tex>P_2</tex>.
+* Если правило <tex>p \in P_3</tex>, то оно имеет вид <tex>A \rightarrow CDE\beta'</tex>, где <tex>\beta' \in N^*</tex>.
+Полагаем <tex>N_p = \{B_p \}</tex>, <tex>P_p = \{A \rightarrow CB_p, B_p \rightarrow DE\beta'\}</tex>, где <tex>A_p, B_p</tex> {{---}} дополнительные символы.
+Тогда <tex>N' = N \bigcup_{p \in (P_2 \cup P_3)} N_p</tex>, <tex>P' = P_1 \bigcup_{p \in (P_2 \cup P_3)} P_p</tex>.
+Из построения очевидно, что <tex>G'</tex> имеет порядок <tex>n - 1</tex>.
 Покажем, что L(G') = L(G).

Нормальная форма Куроды — различия между версиями

Версия 13:42, 4 января 2015

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты