Удаление eps-правил из грамматики — различия между версиями
м (→Литература) |
м (→Доказательство корректности алгоритма) |
||
| Строка 71: | Строка 71: | ||
Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G}{\Rightarrow}Y_1 Y_2...Y_m | Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G}{\Rightarrow}Y_1 Y_2...Y_m | ||
\overset{*}{\underset{G}{\Rightarrow}}w</tex>, где <tex>Y_i \in N \cup \Sigma </tex>. Цепочку <tex>w</tex> можно разбить на <tex>w_1 w_2...w_m</tex>, где <tex>Y_i \overset{*}{\underset{G'}{\Rightarrow}}w_i</tex>.<br/> | \overset{*}{\underset{G}{\Rightarrow}}w</tex>, где <tex>Y_i \in N \cup \Sigma </tex>. Цепочку <tex>w</tex> можно разбить на <tex>w_1 w_2...w_m</tex>, где <tex>Y_i \overset{*}{\underset{G'}{\Rightarrow}}w_i</tex>.<br/> | ||
| − | Пусть <tex>X_1, X_2, ... X_k</tex> будут теми из <tex>Y_j</tex>(в порядке записи), для которых <tex>w_i \ne \varepsilon</tex>. <tex>k \ge 1</tex>, поскольку <tex>w \ne \varepsilon</tex>.<br/> Таким образом <tex>A \rightarrow X_1 X_2 ... X_k</tex> является правилом в <tex>G'</tex> по построению <tex>G'</tex>. | + | Пусть <tex>X_1, X_2, ... X_k</tex> будут теми из <tex>Y_j</tex> (в порядке записи), для которых <tex>w_i \ne \varepsilon</tex>. <tex>k \ge 1</tex>, поскольку <tex>w \ne \varepsilon</tex>.<br/> Таким образом <tex>A \rightarrow X_1 X_2 ... X_k</tex> является правилом в <tex>G'</tex> по построению <tex>G'</tex>. |
Утверждаем, что <tex> X_1 X_2...X_k \overset{*}{\underset{G}{\Rightarrow}}w</tex>, поскольку только <tex>Y_j</tex>, которых нет среди <tex>X_1, X_2, ... X_k</tex>, использованы для порождения <tex>\varepsilon</tex> и не вносят ничего в порождение <tex>w</tex>. | Утверждаем, что <tex> X_1 X_2...X_k \overset{*}{\underset{G}{\Rightarrow}}w</tex>, поскольку только <tex>Y_j</tex>, которых нет среди <tex>X_1, X_2, ... X_k</tex>, использованы для порождения <tex>\varepsilon</tex> и не вносят ничего в порождение <tex>w</tex>. | ||
Так как каждое из порождений <tex>Y_j \overset{*}{\underset{G}{\Rightarrow}}w_j</tex> содержит менее <tex>n</tex> шагов, к ним можно применить предположение индукции и заключить, что если <tex>w_j \ne \varepsilon</tex>, то <tex>Y_j \overset{*}{\underset{G'}{\Rightarrow}}w_j</tex>.<br/> | Так как каждое из порождений <tex>Y_j \overset{*}{\underset{G}{\Rightarrow}}w_j</tex> содержит менее <tex>n</tex> шагов, к ним можно применить предположение индукции и заключить, что если <tex>w_j \ne \varepsilon</tex>, то <tex>Y_j \overset{*}{\underset{G'}{\Rightarrow}}w_j</tex>.<br/> | ||
Версия 06:55, 15 ноября 2011
Содержание
Основные определения
| Определение: |
| Правила вида называются -правилами. |
| Определение: |
Назовем КС грамматику грамматикой без -правил (или неукорачивающей), если либо
|
| Определение: |
| Нетерминал называется -порождающим, если . |
Алгоритм удаления ε-правил из грамматики
Поиск ε-порождающих нетерминалов
Схема алгоритма:
- 1) Если — правило грамматики , то — -порождающий нетерминал.
- 2) Если — правило грамматики , где каждый — -порождающий нетерминал, то — -порождающий нетерминал.
| Теорема: |
Нетерминал является -порождающим тогда и только тогда, когда вышеприведенный алгоритм идентифицирует как -порождающий. |
| Доказательство: |
|
Индукция по длине кратчайшего порождения
|
Схема алгоритма удаления ε-правил из грамматики
Вход. КС грамматика .
Выход. КС грамматика .
Схема алгоритма:
- 1) Найти все -порождаюшие нетерминалы.
- 2) Удалить все -правила из .
- 3) Рассмотрим правила вида (*) , где — последовательности из терминалов и нетерминалов, — -порождающие нетерминалы. Добавить все возможные правила вида (*), в которых либо присутствует, либо отсутствует , кроме правила . Такое правило может возникнуть, если все .
Замечание
Если в исходной грамматике есть правило и встречается в правых частях, то для того, чтобы получить эквивалентную грамматику без -правил, необходимо после применения описанного выше алгоритма добавить новый нетерминал , сделать его стартовым, добавить правила .
Доказательство корректности алгоритма
| Теорема: |
Если грамматика была построена с помощью описанного выше алгоритма по грамматике , то . |
| Доказательство: |
|
Для этого достаточно доказать, что тогда и только тогда, когда и (*). <br\>
Пусть . Несомненно, , поскольку - грамматика без -правил и .
В этом случае в есть правило . Согласно конструкции в есть правило , причем это , символы которой, возможно, перемежаются порождающими переменными. Тогда в есть порождения , где на шагах после первого, из всех переменных в цепочке выводиться .
Пусть в порождении шагов, . Тогда оно имеет вид , где . Первое использованное правило должно быть построено по правилу , где цепочка совпадает с цепочкой , цепочка , возможно, перемежаются порождающими переменными. Ч.т.д.
является правилом в . Поскольку , эта же правило будет и в , поэтому .
Пусть в порождении шагов, . Тогда оно имеет вид , где . Цепочку можно разбить на , где . |
Литература
- Хопкрофт Дж., Мотвани Р., Ульман Д.. Введение в теорию автоматов, языков и вычислений, 2-е изд.. : Пер. с англ. ‒ М. : Издательский дом "Вильямс", 2002. ‒ 528 с.