Участник:Shovkoplyas Grigory — различия между версиями
| Строка 37: | Строка 37: | ||
Для простоты добавим новый стартовый вспомогательный нетерминал <tex>S'</tex> и правило <tex>(S' \rightarrow S)</tex>. | Для простоты добавим новый стартовый вспомогательный нетерминал <tex>S'</tex> и правило <tex>(S' \rightarrow S)</tex>. | ||
<font color=green> // Инициализация </font> | <font color=green> // Инициализация </font> | ||
| − | D[0] = {[S' | + | D[0] = {[S' <tex>\rightarrow</tex> <tex>\cdot</tex>S, 0]} |
'''for''' i = 1 '''to''' len(w) - 1 | '''for''' i = 1 '''to''' len(w) - 1 | ||
D[i] = <tex>\varnothing </tex> | D[i] = <tex>\varnothing </tex> | ||
<font color=green> // Основная часть </font> | <font color=green> // Основная часть </font> | ||
| − | '''for''' j = 0 '''to''' len(w) -1 | + | '''for''' j = 0 '''to''' len(w) - 1 |
scan(D, j) | scan(D, j) | ||
'''while''' D[j] изменяется | '''while''' D[j] изменяется | ||
| Строка 51: | Строка 51: | ||
'''if''' j = 0 | '''if''' j = 0 | ||
'''return''' | '''return''' | ||
| − | '''for''' [A | + | '''for''' [A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>a<tex>\beta</tex>, i] <tex>\in</tex> D[j - 1] |
'''if''' a = w[j - 1] | '''if''' a = w[j - 1] | ||
| − | D[j] ∪= {[A | + | D[j] ∪= {[A <tex>\rightarrow</tex> <tex>\alpha</tex>a<tex>\cdot</tex><tex>\beta</tex>, i]} |
| − | |||
<font color=green> // Второе правило </font> | <font color=green> // Второе правило </font> | ||
'''function''' predict(D, j) | '''function''' predict(D, j) | ||
| − | '''for''' [A | + | '''for''' [A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>B<tex>\beta</tex>, i] <tex>\in</tex> D[j] |
| − | '''for''' [B | + | '''for''' [B <tex>\rightarrow</tex> η] <tex>\in</tex> P |
| − | D[j] ∪= {[B | + | D[j] ∪= {[B <tex>\rightarrow</tex> <tex>\cdot</tex>η]} |
| − | |||
<font color=green> // Третье правило </font> | <font color=green> // Третье правило </font> | ||
'''function''' complete(D, j) | '''function''' complete(D, j) | ||
| − | '''for''' [B | + | '''for''' [B <tex>\rightarrow</tex> η<tex>\cdot</tex>, i] <tex>\in</tex> D[j] |
| − | '''for''' [A | + | '''for''' [A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>B<tex>\beta</tex>, k] <tex>\in</tex> D[i] |
| − | D[j] ∪= {[A | + | D[j] ∪= {[A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>B<tex>\beta</tex>, k]} |
==Корректность алгоритма== | ==Корректность алгоритма== | ||
Версия 19:41, 16 января 2016
Алгоритм Эрли позволяет определить, выводится ли данное слово в данной контекстно-свободной грамматике .
Вход: КС грамматика и слово .
Выход: , если выводится в ; — иначе.
Содержание
Определения
| Определение: |
| Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке . |
| Определение: |
| -м списком ситуаций для входной цепочки , где , называется множество ситуаций . То есть выводит часть c первого по -й символ. |
| Лемма: |
. |
| Доказательство: |
| Поскольку (при ), из определения получаем, что . |
| Определение: |
| Последовательность списков ситуаций называется списком разбора для входной цепочки . |
Алгоритм Эрли
Чтобы воспользоваться леммой, необходимо найти для . Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении используются (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).
Алгоритм основывается на следующих трёх правилах:
- Если (где — -ый символ строки), то .
- Если и , то .
- Если и , то .
Псевдокод
Для простоты добавим новый стартовый вспомогательный нетерминал и правило .
// Инициализация
D[0] = {[S' S, 0]}
for i = 1 to len(w) - 1
D[i] =
// Основная часть
for j = 0 to len(w) - 1
scan(D, j)
while D[j] изменяется
complete(D, j)
predict(D, j)
// Первое правило
function scan(D, j)
if j = 0
return
for [A a, i] D[j - 1]
if a = w[j - 1]
D[j] ∪= {[A a, i]}
// Второе правило
function predict(D, j)
for [A B, i] D[j]
for [B η] P
D[j] ∪= {[B η]}
// Третье правило
function complete(D, j)
for [B η, i] D[j]
for [A B, k] D[i]
D[j] ∪= {[A B, k]}
Корректность алгоритма
| Теорема: |
Приведенный алгоритм правильно строит все списки ситуаций. |
| Доказательство: |
Алгоритм не добавит в список ситуацию, которая ему не принадлежит:Докажем индукцией по исполнению алгоритма. 1. Включаем по правилу . 2. Включаем по правилу . 3. Включаем по правилу . В каждый список попадут все ситуации, которые ему принадлежат:Для всех наборов нужно доказать, что, если , то алгоритм добавит в . Рангом набора называется , где — длина кратчайшего вывода , — длина кратчайшего вывода , — длина кратчайшего вывода . Докажем утверждение индукцией по рангу набора. 1. оканчивается терминалом. 2. оканчивается нетерминалом. 3. . |
Пример
Построим список разбора для строки в грамматике со следующими правилами:
- ;
- ;
- ;
- ;
- ;
- .
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
Так как , то .
Источники информации
- Алексей Сорокин — Алгоритм Эрли
- Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.