Участник:Shovkoplyas Grigory — различия между версиями

Версия 20:00, 16 января 2016

Алгоритм Эрли позволяет определить, выводится ли данное слово [math]w[/math] в данной контекстно-свободной грамматике [math]G[/math].

Вход: КС грамматика и слово [math]w[/math].
Выход: [math]true[/math], если [math]w[/math] выводится в [math]G[/math]; [math]false[/math] — иначе.

Содержание

1 Определения
2 Алгоритм Эрли
- 2.1 Псевдокод
3 Корректность алгоритма
- 3.1 Алгоритм не добавит в список ситуацию, которая ему не принадлежит:
- 3.2 В каждый список попадут все ситуации, которые ему принадлежат:
4 Пример
5 Источники информации

Определения

Определение:

Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке .

Определение:

[math]j[/math]-м списком ситуаций для входной цепочки , где , называется множество ситуаций . То есть выводит часть c первого по -й символ.

Лемма:

.

Доказательство:

Поскольку (при ), из определения получаем, что .

Определение:

Последовательность списков ситуаций называется списком разбора для входной цепочки .

Алгоритм Эрли

Чтобы воспользоваться леммой, необходимо найти [math]D_n[/math] для [math]w[/math]. Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении [math]D_j[/math] используются [math]D_0, \ldots, D_{j}[/math] (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).

Алгоритм основывается на следующих трёх правилах:

Если (где [math]w_j[/math] — [math]j[/math]-ый символ строки), то .
Если и , то .
Если и , то .

Псевдокод

Для простоты добавим новый стартовый вспомогательный нетерминал [math]S'[/math] и правило [math](S' \rightarrow S)[/math].

 // Инициализация 
D[0] = {[math][S' \rightarrow \cdot S, 0][/math]}
for i = 1 to len(w) - 1
  D[i] = [math]\varnothing [/math]
 // Основная часть 
for j = 0 to len(w) - 1
  scan(D, j)
  while D[j] изменяется
    complete(D, j)
    predict(D, j)

 // Первое правило 
function scan(D, j)
  if j = 0
    return
  for [math][A \rightarrow \alpha \cdot a \beta, i][/math] [math]\in[/math] D[j - 1]
    if a = w[j - 1]
      D[j] [math]\cup[/math]= {[math][A \rightarrow \alpha \cdot a \beta, i][/math]}
 // Второе правило 
function predict(D, j)
  for [math][A \rightarrow \alpha \cdot B \beta, i][/math] [math]\in[/math] D[j]
    for [math][B \rightarrow \eta][/math] [math]\in[/math] P
      D[j] [math]\cup[/math]= {[math][B \rightarrow \cdot \eta, j][/math]}
 // Третье правило 
function complete(D, j)
  for [math][B \rightarrow \eta \cdot, i][/math] [math]\in[/math] D[j]
    for [math][A \rightarrow \alpha \cdot B \beta, k][/math] [math]\in[/math] D[i]
      D[j] [math]\cup[/math]= {[math][A \rightarrow \alpha B \cdot \beta, k][/math]}

Корректность алгоритма

Теорема:

Приведенный алгоритм правильно строит все списки ситуаций.

Доказательство:

Алгоритм не добавит в список ситуацию, которая ему не принадлежит:

Докажем индукцией по исполнению алгоритма.
База (инициализация): и при .
Индукционный переход: пусть в [math] I_{0},...,I_{j} [/math] нет лишних ситуаций. Пусть включаем в [math]I_{j}[/math]. Рассмотрим три случая:

1. Включаем по правилу [math](1)[/math].
Тогда . По предположению и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, и при .

2. Включаем по правилу [math](2)[/math].
Тогда и . По предположению, , откуда . Кроме того, существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, при .

3. Включаем по правилу [math](3)[/math].
Тогда . По предположению и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, при выполнено , следовательно .

В каждый список попадут все ситуации, которые ему принадлежат:

Для всех наборов нужно доказать, что, если , то алгоритм добавит в [math] I_{j}[/math].

Рангом набора [math] \tau [/math] называется , где [math]\tau_{S'}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\gamma}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\alpha}(\tau)[/math] — длина кратчайшего вывода .

Докажем утверждение индукцией по рангу набора.
База: если ранг [math]\tau[/math] равен 0, то . Значит, [math]A = S'[/math], , [math]\beta = S [/math]. При инициализации такая ситуация будет добавлена в [math]I_0[/math].
Индукционный переход: пусть ранг [math]\tau[/math] равен [math]r \gt 0[/math], пусть для всех наборов с меньшими рангами утверждение верно. Докажем для набора [math]\tau[/math]. Для этого рассмотрим три случая:

1. [math]\alpha[/math] оканчивается терминалом.
[math]\alpha = \alpha' c[/math]. , значит [math]c = a_{j}[/math]. Рассмотрим набор . , следовательно ранг [math]\tau'[/math] равен [math]r - 2[/math], так как . Значит, по предположению , и будет добавлена в [math]I_{j}[/math] по правилу [math](1)[/math].

2. [math]\alpha[/math] оканчивается нетерминалом.
[math]\alpha = \alpha' B[/math]. , значит [math]\mathcal {9} k[/math] такое, что .
Рассмотрим набор , его ранг меньше [math]r[/math], следовательно по предположению.
Пусть [math]B \Rightarrow \eta[/math] — первый шаг в кратчайшем выводе . Рассмотрим набор . , следовательно .
Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math]. Тогда . Так как , то . Очевидно, что . Тогда ранг [math]\tau''[/math] равен . Значит, по предположению для [math]\tau''[/math], . Из того, что и , по правилу [math](2)[/math] будет добавлена в [math]I_{j}[/math].

3. [math]\alpha = \varepsilon[/math].
В этом случае .
[math]\tau_{S'}(\tau) \neq 0[/math] т.к. иначе [math] \gamma = \varepsilon[/math], следовательно , откуда [math] r = 0[/math], но [math]r \gt 0[/math]. Т.к. [math]\tau_{S'}(\tau) \gt 0[/math], , где . Рассмотрим набор , где [math]k[/math] такое, что . Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math].

Найдём ранг . . , следовательно ранг равен . Значит, по предположению , следовательно по правилу будет добавлена в .

Пример

Построим список разбора для строки [math]w = (a + a)[/math] в грамматике со следующими правилами:

[math]S \rightarrow T + S[/math];
[math]S \rightarrow T [/math];
[math]T \rightarrow F * T[/math];
[math]T \rightarrow F[/math];
[math]F \rightarrow ( S )[/math];
[math]F \rightarrow a[/math].

Ситуация	Из правила
	0
	3
[math][S \rightarrow \cdot T, 0][/math]	3
	3
[math][T \rightarrow \cdot F, 0][/math]	3
	3
[math][F \rightarrow \cdot a, 0][/math]	3

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 1][/math]	3
	3
[math][T \rightarrow \cdot F, 1][/math]	3
	3
[math][F \rightarrow \cdot a, 1][/math]	3

Ситуация	Из правила
[math][F \rightarrow a \cdot, 1][/math]	1
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 3][/math]	3
	3
[math][T \rightarrow \cdot F, 3][/math]	3
	3
[math][F \rightarrow \cdot a, 3][/math]	3

Ситуация	Из правила
	1
	2
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	2
	2
	2
	2
	2

Так как , то [math]w \in L(G) [/math].

Источники информации

Алексей Сорокин — Алгоритм Эрли
Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.

@@ Строка 27: / Строка 27: @@
 == Алгоритм Эрли ==
-Чтобы воспользоваться леммой, необходимо найти <tex>I_n</tex> для <tex>w</tex>. Алгоритм Эрли является [[Динамическое программирование|динамическим алгоритмом]]: он последовательно строит список разбора, причём при построении <tex>I_j</tex> используются <tex>I_0, \ldots, I_{j}</tex> (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).
+Чтобы воспользоваться леммой, необходимо найти <tex>D_n</tex> для <tex>w</tex>. Алгоритм Эрли является [[Динамическое программирование|динамическим алгоритмом]]: он последовательно строит список разбора, причём при построении <tex>D_j</tex> используются <tex>D_0, \ldots, D_{j}</tex> (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).
 Алгоритм основывается на следующих трёх правилах:
-# Если <tex>[A \rightarrow \alpha \cdot a_{j} \beta, i] \in I_{j-1}</tex> (где <tex>a_j</tex> — <tex>j</tex>-ый символ строки), то <tex>[A \rightarrow \alpha a_{j} \cdot \beta, i] \in I_j</tex>.
+# Если <tex>[A \rightarrow \alpha \cdot w_{j} \beta, i] \in D_{j-1}</tex> (где <tex>w_j</tex> — <tex>j</tex>-ый символ строки), то <tex>[A \rightarrow \alpha w_{j} \cdot \beta, i] \in D_j</tex>.
-# Если <tex>[B \rightarrow \eta \cdot , k] \in I_j</tex> и <tex>[A \rightarrow \alpha \cdot B \beta, i] \in I_{k}</tex>, то <tex>[A \rightarrow \alpha B \cdot \beta, i] \in I_j</tex>.
+# Если <tex>[ \rightarrow \eta \cdot , k] \in I_j</tex> и <tex>[A \rightarrow \alpha \cdot B \beta, i] \in I_{k}</tex>, то <tex>[A \rightarrow \alpha B \cdot \beta, i] \in I_j</tex>.
 # Если <tex>[B \rightarrow \alpha \cdot A \eta, k] \in I_j</tex> и <tex>(A \rightarrow \beta) \in P</tex>, то <tex>[A \rightarrow \cdot \beta, j] \in I_j</tex>.
@@ Строка 58: / Строка 58: @@
     '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, i]</tex> <tex>\in</tex> D[j]
       '''for''' <tex>[B \rightarrow \eta]</tex> <tex>\in</tex> P
-        D[j] <tex>\cup</tex>= {<tex>[B \rightarrow \eta]</tex>}
+        D[j] <tex>\cup</tex>= {<tex>[B \rightarrow \cdot \eta, j]</tex>}
   <font color=green> // Третье правило </font>
   '''function''' complete(D, j)
     '''for''' <tex>[B \rightarrow \eta \cdot, i]</tex> <tex>\in</tex> D[j]
       '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, k]</tex> <tex>\in</tex> D[i]
-        D[j] <tex>\cup</tex>= {<tex>[A \rightarrow \alpha \cdot B \beta, k]</tex>}
+        D[j] <tex>\cup</tex>= {<tex>[A \rightarrow \alpha B \cdot \beta, k]</tex>}
 ==Корректность алгоритма==

Участник:Shovkoplyas Grigory — различия между версиями

Версия 20:00, 16 января 2016

Содержание

Определения

Алгоритм Эрли

Псевдокод

Корректность алгоритма

Алгоритм не добавит в список ситуацию, которая ему не принадлежит:

В каждый список попадут все ситуации, которые ему принадлежат:

Пример

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты