Участник:Shovkoplyas Grigory — различия между версиями

Версия 19:41, 16 января 2016

Алгоритм Эрли позволяет определить, выводится ли данное слово [math]w[/math] в данной контекстно-свободной грамматике [math]G[/math].

Вход: КС грамматика и слово [math]w[/math].
Выход: [math]true[/math], если [math]w[/math] выводится в [math]G[/math]; [math]false[/math] — иначе.

Содержание

1 Определения
2 Алгоритм Эрли
- 2.1 Псевдокод
3 Корректность алгоритма
- 3.1 Алгоритм не добавит в список ситуацию, которая ему не принадлежит:
- 3.2 В каждый список попадут все ситуации, которые ему принадлежат:
4 Пример
5 Источники информации

Определения

Определение:

Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке .

Определение:

[math]j[/math]-м списком ситуаций для входной цепочки , где , называется множество ситуаций . То есть выводит часть c первого по -й символ.

Лемма:

.

Доказательство:

Поскольку (при ), из определения получаем, что .

Определение:

Последовательность списков ситуаций называется списком разбора для входной цепочки .

Алгоритм Эрли

Чтобы воспользоваться леммой, необходимо найти [math]I_n[/math] для [math]w[/math]. Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении [math]I_j[/math] используются [math]I_0, \ldots, I_{j}[/math] (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).

Алгоритм основывается на следующих трёх правилах:

Если (где [math]a_j[/math] — [math]j[/math]-ый символ строки), то .
Если и , то .
Если и , то .

Псевдокод

Для простоты добавим новый стартовый вспомогательный нетерминал [math]S'[/math] и правило [math](S' \rightarrow S)[/math].

 // Инициализация 
D[0] = {[S' [math]\rightarrow[/math] [math]\cdot[/math]S, 0]}
for i = 1 to len(w) - 1
  D[i] = [math]\varnothing [/math]
 // Основная часть 
for j = 0 to len(w) - 1
  scan(D, j)
  while D[j] изменяется
    complete(D, j)
    predict(D, j)

 // Первое правило 
function scan(D, j)
  if j = 0
    return
  for [A [math]\rightarrow[/math] [math]\alpha[/math][math]\cdot[/math]a[math]\beta[/math], i] [math]\in[/math] D[j - 1]
    if a = w[j - 1]
      D[j] ∪= {[A [math]\rightarrow[/math] [math]\alpha[/math]a[math]\cdot[/math][math]\beta[/math], i]}
 // Второе правило 
function predict(D, j)
  for [A [math]\rightarrow[/math] [math]\alpha[/math][math]\cdot[/math]B[math]\beta[/math], i] [math]\in[/math] D[j]
    for [B [math]\rightarrow[/math] η] [math]\in[/math] P
      D[j] ∪= {[B [math]\rightarrow[/math] [math]\cdot[/math]η]}
 // Третье правило 
function complete(D, j)
  for [B [math]\rightarrow[/math] η[math]\cdot[/math], i] [math]\in[/math] D[j]
    for [A [math]\rightarrow[/math] [math]\alpha[/math][math]\cdot[/math]B[math]\beta[/math], k] [math]\in[/math] D[i]
      D[j] ∪= {[A [math]\rightarrow[/math] [math]\alpha[/math][math]\cdot[/math]B[math]\beta[/math], k]}

Корректность алгоритма

Теорема:

Приведенный алгоритм правильно строит все списки ситуаций.

Доказательство:

Алгоритм не добавит в список ситуацию, которая ему не принадлежит:

Докажем индукцией по исполнению алгоритма.
База (инициализация): и при .
Индукционный переход: пусть в [math] I_{0},...,I_{j} [/math] нет лишних ситуаций. Пусть включаем в [math]I_{j}[/math]. Рассмотрим три случая:

1. Включаем по правилу [math](1)[/math].
Тогда . По предположению и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, и при .

2. Включаем по правилу [math](2)[/math].
Тогда и . По предположению, , откуда . Кроме того, существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, при .

3. Включаем по правилу [math](3)[/math].
Тогда . По предположению и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, при выполнено , следовательно .

В каждый список попадут все ситуации, которые ему принадлежат:

Для всех наборов нужно доказать, что, если , то алгоритм добавит в [math] I_{j}[/math].

Рангом набора [math] \tau [/math] называется , где [math]\tau_{S'}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\gamma}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\alpha}(\tau)[/math] — длина кратчайшего вывода .

Докажем утверждение индукцией по рангу набора.
База: если ранг [math]\tau[/math] равен 0, то . Значит, [math]A = S'[/math], , [math]\beta = S [/math]. При инициализации такая ситуация будет добавлена в [math]I_0[/math].
Индукционный переход: пусть ранг [math]\tau[/math] равен [math]r \gt 0[/math], пусть для всех наборов с меньшими рангами утверждение верно. Докажем для набора [math]\tau[/math]. Для этого рассмотрим три случая:

1. [math]\alpha[/math] оканчивается терминалом.
[math]\alpha = \alpha' c[/math]. , значит [math]c = a_{j}[/math]. Рассмотрим набор . , следовательно ранг [math]\tau'[/math] равен [math]r - 2[/math], так как . Значит, по предположению , и будет добавлена в [math]I_{j}[/math] по правилу [math](1)[/math].

2. [math]\alpha[/math] оканчивается нетерминалом.
[math]\alpha = \alpha' B[/math]. , значит [math]\mathcal {9} k[/math] такое, что .
Рассмотрим набор , его ранг меньше [math]r[/math], следовательно по предположению.
Пусть [math]B \Rightarrow \eta[/math] — первый шаг в кратчайшем выводе . Рассмотрим набор . , следовательно .
Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math]. Тогда . Так как , то . Очевидно, что . Тогда ранг [math]\tau''[/math] равен . Значит, по предположению для [math]\tau''[/math], . Из того, что и , по правилу [math](2)[/math] будет добавлена в [math]I_{j}[/math].

3. [math]\alpha = \varepsilon[/math].
В этом случае .
[math]\tau_{S'}(\tau) \neq 0[/math] т.к. иначе [math] \gamma = \varepsilon[/math], следовательно , откуда [math] r = 0[/math], но [math]r \gt 0[/math]. Т.к. [math]\tau_{S'}(\tau) \gt 0[/math], , где . Рассмотрим набор , где [math]k[/math] такое, что . Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math].

Найдём ранг . . , следовательно ранг равен . Значит, по предположению , следовательно по правилу будет добавлена в .

Пример

Построим список разбора для строки [math]w = (a + a)[/math] в грамматике со следующими правилами:

[math]S \rightarrow T + S[/math];
[math]S \rightarrow T [/math];
[math]T \rightarrow F * T[/math];
[math]T \rightarrow F[/math];
[math]F \rightarrow ( S )[/math];
[math]F \rightarrow a[/math].

Ситуация	Из правила
	0
	3
[math][S \rightarrow \cdot T, 0][/math]	3
	3
[math][T \rightarrow \cdot F, 0][/math]	3
	3
[math][F \rightarrow \cdot a, 0][/math]	3

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 1][/math]	3
	3
[math][T \rightarrow \cdot F, 1][/math]	3
	3
[math][F \rightarrow \cdot a, 1][/math]	3

Ситуация	Из правила
[math][F \rightarrow a \cdot, 1][/math]	1
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 3][/math]	3
	3
[math][T \rightarrow \cdot F, 3][/math]	3
	3
[math][F \rightarrow \cdot a, 3][/math]	3

Ситуация	Из правила
	1
	2
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	2
	2
	2
	2
	2

Так как , то [math]w \in L(G) [/math].

Источники информации

Алексей Сорокин — Алгоритм Эрли
Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.

@@ Строка 37: / Строка 37: @@
 Для простоты добавим новый стартовый вспомогательный нетерминал <tex>S'</tex> и правило <tex>(S' \rightarrow S)</tex>.
   <font color=green> // Инициализация </font>
-  D[0] = {[S' &#x27f6; &middot;S, 0]}
+  D[0] = {[S' <tex>\rightarrow</tex> <tex>\cdot</tex>S, 0]}
   '''for''' i = 1 '''to''' len(w) - 1
     D[i] = <tex>\varnothing </tex>
   <font color=green> // Основная часть </font>
-  '''for''' j = 0 '''to''' len(w) -1
+  '''for''' j = 0 '''to''' len(w) - 1
     scan(D, j)
     '''while''' D[j] изменяется
@@ Строка 51: / Строка 51: @@
     '''if''' j = 0
       '''return'''
-    '''for''' [A &#x27f6; &alpha;&middot;a&beta;, i] &isin; D[j - 1]
+    '''for''' [A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>a<tex>\beta</tex>, i] <tex>\in</tex> D[j - 1]
       '''if''' a = w[j - 1]
-        D[j] &cup;= {[A &#x27f6; &alpha;a&middot;&beta;, i]}
+        D[j] &cup;= {[A <tex>\rightarrow</tex> <tex>\alpha</tex>a<tex>\cdot</tex><tex>\beta</tex>, i]}
   <font color=green> // Второе правило </font>
   '''function''' predict(D, j)
-    '''for''' [A &#x27f6; &alpha;&middot;B&beta;, i] &isin; D[j]
+    '''for''' [A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>B<tex>\beta</tex>, i] <tex>\in</tex> D[j]
-      '''for''' [B &#x27f6; &eta;] &isin; P
+      '''for''' [B <tex>\rightarrow</tex> &eta;] <tex>\in</tex> P
-        D[j] &cup;= {[B &#x27f6; &middot;&eta;]}
+        D[j] &cup;= {[B <tex>\rightarrow</tex> <tex>\cdot</tex>&eta;]}
   <font color=green> // Третье правило </font>
   '''function''' complete(D, j)
-    '''for''' [B &#x27f6; &eta;&middot;, i] &isin; D[j]
+    '''for''' [B <tex>\rightarrow</tex> &eta;<tex>\cdot</tex>, i] <tex>\in</tex> D[j]
-      '''for''' [A &#x27f6; &alpha;&middot;B&beta;, k] &isin; D[i]
+      '''for''' [A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>B<tex>\beta</tex>, k] <tex>\in</tex> D[i]
-        D[j] &cup;= {[A &#x27f6; &alpha;&middot;B&beta;, k]}
+        D[j] &cup;= {[A <tex>\rightarrow</tex> <tex>\alpha</tex><tex>\cdot</tex>B<tex>\beta</tex>, k]}
 ==Корректность алгоритма==

Участник:Shovkoplyas Grigory — различия между версиями

Версия 19:41, 16 января 2016

Содержание

Определения

Алгоритм Эрли

Псевдокод

Корректность алгоритма

Алгоритм не добавит в список ситуацию, которая ему не принадлежит:

В каждый список попадут все ситуации, которые ему принадлежат:

Пример

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты