LL(k)-грамматики, множества FIRST и FOLLOW
Наибольший интерес в построении синтаксических анализаторов (парсеров) представляют LL(1)-грамматики, так как для них возможно построение нисходящих парсеров без возврата, то есть без корректировки выбранных правил в грамматике. LL(1)-грамматики являются подмножеством КС-грамматик. Однако для достаточно большого количества формальных языков можно построить LL(1)-грамматику, например, для языка арифметических выражений и даже для некоторых языков программирования, в частности можно и для языка Java.
Содержание
LL(k)-грамматика
Дадим теперь формально определение LL(k)-грамматики.
| Определение: |
| Пусть — КС-грамматика. Рассмотрим возникновение следующей ситуации во время левостороннего вывода в этой грамматике слова :
где — стартовый нетерминал грамматики, и — цепочки из терминалов, уже разобранная часть слова , — нетерминал грамматики, в которой есть правила и , причём — последовательности из терминалов и нетерминалов. |
Неформально это означает, что если мы уже вывели какой-то префикс разбираемого слова, то, посмотрев на следующие cимволов, сможем одназначно выбрать правило вывода.
TODO: картинка
LL(1)-грамматика является частным случаем. Её определение почти такое же, только вместо строки один символ .
FIRST и FOLLOW
Ключевую роль в построении парсеров для LL(1)-грамматик играю множества и .
Пусть — символ из алфавита , — строки из нетерминалов и терминалов (возможно пустые), — нетерминалы грамматики (начальный и произвольный соответственно), — символ окончания слова. Тогда определим и следующим образом:
| Определение: |
| Определение: |
Другими словами, — все символы (терминалы), с которых могут начинаться всевозможные выводы из , а — всевозможные символы, которые встречаются после нетерминала во всех правилах грамматики.
Примеры
TODO: Какие-нибудь примеры
Теорема о связи LL(1)-грамматики с множествами FIRST и FOLLOW
TODO: Теорема об LL(1)-грамматиках
TODO: Пара следствий