29376

Принципы работы сканера

Доклад

Информатика, кибернетика и программирование

Синтаксис целых констант представляется: целое ::=цифра знак цифра целое цифра знак ::= Для представления грамматики состояния целых констант диаграмма имеет вид:Вершины соответствуют состояниям автомата и определяются нетерминальными символами. Построим диаграмму состояний для автомата который распознает лексемы трех типов: целые константы десятичные константы идентификаторы идентр ::=буква идентр буква идентр цифра десятичная константа: дес.число цифра смеше число цифра смеше число ::= целое целое ::=цифра знак цифра целое цифра...

Английский

2013-08-21

95.5 KB

0 чел.

12) Принципы работы сканера.

Синтаксис отдельных лексем описывается, главным образом, с использованием регулярных грамматик. Для них продукция имеет следующую форму:
А→а|Ва или А→а|аВ
а – терминальные символы, А,В – нетерминальные
Функционирование сканера базируется на грамматическом описании лексем, в основе построения сканера лежит конечный автомат, соответствующий используемой грамматике.
Конечный автомат – математическая машина, которая определяется множеством возможных состояний, множеством возможных переходов между состояниями и множеством возможных символов, управляющих этими переходами.
Геометрическое функционирование конечного автомата можно задать графовой моделью, которая называется диаграммой состояния.
Пример. 
Синтаксис целых констант представляется:

<целое>::=цифра|<знак>цифра|<целое>цифра
<знак>::= +|-
Для представления грамматики состояния целых констант диаграмма имеет вид:

Вершины соответствуют состояниям автомата и определяются нетерминальными символами. Дуги описывают возможные переходы между состояниями и соответствуют продукции грамматики.
Для заданной грамматики определяются следующие лексемы:
1) каждому нетерминальному символу сопоставляется вершина графа с соответствующим именем
2) добавляется дополнительная вершина, соответствующая начальному состоянию автомата с именем Старт
3) каждому правилу вывода следующего вида А→а сопоставляется дуга, связывающая вершины Старт и А, которая помечается терминальным символом а
4) каждой продукции А→Ва сопоставляется дуга 
, которая также помечается терминальным символом а
Распознавание лексем с использованием диаграмм состояний конечного автомата осуществляется следующим образом:
1) исходным состоянием является состояние Старт
2) последовательно сканируются (считываются) символы входной цепочки и в соответствии с очередным считывающимся символом выполняется переход автомата в следующее состояние. Этот переход происходит из текущей вершины в то состояние ( вершину), в которую направлена дуга, помеченная символом, совпадающим со считанным символом входной цепи.
3) Переходы между состояниями продолжаются до остановки автомата, которая происходит в двух случаях:
• Считаны все символы входной цепочки
• Переход в следующее состояние невозможен, т.к. не найдена дуга, помеченная считанным символом.
В итоге лексемы будут распознаны, если работа автомата заканчивается в состоянии, соответствующем начальному символу грамматики. На диаграмме эта вершина выделена 

По мере считывания символов входной цепочки фиксируется символ, на котором автомат начинает работу ( выходит из состояния Старт) и на котором заканчивает работу, т.е. останавливается. 
Сама лексема состоит из тех считанных символов, начиная с которых автомат вышел из сосояния старт и до символа, на котором автомат завершил работу. 

Построим диаграмму состояний для автомата, который распознает лексемы трех типов: целые константы, десятичные константы, идентификаторы

<идент-р>::=буква|<идент-р>буква|<идент-р>цифра



десятичная константа:

<дес.число>::=<дес.число>цифра|<смеш-е число>цифра
<смеш-е число>::=<целое>
<целое>::=цифра|<знак>цифра|<целое>цифра
<знак>::=+|-


С точки зрения процесса трансляции в целом, сканер может быть реализован в двух вариантах:
1) сканер выполняет полный лексический анализ всей программы и формирует эквивалентную последовательность лексем, которая потом используется на фазе синтаксического анализа

2) сканер выполняется в виде подпрограмм, к которым обращается синтаксический анализатор, когда требуется очередная лексема для грамматического разбора

Применение второго варианта часто является более предпочтительным, т.к. не требуется хранить всю исходную программу, представленную в виде последовательности лексем.


 

А также другие работы, которые могут Вас заинтересовать

47448. Антропогенез 83.5 KB
  Место человека в системе животного мира 2. Методы изучения эволюции человека 3. Адаптивные экологические типы человека 4. Место человека в системе животного мира Неограниченный прогресс в эволюции живой материи проявился в возникновении человека как биосоциального существа.
47449. Общая экология. Основные понятия экологии 45 KB
  Факторы среды и адаптации к ним организмов. Среды жизни и адаптации к ним организмов 5. Связи организмов в экосистемах 1. Геккелем для обозначения науки изучающей о взаимоотношения организмов со средой обитания.
47450. Общая экология. Виды биологических ритмов 42 KB
  Динамика и развитие экосистем. Динамика экосистем 2. Динамика и развитие экосистем. Динамика экосистем Любая экосистема приспосабливаясь к изменениям внешней среды находится в состоянии динамики.
47451. Биология как наука. Общая характеристика жизни 44.5 KB
  Общая характеристика жизни. Общая характеристика жизни. Развитие представлений о сущности жизни. Определение жизни.
47452. Клетка – элементарная биологическая система 117 KB
  Вне клетки не существует настоящей жизнедеятельности. Исходя из предположения о схожести гомологичности растительных и животных клеток доказываемой одинаковым механизмом их возникновения Шванн обобщил многочисленные данные в виде теории согласно которой клетки являются структурной и функциональной основой живых существ. Ему принадлежит вывод о том что клетка может возникнуть лишь из предсуществующей клетки. Выдающаяся роль клетки как первоисточника жизни обусловливается тем что именно она является биологической единицей с помощью...
47453. Изменчивость и ее формы 41.5 KB
  Изменчивость и ее формы. Изменчивость как свойство живых систем Модификационная изменчивость. Наследственная генотипическая изменчивость
47454. Генетика человека. Нормальная наследственность человека 31.5 KB
  Генеалогический метод Популяционностатистический метод Близнецовый метод Метод дерматоглифики Цитогенетический метод Биохимические методы Методы рекомбинантной ДНК Методы генетики соматических клеток Карты хромосом 1. Генеалогический метод Генеалогический метод является наиболее старым методом генетики человека. Метод относительно прост и доступен. В методе составляются и ё анализируются семейные родословные что позволяет определить наследственный или ненаследственный характер заболевания отдельного симптома;...
47455. Медицинская генетика. Медико-генетическое консультирование 33.5 KB
  Наследственные болезни человека Генные болезни Хромосомные болезни Болезни с наследственным предрасположением
47456. Воспроизведение на организменном уровне (размножение организмов). Онтогенез, общие закономерности. Прогенез 42.5 KB
  Тема: Воспроизведение на организменном уровне размножение организмов. Размножение организмов Бесполое размножение. Половое размножение