20616

Фазы трансляции

Лекция

Коммуникация, связь, радиоэлектроника и цифровые приборы

Группы символов соответствующие элементам языка называются токенами. Контекстносвободная грамматика имеет 4 компоненты: множество токенов терминальных символов множество нетерминальных символов множество продукций где слева всегда нетерминал а справа последовательность терминалов нетерминалов указание одного из нетерминалов в качестве стартового символа грамматики. На вход лексического анализатора поступает цепочка символов. Каждый шаг переключение автомата состоит в том что при нахождении в определенном состоянии при...

Русский

2013-07-31

328 KB

1 чел.

Лекция № 1.

Фазы трансляции.

  1.  Написание кода
  2.  Обработка препроцессором
  3.  Модель анализа-синтеза

Компиляция состоит из двух частей: анализа и синтеза.

Анализ — это разбиение исходной программы на составные части и создание ее промежуточного представления.

Синтез — конструирование требуемой целевой программы из промежуточного представления.

Группы символов, соответствующие элементам языка называются токенами.

Position:=initial + rate*50.

Токены:

1. Идентификаторы id1 position 

2. Операция op1:=      

3. id2 initial      

4. op2 +

5. id3 rate       

6. op3 *

7. num1 50

Трансляция инструкции

position:=initial + rate*50

id1:= id2 + id3 * 50

Генерация промежуточного кода

temp1:= inttoreal(50);

temp2:= id3 * temp1;

temp3:= id2 + temp2;

id1:= temp3;

 

Оптимизация

temp1:= id3 * 50;

id1:= id2 + temp1;

Генерация исполнительного кода

mov id3, R2

mulf #50, R2

movf id2, R1

addf R2, R1

movf R2, id1

 Язык определяется синтаксисом и семантикой (как должна выглядеть и что должна делать). Для определения синтаксиса языка используется специальная форма записи, которая называется контекстно – свободная грамматика (BNF).

Для определения семантики используется неформальное описание и примеры. Для лексики используются применения возможных токенов и правила для выделения основных.

 If (выражение) инструкция else инструкция;

Stmt if (expr) stmt else stmt;

 В продукции лексические элементы называются токенами. Переменные типа expr и stmt являются последовательностью токенов и называются нетерминальными символами.

Контекстно-свободная грамматика имеет 4 компоненты:

  1.  множество токенов (терминальных символов)
  2.  множество нетерминальных символов
  3.  множество продукций, где слева всегда нетерминал, а справа последовательность терминалов (нетерминалов)
  4.  указание одного из нетерминалов в качестве стартового символа грамматики.

Begin blockbegin opt_stmts end

…….; opt_stmtsstmt_list|e

…….; stmt_liststmts_list;

…….; stmt|stmt;

End stmt…

 Правила соотношения продукции и дерева

  1.  в корне дерева стартовый символ
  2.  каждый лист помечен токеном или e (пустой)
  3.  каждый внутренний узел нетерминальный
  4.  если А – нетерминал или помечает некоторый внутренний узел, а Х1, Х2, Х3…Хn – отметки его дочерних узлов, то существует продукция следующего вида: АХ1Х2…Хn – могут быть как терминальными, так и нетерминальными. Ае

red (apple)

red (X):-not green (X)

stmt  rule | fact | question

fact  property (object)

rule  property (X):-rule1

rule1  property (X) | property (X), rule1

Лексический анализ

В последовательности его выполнения из последовательности литер (букв языка) выделяются лексемы языка (идентификаторы, служебные слова, константы, знаки операций, комментарии).

На вход лексического анализатора поступает цепочка символов. Лексический анализатор получает элементы этой цепочки, сопоставляет с имеющимися образцами и может производить откаты.

Формальной основой для построения лексического анализатора являются детерминированные конечные автоматы.

Конечный автомат – система, которая в каждый момент времени может находиться в одном из конечного множества состояний. Каждый шаг (переключение) автомата состоит в том, что при нахождении в определенном состоянии при поступлении на вход одного из множества входных символов он переходит в однозначно определенное (детерминированное) состояние и вырабатывает определенное выходное воздействие.

Кроме того, автомат определяется начальным состоянием, в котором он находится на момент начала работы.

Алгоритм работы описывается с помощью диаграммы переходов.

a

e

f

ab

ec

fa

ab

ecd

fha

acd

f(h)a

Пример:

Выделение идентификаторов, целое со знаком, вещественное со знаком, другое.

Таблица символов состоит из полей, включающих полную информацию о всех идентификаторах, встречающихся в программе, так как выявление идентификаторов происходит на этапе выполнения программы. Ключевая задача – определение характерных признаков.

Метод цепочек использует дополнительное поле таблицы, в котором может содержаться ссылка на любой элемент таблицы.

hush

id

link

**

ab

***

***

ba

****

****

de

Методы синтаксического анализа

Предложение языка является цепочкой терминальных символов грамматики. Непосредственным выводом называется замена в некоторой цепочке последовательности символов из правой части продукции на последовательность из левой.

xAyxBy

Последовательность непосредственных выводов основывается на том, что непосредственный вывод может быть применен несколько раз последовательно, в том числе и рекурсивно.

Предложение языка называется правильным, если оно представляет собой цепочку терминальных символов, выводимую из стартового символа грамматики.

Прямое рекурсивное правило – правило, в правой части которого содержится его левая часть: AxAy

 Непрямая рекурсия – содержит неявным образом: BxC; CyB.

Грамматики подразделяются (классы грамматик):

  1.  Контекстно-свободные грамматики.

Характеризуется тем, что в левой части любой продукции находится единственный нетерминал. Наиболее используемый (простые предложения).

  1.  Контекстно–зависимые грамматики.

В левой части содержится терминал. Данный класс является очень сложным, однако позволяет описать тонкие нюансы.

  1.  Регулярные грамматики.

Характеризуется тем, что в правой части может быть не более одного терминального символа, а при его наличии не более одного не терминального символа.

По структуре является достаточно простым, для синтаксического анализа не используется. Используется при описании синтаксических анализаторов.

Нисходящий синтаксический разбор – заключается в поиске очередного нетерминала в выводимой цепочке и замена его на правую часть соответствующей продукции с целью получения в итоге цепочек терминальных символов, соответствующих терминальному предложению. Начальная цепочка представляет собой стартовый символ грамматики.

Восходящий синтаксический разбор – поиск в предложении или промежуточной цепочке правых частей продукции с тем чтобы прийти к стартовому символу грамматики.

Пример:

Описать грамматику сложения-вычитания целых от 0 до 9.

Произвести синтаксический разбор предложения: 9+5-3

Число: 0…9; оператор: +,-

Slist    Нисходящий анализ:

listlist+dig   Slist

listlist-dig   listlist+block

listdig    listlist-block

dig0|1|…|9   list(list)

    block(dig)

    blockdig

     dig0|1|…|9


 

А также другие работы, которые могут Вас заинтересовать

46242. Проявление категории вежливости в русском языке. О социальных аспектах культуры речи 14.09 KB
  Проявление категории вежливости в русском языке. Принципу вежливости и его использованию в речи посвящено немало работ. Например Лакофф формулирует принцип вежливости в виде трех правил: не навязывай своего мнения предоставляй собеседнику возможность выбора будь доброжелательным Цель принципа вежливости поддерживать социальное равновесие и такие социальноречевые отношения которые позволят результативно общаться При выражении вежливости большое значение играет взгляд. Средством выражения вежливости являются также модуляции голоса.
46243. THE STATIVE 14.06 KB
  Unlike such clsses of words s nouns djectives verbs nd dverbs the number of sttives functioning in English is limited. There re bout 30 stble sttives used both in colloquil nd in forml style: frid live like.Semnticlly sttives fll into five groups describing vrious sttes of persons or nonpersons:1.^ From the point of view of their morphologicl composition the clss of sttives is homogeneous tht is ll of them hve specil mrker the prefix : sleep live lone fire etc.
46244. Критический анализ ранних работ Ж.Пиаже. Л.С.Выготский: теоретический, экспериментальный и методологический анализ ранних идей Ж.Пиаже. Ответ Ж.Пиаже Л.С.Выготскому 14.05 KB
  Пиаже считал что детская речь эгоцентрична прежде всего потому что ребёнок говорит лишь со своей точки зрения и не пытается стать на точку зрения собеседника. Выготский писал: Согласно учению Пиаже эгоцентрическая речь ребёнка представляет собой прямое выражение эгоцентризма детской мысли который в свою очередь является компромиссом между изначальным аутизмом детского мышления и постепенной его социализацией что приводит постепенному снижению на нет эгоцентризма. По своей функции эгоцентрическая речь не может быть ничем иным...
46247. Классификация дооржно-ремонтных работ, организация содержания и ремонта дорог 13.87 KB
  Текущий ремонт АД 3.Капитальный ремонт АД Содержание АДкомплекс профилактических работ с учетом сезона выполняемый в течении года по уходу за АД сооружениями и полосой отвода по выявлению и устранению незначительных по объему повреждений и дефектов а также по предотвращению их развития . Состав работ устанавливается по результам обследования фактического состояния дороги или по результату осмотров Текущий ремонт Это комплекс или отдельные виды работ выполняемых с целью предотвращения интенсивного износа покрытий и развития дефектов...
46248. Основные закономерности развития ребенка в младенческом возрасте 13.83 KB
  Основные закономерности развития ребенка в младенческом возрасте. Социальная ситуация психического развития ребенка ситуация мы Л. Ведущий тип деятельности: эмоционально непосредственное общение предметом которого для ребенка является взрослый человек. Дефицит общения в младенческом возрасте оказывает отрицательное влияние на дальнейшее психическое развитие ребенка Эриксон: базовое недоверие к миру.
46250. Виды взрослости в подростковом возрасте 13.76 KB
  Виды взрослости в подростковом возрасте. Подростковый период переходный период от детства к взрослости. Центральное новообразование подросткового возраста возникновение представления о себе как не о ребенке; подросток начинает чувствовать себя взрослым стремится быть и считаться взрослым но у него нет еще ощущения подлинной полноценной взрослости зато есть огромная потребность в признании его взрослости окружающими. Итак чувство взрослости по определению Д.