20616

Фазы трансляции

Лекция

Коммуникация, связь, радиоэлектроника и цифровые приборы

Группы символов соответствующие элементам языка называются токенами. Контекстносвободная грамматика имеет 4 компоненты: множество токенов терминальных символов множество нетерминальных символов множество продукций где слева всегда нетерминал а справа последовательность терминалов нетерминалов указание одного из нетерминалов в качестве стартового символа грамматики. На вход лексического анализатора поступает цепочка символов. Каждый шаг переключение автомата состоит в том что при нахождении в определенном состоянии при...

Русский

2013-07-31

328 KB

1 чел.

Лекция № 1.

Фазы трансляции.

  1.  Написание кода
  2.  Обработка препроцессором
  3.  Модель анализа-синтеза

Компиляция состоит из двух частей: анализа и синтеза.

Анализ — это разбиение исходной программы на составные части и создание ее промежуточного представления.

Синтез — конструирование требуемой целевой программы из промежуточного представления.

Группы символов, соответствующие элементам языка называются токенами.

Position:=initial + rate*50.

Токены:

1. Идентификаторы id1 position 

2. Операция op1:=      

3. id2 initial      

4. op2 +

5. id3 rate       

6. op3 *

7. num1 50

Трансляция инструкции

position:=initial + rate*50

id1:= id2 + id3 * 50

Генерация промежуточного кода

temp1:= inttoreal(50);

temp2:= id3 * temp1;

temp3:= id2 + temp2;

id1:= temp3;

 

Оптимизация

temp1:= id3 * 50;

id1:= id2 + temp1;

Генерация исполнительного кода

mov id3, R2

mulf #50, R2

movf id2, R1

addf R2, R1

movf R2, id1

 Язык определяется синтаксисом и семантикой (как должна выглядеть и что должна делать). Для определения синтаксиса языка используется специальная форма записи, которая называется контекстно – свободная грамматика (BNF).

Для определения семантики используется неформальное описание и примеры. Для лексики используются применения возможных токенов и правила для выделения основных.

 If (выражение) инструкция else инструкция;

Stmt if (expr) stmt else stmt;

 В продукции лексические элементы называются токенами. Переменные типа expr и stmt являются последовательностью токенов и называются нетерминальными символами.

Контекстно-свободная грамматика имеет 4 компоненты:

  1.  множество токенов (терминальных символов)
  2.  множество нетерминальных символов
  3.  множество продукций, где слева всегда нетерминал, а справа последовательность терминалов (нетерминалов)
  4.  указание одного из нетерминалов в качестве стартового символа грамматики.

Begin blockbegin opt_stmts end

…….; opt_stmtsstmt_list|e

…….; stmt_liststmts_list;

…….; stmt|stmt;

End stmt…

 Правила соотношения продукции и дерева

  1.  в корне дерева стартовый символ
  2.  каждый лист помечен токеном или e (пустой)
  3.  каждый внутренний узел нетерминальный
  4.  если А – нетерминал или помечает некоторый внутренний узел, а Х1, Х2, Х3…Хn – отметки его дочерних узлов, то существует продукция следующего вида: АХ1Х2…Хn – могут быть как терминальными, так и нетерминальными. Ае

red (apple)

red (X):-not green (X)

stmt  rule | fact | question

fact  property (object)

rule  property (X):-rule1

rule1  property (X) | property (X), rule1

Лексический анализ

В последовательности его выполнения из последовательности литер (букв языка) выделяются лексемы языка (идентификаторы, служебные слова, константы, знаки операций, комментарии).

На вход лексического анализатора поступает цепочка символов. Лексический анализатор получает элементы этой цепочки, сопоставляет с имеющимися образцами и может производить откаты.

Формальной основой для построения лексического анализатора являются детерминированные конечные автоматы.

Конечный автомат – система, которая в каждый момент времени может находиться в одном из конечного множества состояний. Каждый шаг (переключение) автомата состоит в том, что при нахождении в определенном состоянии при поступлении на вход одного из множества входных символов он переходит в однозначно определенное (детерминированное) состояние и вырабатывает определенное выходное воздействие.

Кроме того, автомат определяется начальным состоянием, в котором он находится на момент начала работы.

Алгоритм работы описывается с помощью диаграммы переходов.

a

e

f

ab

ec

fa

ab

ecd

fha

acd

f(h)a

Пример:

Выделение идентификаторов, целое со знаком, вещественное со знаком, другое.

Таблица символов состоит из полей, включающих полную информацию о всех идентификаторах, встречающихся в программе, так как выявление идентификаторов происходит на этапе выполнения программы. Ключевая задача – определение характерных признаков.

Метод цепочек использует дополнительное поле таблицы, в котором может содержаться ссылка на любой элемент таблицы.

hush

id

link

**

ab

***

***

ba

****

****

de

Методы синтаксического анализа

Предложение языка является цепочкой терминальных символов грамматики. Непосредственным выводом называется замена в некоторой цепочке последовательности символов из правой части продукции на последовательность из левой.

xAyxBy

Последовательность непосредственных выводов основывается на том, что непосредственный вывод может быть применен несколько раз последовательно, в том числе и рекурсивно.

Предложение языка называется правильным, если оно представляет собой цепочку терминальных символов, выводимую из стартового символа грамматики.

Прямое рекурсивное правило – правило, в правой части которого содержится его левая часть: AxAy

 Непрямая рекурсия – содержит неявным образом: BxC; CyB.

Грамматики подразделяются (классы грамматик):

  1.  Контекстно-свободные грамматики.

Характеризуется тем, что в левой части любой продукции находится единственный нетерминал. Наиболее используемый (простые предложения).

  1.  Контекстно–зависимые грамматики.

В левой части содержится терминал. Данный класс является очень сложным, однако позволяет описать тонкие нюансы.

  1.  Регулярные грамматики.

Характеризуется тем, что в правой части может быть не более одного терминального символа, а при его наличии не более одного не терминального символа.

По структуре является достаточно простым, для синтаксического анализа не используется. Используется при описании синтаксических анализаторов.

Нисходящий синтаксический разбор – заключается в поиске очередного нетерминала в выводимой цепочке и замена его на правую часть соответствующей продукции с целью получения в итоге цепочек терминальных символов, соответствующих терминальному предложению. Начальная цепочка представляет собой стартовый символ грамматики.

Восходящий синтаксический разбор – поиск в предложении или промежуточной цепочке правых частей продукции с тем чтобы прийти к стартовому символу грамматики.

Пример:

Описать грамматику сложения-вычитания целых от 0 до 9.

Произвести синтаксический разбор предложения: 9+5-3

Число: 0…9; оператор: +,-

Slist    Нисходящий анализ:

listlist+dig   Slist

listlist-dig   listlist+block

listdig    listlist-block

dig0|1|…|9   list(list)

    block(dig)

    blockdig

     dig0|1|…|9


 

А также другие работы, которые могут Вас заинтересовать

3814. Ценообразование на разных типах рынков 228.5 KB
  Введение Производство товаров зависит от издержек, которые в свою очередь определяются ценами на факторы производства. Эти факторы имеют свой рынок, на котором они продаются и покупаются, а цена на них устанавливается в соответствии с законами спрос...
3815. Печать русской православной Церкви: традиции и перспективы 84.5 KB
  Печать русской православной Церкви: традиции и перспективы Конец 80-х – начало 90-х годов нашего столетия стало началом возрождения системы печати Русской православной церкви. Причем ее становление происходит с использованием богатого опыта изд...
3816. Цикличность развития рыночной экономики 125 KB
  Введение Цикличность экономического развития и ее причины Экономический рост — это не плавный, равномерно совершающийся подъём. В движении общественного производства есть годы, когда рост общего объема производства происходит очень быстро...
3817. Национальная модель социальной защиты Республики Беларусь 118 KB
  Введение Социальная защита населения является первоочередной задачей для большинства стран мира. В мировой практике насчитывается большое количество моделей социальной защиты, которые отличаются друг от друга источниками финансирования, способами по...
3818. Построение робототехнических и автоматизированных линий и комплексов на мебельном предприятии 1.05 MB
  Введение Успешное мебельное производство предполагает предварительный глубокий анализ всех его составных частей, современных тенденций и процессов. Не менее важно знать, в чем конкретно состоит влияние того или иного составляющего на весь комплекс в...
3819. Классификация тесных двойных систем. Алгоритм ZET 88 KB
  Введение Изучение фотометрических и абсолютных элементов тесных двойных систем, находящихся на разных стадиях эволюции, представляет большой интерес с точки зрения статистического исследования этих систем, изучения строения Галактики, а также теории...
3820. Теоретические основы экономического анализа инвестиционных проектов 392.5 KB
  Теоретические основы экономического анализа инвестиционных проектов. Прежде чем рассматривать вопросы анализа инвестиционных проектов необходимо дать краткое понятие инвестиций. Инвестиции- вложение капитала с целью его последующего увеличени...
3821. История и развитие радиотехники 45.5 KB
  История и развитие радиотехники Предметом электронной техники является теория и практика применения электронных, ионных и полупроводниковых приборов в устройствах, системах и установках для различных областей народного хозяйства. Гибкость электронно...
3822. Исследование обнаруживающей и исправляющей способности циклических кодов. 198.5 KB
  Исследование обнаруживающей и исправляющей способности циклических кодов. Цель работы. Ознакомление с методами построения корректирующих кодов. Экспериментальное исследование обнаруживающей и исправляющей способности циклических кодов. Описание лабо...