20616

Фазы трансляции

Лекция

Коммуникация, связь, радиоэлектроника и цифровые приборы

Группы символов соответствующие элементам языка называются токенами. Контекстносвободная грамматика имеет 4 компоненты: множество токенов терминальных символов множество нетерминальных символов множество продукций где слева всегда нетерминал а справа последовательность терминалов нетерминалов указание одного из нетерминалов в качестве стартового символа грамматики. На вход лексического анализатора поступает цепочка символов. Каждый шаг переключение автомата состоит в том что при нахождении в определенном состоянии при...

Русский

2013-07-31

328 KB

1 чел.

Лекция № 1.

Фазы трансляции.

  1.  Написание кода
  2.  Обработка препроцессором
  3.  Модель анализа-синтеза

Компиляция состоит из двух частей: анализа и синтеза.

Анализ — это разбиение исходной программы на составные части и создание ее промежуточного представления.

Синтез — конструирование требуемой целевой программы из промежуточного представления.

Группы символов, соответствующие элементам языка называются токенами.

Position:=initial + rate*50.

Токены:

1. Идентификаторы id1 position 

2. Операция op1:=      

3. id2 initial      

4. op2 +

5. id3 rate       

6. op3 *

7. num1 50

Трансляция инструкции

position:=initial + rate*50

id1:= id2 + id3 * 50

Генерация промежуточного кода

temp1:= inttoreal(50);

temp2:= id3 * temp1;

temp3:= id2 + temp2;

id1:= temp3;

 

Оптимизация

temp1:= id3 * 50;

id1:= id2 + temp1;

Генерация исполнительного кода

mov id3, R2

mulf #50, R2

movf id2, R1

addf R2, R1

movf R2, id1

 Язык определяется синтаксисом и семантикой (как должна выглядеть и что должна делать). Для определения синтаксиса языка используется специальная форма записи, которая называется контекстно – свободная грамматика (BNF).

Для определения семантики используется неформальное описание и примеры. Для лексики используются применения возможных токенов и правила для выделения основных.

 If (выражение) инструкция else инструкция;

Stmt if (expr) stmt else stmt;

 В продукции лексические элементы называются токенами. Переменные типа expr и stmt являются последовательностью токенов и называются нетерминальными символами.

Контекстно-свободная грамматика имеет 4 компоненты:

  1.  множество токенов (терминальных символов)
  2.  множество нетерминальных символов
  3.  множество продукций, где слева всегда нетерминал, а справа последовательность терминалов (нетерминалов)
  4.  указание одного из нетерминалов в качестве стартового символа грамматики.

Begin blockbegin opt_stmts end

…….; opt_stmtsstmt_list|e

…….; stmt_liststmts_list;

…….; stmt|stmt;

End stmt…

 Правила соотношения продукции и дерева

  1.  в корне дерева стартовый символ
  2.  каждый лист помечен токеном или e (пустой)
  3.  каждый внутренний узел нетерминальный
  4.  если А – нетерминал или помечает некоторый внутренний узел, а Х1, Х2, Х3…Хn – отметки его дочерних узлов, то существует продукция следующего вида: АХ1Х2…Хn – могут быть как терминальными, так и нетерминальными. Ае

red (apple)

red (X):-not green (X)

stmt  rule | fact | question

fact  property (object)

rule  property (X):-rule1

rule1  property (X) | property (X), rule1

Лексический анализ

В последовательности его выполнения из последовательности литер (букв языка) выделяются лексемы языка (идентификаторы, служебные слова, константы, знаки операций, комментарии).

На вход лексического анализатора поступает цепочка символов. Лексический анализатор получает элементы этой цепочки, сопоставляет с имеющимися образцами и может производить откаты.

Формальной основой для построения лексического анализатора являются детерминированные конечные автоматы.

Конечный автомат – система, которая в каждый момент времени может находиться в одном из конечного множества состояний. Каждый шаг (переключение) автомата состоит в том, что при нахождении в определенном состоянии при поступлении на вход одного из множества входных символов он переходит в однозначно определенное (детерминированное) состояние и вырабатывает определенное выходное воздействие.

Кроме того, автомат определяется начальным состоянием, в котором он находится на момент начала работы.

Алгоритм работы описывается с помощью диаграммы переходов.

a

e

f

ab

ec

fa

ab

ecd

fha

acd

f(h)a

Пример:

Выделение идентификаторов, целое со знаком, вещественное со знаком, другое.

Таблица символов состоит из полей, включающих полную информацию о всех идентификаторах, встречающихся в программе, так как выявление идентификаторов происходит на этапе выполнения программы. Ключевая задача – определение характерных признаков.

Метод цепочек использует дополнительное поле таблицы, в котором может содержаться ссылка на любой элемент таблицы.

hush

id

link

**

ab

***

***

ba

****

****

de

Методы синтаксического анализа

Предложение языка является цепочкой терминальных символов грамматики. Непосредственным выводом называется замена в некоторой цепочке последовательности символов из правой части продукции на последовательность из левой.

xAyxBy

Последовательность непосредственных выводов основывается на том, что непосредственный вывод может быть применен несколько раз последовательно, в том числе и рекурсивно.

Предложение языка называется правильным, если оно представляет собой цепочку терминальных символов, выводимую из стартового символа грамматики.

Прямое рекурсивное правило – правило, в правой части которого содержится его левая часть: AxAy

 Непрямая рекурсия – содержит неявным образом: BxC; CyB.

Грамматики подразделяются (классы грамматик):

  1.  Контекстно-свободные грамматики.

Характеризуется тем, что в левой части любой продукции находится единственный нетерминал. Наиболее используемый (простые предложения).

  1.  Контекстно–зависимые грамматики.

В левой части содержится терминал. Данный класс является очень сложным, однако позволяет описать тонкие нюансы.

  1.  Регулярные грамматики.

Характеризуется тем, что в правой части может быть не более одного терминального символа, а при его наличии не более одного не терминального символа.

По структуре является достаточно простым, для синтаксического анализа не используется. Используется при описании синтаксических анализаторов.

Нисходящий синтаксический разбор – заключается в поиске очередного нетерминала в выводимой цепочке и замена его на правую часть соответствующей продукции с целью получения в итоге цепочек терминальных символов, соответствующих терминальному предложению. Начальная цепочка представляет собой стартовый символ грамматики.

Восходящий синтаксический разбор – поиск в предложении или промежуточной цепочке правых частей продукции с тем чтобы прийти к стартовому символу грамматики.

Пример:

Описать грамматику сложения-вычитания целых от 0 до 9.

Произвести синтаксический разбор предложения: 9+5-3

Число: 0…9; оператор: +,-

Slist    Нисходящий анализ:

listlist+dig   Slist

listlist-dig   listlist+block

listdig    listlist-block

dig0|1|…|9   list(list)

    block(dig)

    blockdig

     dig0|1|…|9


 

А также другие работы, которые могут Вас заинтересовать

17353. Трохи економічної історії 83.5 KB
  Трохи економічної історії: З розвитком товарного виробництва купівліпродажу починається пошук більш зручних товарних грошей тобто відмовою від мало транспортабельних та неоднорідних грошей. На грошову арену виходять бронзові зливки залізні з олова свинцю ...
17354. Загальна характеристика товарного виробництва 131 KB
  Загальна характеристика товарного виробництва Суспільство знає 1. Два основних типи економічної організації суспільного виробництва: а натуральне господарство і б товарне господарство. Їм відповідають дві основні форми господарювання: натуральна і тов...
17355. Сутність ринку (ринкової економіки) 99 KB
  1. Сьогодні ринок розглядається як економічний інститут власності і далі з цього будемо і виходить в розкритті засад функціонування ринку. Сутність ринку ринкової економіки полягає в матеріалізації товарногрошових відносин що виступають суспільною формою розвитку
17356. Економічна конкуренція. Ринок досконалої і недосконалої конкуренції 59.5 KB
  Економічна конкуренція. Ринок досконалої і недосконалої конкуренції. Ринок монополістичної конкуренції. Модель олігополістичного ринку. Ринок як складне полісистемне утворення має надзвичайно багату структуру. Його складовими є ринки: товарів капіталу фінансо...
17357. Національні моделі ринкової економіки 93 KB
  PAGE 7 Національні моделі ринкової економіки Необхідно відзначити що вплив на рівень цін шляхом концентрації попиту в руках держави це ринковий метод регулювання ринку несумісний з методами адміністративного розподілу товарів і пов'язаний з ц
17358. Антимолнопольне регулювання підприємницької діядльності 88.5 KB
  Антимолнопольне регулювання підприємницької діядльності Актуальність антимонопольного законодавства сьогодні є безперечним оскільки про порушення його постійно проводяться справи при чому деякі з яких набувають неабиякого розмаху. Діяльність органів покли...
17359. Сутність ринку і його головні елементи 103 KB
  1. Сутність ринку і його головні елементи. Суб’єкти ринкового господарювання. Принципи функціонування ринку. Функції ринку: позитив негатив. Сьогодні ринок розглядається як економічний інститут власності і далі з цього будемо і виходить в розкритті засад функціо
17360. ВЕНЧУРНИЙ БІЗНЕС ТА ЙОГО МОЖЛИВОСТІ 143.5 KB
  ВЕНЧУРНИЙ БІЗНЕС ТА ЙОГО МОЖЛИВОСТІ Зазначимо що інноваційна підприємницька діяльність у формі інноваційного бізнесу в країнах Заходу дає понад 50 найважливіших нововведень. ВСТУП. Основною причиною високої ефективності малого бізнесу в цій сфері є специфіка п
17361. Ціни і ціноутворення та підприємництво, венчурний бізнес й інновації в ринковій економіці 130.5 KB
  Ціни і ціноутворення та підприємництво венчурний бізнес й інновації в ринковій економіці Визначення ціни в межах ринкового підходу: Ціна – це форма вираження цінності благ що мають прояв в процесі їх обміну. Тут виділяємо два акценти: 1підкреслюється безпосередній