20616

Фазы трансляции

Лекция

Коммуникация, связь, радиоэлектроника и цифровые приборы

Группы символов соответствующие элементам языка называются токенами. Контекстносвободная грамматика имеет 4 компоненты: множество токенов терминальных символов множество нетерминальных символов множество продукций где слева всегда нетерминал а справа последовательность терминалов нетерминалов указание одного из нетерминалов в качестве стартового символа грамматики. На вход лексического анализатора поступает цепочка символов. Каждый шаг переключение автомата состоит в том что при нахождении в определенном состоянии при...

Русский

2013-07-31

328 KB

1 чел.

Лекция № 1.

Фазы трансляции.

  1.  Написание кода
  2.  Обработка препроцессором
  3.  Модель анализа-синтеза

Компиляция состоит из двух частей: анализа и синтеза.

Анализ — это разбиение исходной программы на составные части и создание ее промежуточного представления.

Синтез — конструирование требуемой целевой программы из промежуточного представления.

Группы символов, соответствующие элементам языка называются токенами.

Position:=initial + rate*50.

Токены:

1. Идентификаторы id1 position 

2. Операция op1:=      

3. id2 initial      

4. op2 +

5. id3 rate       

6. op3 *

7. num1 50

Трансляция инструкции

position:=initial + rate*50

id1:= id2 + id3 * 50

Генерация промежуточного кода

temp1:= inttoreal(50);

temp2:= id3 * temp1;

temp3:= id2 + temp2;

id1:= temp3;

 

Оптимизация

temp1:= id3 * 50;

id1:= id2 + temp1;

Генерация исполнительного кода

mov id3, R2

mulf #50, R2

movf id2, R1

addf R2, R1

movf R2, id1

 Язык определяется синтаксисом и семантикой (как должна выглядеть и что должна делать). Для определения синтаксиса языка используется специальная форма записи, которая называется контекстно – свободная грамматика (BNF).

Для определения семантики используется неформальное описание и примеры. Для лексики используются применения возможных токенов и правила для выделения основных.

 If (выражение) инструкция else инструкция;

Stmt if (expr) stmt else stmt;

 В продукции лексические элементы называются токенами. Переменные типа expr и stmt являются последовательностью токенов и называются нетерминальными символами.

Контекстно-свободная грамматика имеет 4 компоненты:

  1.  множество токенов (терминальных символов)
  2.  множество нетерминальных символов
  3.  множество продукций, где слева всегда нетерминал, а справа последовательность терминалов (нетерминалов)
  4.  указание одного из нетерминалов в качестве стартового символа грамматики.

Begin blockbegin opt_stmts end

…….; opt_stmtsstmt_list|e

…….; stmt_liststmts_list;

…….; stmt|stmt;

End stmt…

 Правила соотношения продукции и дерева

  1.  в корне дерева стартовый символ
  2.  каждый лист помечен токеном или e (пустой)
  3.  каждый внутренний узел нетерминальный
  4.  если А – нетерминал или помечает некоторый внутренний узел, а Х1, Х2, Х3…Хn – отметки его дочерних узлов, то существует продукция следующего вида: АХ1Х2…Хn – могут быть как терминальными, так и нетерминальными. Ае

red (apple)

red (X):-not green (X)

stmt  rule | fact | question

fact  property (object)

rule  property (X):-rule1

rule1  property (X) | property (X), rule1

Лексический анализ

В последовательности его выполнения из последовательности литер (букв языка) выделяются лексемы языка (идентификаторы, служебные слова, константы, знаки операций, комментарии).

На вход лексического анализатора поступает цепочка символов. Лексический анализатор получает элементы этой цепочки, сопоставляет с имеющимися образцами и может производить откаты.

Формальной основой для построения лексического анализатора являются детерминированные конечные автоматы.

Конечный автомат – система, которая в каждый момент времени может находиться в одном из конечного множества состояний. Каждый шаг (переключение) автомата состоит в том, что при нахождении в определенном состоянии при поступлении на вход одного из множества входных символов он переходит в однозначно определенное (детерминированное) состояние и вырабатывает определенное выходное воздействие.

Кроме того, автомат определяется начальным состоянием, в котором он находится на момент начала работы.

Алгоритм работы описывается с помощью диаграммы переходов.

a

e

f

ab

ec

fa

ab

ecd

fha

acd

f(h)a

Пример:

Выделение идентификаторов, целое со знаком, вещественное со знаком, другое.

Таблица символов состоит из полей, включающих полную информацию о всех идентификаторах, встречающихся в программе, так как выявление идентификаторов происходит на этапе выполнения программы. Ключевая задача – определение характерных признаков.

Метод цепочек использует дополнительное поле таблицы, в котором может содержаться ссылка на любой элемент таблицы.

hush

id

link

**

ab

***

***

ba

****

****

de

Методы синтаксического анализа

Предложение языка является цепочкой терминальных символов грамматики. Непосредственным выводом называется замена в некоторой цепочке последовательности символов из правой части продукции на последовательность из левой.

xAyxBy

Последовательность непосредственных выводов основывается на том, что непосредственный вывод может быть применен несколько раз последовательно, в том числе и рекурсивно.

Предложение языка называется правильным, если оно представляет собой цепочку терминальных символов, выводимую из стартового символа грамматики.

Прямое рекурсивное правило – правило, в правой части которого содержится его левая часть: AxAy

 Непрямая рекурсия – содержит неявным образом: BxC; CyB.

Грамматики подразделяются (классы грамматик):

  1.  Контекстно-свободные грамматики.

Характеризуется тем, что в левой части любой продукции находится единственный нетерминал. Наиболее используемый (простые предложения).

  1.  Контекстно–зависимые грамматики.

В левой части содержится терминал. Данный класс является очень сложным, однако позволяет описать тонкие нюансы.

  1.  Регулярные грамматики.

Характеризуется тем, что в правой части может быть не более одного терминального символа, а при его наличии не более одного не терминального символа.

По структуре является достаточно простым, для синтаксического анализа не используется. Используется при описании синтаксических анализаторов.

Нисходящий синтаксический разбор – заключается в поиске очередного нетерминала в выводимой цепочке и замена его на правую часть соответствующей продукции с целью получения в итоге цепочек терминальных символов, соответствующих терминальному предложению. Начальная цепочка представляет собой стартовый символ грамматики.

Восходящий синтаксический разбор – поиск в предложении или промежуточной цепочке правых частей продукции с тем чтобы прийти к стартовому символу грамматики.

Пример:

Описать грамматику сложения-вычитания целых от 0 до 9.

Произвести синтаксический разбор предложения: 9+5-3

Число: 0…9; оператор: +,-

Slist    Нисходящий анализ:

listlist+dig   Slist

listlist-dig   listlist+block

listdig    listlist-block

dig0|1|…|9   list(list)

    block(dig)

    blockdig

     dig0|1|…|9


 

А также другие работы, которые могут Вас заинтересовать

65088. Никудерийская орда как фактор чагатайской истории (1270-1330-е гг.) 99.5 KB
  Никудер поддержал Чагатаида Боракхана потерпел неудачу и попал под стражу. когда Боракхан опираясь на решение курултая в Таласе заявил о претензиях на южные территории входившие по завещанию Чингизхана в улус Чагатая.
65090. Караунасы-никудерийцы и их роль в чагатайской истории 63.5 KB
  Никудерийцы и Дувахан Согласно завещанию Чингизхана улус его сына Чагатая распространялся от уйгурских земель на востоке до Амударьи на западе а на юге имел пределом индийские владения. После поражения Боракхана и подчинения ильханами дома...
65091. Клад серебряных монет первой четверти XV в. из Туркмении 88 KB
  Осенью 1997 г. в Москву были привезены для продажи коллекционерам 350 серебряных монет из большого клада, найденного незадолго до того в северной части Туркменистана. Владелец А.Алиев сообщил, что точное место находки ему неизвестно...
65093. ХУДОЖЕСТВЕННОЕ ОФОРМЛЕНИЕ МУСУЛЬМАНСКИХ МОНЕТ: НАРУШЕНИЕ ЗАПРЕТА? 137.5 KB
  Но если монеты античной Греции Рима эллинистического Востока обычно ассоциируются с прекрасными портретами конными экипажами образами богов и богинь то традиционно оформленные дирхемы и динары Арабского халифата а после его распада монеты многих его идеологических преемников...
65096. Клад из с. Новая Казанка Уральской области 159 KB
  Монетный состав клада, несмотря на его скромные размеры, довольно необычен и представляет научный интерес даже в таком составе. Монетные дворы, представленные в комплексе — Сарай ал-Махруса, Мохша, Сарай, Хорезм, Сарай ал-Джадид...