4861

Общая схема работы компилятора С++. Назначение и функционирование редактора связей. Загрузчик

Лекция

Информатика, кибернетика и программирование

Общая схема работы компилятора С++. Назначение и функционирование редактора связей. Загрузчик. Для оптимизации процесса перевода программы с С++ на машинный язык процесс трансляции разбивают на два этапа: промежуточная трансляция в набор объектных м...

Русский

2012-11-28

52 KB

33 чел.

Общая схема работы компилятора С++. Назначение и функционирование редактора связей. Загрузчик.

Для оптимизации процесса перевода программы с С++ на машинный язык процесс трансляции разбивают на два этапа: промежуточная трансляция в набор объектных модулей – компиляция и связывание объектных модулей в исполняемый файл – компоновка. Соответственно, программы, реализующие эти два этапа, называют компилятором и компоновщиком или редактором связей. Поскольку, как правило, оба этих инструмента предоставляются их разработчиками в паре, то часто под компиляцией (сборкой) подразумевают целиком весь процесс обработки исходного кода на С++ с получением итогового результата в виде исполняемого файла.

Кроме того, непосредственно перед передачей компилятору, исходный код программы проходит предварительную обработку препроцессором. Назначение препроцессора – обеспечение возможности разбиения больших программ на несколько взаимосвязанных частей – модулей, раскрытие сокращений – макросов, обработка некоторых параметров конфигурации компилятора и т.п.

Процесс компиляции представляет собой последовательность фаз, каждая из который преобразует одно представление программы в другое.

Лексический анализ: эту часть компилятора выполняет сканер, который читает литеры программы (символы) на исходном языке и строит из них слова (лексемы) языка. Для каждой построенной лексемы анализатор строит токен вида <id, attrib>. id – имя токена, представляет собой внутренний идентификатор, используемый на следующем этапе компиляции – синтаксическом разборе, а значение attrib указывает на соответствующую этому токену запись в специальной таблице символов, построенной анализатором. Эта информация используется на дальнейших этапах компиляции.

Например, для выражения

a = b + c / 100;

лексический анализатор выделит следующие лексемы: <a>, <=>, <b>, <+>, <c>, </>, <100>. Пробелы и другие разделительные символы анализатором автоматически отбрасываются. Для лексем <a>, <b>, <c> (представляющих переменные) может быть сформирована таблица символов вида:

В результате лексического анализа исходное выражение будет представлено в виде последовательности токенов:

 <id, 1> <=> <id, 2> <+> <id, 3> </> <100>

Здесь токены <=>, <+>, </> представляют собой абстрактные символы для операций присваивания, сложения и деления соответственно.

Следующая фаза – синтаксический разбор. Здесь используются идентификаторы токенов для построения промежуточного древовидного представления программы, описывающего её грамматическую структуру. Чаще всего таким представлением является синтаксическое дерево, в котором каждый внутренний узел представляет операцию, а его дочерние узлы – аргументы этой операции. Синтаксическое дерево определяет порядок, в котором выполняются операции.

Далее выполняется этап семантического анализа, на котором используется построенное синтаксическое дерево и информация из таблицы символов для проверки исходной программы на смысловое соответствие с правилами языка. Важной частью семантического анализа является проверка типов, когда компилятор проверяет, имеет ли каждый оператор аргументы соответствующего типа, и выполняет приведение типов, если оно допустимо.

После этого компилятор генерирует явное машинное промежуточное представление исходной программы. Выполняется оптимизация промежуточного кода: удаление избыточных инструкций, упрощение кода с обязательным сохранением его семантики и т.п.

Финальной фазой компиляции является генерация кода – из промежуточного представления исходной программы порождается программа в машинном коде. Чаще всего, компиляторы С++ реализуют механизм раздельной компиляции, при котором модули исходной программы обрабатываются отдельно. Такой подход обладает рядом преимуществ: для крупных программ, исходный код которых представлен большим количеством файлов-модулей, при внесении небольших изменений в отдельно взятый файл удобно иметь возможность перекомпилировать только соответствующий ему объектный модуль (и все, непосредственно от него зависящие), не затрагивая остальные.

Результатом работы компилятора является машинное представление программы в виде набора объектных модулей. Такой машинный код ещё не может быть исполнен компьютером, поскольку он содержит ряд неразрешенных ссылок на объекты других модулей и библиотек. Разрешение таких ссылок берет на себя компоновщик. Если по каким-то причинам один из объектных модулей или требуемая библиотека не обнаружены, компоновщик сообщит об ошибке сборки. При успешном разрешении всех связей, на выходе компоновщик собирает готовый исполняемый файл.

Несмотря на то, что, по сути, программа представляет собой реализацию некоторого абстрактного алгоритма действий, любая программа неизбежно потребует выполнения операций, затрагивающих общие ресурсы компьютера, например, выделение памяти, чтение или запись файлов и т.п. Управление ресурсами компьютера обеспечивается операционной системой, поэтому собранная программа всегда ориентирована на работу в контексте определенной операционной системы. За запуск готовых программ в операционной системе отвечает загрузчик – специальный инструмент (как правило, являющийся частью системы), выполняющий подготовительную работу для возможности начала работы программы.

Загрузчик считывает данные из исполняемого файла, проверяет соответствие их определенному формату, при необходимости, загружает в память требуемые дополнительные библиотеки и связывает их с программой, и наконец, создает соответствующий образ процесса и вносит его в очередь на исполнение.


1

2

3

b

c

<=>

<id, 2>

<id, 3>

<+>

</>

<id, 1>

<60>

файл 1

файл 2

файл 3

файл 4

файл 5

                                        компилятор

редактор связей

объектный модуль 1

объектный модуль 2

объектный модуль 3

объектный модуль 4

объектный модуль 5

новый

объектный модуль 1

новый

объектный модуль 2

исполняемый файл


 

А также другие работы, которые могут Вас заинтересовать

16833. Вывод данных в текстовый файл 404 KB
  Лекция 6 Вывод данных в текстовый файл Процедуры Write и Writeln Вывод данных в текстовый файл осуществляется в основном для просмотра и подготовки к печати результатов работы программы. Вывод данных производится с помощью процедур Write и Writeln. С их помощью можно выводить...
16834. Модульное программирование 222.5 KB
  Лекция 7 1. Модульное программирование Основные понятия Принцип модульности оказывает наиболее сильное влияние на дисциплину мышления при решении задач. Он состоит в декомпозиции первоначального задания в связную систему подзадач и является основным методом в н
16835. Компиляция и подключение модулей 294 KB
  Лекция 8 Компиляция и подключение модулей Для того чтобы сформировать модуль библиотеку с подпрограммами можно отладить подпрограммы в составе основной программы а затем перенести их в модуль. Для использования подпрограмм модуля его надо оттранслировать т. е. сф
16836. Распределение оперативной памяти при выполнении программ 756 KB
  Лекция 9 1. Динамические переменные. Основные понятия Распределение оперативной памяти при выполнении программ Адресуемое пространство ОП в ОС MSDOS организовано сегментами: перенумерованными блоками памяти по 64 Кбайта. Причем сегмент может начинаться с любого фи
16837. Массивы указателей 1.37 MB
  6. Массивы указателей С помощью массивов указателей можно формировать большие массивы и коллекции массивов любых типов. Работа с большими массивами Размер одного массива данных должен быть не более 64 Кбайт. Но в реальных задачах могут использоваться массивы требую...
16838. Массивы и многоуровневая косвенная адресация 564 KB
  Лекция 10 5. Массивы и многоуровневая косвенная адресация Многоуровневая косвенная адресация и одномерные арифметические массивы Многоуровневая адресация имеет место при использовании указателей на указатели на массивы. Рассмотрим это на примерах формирования одн
16839. Связанные структуры 682 KB
  Лекция 11 8. Связанные структуры Основные понятия Записи содержащие указатели позволяют формировать в ОП линейные и нелинейные связанные структуры. К линейным связанным структурам относят например стеки очереди и списки. К нелинейным деревья и сети. Эти структур
16840. Объектно-ориентированное программирование. Методология объектно-ориентированного программирования 362 KB
  Объектно-ориентированное программирование. Основные понятия Методология объектно-ориентированного программирования Фундаментальными понятиями в программировании являются: технология программирования методология метод. Технология программирования...
16841. Подготовка и решение задач на компьютере Этапы полготовки и решения задач на компьютере 428.5 KB
  Лекция 1. Подготовка и решение задач на компьютере Этапы полготовки и решения задач на компьютере Подготовка и решение задач на компьютере имеет следующие этапы: постановка задачи и разработка технического задания; разработка: а информационной мо