4861

Общая схема работы компилятора С++. Назначение и функционирование редактора связей. Загрузчик

Лекция

Информатика, кибернетика и программирование

Общая схема работы компилятора С++. Назначение и функционирование редактора связей. Загрузчик. Для оптимизации процесса перевода программы с С++ на машинный язык процесс трансляции разбивают на два этапа: промежуточная трансляция в набор объектных м...

Русский

2012-11-28

52 KB

32 чел.

Общая схема работы компилятора С++. Назначение и функционирование редактора связей. Загрузчик.

Для оптимизации процесса перевода программы с С++ на машинный язык процесс трансляции разбивают на два этапа: промежуточная трансляция в набор объектных модулей – компиляция и связывание объектных модулей в исполняемый файл – компоновка. Соответственно, программы, реализующие эти два этапа, называют компилятором и компоновщиком или редактором связей. Поскольку, как правило, оба этих инструмента предоставляются их разработчиками в паре, то часто под компиляцией (сборкой) подразумевают целиком весь процесс обработки исходного кода на С++ с получением итогового результата в виде исполняемого файла.

Кроме того, непосредственно перед передачей компилятору, исходный код программы проходит предварительную обработку препроцессором. Назначение препроцессора – обеспечение возможности разбиения больших программ на несколько взаимосвязанных частей – модулей, раскрытие сокращений – макросов, обработка некоторых параметров конфигурации компилятора и т.п.

Процесс компиляции представляет собой последовательность фаз, каждая из который преобразует одно представление программы в другое.

Лексический анализ: эту часть компилятора выполняет сканер, который читает литеры программы (символы) на исходном языке и строит из них слова (лексемы) языка. Для каждой построенной лексемы анализатор строит токен вида <id, attrib>. id – имя токена, представляет собой внутренний идентификатор, используемый на следующем этапе компиляции – синтаксическом разборе, а значение attrib указывает на соответствующую этому токену запись в специальной таблице символов, построенной анализатором. Эта информация используется на дальнейших этапах компиляции.

Например, для выражения

a = b + c / 100;

лексический анализатор выделит следующие лексемы: <a>, <=>, <b>, <+>, <c>, </>, <100>. Пробелы и другие разделительные символы анализатором автоматически отбрасываются. Для лексем <a>, <b>, <c> (представляющих переменные) может быть сформирована таблица символов вида:

В результате лексического анализа исходное выражение будет представлено в виде последовательности токенов:

 <id, 1> <=> <id, 2> <+> <id, 3> </> <100>

Здесь токены <=>, <+>, </> представляют собой абстрактные символы для операций присваивания, сложения и деления соответственно.

Следующая фаза – синтаксический разбор. Здесь используются идентификаторы токенов для построения промежуточного древовидного представления программы, описывающего её грамматическую структуру. Чаще всего таким представлением является синтаксическое дерево, в котором каждый внутренний узел представляет операцию, а его дочерние узлы – аргументы этой операции. Синтаксическое дерево определяет порядок, в котором выполняются операции.

Далее выполняется этап семантического анализа, на котором используется построенное синтаксическое дерево и информация из таблицы символов для проверки исходной программы на смысловое соответствие с правилами языка. Важной частью семантического анализа является проверка типов, когда компилятор проверяет, имеет ли каждый оператор аргументы соответствующего типа, и выполняет приведение типов, если оно допустимо.

После этого компилятор генерирует явное машинное промежуточное представление исходной программы. Выполняется оптимизация промежуточного кода: удаление избыточных инструкций, упрощение кода с обязательным сохранением его семантики и т.п.

Финальной фазой компиляции является генерация кода – из промежуточного представления исходной программы порождается программа в машинном коде. Чаще всего, компиляторы С++ реализуют механизм раздельной компиляции, при котором модули исходной программы обрабатываются отдельно. Такой подход обладает рядом преимуществ: для крупных программ, исходный код которых представлен большим количеством файлов-модулей, при внесении небольших изменений в отдельно взятый файл удобно иметь возможность перекомпилировать только соответствующий ему объектный модуль (и все, непосредственно от него зависящие), не затрагивая остальные.

Результатом работы компилятора является машинное представление программы в виде набора объектных модулей. Такой машинный код ещё не может быть исполнен компьютером, поскольку он содержит ряд неразрешенных ссылок на объекты других модулей и библиотек. Разрешение таких ссылок берет на себя компоновщик. Если по каким-то причинам один из объектных модулей или требуемая библиотека не обнаружены, компоновщик сообщит об ошибке сборки. При успешном разрешении всех связей, на выходе компоновщик собирает готовый исполняемый файл.

Несмотря на то, что, по сути, программа представляет собой реализацию некоторого абстрактного алгоритма действий, любая программа неизбежно потребует выполнения операций, затрагивающих общие ресурсы компьютера, например, выделение памяти, чтение или запись файлов и т.п. Управление ресурсами компьютера обеспечивается операционной системой, поэтому собранная программа всегда ориентирована на работу в контексте определенной операционной системы. За запуск готовых программ в операционной системе отвечает загрузчик – специальный инструмент (как правило, являющийся частью системы), выполняющий подготовительную работу для возможности начала работы программы.

Загрузчик считывает данные из исполняемого файла, проверяет соответствие их определенному формату, при необходимости, загружает в память требуемые дополнительные библиотеки и связывает их с программой, и наконец, создает соответствующий образ процесса и вносит его в очередь на исполнение.


1

2

3

b

c

<=>

<id, 2>

<id, 3>

<+>

</>

<id, 1>

<60>

файл 1

файл 2

файл 3

файл 4

файл 5

                                        компилятор

редактор связей

объектный модуль 1

объектный модуль 2

объектный модуль 3

объектный модуль 4

объектный модуль 5

новый

объектный модуль 1

новый

объектный модуль 2

исполняемый файл


 

А также другие работы, которые могут Вас заинтересовать

68926. Змінні і типи даних 56.5 KB
  Чому я спожив вираз Практично у всіх Існують і такі мови в яких немає змінних як таких. На щастя РНР не відноситься до таких мов він найзвичайніша мова з погляду наявності змінних. Всі дані з якими працює програма зберігаються у вигляді змінних.
68927. Операції над змінними 43 KB
  Перевірка існування змінної. Знищення змінної. Перевірка існування змінної. Знищення змінної Ви можете запитати а як же арифметичні і інші операції Решта всіх операцій специфічна для конкретного типу змінної.
68928. Вирази та операції в РНР 62 KB
  Вирази є тією «цеглою», з якої складаються РHP-програми. Практично все, що ви пишете в програмі, є виразом. При цьому під виразом розуміється те, що має значення. Можна сказати і по-іншому: все, що має значення, є виразом. Найпростіший вираз — це константа, що стоїть в правій частині оператора...
68929. Рядки. Операції над рядками 36.5 KB
  Обоє операторів echo виведуть рядки. Перший оператор echo виведе рядок Hello, а другою — $s. Між рядками в лапках і в апострофах існує велика різниця. Якщо рядок поміщений в апострофи, то всі символи трактуються як є. Винятки становлять послідовност...
68930. Посилання, умовний оператор 43 KB
  Неважко здогадатися що виведе програма 66. Краще використовувати жорсткі посилання: хоч би виходячи з того що для них потрібний один оператор. Умовний оператор Проблему вибору можна без докорів совісті віднести до глобальних проблем.
68931. Цикли План. Цикли з передумовою. Цикли з постумовою 58 KB
  Цикл дозволяє повторити певну і навіть не визначене коли робота циклу залежить від умови кількість разів якінебудь оператори. Дані оператори називаються тілом циклу они крутитимуться в циклі. Прохід циклу називається ітерацією. Як і С PHP підтримує три види циклів: Цикл з передумовою while...
68932. Форми в HTML-документах. Елементи форм 109.5 KB
  Форма в HTML-документі реалізується тегом-контейнером FORM, в якому задаються всі елементи, що управляють, — поля введення, кнопки і т.д. Якщо елементи, що управляють, вказані поза вмістом тега FORM, то вони не створюють форму, а використовуються для побудови призначеного для користувача...
68933. Перехоплення всіх виняткових ситуацій 32 KB
  Обробка виняткових ситуацій в мові C++ володіє додатковими властивостями і нюансами, які полегшують її застосування. Ці особливості описуються нижчим. Перехоплення всіх виняткових ситуацій В деяких випадках немає сенсу обробляти окремі типи виняткових ситуацій...
68934. Потоки. Класи потоків С++. Вбудовані потоки C++ 35 KB
  Потоки. Система введення-виводу мови C++, як і її аналог в мові С, оперує потоками. Потік (stream) — це логічний пристрій, одержуючий або передавальний інформацію. Потік пов’язаний з фізичним пристроєм введення-виводу. Всі потоки функціонують однаково, хоча фізичні пристрої