52294

Введение в архитектуру ЭВМ и системы программирования

Книга

Информатика, кибернетика и программирование

Данная книга представляет собой учебное пособие по архитектуре ЭВМ и системам программирования. Книга написана по читаемому автором лекционому курсу Архитектура ЭВМ и язык Ассемблера для студентов первого курса факультета Вычислительной математики и кибернетики МГУ им. М.В. Ломоносова.

Русский

2014-02-15

698.26 KB

20 чел.

25

Московский Государственный Университет им. М.В. Ломоносова

Факультет вычислительной математики и кибернетики

В. Г. Баула

Введение в архитектуру ЭВМ и

системы программирования

Москва 2003


Предисловие

Данная книга представляет собой учебное пособие по архитектуре ЭВМ и системам программирования. Книга написана по читаемому автором лекционому курсу Архитектура ЭВМ и язык Ассемблера для студентов первого курса факультета Вычислительной математики и кибернетики МГУ им. М.В. Ломоносова. По данному курсу существует достаточно обширная литература, посвящённая программированию на Ассемблере, однако явно недостаточно учебной литературы собственно по архитектуре ЭВМ и системам программирования. Эта книга пособие призвано восполнить этот пробел.

В данном курсе вместе с архитектурой ЭВМ изучается и язык низкого уровня (Ассемблер). Это связано с тем обстоятельством, что ЭВМ является исполнителем алгоритма на машинном языке, поэтому знание языка низкого уровня необходимо для понимания архитектуры ЭВМ, на Ассемблере приводятся и все примеры, иллюстрирующие те ли иные особенности архитектуры. В то же время в изложении материала по архитектуре ЭВМ язык Ассемблера выполняет вспомогательную роль, основное внимание уделяется не изучению этого языка, а способам отображения конструкций языка высокого уровня (в основном Паскаля) на язык низкого уровня. Поэтому для достаточно полного изучения языка Ассемблер студентам совершенно необходимо знакомство с соответствующими курсами по этому языку (рекомендуется книга [5]).

Изложение материала по архитектуре ЭВМ проводится сначала по возможности в общем виде, безотносительно к конкретным компьютерам, а затем приводятся примеры, как та или иная особенность архитектуры реализована в современных ЭВМ. Так как в настоящее время в большинстве массовых ЭВМ используются процессоры фирмы Intel, то архитектура именно этого процессора (в основном его младшей модели) используются для изучения в первую очередь.

Большое внимание уделяется обоснованию тех или иных архитектурных решений, показывается необходимость появления определённых аппаратных возможностей, их нацеленность на решение встающих перед вычислительной техникой проблем. Показывается историческое развитие основных аппаратных решений, эволюция главных понятий от первых простых ЭВМ до современных компьютеров.

Изучение архитектуры ЭВМ неразрывно связано с выполнением машинных программ. Исходя из этого, в книге рассматриваются элементы системы программирования, показывается путь прохождения программы по всей цепочке от исходного текста, через объектный и загрузочный модули, до этапа счёта. Большое внимание приходится уделять модульному программированию, способам распределения памяти, статической и динамической загрузке и связыванию.


1. Понятие об архитектуре ЭВМ

Этот семестровый курс лекций называется Архитектура ЭВМ и язык Ассемблера, хотя правильнее было бы назвать его всего лишь введением в архитектуру ЭВМ, так как в нашем курсе мы будем изучать только основы этого сложного предмета. Сначала нам нужно определить, что мы будем понимать под архитектурой компьютера. Обычно, определяя это понятие, говорят, что архитектура – это компоненты компьютера, их устройство, выполняемые ими функции, а также взаимосвязи между этими компонентами. Нас такое поверхностное определение не будет удовлетворять.

Дело в том, что понятие архитектура чего-либо существует не само по себе, а только в паре с другим понятием. Вы уже встречались с такой ситуацией в курсе из прошлого семестра Алгоритмы и алгоритмические языки, где понятие алгоритм было неразрывно связано с понятием исполнитель алгоритма. При этом одна и та же запись для одного исполнителя была алгоритмом, а для другого – нет (например, если этот другой исполнитель не умел выполнять некоторые предписания в записи текста алгоритма).

Так и в нашем случае понятие архитектуры неразрывно связано с тем человеком (или теми людьми), которые изучают или рассматривают эту архитектуру. Ясно, что для разных людей архитектура одного и того же объекта может выглядеть совершенно по-разному. Так, например, обычный жилец многоэтажного дома видит, что этот дом состоит из фундамента, стен и крыши, имеет этажи, на каждом этаже есть квартиры, присутствует лестница, лифт и т.д. Совсем по-другому видит архитектуру этого же дома инженер, ответственный за его эксплуатацию. Он, например, знает, что некоторые перегородки между комнатами можно убрать при перепланировке квартиры, а другие перегородки являются несущими, если их убрать – дом рухнет. Инженер знает, где внутри стен проходят электрические провода, трубы водяного отопления, как обеспечивается противопожарная безопасность и многое другое.

Отсюда можно сделать вывод, что, изучая какой-либо объект, часто бывает удобно выделить различные уровни рассмотрения архитектуры этого объекта. Обычно выделяют три таких уровня: внешний, концептуальный и внутренний.2 В качестве примера рассмотрим архитектуру какого-нибудь всем хорошо известного объекта, например, легкового автомобиля, на этих трёх уровнях.

  1.  Внешний уровень. На этом уровне видит архитектуру автомобиля обычный пассажир. Он знает, что машина имеет колёса, кузов, сиденья, мотор и другие части. Он понимает, что для работы автомобиля в него надо заливать бензин, знает назначение дворников на ветровом стекле, ремней безопасности и т.д. И этого эму вполне достаточно, чтобы успешно пользоваться машиной, главное – правильно назвать водителю нужный адрес.
  2.  Концептуальный уровень. Примерно на этом уровне видит архитектуру машины её водитель. В отличие от пассажира он знает, что в его автомобиль нужно заливать вовсе не бензин, а дизельное топливо, кроме того, необходимо ещё заливать масло и воду. Водитель знает назначение всех органов управления машиной, марку топлива, температуру окружающего воздуха, ниже которой необходимо заливать в машину не обычную воду, а так называемый антифриз и т.д. Ясно, что водитель видит архитектуру автомобиля совсем иначе, нежели обычный пассажир.
  3.  Внутренний уровень. На этом уровне автомобиль видит автомобиль инженер-конструктор, ответственный за его разработку. Он знает марку металла, из которого изготавливаются цилиндры двигателя, зависимость отдаваемой мотором мощности от вида топлива, допустимую нагрузку на отдельные узлы автомобиля, антикоррозийные свойства внешнего корпуса и многое другое.

Не надо думать, что один уровень видения архитектуры хороший, а другой – плохой. Каждый из них необходим и достаточен для конкретного применения рассматриваемого объекта. Знать объект на более глубоком уровне часто бывает даже вредно, так как получить эти знания обычно достаточно трудно, и все усилия пропадут, если в дальнейшем эти знания не понадобятся.

Необходимо, чтобы выпускники нашего университета, изучая какой-либо объект, достаточно ясно представляли себе, на каком уровне они его рассматривают и достаточен ли этот уровень для практической работы с этим объектом. При необходимости, разумеется, надо перейти на более глубокий уровень рассмотрения.

Перейдём теперь ближе к предмету нашего курса – архитектуре компьютеров. Все люди, которые используют компьютеры в своей работе, обычно называются пользователями. Ясно, что в зависимости от того, на каком уровне они видят архитектуру компьютера, всех пользователей можно разделить на уровни или группы. Как правило, в научной литературе выделяют следующие группы пользователей.

  1.  Конечные пользователи (пользователи-непрограммисты). Обычно это специалисты в конкретных предметных областях – физики, биологи, лингвисты, финансовые работники и т.д., либо люди, использующие компьютеры в сфере образования, досуга и развлечений (они имеют дело с обучающими программами, компьютерными играми и т.д.).  В своей работе все они используют компьютер, снабжённый соответствующим, как говорят, прикладным программным обеспечением. Это различные базы данных, текстовые редакторы, пакеты прикладных программ, системы автоматического перевода, обучающие, игровые и музыкальные программы. Этим пользователям достаточно видеть архитектуру компьютеров на внешнем уровне, их абсолютное большинство, примерно 90% от общего числа. Вообще говоря, компьютеры разрабатываются и выпускаются для нужд этих пользователей.
  2.  Прикладные программисты. Эти пользователи разрабатывают для конечных пользователей прикладное программное обеспечение. В своей работе они используют различные языки программирования высокого уровня (Паскаль, Фортран, Си, языки баз данных и т.д.) и соответствующие системы программирования (с этим понятием мы будем знакомиться в нашем курсе). Прикладным программистам достаточно видеть архитектуру компьютеров на концептуальном уровне. Можно примерно считать, что прикладных программистов примерно 8–9% от числа всех пользователей.
  3.  Системные программисты. Это самая небольшая (порядка 1%) группа пользователей, которая видит архитектуру ЭВМ на внутреннем уровне. Основная деятельность системных программистов заключается в разработке системного программного обеспечения. Курс лекций по системному программному обеспечению будет у Вас в следующем семестре, пока достаточно знать, что сюда относятся и системы программирования – тот инструмент, с помощью которого прикладные программисты пишут свои программы для конечных пользователей.

Разумеется, можно выделить и другие уровни видения архитектуры компьютера, не связанные с его использованием. В качестве примера можно указать уровень инженера-разработчика аппаратуры компьютера, уровень физика, исследующего новые материалы для построения схем ЭВМ и т.д. Эти уровни изучаются на других специальностях, и непосредственно нас интересовать не будут. В нашем курсе изучаются в основном первые три уровня, но иногда, в качестве примеров, мы совсем немного будем рассматривать и эти другие уровни видения архитектуры ЭВМ.

Далее укажем те способы, с помощью которых мы будем описывать архитектуру компьютера в нашем курсе. Можно выделить следующие основные способы описания архитектуры ЭВМ.

  1. Словесные описания, использование чертежей, графиков, блок-схем и т.д. Именно таким способом в научной литературе описывается архитектура ЭВМ для пользователей.
  2. В качестве другого способа описания архитектуры компьютера на внутреннем уровне можно с успехом использовать язык машины и близкий к нему язык Ассемблера. Дело в том, что компьютер является исполнителем алгоритма на языке машины и архитектуру компьютера легче понять, если знать язык, на котором записываются эти алгоритмы. В нашем курсе мы будем изучать язык Ассемблера в основном именно для лучшего понимания архитектуры ЭВМ. Для этого нам понадобится не полный язык Ассемблера, а лишь относительно небольшое подмножество этого языка.
  3. Можно проводить описание архитектуры ЭВМ и с помощью формальных языков. Из курса предыдущего семестра Вы знаете, как важна формализация некоторого понятия, что позволяет значительно поднять строгость его описания и устранить различное понимание этого понятия разными людьми. В основном формальные языки используются для описания архитектуры ЭВМ на инженерном уровне, эти языки весьма сложны и их изучение выходит за рамки нашего предмета. Мы, однако, попробуем дать почти формальное описание архитектуры, но не настоящего компьютера, а некоторой учебной ЭВМ. Эта ЭВМ будет, с одной стороны, достаточно проста, чтобы её формальное описание не было слишком сложным, а, с другой стороны, она должна быть универсальной (т.е. пригодной для реализации любых алгоритмов, для выполнения которых хватает аппаратных ресурсов компьютера).

Вы, конечно, уже знаете, что сейчас производятся самые разные компьютеры. Определим теперь, архитектуру каких именно ЭВМ мы будем изучать в нашем курсе.

  1. Сначала мы рассмотрим архитектуру некоторой абстрактной машина (машины фон Неймана).
  2. Далее мы изучим специальную учебную ЭВМ, которая по своей архитектуре близка к самым первым из выпускавшихся компьютеров.
  3. Затем мы достаточно подробно изучим архитектуру первой модели того конкретного компьютера, на котором Вы работаете в терминальном классе.
  4. В заключение нашего курса мы проведём некоторый достаточно простой сравнительный анализ архитектуры основных классов универсальных ЭВМ.

2. Машина Фон Неймана

В 1946 Джон фон Нейман (с соавторами) описал архитектуру некоторого абстрактного вычислителя, который сейчас принято называть машиной фон Неймана [2]. Эта машина является абстрактной моделью ЭВМ, однако, эта абстракция отличается от абстрактных исполнителей алгоритмов (например, машины Тьюринга). Если машину Тьюринга принципиально нельзя реализовать из-за входящей в её архитектуру бесконечной ленты, то машина фон Неймана не поддаётся реализации, так как многие детали в архитектуре этой машины не конкретизированы. Это было сделано специально, чтобы не сковывать творческого подхода к делу у инженеров-разработчиков новых ЭВМ.

В некотором смысле машина фон Неймана подобна абстрактным структурам данных, которые Вы изучали в предыдущем семестре. Для таких структур данных, как Вы помните, для их использования необходимо было произвести отображение на структуры данных хранения и реализовать соответствующие операции над этими данными.

Можно сказать, что в машине фон Неймана зафиксированы те особенности архитектуры, которые в той или иной степени должны быть присущи, по мнению авторов этой абстрактной машины, всем компьютерам. Разумеется, практически все современные ЭВМ по своей архитектуре отличаются от машины фон Неймана, однако эти отличия удобно изучать именно как отличия, проводя сравнения и сопоставления с машиной фон Неймана. При нашем рассмотрении данной машины будет обращено внимание на отличия архитектуры машины фон Неймана от современных ЭВМ. Основополагающие свойства архитектуры машины фон Неймана будут сформулированы в виде принципов фон Неймана. Эти принципы многие годы определяли основные черты архитектуры ЭВМ нескольких поколений [3].

На рис. 2.1 приведена схема машины фон Неймана, как она изображается в большинстве учебников, посвящённых архитектуре ЭВМ. На этом рисунке толстыми стрелками показаны потоки команд и данных, а тонкими – передача между устройствами управляющих сигналов. Машина фон Неймана состоит из памяти, устройств ввода/вывода и центрального процессора (ЦП). Центральный процессор, в свою очередь, состоит из устройства управления (УУ) и арифметико-логического устройства (АЛУ). Рассмотрим последовательно устройства машины фон Неймана и выполняемые ими функции.

2.1. Память

Принцип линейности и однородности памяти.

Память – линейная (упорядоченная) однородная последовательность некоторых элементов, называемых ячейками. В любую ячейку памяти другие устройства машины (по толстым стрелкам) могут записать и считать информацию, причём время чтения из любой ячейки одинаково для всех ячеек. Время записи в любую ячейку тоже одинаково (это и есть принцип однородности памяти).3 Такая память в современных компьютерах называется памятью с произвольным доступом (Random Access Memory, RAM). На практике многие ЭВМ могут иметь участки памяти разных видов, одни из которых поддерживают только чтение информации (Read Only Memory, ROM), другие могут допускать запись, но за большее время, чем в остальную память (это так называемая полупостоянная память) и др.

Ячейки памяти в машине фон Неймана нумеруются от нуля до некоторого положительного числа N, которое обычно является степенью двойки. Адресом ячейки называется её номер. Каждая ячейка состоит из более мелких частей, именуемых разрядами и нумеруемых также от нуля и до определённого числа. Количество разрядов в ячейке обозначает разрядность памяти. Каждый разряд может хранить цифру в некоторой системе счисления. В большинстве ЭВМ используется двоичная система счисления, т.к. это более выгодно с точки зрения аппаратной реализации, в этом случае каждый разряд хранит один бит информации. Восемь бит составляет один байт.

Содержимое ячейки называется машинным словом. С точки зрения архитектуры, машинное слово – это минимальный объём данных, которым могут обмениваться различные узлы машины (не надо, однако, забывать о передаче управляющих сигналов по тонким стрелкам). Из каждой ячейки памяти можно считать копию машинного слова и передать её в другую часть памяти, при этом оригинал не меняется. При записи в память старое содержимое ячейки пропадает и заменяется новым машинным словом.

Заметим, что на практике решение задачи сохранения исходного машинного слова при чтении из ячейки для некоторых видов памяти является нетривиальным и достаточно трудоёмким, так как в этой памяти (она называется динамической памятью) при чтении оригинал разрушается. Приведём типичные характеристики памяти современных ЭВМ.

  1. Объём памяти – сотни миллионов ячеек (обычно восьмиразрядных).
  2. Скорость работы памяти: время доступа (минимальная задержка на чтение слова) и время цикла (минимальная задержка на чтение из одной и той же ячейки двух слов) – порядка единиц и десятков наносекунд (1 секунда=109 наносекунд). Заметим, что для упомянутой выше динамической памяти время цикла больше, чем время доступа, так как надо ещё восстановить разрушенное при чтении содержимое ячейки.
  3. Стоимость. Для основной памяти ЭВМ пока достаточно знать, что чем быстрее такая память, тем она, естественно, дороже. Конкретные значения стоимости памяти не представляют интереса в рамках наших лекций.

Принцип неразличимости команд и данных. Машинное слово представляет собой либо команду, либо подлежащее обработке данное (число, символьная информация, элемент изображения и т.д.). Для краткости в дальнейшем будем называть такую информацию числами. Данный принцип фон Неймана заключается в том, что числа и команды неотличимы друг от друга – в памяти и те и другое представляются некоторым набором разрядов, причём по внешнему виду машинного слова нельзя определить, что оно представляет – команду или число.

Из этого принципа вытекает очевидное следствие – принцип хранимой программы. Этот принцип является очень важным, его суть состоит в том, что программа хранится в памяти вместе с числами, а значит, может изменяться во время счёта этой программы. Говорят также, что программа может самомодифицироваться во время счёта. Заметим, что, когда фон Нейман писал свою работу, большинство тогдашних ЭВМ хранили программу в памяти одного вида, а числа – в памяти другого вида. В современных ЭВМ и программы, и данные хранятся в одной и той же памяти.

2.2. Устройство Управления

Как ясно из самого названия, устройство управления (УУ) управляет всеми остальными устройствами ЭВМ. Оно осуществляет это путём посылки управляющих сигналов, подчиняясь которым остальные устройства производят определённые действия, предписанные этими сигналами. Это устройство является единственным, от которого на рис. 2.1 отходят тонкие стрелки ко всем другим устройствам. Остальные устройства могут командовать только памятью, делая ей запросы на чтение и запись машинных слов.

Принцип автоматической работы. Машина, выполняя записанную в её памяти программу, функционирует автоматически, без участия человека.4 Программа – набор записанных в памяти (не обязательно последовательно) машинных команд, описывающих шаги работы алгоритма. Таким образом, программа – это запись алгоритма на языке машины. Язык машины – набор всех возможных команд.

Принцип последовательного выполнения команд. Устройство управления выполняет некоторую команду от начала до конца, а затем по определённому правилу выбирает следующую команду для выполнения, затем следующую и т.д. Этот процесс продолжается, пока не будет выполнена специальная команда останова, либо при выполнении очередной команды не возникнет аварийная ситуация (например, деление на ноль). Аварийная ситуация – это аналог безрезультативного останова алгоритма.

2.3. Арифметико–Логическое Устройство

В архитектуре машины фон Неймана арифметико-логическое устройство (АЛУ) может выполнить следующие действия.

  1. Считать содержимое некоторой ячейки памяти – поместить копию машинного слова из этой ячейки в ячейку, расположенную в самом АЛУ. Такие ячейки, расположенные не в памяти, а в других устройствах ЭВМ, называются регистровой памятью или просто регистрами.
  2. Записать в некоторую ячейку памяти – поместить копию содержимого регистра АЛУ в ячейку памяти. Когда не имеет значения, какая операция (чтение или запись) производится, говорят, что происходит обмен машинным словом между регистром и памятью.
  3. АЛУ может также выполнять различные операции над данными в своих регистрах, например, сложить содержимое двух регистров (обычно называемых регистрами первого R1 и второго R2 операндов), и поместить результат на третий регистр (называемый, как правило, сумматором S).

2.4. Взаимодействие УУ и АЛУ

Революционность идей фон Неймана заключалась в специализации: каждое устройство отвечает за выполнение только своих функций. Если раньше, например, память часто не только хранила данные, но и могла производить операции над ними, то теперь было предложено, чтобы память только хранила данные, АЛУ производило арифметико-логические операции над ними, устройство ввода только вводило данные из внешнего мира в память и т.д. Фон Нейман распределил функции между различными устройствами, что существенно упростило схему машины.

Устройство управления тоже имеет свои регистры, оно может считывать команды из памяти на специальный регистр команд (RK), на котором всегда хранится текущая выполняемая команда. Регистр УУ с именем RA называется счётчиком адреса, при выполнении текущей команды в него записывается адрес следующей команды (первую букву в сокращении слова регистр будем записывать латинской буквой R).

Рассмотрим, например, операцию сложения двух чисел z:=x+y (здесь x, y и z – адреса ячеек памяти, в которых хранятся, соответственно, операнды и результат сложения). При получении такой команды УУ последовательно посылает управляющие сигналы в АЛУ, предписывая ему сначала считать операнды x и y из памяти и поместить их на регистры R1 и R2. Затем по следующему управляющему сигналу АЛУ производит операцию сложения чисел на регистрах R1 и R2 и записывает результат на регистр S. По следующему управляющему сигналу АЛУ пересылает копию регистра S в ячейку памяти с адресом z. Ниже приведена иллюстрация описанного примера на языке Паскаль, где R1, R2 и S – регистры АЛУ, ПАМ – массив, условно обозначающий память ЭВМ, а  – операция (в нашем случае это сложение, т.е.  = +).

R1:=ПАМ[x]; R2:=ПАМ[y]; S:=R1R2; ПАМ[z]:=S;

В дальнейшем конструкция ПАМ[А] для краткости будет обозначаться как <А>, тогда наш пример перепишется так:

R1:=<x>; R2:=<y>; S:=R1R2; <z>:=S;

Опишем теперь более формально шаги выполнения одной команды в машине фон Неймана:

RK:=<RA>; считать из памяти очередную команду на регистр команд;

RA:=RA+1; увеличить счётчик адреса на единицу;

Выполнить очередную команду.

Затем выполняется следующая команда и т.д. Итак, если машинное слово попадает на регистр команд, то оно интерпретируется УУ как команда, а если слово попадает в АЛУ, то оно по определению считается числом. Это позволяет, например, складывать команды программы как числа, либо выполнить некоторое число как команду. Разумеется, обычно такая ситуация является семантической ошибкой, если только специально не предусмотрена программистом для каких-то целей (мы иногда будем оперировать с командами, как с числами, в нашей учебной машине).

Современные ЭВМ в той или иной степени нарушают все принципы фон Неймана. Например, существуют компьютеры, которые различают команды и данные. В них каждая ячейка памяти кроме собственно машинного слова содержит ещё специальный признак, называемый тэгом, который и определяет, чем является машинное слово. В этой архитектуре при попытке выполнить число как команду, либо складывать команды как числа, будет зафиксирована ошибка. Так нарушается принцип неразличимости команд и чисел.

Практически все современные ЭВМ нарушают принцип однородности и линейности памяти. Память может быть, например, двумерной, когда адрес ячейки задаётся не одним, а двумя числами, либо ячейки памяти могут вообще не иметь адресов (такая память называется ассоциативной) и т.д.

Достаточно мощные компьютеры нарушают и принцип последовательного выполнения команд: они одновременно могут выполнять несколько команд как из одной программы, так, иногда, и из разных программ (такие компьютеры могут иметь несколько центральных процессоров, а также быть так называемыми конвейерными ЭВМ, их мы рассмотрим в конце нашего курса).

Особо следует отметить, что в архитектуре машины фон Неймана реализованы и другие принципы, которые самим фон Нейманом явно не формулировались, так как считались самоочевидными. Так, например, предполагается, что во время выполнения программы не меняется число узлов компьютера и взаимосвязи между ними. В то же время сейчас существуют ЭВМ, которые нарушают и этот принцип. Во время работы одни устройства могут, как говорят, отбраковываться (например, отключаться для ремонта), другие – автоматически подключаться, появляются новые связи между элементами ЭВМ (например, в так называемых транспьютерах) и т.д.

На этом мы закончим краткое описание машины фон Неймана и принципов её работы. И в заключение этого раздела мы совсем немного рассмотрим архитектуру ЭВМ на уровне инженера-конструктора. Это будет сделано исключительно для того, чтобы снять тот покров таинственности с работы центрального процессора, который есть сейчас у некоторых студентов: как же машины может выполнять различные операции, неужели она такая умная?

Аппаратура современных ЭВМ состоит из некоторых элементарных конструктивных элементов, называемых вентилями. Каждый вентиль реализует одну из логических операций, у него есть один или два входа и один выход. На входах и выходе могут быть электрические сигналы двух видов: низкое напряжения (трактуется как ноль или логическое значение false) и высокое (ему соответствует единица или логическое значение true). Основные вентили следующие.

  1.  Отрицание, этот вентиль имеет один вход и один выход, если на входе значение true, то на выходе значение false и наоборот. Будем изображать этот вентиль так:

  1.  Дизъюнкция или логическое сложение, реализует хорошо известную Вам операцию Паскаля or, будем изображать его как   
  2. И, наконец, конъюнкция или логическое умножение, изображаемое как

Каждый вентиль срабатывает (т.е. преобразует входные сигналы в выходные) не непрерывно, а только тогда, когда на вентиль по специальному управляющему проводу приходит так называемый тактовый импульс. Заметим, что по этому принципу работают ЭВМ, которые называются дискретными, в отличие от аналоговых компьютеров, схемы в которых работают непрерывно. Подавляющее число современных ЭВМ являются дискретными, только их мы и будем изучать. Более подробно об этом можно прочесть в книгах [1,3].

Из вентилей строятся так называемые интегральные схемы – это набор вентилей, соединённых проводами и такими радиотехническими элементами, как сопротивления, конденсаторы и индуктивности. Каждая интегральная схема тоже имеет свои входы и выходы и реализует какую-нибудь функцию узла компьютера. В специальной литературе интегральные схемы, которые содержат порядка 1000 вентилей, называются малыми интегральными схемами (МИС), порядка 10000 вентилей – средними (СИС), порядка 100000 – большими (БИС) и более 100000 вентилей – сверхбольшими интегральными схемами (СБИС).

Большинство современных интегральных схем собираются на одной небольшой прямоугольной пластинке полупроводника с размерами порядка сантиметра. Под микроскопом такая пластинка СБИС похожа на план большого города. Интегральная схема имеет от нескольких десятков до нескольких сотен внешних контактов.

Для того, чтобы реализовать простые электронные часы, необходимо порядка 1000 вентилей, из 10000 вентилей уже можно собрать простейший центральный процессор, а современные мощные ЭВМ состоят из миллионов вентилей.

В качестве примера рассмотрим интегральную схему, которая реализует функцию сложение двух одноразрядных двоичных чисел. Входными данными этой схемы являются значения переменных x и y, а результатом – их сумма, которая, в общем случае, является двухразрядным числом (обозначим разряды этого числа как a и b), формирующиеся как результат сложения x+y. Запишем таблицу истинности для этой функции от двух переменных:

x

y

b

a

0

0

0

0

0

1

0

1

1

0

0

1

1

1

1

0

Легко вычислить, что величины a и b будут определяться формулами:

а = x<>y =(x or y) and not(x and y)

b = x and y

Реализуем нашу интегральную схему как набор вентилей, связанных проводниками (рис. 2.2. а).

Рис. 2.2. а) Сборка двоичного сумматора из вентилей, ↓ – тактовые импульсы.

x

y

a

b

or

and

not

and

Наша интегральная схема (см. рис. 2.2 б) будет иметь не менее 7-ми внешних контактов: входные x и y, выходные а и b, один контакт для подачи тактовых импульсов, два контакта для подачи электрического питания (ясно, что без энергии ничего работать не будет) и, возможно, другие контакты. Суммирование чисел x и y в приведенной выше схеме осуществляется после прихода трёх тактовых импульсов (как говорят, за три такта). Современные компьютеры обычно реализуют более сложные схемы суммирования, срабатывающие за один такт.

Скорость работы интегральной схемы зависит от частоты прихода тактовых импульсов, называемой тактовой частотой. У современных ЭВМ тактовые импульсы приходят на схемы основной памяти с частотой примерно в сто миллионов раз в секунду, а на схемы центрального процессора – ещё примерно в 10 раз чаще.

Рис. 2.2б. Интегральная схема двоичного сумматора.

Интегральная

схема двоичного

сумматора

x

y

a

b

+

такт

3. Учебная машина

Рассмотрим конкретизацию абстрактной машины фон Неймана на примере учебной машины, которую будем называть УМ–3 (смысл этого названия – учебная машина трёхадресная). Наша учебная машина будет удовлетворять всем принципам фон Неймана.

Память учебной машины состоит из 512 ячеек, имеющих адреса от 0 до 511, по 32 двоичных разряда каждая. В каждой ячейке может быть записано целое или вещественное число (представляются они по-разному) или команда. Команда в ячейке будет представляться в следующей форме:

КОП

A1

A2

A3

5 разрядов

9 разрядов

9 разрядов

9 разрядов

Здесь КОП – это число от 0 до 31, которое задаёт номер (код) операции, а A1, A2 и A3 – адреса операндов. Таким образом, в каждой команде задаются адреса аргументов (это A2 и A3)и адрес результата операции A1. Конкретизируем регистры устройства управления:

  1.  RA – регистр, называемый счётчиком адреса, он имеет 9 разрядов и хранит адрес команды, которая будет выполняться вслед за текущей командой;
  2.  RK – регистр команд имеет 32 разряда и содержит текущую выполняемую команду (код операции КОП и адреса операндов A1, A2 и A3);
  3.  w – регистр «омега», в который после выполнения некоторых команд (у нас это будут арифметические команды сложения, вычитания, умножения и деления) записывается число от 0 до 2 по правилу (S – результат арифметической операции):

  1.  Err – регистр ошибки, содержащий нуль в случае успешного выполнения очередной команды и единицу в противном случае.

В таблице 3.1 приведёны все команды учебной машины УМ–3.

3.1. Схема выполнения команд

Все бинарные операции (т.е. те, которые имеют два аргумента и один результат) выполняются в нашей учебной машине по схеме: <A1>:=<A2><A3> ( – любая бинарная операция). Каждая команда выполняется по следующему алгоритму:

  1.  RK := <RА>;  чтение очередной команды на регистр команд УУ.
  2.  RА := RА + 1.
  3. Выполнение операции, заданной в коде операции (КОП). При ошибочном КОП выполняется Err := 1.
  4.  if (Err=0) and (КОП<>СТОП) then goto 1 else КОНЕЦ.

Теперь нам осталось определить условие начала работы программы. Для загрузки программы в память и формирования начальных значений регистров в устройстве управления на устройстве ввода имеется специальная кнопка ПУСК (   ). При нажатии этой кнопки устройство ввода самостоятельно (без сигналов со стороны устройства управления) производит следующую последовательность действий:

  1. Производится ввод расположенного на устройстве ввода массива машинных слов в память, начиная с первой ячейки; этот массив машинных слов заканчивается специальным признаком конца массива.
  2.  RА := 1
  3.  w := 0
  4.  Err := 0

Далее всё готово для автоматической работы центрального процессора по загруженной в память программе. Таким образом, мы полностью определили условия начала и конца работы нашей алгоритмической системы (вспомним курс "Алгоритмы и алгоритмические языки").

Таблица 3.1. Команды учебной машины.

КОП

Операция и её мнемоническое обозначение

01

СЛВ – сложение вещественных чисел

11

СЛЦ – сложение целых чисел

02

ВЧВ – вычитание вещественных чисел

12

ВЧЦ – вычитание целых чисел

03

УМВ – умножение вещественных чисел

13

УМЦ – умножение целых чисел

04

ДЕВ – деление вещественных чисел

14

ДЕЦ – деление целых чисел (то же, что и div в Паскале)

24

МОД – остаток от деления (то же, что и mod в Паскале)

00

ПЕР – пересылка: <A1>:=<A3>

10

ЦЕЛ – вещественное в целое: <A1>:=Round(<A3>)

20

ВЕЩ – целое в вещественное: <A1>:=Real(<A3>)

09

БЕЗ – безусловный переход: goto A2, т.е. RA:=A2

19

УСЛ – условный переход:

Case w of 0: goto A1; 1: goto A2; 2: goto A3 end

31

СТОП – остановка выполнения программы

05

ВВВ – ввод A2 вещественных чисел в память, начиная с адреса A1

15

ВЫВ – вывод вещественных чисел, аналогично ВВВ

06

ВВЦ – ввод целых чисел, аналогично ВВВ

16

ВЫЦ – вывод целых чисел, аналогично ВВВ

По своей архитектуре наша учебная машина очень похожа на первые ЭВМ, построенные в соответствии с принципами фон Неймана, например, на отечественную ЭВМ СТРЕЛА [3], выпускавшуюся в средине прошлого века.

3.2. Примеры программ для учебной машины.

3.2.1. Пример 1. Оператор присваивания.

Составим программу, которая реализует арифметический оператор присваивания.

y := (x+1)2 mod (x-1)2.

Сначала необходимо решить, в каких ячейках памяти будут располагаться наши переменные x и y. Эта работа называется распределением памяти под хранение переменных. При программировании на Паскале эту работу выполняла за нас Паскаль-машина, когда видела описания переменных:

Var x,y: integer;

Теперь нам придётся распределять память самим. Сделаем естественное предположение, что наша программа будет занимать не более 100 ячеек памяти (напомним, что программа вводится, начиная с первой ячейки памяти при нажатии кнопки ПУСК). Тогда, начиная со 101 ячейки, память будет свободна. Пусть для хранения значения переменной x мы выделим 101 ячейку, а переменной y – 102 ячейку. Остальные переменные при необходимости будем размещать в последующих ячейках памяти. В приведенном примере нам понадобятся дополнительные (как говорят, рабочие) переменные r1 и r2, которые мы разместим в ячейках 103 и 104 соответственно.

При программировании на машинном языке, в отличие от Паскаля, у нас не будут существовать константы. Действительно, в какой бы ячейке мы не поместили значение константы, ничто не помешает нам записать в эту ячейку новое значение. Поэтому мы будем называть константами такие переменные, которые имеют начальные значения, и которые мы не планируем изменять в ходе выполнения программы. Отсюда следует, что такие константы, как и переменные с начальным значением, следует располагать в тексте программы и загружать в память вместе с программой при нажатии кнопки ПУСК. Разумеется, такие переменные с начальными значениями следует располагать в таком месте программы, чтобы устройство управления не начало бы выполнять их как команды. Чтобы избежать этого мы будем размещать их в конце программы, после команды СТОП.

Следует обратить внимание и на тот факт, что изначально программист не знает, сколько ячеек в памяти будет занимать его программа. Поэтому адреса программы, ссылающиеся на переменные с начальным значением, до завершения написания программы остаются незаполненными, и уже потом, разместив эти переменные в памяти сразу же вслед за командами программы, следует указать их адреса в тексте программы. В приведённом примере те адреса программы, которые заполняются в последнюю очередь, будут обозначаться подчёркиванием.

Запись программы состоит из строк, каждая строка снабжается номером ячейки, куда будет помещаться это машинной слово (команда или переменная с начальным значением) при загрузке программы. Вслед за номером задаются все поля команды, затем программист может указать комментарий. Номера ячеек, кодов операций и адреса операндов будем записывать в десятичном виде, хотя первые программисты использовали для этого 8-ую или 16-ую системы счисления. Кроме того, так как числа неотличимы по внешнему виду от команд, то будем записывать их тоже чаще всего в виде команд. Текст нашей первой программы с комментариями приведён на рис. 3.1.

Команда

Комментарий

001

06

101

001

000

Ввод x

2

11

103

101

009

r1 := (x+1)

3

13

103

103

103

r1 := (x+1)2

4

12

104

101

009

r2 := (x-1)

5

13

104

104

104

r2 := (x-1)2

6

24

102

103

104

y := r1 mod r2

7

16

102

001

000

Вывод y

8

31

000

000

000

Стоп

9

00

000

000

001

Целая константа 1

Рис 3.1. Текст программы первого примера.

После написания программы осталось поместить на устройство ввода два массива – саму программу (9 машинных слов) и число x (одно машинное слово) и нажать кнопку ПУСК. Как мы уже говорили, первый массив заканчивался специальной строкой – признаком конца ввода, так что устройство ввода знает, сколько машинных слов надо ввести в память по кнопке ПУСК.

3.2.2. Пример 2. Условный оператор.

Составим теперь программу, реализующую условный оператор присваивания. Пусть целочисленная переменная y принимает значение в зависимости от вводимой целочисленной переменной x в соответствии с правилом:

В данном примере при записи программы на месте кода операции мы будем для удобства вместо числа указывать его мнемоническое обозначение. Разумеется, потом, перед вводом программы необходимо будет заменить эти мнемонические обозначения соответствующими им числами.

Для определения того, является ли значение переменной x больше, меньше или равным константе 2, мы будем выполнять операцию вычитания x–2, получая в регистре w значение 0 при x=2, 1 при x<2 и 2 при x>2. При этом сам результат операции вычитания нам не нужен, но по нашему формату команд указание адреса ячейки для записи результата является обязательным. Для записи таких ненужных значений мы будем чаще всего использовать ячейку с номером 0. В соответствии с принципом однородности памяти, эта ячейка ничем не отличается от других, то есть, доступна как для записи, так и для чтения данных. В некоторых реальных ЭВМ этот принцип нарушается: при считывании из этой ячейки всегда возвращался нуль, а запись в ячейку с адресом ноль физически не осуществляется (на практике такой принцип работы c с этой ячейкой иногда удобнее).

Для хранения переменных x и y выделим ячейки 100 и 101 соответственно. Программист сам определяет порядок размещения в программе трёх ветвей нашего условного оператора присваивания. Мы будем сначала располагать вторую ветвь (x=2), затем первую (x<2), а потом третью (x>2). На рис. 3.2 приведён текст этой программы.

Команда

Комментарий

001

ВВЦ

100

001

000

Read(x)

2

СЛЦ

101

100

011

y := x+2

3

ВЧЦ

000

100

011

<000> := x–2; формирование w

4

УСЛ

005

007

009

Case w of 0: goto 005; 1: goto 007; 2: goto 009 end

5

ВЫЦ

011

001

000

Write(2)

6

СТОП

000

000

000

Конец работы

7

ВЫЦ

101

001

000

Write(y)

8

СТОП

000

000

000

Конец работы

9

УМЦ

101

011

101

y := 2 * y

010

БЕЗ

000

007

000

Goto 007

1

00

000

000

002

Целая константа 2

Рис 3.2. Текст программы второго примера.

Обратите внимание, что константа 2 неотличима от команды пересылки содержимого второй ячейки памяти в нулевую ячейку, именно такая команда и будет выполняться, если эта константа будет выбрана на регистр команд устройства управления.

3.2.3. Пример 3. Реализация цикла.

В качестве следующего примера напишем программу для вычисления начального отрезка гармонического ряда:

Для хранения переменных n,y и i выделим ячейки 100, 101 и 102 соответственно. В этом алгоритме мы реализуем цикл с предусловием, поэтому при вводе n<1 тело цикла не будет выполняться ни одного раза, и наша программа будет выдавать нулевой результат. На рис. 3.3 приведена возможная программа для решения этой задачи.

Сделаем некоторые замечания к этой программе. В нашем языке у нас нет команды деления целого числа на вещественное, поэтому при вычислении величины 1.0/i нам пришлось отдельной командой

 ВЕЩ 000 000 102 

преобразовать значение целой переменной i в вещественной значение. Обратите также внимание, что для нашей учебной машины мы ещё не определили формат представления вещественных чисел, поэтому в ячейке с адресом 14 стоит пока просто условное обозначение константы 1.0, а не её машинное представление.

Команда

Комментарий

001

ВВЦ

100

001

000

Read(n)

2

ВЧВ

101

101

101

y := 0.0

3

ПЕР

102

000

013

i := 1

4

ВЧЦ

000

102

100

i := in; формирование w

5

УСЛ

006

006

011

If i>n then goto 011

6

ВЕЩ

000

000

102

<000> := Real(i)

7

ДЕВ

000

014

000

<000> := 1.0/<000>

8

СЛВ

101

101

000

y := y+<000>

9

СЛЦ

102

102

013

i := i+1

010

БЕЗ

000

004

000

Следующая итерация цикла

1

ВЫВ

101

001

000

Write(y)

2

СТОП

000

000

000

Стоп

3

00

000

000

001

Целая константа 1

4

<1.0>

Вещественная константа 1.0

Рис 3.3. Текст программы третьего примера.

3.2.4. Пример 4. Работа с массивами.

Пусть требуется написать программу для ввода массива x из 100 вещественных чисел и вычисления суммы всех элементов этого массива:

 

Будем предполагать, что длина программы не превышает 200 ячеек, и поместим массив x, начиная с 200-ой ячейки памяти. Вещественную переменную S с начальным значением 0.0 и целую переменную i с начальным значением 100 разместим в конце текста программы. На рис. 3.4 приведён текст этой программы.

Команда

Комментарий

001

ВВВ

200

100

000

Read(x); массив x в ячейках 200299

2

СЛВ

008

200

008

S := S+x[1]

3

СЛЦ

002

002

011

Модификация команды в ячейке 2

4

ВЧЦ

010

010

009

n := n-1

5

УСЛ

006

006

002

Следующая итерация цикла

6

ВЫВ

008

001

000

Write(S)

7

СТОП

000

000

000

Стоп

8

<0.0>

Переменная S = 0.0

9

00

000

000

001

Целая константа 1

010

00

000

000

100

Переменная n с начальным значением 100

1

00

000

001

000

Константа переадресации

Рис 3.4. Текст программы четвёртого примера.

Рассматриваемая программа выделяется своим новым приёмом программирования и может быть названа самомодифицирующейся программой. Обратим внимание на третью строку программы. Содержащаяся в ней команда изменяет исходный код программы (команду в ячейке 2) для организации цикла перебора элементов массива. Модифицируемая команда рассматривается как целое число, которое складывается со специально подобранное константой переадресации. Согласно одному из принципов фон Неймана, числа и команды в учебной машине неотличимы друг от друга, а, значит, изменяя числовое представление команды, мы можем изменять и её суть.

У такого метода программирования есть один существенный недостаток: модификация кода программы внутри её самой может привести к путанице и вызвать появление ошибок. Кроме того, самомодифицирующуюся программу трудно понимать и вносить в неё изменения. В нашей учебной машине это, однако, единственный способ обработки массивов. В других архитектурах ЭВМ, с которыми мы познакомимся несколько позже, есть и другие, более эффективные способы работы с массивами, поэтому метод с модификацией команд не используется.

3.3. Формальное описание учебной машины

При описании архитектуры учебной ЭВМ на естественном языке многие вопросы остались нераскрытыми. Что, например, будет после выполнения команды из ячейки с адресом 511? Какое значение после нажатия кнопки ПУСК имеют ячейки, расположенные вне введённой программы? Как представляются целые и вещественные числа? Для ответа на почти все такие вопросы мы приведём формальное описание нашей учебной машины. В качестве метаязыка мы будем использовать Турбо-Паскаль, на котором Вы работаете. Другими словами, мы напишем программу, выполнение которой моделирует работу нашей учебной машины, т.е. наша машина, по определению, работает почти так же, как и написанная нами программа на Паскале.

Ниже приведена реализация учебной машины на языке Турбо-Паскаль:

program УМ_3(input, output);

 const

N = 511;

 type

Address = 0..N;

Tag = (kom, int, fl);  {В машинном слове может хранится команда, целое

   или вещественное число}

 Komanda = packed record

KOP: 0..31;

A1, A2, A3: Address;

 end;

Slovo = packed record

  case Tag of

kom: (k: Komanda);

int: (i: LongInt)

fl:  (f: Single);

end

Memory = array[0..N] of Slovo;

 var

 Mem: Memory;

S, R1, R2: Slovo; {Регистры АЛУ}

RK: Komanda;  {Регистр команд}

 RA: Address;  {Счётчик адреса}

Om: 0..2;     {Регистр w}

 Err: Boolean;

begin

Input_Program; {Эта процедура должна вводить текст программы с устройства

ввода в память по кнопке ПУСК}

Om := 0; Err := False; RA := 1; {Начальная установка регистров}

with RK do

repeat {Основной цикл выполнения команд}

    RK := Mem[RA].k;

    RA := (RA+1) mod (N+1);

     case KOP of {Анализ кода операции}

     00: { ПЕР }

begin R1 := Mem[A3]; Mem[A1] := R1 end;

     01: { СЛВ }

begin

 R1 := Mem[A2]; R2 := Mem[A3]; S.f := R1.f + R2.f;

 if S.f = 0.0 then OM := 0 else

 if S.f < 0.0 then OM := 1 else OM := 2;

 Mem[A1] := S; { Err := ? }

      end;

     09: { БЕЗ }

RA := A2;

     24: { МОД }

begin

 R1 := Mem[A2]; R2 := Mem[A3];

          if R2.i = 0 then Err := True else begin

    S.i := R1.i mod R2.i; Mem[A1] := S;

    if S.i = 0 then OM := 0 else

    if S.i < 0 then OM := 1 else OM := 2;

          end

end;

   13: { СТОП } ;

     { Реализация остальных кодов операций }

    else

      Err := True;

    end; { case }

  until Err or (KOP = 31)

end.

Для хранения машинных слов мы описали тип Slovo, который является записью с вариантами языка Турбо-Паскаль. В такой записи на одном и том же месте памяти могут располагаться команды, длинные (32-битные) целые числа или же 32-битные вещественные числа типа Single. 5

Наша программа ведёт себя почти так же, как учебная машина. Одно из немногих мест, где это поведение расходится, показано в тексте программы, например, при реализации команды сложения вещественных чисел. Программа на Паскале при переполнении (когда результат сложения не помещается в переменную S) производит аварийное завершение программы, а учебная машина просто присваивает регистру Err значение 1. Наше формальное описание отвечает и на вопрос о том, как в учебной машине представляются целые и вещественные числа: точно так же, как в переменных на Паскале. Это представление мы изучим в нашем курсе несколько позже.

Заметим также, что память учебной машины как бы замкнута в кольцо: после выполнения команды из ячейки с адресом 511 (если это не команда перехода) следующая команда будет выполняться из ячейки с адресом ноль. Такая организация памяти типична для многих современных ЭВМ.

4. Введение в архитектуру ЭВМ

4.1. Адресность ЭВМ

Как мы уже упоминали, число адресов в команде называется адресностью ЭВМ. Разнообразие архитектур ЭВМ предполагает, в частности, и различную адресность команд. Рассмотрим схему выполнения команд с различным числом адресов операндов. Будем предполагать, что для хранения кода операции в команде отводится один байт (8 разрядов), а для хранения каждого из адресов – 3 байта (это обеспечивает объём памяти 224 ячеек). Ниже приведены форматы команд для ЭВМ различной адресности и схемы выполнения этих команд для случая бинарных операций (у таких операций два операнда и один результат).

  1.  Трёхадресная машина.

КОП

A1

A2

A3

= 10 байт

8 разрядов

24 разряда

24 разряда

24 разряда

Схема выполнения команд такой машины нам уже известна:

R1 := <A2>; R2 := <A3>; S := R1  R2; <A1> := S; { – операция}

  1.  Двухадресная машина.

КОП

A1

A2

= 7 байт

8 разрядов

24 разряда

24 разряда

Схема выполнения команд:

R1 := <A1>; R2 := <A2>; S := R1  R2; <A1> := S;

Заметим, что теперь для выполнения бинарной операции первый и второй операнды задаются явно в качестве адресов в команде, а местоположение результата операции задаётся неявно или, как говорят, по умолчанию. В рассмотренном выше случае результат операции по умолчанию помещается на место первого операнда, уничтожая его.

  1.  Одноадресная машина.

КОП

A1

= 4 байта

8 разрядов

24 разряда

Схема выполнения команд:

R1 := <A1>; S := S  R1;

Для работы в одноадресной машине необходимы ещё две команды, которые имеют один операнд и один результат и выполняются  по другим схемам. Это команда чтения числа из памяти на регистр сумматора:

СЧ A1

Она выполняется по схеме

S := <A1>

и команда записи значения из сумматора в память:

ЗП A1 

Она выполняется по схеме

<A1> := S

При выполнении бинарных операций в одноадресной ЭВМ только один второй операнд задаётся в команде явно, а первый операнд и результат задаются неявно – это регистр сумматора.

  1.  Безадресная машина.

КОП

= 1 байт

8 разрядов

В отличие от других рассмотренных выше машин, безадресная машина использует при работе аппаратно реализованный в компьютере стек, для чего вводятся две дополнительные одноадресные команды: записи из памяти в стек

ВСТЕК A1

которая выполняется по схеме

R1 := <A1>; ВСТЕК(R1)

и команда чтения из стека

ИЗСТЕКА A1

которая выполняется по схеме

ИЗСТЕКА(R1); <A1> := R1

Таким образом, за исключение двух указанных выше одноадресных команд, которые имеют длину 4 байта, все остальные команды являются безадресными, имеют длину 1 байт и выполняются по схеме:

R1 := ИЗСТЕКА; R2 := ИЗСТЕКА; S := R1  R2; ВСТЕК(S)

Как видно, для безадресных команд при выполнении бинарных операций уже все аргументы (два операнда и результат) задаются неявно и располагаются в стеке. Отсюда понятно, почему часто машины этой архитектуры называются стековыми ЭВМ.

Кроме рассмотренных видов машин, существовали и другие архитектуры ЭВМ, например, четырёхадресные, в четвёртом адресе которых дополнительно хранится ещё и адрес следующей выполняемой команды. Собственно, адресов может быть и больше, с помощью таких команд можно, например, реализовать функции от многих переменных.

Существуют архитектуры ЭВМ, которые различаются не только количеством адресов в команде, но и наличием в команде нескольких кодов операций. Такие ЭВМ называются машинами с очень длинным командным словом (VLIWvery large instruction word). В этих компьютерах, например, указанные команды могут реализовывать оператор присваивания вида z:=k*(x+y) по схеме:

R1 := <x>; R2 := <y>; S := R1+R2;

R1 := <k>; S := S*R1; <z> := S

В компьютерах с такой архитектурой команда содержит два кода операции и четыре адреса аргументов:

КОП1

КОП2

A1

A2

A3

A4

Такие команды могут выполняться, например,  по схеме:

R1 := <A2>; R2 := <A3>; S := R1 КОП1 R2;

R1 := <A4>; S := S КОП2 R1; <A1> := S

4.2. Сравнительный анализ ЭВМ различной адресности

При изучении ЭВМ с разным количеством адресов естественно встаёт вопрос, какая архитектура лучше, например, даёт программы, занимающие меньше места в памяти (что было весьма актуально для первых ЭВМ). Исследуем этот вопрос, составив небольшой фрагмент программы для ЭВМ с различной адресностью. В качестве примера рассмотрим реализацию оператора присваивания, который содержит типичный набор операций: x := a/(a+b)2. В наших примерах мы будем использовать мнемонические коды операций и мнемонические имена для номеров ячеек памяти, в которых хранятся переменные (т.е. мы не будем производить явного распределения памяти, так как это несущественно для нашего исследования). Кроме того, не будем конкретизировать тип величин, это тоже не влияет на размер программы.

  1.  Трёхадресная машина.

СЛ

x

a

B

X := a+b

УМН

x

x

X

X := (a+b)2

ДЕЛ

x

a

x

X := a/(a+b)2

Длина программы: 3*10 = 30 байт.

  1.  Двухадресная машина.

ПЕР

R

a

R := a

СЛ

R

b

R := a+b

УМН

R

R

R := (a+b)2

ПЕР

X

a

x := a;

ДЕЛ

X

R

x := a/(a+b)2

Длина программы: 5*7 = 35 байт.

  1.  Одноадресная машина.

СЧ

A

S := a

СЛ

B

S := a+b

ЗП

X

x := a+b

УМН

X

x := (a+b)2

ЗП

X

СЧ

A

S := a/(a+b)2

ДЕЛ

X

ЗП

X

Длина программы: 8*4 = 32 байта.

  1.  Безадресная машина.

ВСТЕК

A

Поместить a в стек

ВСТЕК

Дублировать вершину стека

ВСТЕК

B

Теперь в стеке 3 числа:  b,a,a

СЛ

В стеке два числа: b+a, a

ВСТЕК

Дублировать вершину стека, в стеке b+a,b+a,a

УМН

В стеке (a+b)2,a

ОБМЕН

Поменять местами два верхних элемента стека

ДЕЛ

В стеке a/(a+b)2

ИЗСТЕКА

X

Запись результата из стека в x

В данной программе использовались команды разной длины (безадресные и одноадресные). Длина программы: 3*4 + 6*1 = 18 байт.

Наше небольшое исследование показало, что архитектура ЭВМ с безадресными командами даёт наиболее компактные программы. В начале развития вычислительной техники такие компьютеры были весьма распространены, их, в частности, выпускала известная фирма Барроуз (Burroughs). Однако в дальнейшем были предложены ЭВМ с другой архитектурой, которая позволила писать не менее компактные программ, и в настоящее время стековые ЭВМ используются редко.

4.3. Дробно-адресная архитектура

Далее мы рассмотрим архитектуру ЭВМ, которые называются компьютерами с адресуемыми регистрами, в русскоязычной литературе они часто называются дробно-адресными [3,4] (смысл этого названия мы скоро выясним). Эти компьютеры должны давать возможность писать такие же компактные программы, как и компьютеры с безадресной системой команд, но при этом они обладают рядом дополнительных достоинств.

Компьютеры дробно-адресной архитектуры нарушают один из принципов фон Неймана – принцип однородности памяти. Будем считать, что память, к которой может непосредственно обращаться центральный процессор, состоит из двух частей, каждая со своей независимой нумерацией ячеек. Одна из этих частей называется адресуемой регистровой памятью и имеет небольшой объём (порядка десятков ячеек), а другая называется основной (оперативной) памятью большого объёма. Ячейка каждого из видов памяти имеет свой адрес, но в случае с маленькой регистровой памятью этот адрес имеет размер в несколько раз меньший, чем адрес ячейки основной памяти.

Например, рассмотрим двухадресную ЭВМ, в которой регистровая память состоит из 16 ячеек. В этом случае адрес каждого регистра лежит в диапазоне 015, и будет помещаться в 4 бита, а основная память содержит 220 ячеек и адрес каждой ячейки занимает 20 двоичных разрядов. В такой ЭВМ в качестве адресов операндов каждой команды могут быть или адреса двух регистров, или адрес регистра и адрес ячейки основной памяти. Адреса регистров на схемах команд будем обозначать R1 и R2, а адрес основной памяти A1 или A2. Первый вид команд будем называть командами формата регистр-регистр (обозначается RR), а вторые – формата регистр-память (обозначается RX). В этом случае для одного кода операции (например, сложения) мы получим команды двух форматов длины 2 и 4 байта соответственно:

КОП

R1

R2

= 2 байта

1 байт

1 байт

КОП

R1

A2

= 4 байта

8 бит

4 бита

20 бит

В качестве преимущества этой архитектуры нужно отметить, что ячейки регистровой памяти размещаются внутри центрального процессора, и, имея статус регистров, позволяют производить на них арифметические и логические операции (что, как мы помним, в основной памяти невозможно). Кроме того, это обеспечивает быстрый доступ к хранимым на регистрах данным (не требуется делать обмен с расположенной отдельно от центрального процессора основной памятью).

Скажем теперь, что такая архитектура получила название дробно-адресной потому, что адрес ячейки регистровой памяти составляет какую-то часть адреса ячейки большой основной памяти. В нашем примере соответствующее отношение равно правильной дроби 1/5.

Из рассмотренного выше можно сделать вывод, что при программировании на ЭВМ с такой архитектурой желательно как можно чаще оперировать с регистровой памятью и как можно реже обращаться к большой основной памяти, такого принципа мы и будем придерживаться. Теперь для нашей дробно-адресной машины составим фрагмент программы, который реализует, как и в предыдущих примерах, арифметический оператор присваивания x:=a/(a+b)2 . Мнемонические коды операций задают арифметические операции с обычным смыслом. Точка с запятой, как это принято в языке Ассемблера, задаёт комментарий к команде:

...

СЧ  R1,a;  R1 := a

СЧ  R2,b;  R2 := b

СЛ  R2,R1; R2 := b+a=a+b

УМН R2,R2; R2 := (a+b)2

ДЕЛ R1,R2; R1 := a/(a+b)2

ЗП  x,R1;  x  := R1= a/(a+b)2

...

Длина этого фрагмента программы равна 3*4+3*2 = 18 байт. Как видим, данная архитектура не уступает стековой (безадресной) архитектуре по длине получаемых программ.

Рассмотрим теперь недостатки дробно-адресной архитектуры ЭВМ. Если ранее для каждой арифметической операции было необходимо реализовать по одной команде для целых и вещественных чисел, то теперь число этих команд возросло вдвое из-за необходимости реализовывать эти команды как в формате RR, так и в формате RX. Это приводит к существенному усложнению устройства управления, которое отныне должно поддерживать бόльшее количество операций.

Однако преимущества дробно-адресной архитектуры настолько очевидны, что её имеют большинство современных машин. Разумеется, в них есть и много новых особенностей, некоторые из которых мы рассмотрим далее в нашем курсе.

При работе с дробно-адресной архитектурой мы встречаемся с командами разного формата (и, соответственно, разной длины). Как говорится, современные ЭВМ обладают многообразием форматов команд. Например, на тех компьютерах, на которых Вы сейчас выполняете свои практические работы, реализованы около десяти форматов, а длина команд составляет от 1 до 6 байт.

4.4. Способы адресации

Введём следующее определение. Способ адресации – это способ задания операндов внутри машинной команды. Другими словами это правила, по которым заданные в команде (двоичные) числа определяют местонахождение и значение операндов для данной команды. Как правило, способ адресации операндов определяется только кодом операции команды. Для лучшего понимания этого понятия рассмотрим операцию сложения двух чисел в одноадресной ЭВМ. Мнемоника кодов операций будет указывать на способ адресации.

  1.  Прямой способ адресации.

СЛ

2

S := S + <2>

При этом способе адресации (только этот способ мы использовали до сих пор) число на месте операнда задаёт адрес ячейки основной памяти, в котором и содержится необходимый в команде операнд. Мы будем в угловых скобках обозначать содержимое ячейки основной памяти с данным адресом. Так, в приведённом выше примере <2> обозначает содержимое ячейки с адресом 2. В этой ячейки, конечно же, скорее всего не хранится число 2.

  1.  Непосредственный способ адресации.

СЛН

2

S := S + 2

При таком способе адресации поле адреса команды содержит, как говорят, непосредственный операнд. Разумеется, такие операнды могут быть только (неотрицательными) целыми числами, по длине не превышающими максимального значения в поле адреса.

  1.  Косвенный способ адресации.

СЛК

2

S := S + <<2>>

Здесь число на месте операнда задаёт адрес ячейки памяти, содержимое которой, в свою очередь, трактуется как целое число – адрес необходимого операнда в памяти ЭВМ.

В качестве примера выполним несколько команд сложения с различными способами адресации для одноадресной ЭВМ и рассмотрим значение регистра-сумматора S после выполнения этих команд (см. рис. 4.1). Справа на этом рисунке показаны первые ячейки памяти и хранимые в них целые числа.

. . .

Адрес

Значение

СЧ   0;  S :=  0

000

0

СЛ   2;  S :=  3

001

2

СЛН  2;  S :=  5

002

3

СЛК  2;  S := 13

003

8

. . .

. . .

. . .

Рис. 4.1. Значение регистра сумматора после выполнения команд

сложения с различными способами адресации.

Упражнение. Добавьте в язык учебной машины УМ-3 новую команду пересылки, которая использует косвенную адресацию по своему третьему адресу, и покажите, что в этом случае можно обрабатывать массивы без использования самомодифицирующийся программ.

4.5. Многообразие форматов данных

Современные ЭВМ позволяют совершать операции над целыми и вещественными числами разной длины. Это вызвано чисто практическими соображениями. Например, если нужное нам целое число помещается в один байт, но неэкономно использовать под его хранение два или более байта. Во избежание такого неоправданного расхода памяти введены соответствующие форматы данных, отражающие представление в памяти ЭВМ чисел разной длины. В зависимости от размера числа, оно может занимать 1, 2, 4 и более байт. Приведённая ниже таблица иллюстрирует многообразие форматов данных (для представления целых чисел).

Размер (байт)

Название формата

1

Короткое

2

Длинное

4

Сверхдлинное

Многообразие форматов данных требует усложнения архитектуры регистровой памяти. Теперь регистры должны уметь хранить и обрабатывать данные разной длины.

4.6. Форматы команд

Для операций с разными способами адресации и разными форматами данных необходимо введение различных форматов команд, которые, естественно, имеют разную длину. Обычно это такие форматы команд (в скобках указано их мнемоническое обозначение):

  1. регистр – регистр (RR);
  2. регистр – память, память – регистр (RX);
  3. регистр – непосредственный операнд в команде (RI);
  4. память – непосредственный операнд в команде (SI);
  5. память – память, т.е. оба операнда в основной памяти (SS).

Многообразие форматов команд и данных позволяет писать более компактные и эффективные программы на языке машины, однако, как уже упоминалось, сильно усложняют центральный процессор ЭВМ.

4.7. Базирование адресов

Для дальнейшего уменьшения объёма программы современные ЭВМ используют базирование адресов. Изучение этого понятия проведём на следующем примере. Пусть в программе на одноадресной машине необходимо реализовать арифметический оператор присваивания X:=(A+B)2. Ниже приведена эта часть программы с соответствующими комментариями (напомним, что S – это регистр сумматора одноадресной ЭВМ):

...

СЧ A; S:=A

СЛ B; S:=A+B

ЗП R; R:=A+B – запись в рабочую переменную

УМ R; S:=(A+B)2

ЗП X; X:=(A+B)2

...

Так как в нашем примере одноадресная ЭВМ имеет 224 (примерно 16 миллионов) ячеек памяти, то будем считать, что наш фрагмент программы располагается где-то примерно в средине памяти. Пусть, например, наши переменные располагаются соответственно в следующих ячейках памяти:

A – в ячейке с адресом 10 000 000

B – в ячейке с адресом 10 000 001

X – в ячейке с адресом 10 000 002

R – в ячейке с адресом 10 000 003

Тогда приведённый выше фрагмент программы будут выглядеть следующим образом:

...

СЧ 10 000 000; S:=A

СЛ 10 000 001; S:=A+B

ЗП 10 000 003; R:=A+B

УМ 10 000 003; S:=(A+B)2

ЗП 10 000 002; X:=(A+B)2

...

Из этого примера видно, что большинство адресов в нашей программе имеют вид B+, где число B назовём базовым адресом программы или просто базой (в нашем случае B=10 000 000), а  – смещением адреса относительно этой базы. Здесь налицо существенная избыточность информации. Очевидно, что в каждой команде можно указывать только короткое смещение , а базу хранить отдельно (обычно на каком-то специальном базовом регистре центрального процессора). Исходя из этих соображений, предусмотрим в машинном языке команду загрузки базы (длина этой команды 4 байта):

ЗГБ

A1

8 бит

24 бита

Тогда наш фрагмент программы будет иметь такой вид:

...

ЗГБ 10 000 000

...

СЧ  000; S:=A

СЛ  001; S:=A+B

ЗП  003; R:=A+B

УМ  003; S:=(A+B)2

ЗП  002; X:=(A+B)2

...

Теперь, однако, при выполнении каждого обращения за операндом в основную память, центральный процессор должен вычислять значение адреса этого операнда адреса по формуле A=B+. Это вычисление производится в устройстве управления и, естественно, усложняет его. Например, адрес переменной  A=10000001=B+=107+1.

Осталось выбрать длину смещения . Вернёмся к рассмотрению дробноадресной ЭВМ, для которой реализовано базирование адресов. Например, пусть под запись смещения выделим в команде поле длиной в 12 бит. Будем, как и раньше, обозначать операнд в памяти A1 или A2, но помним, что теперь это только смешение относительно базы. Тогда все команды, которые обращаются за операндом в основную память, будут в нашей дробноадресной ЭВМ более короткими:

КОП

R1

A2

8 бит

4 бита

12 бит

Схема выполнения такой команды для формата регистр-память:

<R1> := <R1>  <B+A2>

или для формата память-регистр:

<B+A2> := <B+A2>  <R1>

Область, в которой находятся вычисляемые относительно базы ячейки основной памяти, обычно называется сегментом памяти – это сплошной участок памяти, начало которого задаётся в некотором регистре, называемом базовым, или сегментным. Будем далее для определённости называть такие регистры сегментными, а сам приём – сегментированием памяти.

Сегментирование позволяет уменьшить объём памяти для хранения программ, но оно имеет и один существенный недостаток: теперь каждая команда может обращаться не к любой ячейки оперативной памяти, а только к тем из них, до которых "дотягивается" смещение. В нашем примере каждая команда может обращаться к диапазону адресов от значения сегментного регистра B до B+212-1. Для доступа к другим ячейкам памяти необходимо записать в сегментный регистр новое значение (как говорят, перезагрузить сегментный регистр). Несмотря на указанный недостаток, практически все современные ЭВМ производят сегментирование памяти. Заметим также, что этот недостаток в большинстве архитектур современных ЭВМ исправляется путём реализации переменной длины смещения (например, разрешается смешение в 1, 2 или 4 байта), что, однако ещё более увеличивает набор команд и усложняет центральный процессор.

Итак, для осуществления доступа к памяти ЭВМ необходимо, чтобы ячейка, к которой осуществляется доступ, находилась в сегменте, на начало которого указывает сегментный регистр. Современные ЭВМ обеспечивают одновременную работу с несколькими сегментами памяти и, соответственно, имеют несколько сегментных регистров.

В некоторых архитектурах регистры центрального процессора являются универсальными, т.е. каждый из них может быть использован как сегментный или для выполнения любых операций над данными. Сложность центрального процессора при этом существенно повышается, так что во многих архитектурах используются специализированные регистры, т.е. определённые регистры являются сегментными, на других могут производиться операции и т.д.

5. Понятие семейства ЭВМ

Компьютеры могут применяться в самых различных областях человеческой деятельности (эти области часто называются предметными областями). В качестве примеров можно привести область научно-технических расчётов (там много операций с вещественными числами), область экономи–ческих расчётов (там, в основном, выполняются операции над целыми числами и обработка символьной информации), мультимедийная область (обработка звука, изображения и т.д.), область управления различными сложными устройствами (ракетами, доменными печами и др.)

Компьютеры, архитектура которых ориентирована на какую-то одну предметную область, называются специализированными, в отличие от универсальных ЭВМ, которые более или менее успешно можно использовать во всех предметных областях. Мы в нашем курсе будем изучать архитектуру только универсальных ЭВМ.

Говорят, что компьютеры образуют семейство, если выполняются следующие требования:

  1. Одновременно выпускаются и используются несколько моделей семейства с различными производительностью и ценой (моделями называются компьютеры-члены семейства).
  2. Модели обладают программной совместимостью:
  3. снизу-вверх – старшие модели поддерживают все команды младших (любая программа, написанная для младшей модели, безошибочно выполняется и на старшей);
  4. сверху-вниз – на младших моделях выполняются программы, написанные для старших, если выполнены условия:
  5. наличие у младшей модели достаточного количества ресурсов (например, памяти);
  6. программа состоит только из поддерживаемых младшей моделью команд.
  7. Присутствует унификация устройств, то есть их аппаратная совместимость между моделями (например, печатающее устройство для младшей модели должно работать и на старшей).
  8. Модели организованы по принципу модульности, что позволяет в определённых пределах расширять возможности ЭВМ, увеличивая, например, объём памяти или повышая быстродействие центрального процессора.
  9. Стандартизировано системное программное обеспечение (например, компилятор с языка Турбо-Паскаль может работать на всех моделях семейства).

Большинство выпускаемых в наше время ЭВМ содержатся в каких-либо семействах. В нашем курсе для упрощения изложения будут рассматриваться в основном младшие модели семейства ЭВМ компании Intel. Соответственно все примеры программ должны выполняться для всех моделей этого семейства, поэтому мы ограничимся лишь архитектурой и системой команд самой младшей модели этого семейства [9].

6. Архитектура младшей модели семейства Intel

6.1. Память

Архитектура рассматриваемого компьютера является дробно-адресной, поэтому адресуемая память состоит из регистровой и основной памяти. В младшей модели семейства основная память имеет объём 220 ячеек по 8 бит каждая. Регистровая память будет рассмотрена немного позже.

6.2. Форматы данных

  1.  Целые числа.

Целые числа могут занимать 8 бит (короткое целое), 16 бит (длинное целое) и 32 бита (сверхдлинное целое). Длинное целое принято называть машинным словом (не путать с машинным словом в Учебной Машине!).

Как видим, в этой архитектуре есть многообразие форматов целых чисел, что позволяет писать более компактные программы. Для других архитектур это может оказаться несущественно, например, в некоторых современных супер-ЭВМ идёт работа с малым количеством целых чисел, поэтому вводится только один формат – сверхдлинное целое.

  1.  Символьные данные.

В качестве символов используются короткие целые числа, которые трактуются как неотрицательные (беззнаковые) числа, задающие номер символа в некотором алфавите.6 Заметим, что как таковой символьный тип данных (в смысле языка Паскаль) в Ассемблере отсутствует, а запись 'A' обозначает не символьный тип данных, а эквивалентна выражению языка Паскаль Ord('A').

  1.  Массивы (строки).

Массивы могут состоять из коротких или длинных целых чисел. Массив коротких целых чисел может рассматриваться как символьная строка. В машинном языке присутствуют команды для обработки элементов таких массивов, если такую команду поставить в цикл, то образуются удобное средство для работы с массивами.

  1.  Вещественные числа.

Чаще всего используются три формата вещественных чисел: короткие, длинные и сверхдлинные вещественные числа. Стоит отметить следующий важный факт. Если целые числа в различных ЭВМ по чисто историческим причинам иногда имеют разное внутреннее представление, то на момент массового выпуска ЭВМ с командами для работы с вещественными числами уже существовал определённый стандарт на внутреннее представление этих чисел – IEEE (Institute of Electrical and Electronics Engineers), и почти все современные машины этого стандарта придерживаются.

6.3. Вещественные числа

Рассмотрим представление короткого вещественного числа. Такое число имеет длину 32 бита и содержит три поля:

E

M

1 бит

8 бит

23 бита

Первое поле из одного бита определяет знак числа (знак "плюс" кодируется нулём, "минус" – единицей). Остальная биты, отведённые под хранение вещественного числа, разбивается на два поля: машинный порядок E и мантиссу M, которая по модулю меньше единицы. Каждое представимое вещественное число A (кроме числа 0.0) может быть записано в виде: A=1.M*2E–127. Такие вещественные числа называются нормализованными: первый сомножитель удовлетворяет неравенству 1.0  1.M < 2.0. Нормализация необходимо для однозначного представления вещественного числа в виде двух сомножителей. Нулевое число представляется нулями во всех позициях, за исключением, быть может, первой позиции знака числа.

В качестве примера переведём десятичное число  –13.25 во внутреннее машинное представление. Сначала переведём его в двоичную систему счисления:

–13.2510 = -1101.012

Затем нормализуем это число:

-1101.012 = -1.101012*23

Следовательно, мантисса будет иметь вид  101010000000000000000002  , осталось вычислить машинный порядок: 3 = E-127; E = 130 = 128 + 2 = 1000000102 . Теперь, учитывая знак, получаем вид внутреннего машинного представления числа –13.2510:

1100 0001 0101 0100 0000 0000 0000 00002 = C150000016

Шестнадцатеричные числа в языке Ассемблера принято записывать с буквой h на конце:

C150000016 = C1500000h

Таков формат короткого вещественного числа. Согласно его виду, E изменяется от 0 до 255, следовательно, диапазон порядков коротких вещественных чисел равен 2–127..2128  10–38..1038. Как и для целых чисел, машинное представление которых мы рассмотрим чуть позже, число представимых вещественных чисел конечно. Заметим также, что, в отличие от целых чисел, в представлении вещественных чисел используется симметричная числовая ось, то есть для любого положительного числа найдётся соответствующее ему отрицательное (и наоборот).

Некоторые комбинации нулей и единиц в памяти, отведённой под вещественное число, собственно числа не задают, а используются для служебных целей. В частности, E=255 обозначает специальное значение "не число" (NANnot a number). При попытке производить арифметические операции над такими "числами" возникает аварийная ситуация. Например, значение "не число" может быть присвоено вещественной переменной при её порождении, если эта переменная не имеет начального значения (как говорят, не инициализирована). Такой приём позволяет избежать тяжёлых семантических ошибок, которые могут возникать при работе с неинициализированными переменными, которые при порождении, как правило, имеют случайные значения.

Отметим ещё две специальные комбинации нулей и единиц, которые будем обозначать . Эти значения присваиваются результату операции с вещественными числами, если этот результат, хотя и не равен нулю, но не представим в виде вещественного числа, то есть  меньше самого маленького представимого положительного вещественного числа и больше самого большого отрицательного.

Аналогично существуют комбинации битов, задающие специальные значения . Эти значения выдаются в качестве результата, если этот результат такой большой по абсолютной величине, что не представим среди множества машинных вещественных чисел.

Центральный процессор "разумно" (по крайней мере с точки зрения математика) производит арифметические операции над такими "числами". Например, пусть A любое представимое вещественное число, тогда

A   = A;  * A = ; A *  = ; и т.д. 7

Для любознательных студентов заметим, что существует нетрадиционное построение математического анализа, в котором, как и в нашей ЭВМ, бесконечно малые величины  определяются не в виде пределов, как в обычном анализе, а существуют в виде "настоящих" вещественных чисел. Изложение нетрадиционного анализа можно посмотреть в книгах [13,14].

При изучении архитектуры ЭВМ вещественные числа не будут представлять для нас большого интереса и поэтому (а также из-за недостатка времени) операции над вещественными числами мы изучать не будем.

6.4. Целые числа

Мы уже знаем, что хранимые в памяти машинные слова (наборы битов) могут трактоваться по-разному.  При вызове в устройство управления этот набор битов трактуется как команда, а при вызове в арифметико-логическое устройство – как число. В дополнении к этому в рассматриваемой нами архитектуре каждое хранимое в памяти целое число может трактоваться программистом как знаковое или беззнаковое (неотрицательное). По внешнему виду невозможно определить, какое число храниться в определённом месте памяти, только сам программист может знать, как он рассматривает это число. Таким образом, определены две машинные системы счисления для представления знаковых и беззнаковых чисел соответственно.

Беззнаковые (неотрицательные) числа представляются в уже известной Вам двоичной системе счисления, такое представление называется прямым кодом неотрицательного числа. Например, десятичное число 13, хранимое в одном байте, будет записано как прямой код 00001101.

Если инвертировать прямой код (т.е. заменить все "1" на "0", а все "0" на "1"), то получим так называемый обратный код числа. Например, обратный код числа 13 равен 11110010.

Для представления отрицательных знаковых чисел используется так называемый дополнительный код, который можно получить из дополнительного кода прибавлением единицы. Например, получим дополнительный код числа –13:


Прямой код                  =  00001101

Обратный код              =  11110010

+         1

Дополнительный код  =  11110011

Существует и другой алгоритм преобразования отрицательного числа X в дополнительный код. Для этого необходимо записать в прямом коде значение 2N -|X|, где значение N равно максимальному числу бит в представлении числа (в нашем примере N=8).

Итак, в знаковой системе счисления отрицательные числа представляются в дополнительном коде, а неотрицательные – в прямом коде. Заметим, что при знаковой трактовке целых чисел крайний правый бит определяет знак числа ("1" для отрицательных чисел). Этот бит называется знаковым битом целого числа. Для знаковых чисел числовая ось несимметрична: количество отрицательных чисел на единицу больше, чем количество положительных чисел (докажите это !).

Процесс перехода от прямого кода к дополнительному коду и обратно с технической точки зрения очень прост и может быть легко реализован в центральном процессоре.

Очень важно понять, что все арифметические операции над знаковыми и беззнаковыми целыми числами производятся абсолютно по одинаковым алгоритмам, что естественно, потому что центральный процессор "не знает", какие это числа "на самом деле". В то же время, с точки зрения программиста, результаты таких операций могут быть разными для знаковых и беззнаковых чисел. Рассмотрим примеры сложения двух чисел длиной в байт. В первом столбике записано внутреннее двоичное представление чисел, а во втором и третьем – беззнаковое и знаковое десятичное представления этих же чисел.

  1.  Пример 1.

Б/з.

Знак.

11111100

252

–4

00000101

5

5

100000001

1

1

Из этого примера видно, что для знаковой трактовки чисел операция сложения выполнена правильно, а при рассмотрении чисел как беззнаковые результат будет неправильным, так как мы получим девятизначное двоичное число, не "умещающееся" в один байт. Так как центральный процессор "не знает", как программист будет трактовать складываемые числа, то он "на всякий случай" сигнализирует о том, что при сложении беззнаковых чисел произошла ошибка.

Для обозначения таких (и некоторых других) ситуаций в архитектуре компьютера введено понятие флагов. Каждый флаг занимает один бит в специальном регистре флагов (FLAGS). В данном случае флаг CF (carry flag) примет значение, равное единице (иногда говорят – флаг поднят). Рассматривая результат в знаковых числах, мы получили правильный ответ, поэтому соответствующий флаг OF (overflow flag) будет положен равным нулю (опущен).

  1.  Пример 2.

Б/з.

Знак.

01111001

121

121

00001011

11

 11

10000100

132

-124

В данном примере ошибка будет, наоборот, в случае со знаковой трактовкой складываемых чисел, поэтому флаги CF и OF принимают соответственно значения 0 и 1.

  1.  Пример 3.

Б/з.

Знак.

11110110

246

–10

10001001

137

–119

101111111

383

+127

В данном случае результат будет ошибочен как при беззнаковой, так и при знаковой трактовке складываемых чисел. Содержимое флагов: CF = OF = 1. Легко придумать пример, когда результат сложения правильный как для знаковых, так и для беззнаковых чисел (сделайте это самостоятельно!).

Кроме формирования флагов CF и OF команда сложения целых чисел меняет и значения некоторых других флагов в регистре флагов FLAGS. Для нас будет важен флаг SF, в который заносится знаковый (крайний правый) бит результата, и флаг ZF, который устанавливается в 1, если результат равен нулю, в противном случае этот флаг устанавливается в 0.

Представление отрицательных чисел в дополнительном коде не очень удобно для программистов, однако, позволяет существенно упростить арифметико-логическое устройство. Заметим, например, что вычитание можно выполнять как сложение с дополнительным кодом числа.

Основная причина использования двух систем счисления для представления целых чисел заключается в том, что при использовании обеих систем счисления диапазон представимых целых чисел увеличивается в полтора раза. Это было весьма существенно для первых ЭВМ с их небольшим объёмом памяти.

6.5. Сегментация памяти

Память нашей ЭВМ имеет уже знакомую нам сегментную организацию. В любой момент времени для младшей модели определены четыре сегмента (хотя для старших моделей число сегментов может быть и больше). Это означает, что есть четыре сегментных регистра, которые указывают на определённые области памяти. Каждый сегментный регистр имеет длину 16 разрядов, поэтому для того, чтобы сегмент мог располагаться на любом месте оперативной памяти, адрес начала сегмента получается после умножения значения сегментного регистра на число 16. Правда, при таком способе задания начала сегмента, он может начинаться не с любого места оперативной памяти, а только с адресов, кратных 16.

Итак, извлекать из памяти числа или команды можно только относительно одного из них этих сегментных регистров. Таким образом, физический адрес числа или команды вычисляется по формуле

Aфиз := (SR*16 + A)mod 220,

DS

Рис. 6.1. Пример расположения сегментов в памяти.

CS

SS

ES

где SR – значение сегментного регистра, а Aсмещение. Физический адрес берётся по модулю 220, чтобы он не вышел за максимальный адрес памяти.

В качестве мнемонических обозначений сегментных регистров выбраны следующие двухбуквенные служебные8 имена: кодовый сегментный регистр (CS), сегментный регистр данных (DS), сегментный регистр стека (SS) и дополнительный сегментный регистр (ES). Каждый из них может адресовать сегмент памяти длиной от 1 до 216 байт (напомним, что вся память состоит из 220 ячеек). Так как физический адрес в приведённой выше формуле берётся по модулю 220, то очевидно, что память "замкнута в кольцо". Таким образом, в одном сегменте могут находиться ячейки с самыми большими и самыми маленькими адресами основной памяти.На рис. 6.1 показан пример расположения сегментов в памяти.

Стоит отметить, что сегментные регистры являются специализированными, предназначенными только для хранения адресов сегментов, поэтому арифметические операции над их содержимым не предусмотрены.

Заметим, что даже если все сегменты не перекрываются и имеют максимальный размер, то и в этом случае центральный процессор в каждый момент времени имеет доступ только к одной четвёртой от общего объёма оперативной памяти.

6.6. Мнемонические обозначения регистров

В силу того, что в ЭВМ все регистры имеют безликие двоичные обозначения, программисты предпочитают использовать мнемонические названия регистров. Регистры общего назначения, каждый из которых может складывать, вычитать и просто хранить данные, а некоторые – умножать и делить, обозначают следующими именами: AX, BX, CX, DX. Для обеспечения многообразия форматов данных каждый из них разбит на две части по 8 бит каждая (биты нумеруются немного непривычно справа налево, начиная с нуля):

15

7

0

AX

AH

AL

BX

BH

BL

CX

CH

CL

DX

DH

DL

16 бит

Каждый из регистров AH, AL, BH, BL, CH, CL, DH и DL может быть использован как самостоятельный регистр, на которых возможно выполнять операции сложения и вычитания.

Существуют также четыре регистра SI, DI, SP и BP, которые также могут использоваться для проведения сложения и вычитания, но уже не делятся на половинки:

15                                  0

SI

DI

SP

BP

16 бит

В основном эти четыре регистра используются как индексные, т.е. на них храниться положение конкретного элемента в некотором массиве.

Кроме перечисленных выше регистров программист имеет дело с регистром IP (instruction pointer), который называется счётчиком адреса и содержит адрес следующей исполняемой команды (точнее, содержит смещение относительно начала кодового сегмента, адрес начала этого сегмента, как мы уже знаем, равен значению сегментного регистра CS, умноженному на 16).

16 бит

IP

И, наконец, как уже упоминалось, архитектурой изучаемой ЭВМ предусмотрен регистр флагов FLAGS. Он содержит шестнадцать одноразрядных флагов, например, ранее упоминавшиеся флаги CF и OF. Конкретные номера битов, содержащих тот или иной флаг, для понимания архитектуры несущественны, и приводиться здесь не будут.

16 бит

FLAGS

CF

OF

Все биты в регистрах пронумерованы справа налево: в шестнадцатибитных – от 0 до 15, в восьмибитных – от 0 до 7.

Все упомянутые имена регистров являются служебными в языке Ассемблера. Как и в языке Паскаль, в языке Ассемблера принято соглашение по синтаксису имён: регистр символов не различается, таким образом, AX,Ax,aX и ax обозначают один и тот же регистр.

Рассмотрим теперь способ хранения чисел в памяти ЭВМ. Запишем, например, шестнадцатеричное число 1234h в какой-нибудь 16-тиразрядный регистр (каждая шестнадцатиричная цифра занимает по 4 бита):

1

2

3

4

Теперь поместим это число в память в ячейки с номерами, например, 100 и 101. Так вот: в ячейку с номером 100 запишется число 34h, а в ячейку 101 – число 12h. Говорят, что число представлено в основной памяти (в отличие от регистров) в перевёрнутом виде. Это связано с тем, что в младших моделях ЭВМ при каждом обращении к памяти читался один байт. Чтобы считать слово, было необходимо дважды обратиться к памяти, поэтому было удобно (например, для проведения операция сложения "в столбик") получать сначала младшие цифры числа, а затем – старшие. В современной архитектуре за одно обращение из памяти получают сразу 4, 8 или 16 байт, но из-за совместимости моделей семейства пришлось оставить перевёрнутое представление чисел. Заметим, что в отличие от чисел, команды хранятся в памяти в обычном (не перевернутом) виде.

6.7. Структура команд 

Теперь рассмотрим структуру машинных команд самых распространённых форматов регистр-регистр и регистр-память.

  1.  Формат регистр–регистр.

6 бит

1 бит

1 бит

1 бит

1 бит

3 бита

3 бита

КОП

d

w

1

1

R1

R2

Команды этого формата занимают 2 байта. Первая часть команды – код операции – занимает в команде 6 бит, за ним следуют однобитные поля d и w, где d – бит направления, а w – бит размера аргумента, последующие два бита для этого формата равны 1, а последние две части по 3 бита каждая указывают на регистры – операнды.

Стоит подробнее рассмотреть назначение битов d и w. Бит d задаёт направление выполнения команды, а именно:

<R1> := <R1>  <R2> при d = 0

<R2> := <R2>  <R1> при d = 1.

Бит w задаёт размер регистров-операндов, имена которых можно определить по следующей схеме:

R1,2

w = 1

w = 0

000

AX

AL

001

CX

CL

010

DX

DL

011

BX

BL

100

SP

AH

101

BP

CH

110

SI

DH

111

DI

BH

В младших моделях ЭВМ нашего семейства в таком формате возможна работа лишь с упомянутыми в таблице регистрами. В последующих же моделях возможности этого формата были расширены, но за счёт увеличения длины команды. Мы будем пользоваться и другими видами формата регистр-регистр, например, командой  mov ds,ax, но выписывать их внутреннее представление не будем.

Как видно из таблицы, архитектурой не предусмотрены операции формата r8–r16, т.е. операции над регистрами разной длины запрещены, например, команды типа add AL,BX  являются некорректными. Поэтому появляется необходимость преобразования типов из короткого целого в длинное, и из длинного в сверхдлинное. Такое преобразование зависит от трактовки числа – знаковое или беззнаковое. В первом случае число всегда расширяется слева нулями, а во втором – размножается знаковый бит (для знаковых чисел незначащими двоичными цифрами будут 0 для неотрицательных и 1 для отрицательных значений). Для этого в языке машины предусмотрены безадресные команды, имеющие а Ассемблере такую мнемонику:

cbw   (convert byte to word)

и

cwd   (convert word to double),

которые производят знаковое расширение соответственно регистра AL до AX и AX до пары регистров <DX,AX>, которые в этом случае рассматриваются как один длинный 32 битный регистр.

Преобразование целого значения из более длинного формата в более короткий (усечение) производится путём отбрасывания соответствующего числа левых битов целого числа. Усечённое число получится правильным, если будут отброшены только незначащие биты. Для беззнаковых чисел это всегда нулевые биты, а для знаковых – биты, совпадающие со знаковым битом усечённого числа.

  1.  Формат регистр–память (и память-регистр).

КОП

R1

A2

Операнд A2 может иметь один из приведённых ниже трёх видов:

  1.  A2 = A,
  2.  A2 = A[M1],
  3.  A2 = A[M1][M2].

Здесь A – задаваемое в команде смещение длиной 1 или 2 байта (заметим, что нулевой смещение может и не занимать места в команде), M1 и M2 – так называемые регистры-модификаторы. Как мы сейчас увидим, значение адреса второго операнда A2 будет вычисляться по определённым правилам, поэтому этот адрес часто называют исполнительным адресом.

Стоит отметить один факт. До сих пор адресом мы называли физический номер ячейки в памяти машины. В языке Ассемблера адресом принято называть смещение ячейки относительно начала того сегмента, в котором она находится. Для обозначения полного адреса будем употреблять термин физический адрес.

Рассмотрим подробнее каждый их трёх возможных видов операнда A2. При A2 = A физический адрес вычисляется центральным процессором по формуле:

Aфиз := (B*16 + A)mod 220,

где B, как обычно, обозначает значение одного из сегментных регистров. Запись A2 = A[M1] означает использование регистра-модификатора, которым может быть любой из следующих регистров: BP, BX, SI, DI. В этом случае физический адрес вычисляется по формуле

Aфиз := (B*16 + (A + <M1>)mod 216)mod 220,

где вместо <M1> подставляется содержимое регистра-модификатора (одного из четырёх указанных). Запись A2 = A[M1][M2] 9 обозначает вычисление физического адреса по формуле:

Aфиз := (B*16 + (A + <M1> + <M2>)mod 216)mod 220,

где используются сразу два регистра-модификатора. На месте M1 можно указывать любой из регистров BX или BP, а на месте M2 – любой из регистров SI или DI. Использование, например, регистров BX и BP (как и SI и DI) одновременно в качестве модификаторов запрещено. В старших моделях почти все ограничения на использование регистров модификаторов также было снято (за счёт увеличения длины команды).

В качестве примера вычислим физический адрес второго операнда команды сложения формата RX, на языке Ассемблера эту команду можно записать в виде add ax,6[bx][di]. Пусть регистры имеют следующие значения (в шестнадцатеричном виде перед числом записывается ноль, если оно начинается с цифр AF):

bx = 0FA00h, di = 0880h, ds = 2000h

Тогда

Aфиз := (2000h*16 + (6 + 0FA00h + 0880h)mod 216)mod 220 =

(20000h + 0286)mod 220 = 20286h

Если, например, в байте с адресом 20286h хранится число 56h, а в байте с адресом 20287h – число 32h, то наша команда реализует операцию сложения ax:=ax+3256h.

Рассмотрим теперь внутреннее представление формата команды регистр–память. Длина этой команды 2, 3 или 4 байт:

8 бит

2 бита

3 бита

3 бита

8 бит

8 бит

КОП

d

W

Mod

R1

Mem

a8

a8->a16

где mod – трёх битовое поле модификатора, mem – двух битовое поле способа адресации, a8 и a16 – это обозначения для одно- или двухбайтного смещение. Биты d и w знакомы нам из предыдущего формата регистр-регистр. Все возможные комбинации mod и mem приведены в таблице 6.1.

Таблица 6.1. Значения полей mod и mem в формате регистр-память.


Mem \ mod

00

01

10

11

0 доп. Байт.

1 доп. байт

2 доп. байта

Формат RR

000

[BX+SI]

[BX+SI]+a8

[BX+SI]+a16

001

[BX+DI]

[BX+DI]+a8

[BX+DI]+a16

010

[BP+SI]

[BP+SI]+a8

[BP+SI]+a16

011

[BP+DI]

[BP+DI]+a8

[BP+DI]+a16

100

[SI]

[SI]+a8

[SI]+a16

101

[DI]

[DI]+a8

[DI]+a16

110

a16

[BP]+a8

[BP]+a16

111

[BX]

[BX]+a8

[BX]+a16

Данная таблица показывает, как зависит способ адресации от полей mem и mod. Как видим, она полностью объясняет ограничения на выбор регистров-модификаторов, которые мы сформулировали ранее. Мы не будем рассматривать машинный вид остальных форматов команд, будем изучать их только на языке Ассемблера. Напомним, что это такие форматы команд:

  1.  RR – (регистр – регистр);
  2.  RX – (регистр – память, память – регистр);
  3.  RI –  (регистр – непосредственный операнд в команде);
  4.  SI –  (память – непосредственный операнд в команде);
  5.  SS – (память – память, т.е. оба операнда в основной памяти).

6.8. Команды языка машины

Далее мы будем изучать синтаксис машинных команд и семантику их выполнения центральным процессором. Для удобства команды будем записывать так, как это принято в языке Ассемблер (можно считать, что мы уже начали понемногу изучать этот язык).

6.8.1. Команды пересылки

Команды пересылки – одни из самых распространённых команд в языке машины. Все они пересылают один или два байта из одного места памяти в другое. Для более компактного описания синтаксиса команд введём следующие условные обозначения:

r8 – любой короткий регистр AH,AL,BH,BL,CH,CL,DH,DL;

r16 – любой из длинных регистров AX,BX,CX,DX,SI,DI,SP,BP;

m8, m16 – операнды в основной памяти длиной 1 и 2 байта соответственно;

i8, i16 – непосредственные операнды в самой команде длиной 1 и 2 байта соответственно;

SR – один из сегментных регистров SS, DS, ES;

m32 – операнд в основной памяти длиной 4 байта.

Общий вид команды пересылки в нашей двухадресной ЭВМ такой (после точки с запятой будем записывать, как это принято в Ассемблере,  комментарий к команде):

mov op1, op2; op1 := op2

Существуют следующие допустимые форматы операндов команды пересылки:

op1

оp2

R8

r8, m8, i8

R16

r16, m16, i16, SR, CS

M8

r8, i8

M16

r16, i16, SR, CS

SR

r16, m16

Команды пересылки не меняет флаги в регистре FLAGS.

6.8.2. Арифметические команды

Изучение команд для выполнения арифметических операций начнём с команд сложения и вычитания целых чисел. Определим вид и допустимые операнды у команд сложения и вычитания:

КОП op1, op2, где КОП = add, sub, adc, sbb.

add – сложение,

sub – вычитание:

op1 := op1  op2

adc – сложение с учётом флага переноса,

sbb – вычитание с учётом флага переноса:

op1 := op1  op2  CF

Таблица допустимых операндов для этих команд:

op1

op2

R8

r8, m8, i8

M8

r8, i8

R16

r16, m16, i16

M16

r16, i16

В результате выполнения операций изменяются флаги CF, OF, ZF, SF, которые отмечают соответственно за перенос, переполнение, нулевой результат и знак результата (флагу SF всегда присваивается знаковый бит результата). Эти команды меняют и некоторые другие флаги (см. [5,9]), но это нас интересовать не будет.

Далее рассмотрим команды умножения и деления целых чисел. Формат этих команд накладывает сильные ограничения на месторасположение операндов. Первый операнд всех команд этого класса явно в команде не указывается и находится в фиксированном регистре, принимаемом по умолчанию. В младшей модели семейства есть следующие команды умножения и деления, в них явно задаётся только второй операнд (второй сомножитель или делитель):

mul  op2  – беззнаковое умножение,

imul op2 – знаковое умножение,

div  op2  – беззнаковое целочисленное деление,

idiv op2  – знаковое целочисленное деление.

Как видим, в отличие от команд сложения и вычитания, умножение и деление знаковых и беззнаковых целых чисел выполняются разными командами (по разным алгоритмам).

В случае с короткими целыми операндами при умножении вычисление производится по формуле:

AX := AL * op2

При делении (операции div и mod понимаются в смысле языка Паскаль):

AL := AX div op2

AH := AX mod op2

В случае с длинными операндами при умножении вычисление производится по формуле:

(DX,AX) := AX * op2

При делении:

AX := (DX,AX) div op2

DX := (DX,AX) mod op2

В этих командах операнд op2 может иметь формат r8,r16,m8 или m16.

Как видим, команды умножения всегда дают точный результат, так как под хранение произведения выделяется в два раза больше места, чем под каждый из сомножителей. Команды деления могут вызывать аварийную ситуацию, если частное не помещается в отведённое для него место, т.е. в регистры AL и AX соответственно. Заметим, что остаток от деления всегда помещается в отводимое для него место на регистрах AH или DX соответственно (докажите это!).

После выполнения команд умножения устанавливаются некоторые флаги, из которых для программиста представляют интерес только флаги переполнения и переноса (CF и OF). Эти флаги устанавливаются по следующему правилу. CF=OF=1, если в произведении столько значащих (двоичных) цифр, что они не помещаются в младшей половине произведения. На практике это означает, что при CF=OF=1 произведение коротких целых чисел не помещается в регистр AL и частично "переползает" в регистр AH, а произведение длинных целых чисел – не помещается в регистре AX и "на самом деле" занимает оба регистра (DX,AX). И наоборот, если CF=OF=0, то в старшей половине произведения (соответственно в регистрах AH и DX) находятся только незначащие двоичные цифры произведения. Другими словами, при CF=OF=0 в качестве результата произведения можно взять его младшую половину.

Команды деления после своего выполнения как-то устанавливают некоторые флаги, но никакой полезной информации из значения этих флагов программист извлечь не может. Можно сказать, что деление "портит" некоторые флаги.

Для написания программ на Ассемблере нам будут полезны также следующие унарные арифметические операции.

neg op1 – взятие обратной величины знакового числа, op1 := -op1;

inc op1 – увеличение (инкремент) аргумента на единицу, op1 := op1+1;

dec op1 – уменьшение (декремент) аргумента на единицу, op1 := op1-1;

Применение этих команд вместо соответствующих по действию команд вычитания и сложения приводит к более компактным программам. Необходимо также отметить, что команды inc и dec, в отличие от эквивалентных им команд add и sub никогда не меняют флаг CF. 10


7. Язык Ассемблера

7.1. Понятие о языке Ассемблера

Наличие большого количества форматов данных и команд в современных ЭВМ приводит к существенным трудностям при программировании на машинном языке. Для упрощения процесса написания программ для ЭВМ был разработан язык-посредник, названный Ассемблером, который, с одной стороны, должен быть машинно-ориентированным (допускать написание любых машинных программ), а с другой стороны – позволять автоматизировать процесс составления программ в машинном коде. Для перевода с языка Ассемблера на язык машины используется специальная программа-переводчик, также называемая Ассемблером (от английского слова “assembler” – “сборщик”). В зависимости от контекста, в разных случаях под словом "Ассемблер" будет пониматься или язык программирования, или программа-переводчик с этого языка на язык машины.

В нашем курсе мы не будем рассматривать все особенности языка Ассемблера, для этого надо обязательно изучить хотя бы один из учебников [5–8]. Заметим также, что для целей изучения архитектуры ЭВМ нам понадобится только некоторое достаточно небольшое подмножество  языка Ассемблера, только оно и будет использоваться на наших лекциях.

Рассмотрим, что, например, должна делать программа Ассемблер при переводе с языка Ассемблера на язык машины. 11

  1. заменять мнемонические обозначения кодов операций на соответствующие машинные коды операций (например, для нашей учебной машины, ВЧЦ  002);
  2. автоматически распределять память под хранение переменных, что позволяет программисту не заботиться о конкретном адресе переменной, если ему всё равно, где она будет расположена;
  3. преобразовывать числа, написанные в программе в различных системах счисления во внутреннее машинное представление (в машинную систему счисления).

В конкретном Ассемблере обычно существуют много дополнительных возможностей для более удобного написания программ, однако при этом должны выполняться следующие требования (они вытекают из принципов Фон Неймана):

  1. возможность помещать в любое определённое программистом место памяти любую команду или любые данные;
  2. возможность выполнять любые данные как команды и работать с командами, как с данными (например, складывать команды как числа).

7.2. Применение языка Ассемблера

Общеизвестно, что программировать на Ассемблере трудно. Как Вы знаете, сейчас существует много различных языков высокого уровня, которые позволяют затрачивать много меньше усилий при написании программ. Естественно, возникает вопрос, когда у программиста может появиться необходимость использовать Ассемблер при написании программ. В настоящее время можно указать две области, в которых использование языка Ассемблера оправдано, а зачастую и необходимо.

Во-первых, это так называемые машинно-зависимые системные программы, обычно они управляют различными устройствами компьютера (такие программы называются драйверами). В этих системных программах используются специальные машинные команды, которые нет необходимости применять в обычных (или, как говорят прикладных) программах. Эти команды невозможно или весьма затруднительно задать в языке высокого уровня.

Вторая область применения Ассемблера связана с оптимизацией выполнения программ. Очень часто программы-переводчики (компиляторы) с языков высокого уровня дают весьма неэффективную программу на машинном языке. Обычно это касается программ вычислительного характера, в которых большую часть времени выполняется очень небольшой (порядка 3-5%) участок программы (главный цикл). Для решения этой проблемы могут использоваться так называемые многоязыковые системы программирования, которые позволяют записывать части программы на различных языках. Обычно основная часть программы записывается на языке программирования высокого уровня (Фортране, Паскале, С и т.д.), а критические по времени выполнения участки программы – на Ассемблере. Скорость работы всей программы при этом может значительно увеличиться. Часто это единственный способ заставить программу дать результат за приемлемое время.

При дальнейшем изучения архитектуры компьютера нам придётся писать как фрагменты, так и полные программы на машинном языке. Для написания этих программ мы будем использовать одну из версий языка Ассемблера,  так называемый Макроассемблер версии 4.0 (MASM-4.0). Достаточно полное описание этого языка приведено в учебнике [5], изучения этого учебника (или аналогичных учебников по языку Ассемблера [6-8]) является обязательным для хорошего понимания материала по нашему курсу. На лекциях мы подробно будем изучать только те особенности и тонкие свойства языка Ассемблера, которые недостаточно полно описаны в указанных учебниках.

Изучение языка Ассемблера начнём с рассмотрения общей структуры программы на этом языке. Программа на языке Ассемблера состоит из одного или более независимых модулей. В каком смысле модуль является независимой единицей языка Ассемблер, мы выясним несколько позже, когда будем изучать тему "Модульное программирование". Наши первые программы будут содержать всего один модуль, но позже будут рассмотрены и многомодульные программы.

Каждый модуль обычно содержит описание одного или нескольких сегментов памяти. Напомним, что в нашей архитектуре для работы программы каждая команда и каждое данное должны располагаться в каких-либо сегментах памяти. Как мы уже знаем, в младшей модели нашего семейства ЭВМ в каждый момент времени определены четыре активных (или текущих) сегмента памяти, на которые указывают соответствующие сегментные регистры CS, DS, SS и ES.

Таким образом, перед непосредственной работой с содержимым любого сегмента требуется установить на его начало определённый сегментный регистр, до этого нельзя ни писать в этот сегмент, ни читать из него. С другими сегментами, кроме этих четырёх текущих (если они есть в программе), работать  в этот момент нельзя, при необходимости доступа к ним нужно менять (перезагружать) содержимое соответствующих сегментных регистров.

Стоит заметить, что сегменты могут перекрываться в памяти ЭВМ и даже полностью совпадать (накладываться друг на друга). Однако максимальный размер сегмента в младшей модели нашего семейства ЭВМ равен 64К, и, если сегменты будут перекрываться, то одновременно для работы будет доступно меньшее количество оперативной памяти. Заметим, что пересечение сегментов никак не влияет на логику работы центрального процессора.12

В соответствии с принципом фон Неймана, мы имеем право размещать в любом из сегментов памяти как числа, так и команды. Но такой подход ведёт к плохому стилю программирования, программа перестаёт легко читаться и пониматься программистами. Будем поэтому стараться размещать команды программы в одним сегментах, а данные – в других. Весьма редко программисту будет выгодно размещать данные среди команд, один такой случай будет рассмотрен позже в нашем курсе.

На текущий сегмент команд должен указывать регистр CS, а на сегмент данных – регистр DS. Дело в том, что эти регистры специализированные. В частности, устройство управления может выбирать команды для выполнения только из сегмента, на который указывает регистр CS. Производить арифметические операции можно над числами из любого сегмента, однако в соответствии с принципом умолчания все переменные, если прямо не указано противное, сегментируются по регистру DS. Явное указание необходимости выбирать аргументы команды по другому сегментному регистру увеличивает длину команды на один байт (перед такой командой вставляется специальная однобайтная команда, которая называется префиксом сегмента).

Итак, модуль состоит из описаний сегментов. В сегментах находятся все команды и области памяти, используемые для хранения переменных. Вне сегментов могут располагаться только так называемые директивы языка Ассемблер, о которых мы будем говорить немного ниже. Пока лишь отметим, что чаще всего директивы не определяют в программе ни команд, ни переменных (поймите, что именно поэтому они и могут стоять вне сегментов). 13

Описание каждого сегмента, в свою очередь, состоит из предложений (statement) языка Ассемблера. Каждое предложение языка Ассемблера занимает отдельную строчку программы, исключение из этого правила будет отмечено особо. Далее рассмотрим различные классы предложений Ассемблера.

7.3. Классификация предложений языка Ассемблер

  1.  Многострочные комментарии. Это единственная конструкция Ассемблера, которая может занимать несколько строк текста программы. Будем для унификации терминов считать её неким частным типом предложения, хотя не все авторы учебников по Ассемблеру придерживаются этой точки зрения. Способ записи этих комментариев:

COMMENT *

< строки – комментарии >

*

здесь символ * задаёт границы комментария, он не должен встречаться внутри самого комментария. При необходимости использовать символ * внутри комментария, надо вместо этого символа в качестве границ комментария выбрать какой-нибудь другой подходящий символ, например, &.

  1.  Команды. Почти каждому такому предложению языка Ассемблера будет соответствовать одна команде на языке машины (в редких случаях получаются две "тесно связанных" команды). Как уже отмечалось, вне описания сегмента такое предложение встречаться не может.
  2.  Резервирование памяти. Эти предложения отводят в том сегменте, где они записаны, области памяти для хранения переменных. Это некоторый аналог описания переменных языка Паскаль. Способ записи таких предложений надо посмотреть в учебнике [5], мы приведём лишь некоторые примеры с комментариями.

Предложение

Количество памяти

A db ?

1 байт

B dw ?

2 байта (слово)

C dd ?

4 байта (двойное слово)

В этих примерах описаны переменные с именами A,B и C разной длины, которые, как мы уже привыкли в языке Паскаль, не будут иметь конкретных начальных значений, что отмечено символом вопросительного знака. Однако, но принципу Фон Неймана ничто не мешает нам работать напрямую с одним или несколькими байтами, расположенными в любом месте памяти. Например, команда

mov ax,B+1

будет читать на регистр ax слово, второй байт которого располагается в конце переменной B, а первый – в начале переменной C (помним о "перевёрнутом" хранении слов в памяти!). Поэтому следует быть осторожными и не считать A, B и C отдельными, "независимыми" переменными в смысле языка Паскаль, это просто именованные области памяти. Разумеется, в понятно написанной программе эти области используются так, как они описаны с помощью присвоенных им имён.

Предложение

D dw 20 dup (?)

резервирует в сегменте 20 подряд расположенных слов с неопределёнными начальными значениями. Это можно назвать резервированием памяти под массив из 20 элементов, но при этом мы также не теряем возможности работать с произвольными байтами и словами из области памяти, зарезервированной под массив.

  1.  Директивы или команды Ассемблеру. Эти предложения, как уже упоминалось, не порождают в машинной программе никакого кода, т.е. команд или переменных (редким исключением является директива include, о которой мы будем говорить при написании полных программ). Директивы используются программистом для того, чтобы давать программе Ассемблер определённые указания, управлять работой Ассемблера при компиляции (переводе) программы на язык машины. В качестве примера рассмотрим директивы объявления начала и конца описания сегмента с именем A:

A segment

  ...

A ends

Частным случаем директивы является и предложение-метка, она приписывает имя (метку) следующему за ней предложению. Так, в приведённом ниже примере метка Next_Statement_Name является именем следующего за ней предложения, таким образом, у этого предложения две метки:

Next_Statement_Name:

L: mov ax,2

  1.  Макрокоманды. Этот класс предложений Ассемблера относится к макросредствам языка, и будут подробно изучаться далее в нашем курсе. Пока лишь скажем, что на место макрокоманды по определённым правилам подставляется некоторый набор (возможно и пустой) предложений Ассемблера.

Теперь рассмотрим структуру одного предложения. За редким исключением, каждое предложение может содержать от одного до четырёх полей: поле метки, поле кода операции, поле операндов и поле комментария (как обычно, квадратные скобки указывают на необязательность заключённой в них конструкции):

[<метка>[:]] КОП [<операнды>] [; комментарий]

Как видно, все поля предложения, кроме кода операции, являются необязательными и могут отсутствовать в конкретном предложении. Операнды, если их в предложении несколько, отделяются друг от друга запятыми (в макрокоманде операнды могут разделяться и пробелами). Если после метки стоит двоеточие, то это указание на то, что данное предложение может рассматриваться как команда, т.е. выбираться для исполнения в устройство управления.

В очень редких случаях предложения языка Ассемблера имеют другую структуру, например, директива присваивания значения переменной периода генерации (с этими переменными мы познакомимся при изучении макросредств языка):

K = K+1

Другим примером может служить строка-комментарий, такие строки начинаются с символа точки с запятой, перед которой могут стоять только символы пробелов:

; это строка-комментарий

7.4. Пример полной программы на Ассемблере

Прежде, чем написать нашу первую полную программу на Ассемблере, нам необходимо научиться выполнять операции ввода/вывода, без которых ни одна сколько-нибудь серьёзная программа обойтись не может. В самом языке машины, в отличие от языка нашей учебной машины УМ-3, нет команда ввода/вывода,14 чтобы, например, ввести целое число, необходима достаточно большая программа на машинном языке.

Для организации ввода/вывода мы в наших примерах будем использовать макрокоманды из учебника [5]. Вместо каждой макрокоманды Ассемблер будет подставлять соответствующий этой макрокоманде набор команд и констант (этот набор, как мы узнаем позже, называется макрорасширением для макрокоманды).

Нам понадобятся следующие макрокоманды ввода/вывода.

  1. Макрокоманда вывода символа на экран

outch op1

где операнд op1 может быть в формате i8, r8 или m8. Значение операнда трактуется как код символа, этот символ выводится в текущую позицию экрана. Для задания кода символа удобно использовать символьную константу языка Ассемблер, например, ′A′. Такая константа преобразуется программой Ассемблера именно в код этого символа. Например,  outch ′*′  выведет символ звёздочки на место курсора.

  1. Макрокоманда ввода символа с клавиатуры

inch op1

где операнд op1 может быть в формате r8 или m8. Код введённого символа записывается в место памяти, определяемое операндом.

  1. Макрокоманды вывода на экран целого значения

outint  op1[,op2]

outword op1[,op2]

Здесь, как всегда, квадратные скобки говорят о том, что второй операнд может быть опущен. В качестве первого операнда op1 можно использовать i16, r16 или m16, а второго – i8, r8 или m8. Действие макрокоманды  outint op1,op2  полностью эквивалентно процедуре вывода языка Паскаль write(op1:op2), а действие макрокоманды с именем outword отличается только тем, что первый операнд трактуется как беззнаковое (неотрицательное) число.

  1. Макрокоманда ввода целого числа

inint op1

где операнд op1 может иметь формат r16 или  m16, производит ввод с клавиатуры на место первого операнда целого значения из диапазона –215..+216. Особо отметим, что операнды форматов r8 и m8 недопустимы.

  1. Макрокоманда без параметров

newline

предназначена для перехода курсора к началу следующей строки экрана и эквивалентна вызову процедуры без параметров writeln языка Паскаль. Этого же эффекта можно достичь, если вывести на экран служебные символы с кодами 10 и 13, т.е. выполнить, например, макрокоманды

outch 10

outch 13

  1. Макрокоманда без параметров

flush

предназначена для очистки буфера ввода и эквивалентна вызову процедуры без параметров readln языка Паскаль.

  1. Макрокоманда вывода на экран строки текста

outstr

Эта макрокоманда выводит на экран строку текста из того сегмента, на который указывает сегментный регистр DS, причём адрес начала этой строки в сегменте должен находится в регистре DX. Таким образом, физический адрес начала выводимого текста определяется по формуле

Афиз = (DS*16 + DX)mod 220

Заданный таким образом адрес принято записывать в виде так называемой адресной пары <DS,DX>. В качестве признака конца выводимой строки символов должен быть задан символ $ (он рассматривается как служебный признак конца и сам не выводится). Например, если в сегменте данных есть текст

Data segment

. . .

T db ′Текст для вывода на экран$’

. . .

data ends

то для вывода этого текста на экран можно выполнить следующий фрагмент программы

. . .

mov DX,offset T; DX:=адрес T

outstr

. . .

Рассмотрим теперь пример простой полной программы на Ассемблере. Эта программа должна вводить значение целой переменной A и реализовывать оператор присваивания (в смысле языка Паскаль)

X := (2*A - 241 div (A+B)2) mod 7

где Bпараметр, т.е. значение, которое не вводится, а задаваётся в самой программе. Пусть A, B и Сзнаковые целые величины, описанные в сегменте данных так:

A dw ?

B db –8; это параметр, заданный программистом

X dw ?

Вообще говоря, результат, заносимый в переменную X короткий (это остаток от деления на 7), однако мы выбрали для X формат слова, т.к. его надо выдавать в качестве результата, а макрокоманда outint может выводить только длинные целые числа.

Наша программа будет содержать три сегмента с именами data, code и stack и выглядеть следующим образом:

include io.asm

; вставить в программу файл с макроопределениями

; для макрокоманд ввода-вывода

data  segment

A dw ?

B db -8

X dw ?

Data ends

stack segment stack

db 128 dup (?)

stack ends

code segment

assume cs:code, ds:data, ss:stack

start:mov ax,data; это команда формата r16,i16

mov ds,ax ; загрузка сегментного регистра DS

inint A ; макрокоманда ввода целого числа

mov bx,A ; bx := A

mov al,B ; al := B

cbw   ; ax := длинное B

add ax,bx ; ax := B+A=A+B

add bx,bx ; bx := 2*A

imul ax ; (dx,ax) := (A+B)2

mov cx,ax ; cx := младшая часть(A+B)2

mov ax,241

cwd  ; <dx,ax> := сверхдлинное 241

idiv cx ; ax := 241 div (A+B)2 , dx := 241 mod (A+B)2

sub bx,ax ; bx := 2*A - 241 div (A+B)2

mov ax,bx

cwd

mov bx,7

idiv bx ; dx := (2*A - 241 div (A+B)2) mod 7

mov X,dx

outint X

finish

code ends

end start

Прокомментируем текст нашей программы. Во-первых, заметим, что сегмент стека мы нигде явно не используем, однако он необходим в любой программе. Как мы узнаем далее из нашего курса, во время выполнения любой программы возможно автоматическое (без нашего ведома) переключение на выполнение некоторой другой программы, при этом используется сегмент стека. Подробно этот вопрос мы рассмотрим при изучении прерываний.

В начале сегмента кода расположена директива assume, она говорит программе Ассемблера, на какие сегменты будут указывать соответствующие сегментные регистры при выполнении команд, обращающихся к этим сегментам. Сама эта директива не меняет значения ни одного сегментного регистра, подробно про неё необходимо прочитать в учебнике [5].

Заметим, что сегментные регистры SS и CS должны быть загружены перед выполнением самой первой команды нашей программы. Ясно, что сама наша программа этого сделать не в состоянии, так как для этого необходимо выполнить хотя бы одну команду, что требует доступа к сегменту кода, и, в свою очередь, уже установленного на этот сегмент регистра CS. Получается замкнутый круг, и единственным решением будет попросить какую-то другую программу загрузить значения этих регистров, перед вызовом нашей программы. Как мы потом увидим, эту операцию будет делать служебная программа, которая называется загрузчиком.

Первые две команды нашей программы загружают значение сегментного регистра DS, в младшей модели для этого необходимы именно две команды, так как одна команда имела бы несуществующий формат:

mov ds,data; формат SR,i16 такого формата нет!

Пусть, например, при счёте нашей программы сегмент данных будет располагаться, начиная с адреса 10000010 оперативной памяти. Тогда команда

mov ax,data

будет во время счёта иметь вид

mov ax,6250 ; 100000 div 16 = 6250

Макрокоманда

inint  A; макрокоманда ввода целого числа

вводит значение целого числа в переменную A.

Далее начнём непосредственное вычисление правой части оператора присваивания. Задача усложняется тем, что величины  A и B имеют разную длину и непосредственно складывать их нельзя. Приходится командами

mov al,B ; al := B

cbw   ; ax := длинное B

преобразовать короткое целое B, которое сейчас находится на регистре al, в длинное целое на регистре ax. Далее вычисляется значение выражения (A+B)2 и можно приступать к выполнению деления. Так как делитель является длинным целым числом (мы поместили его на регистр cx), то необходимо применить операцию длинного деления, для чего делимое (число 241 на регистре ax) командой

cwd

преобразуем в сверхдлинное целое и помещаем на два регистра (dx,ax). Вот теперь всё готово для команды целочисленного деления

idiv cx;  ax:= 241 div (A+B)2 , dx:= 241 mod (A+B)2

Далее мы присваиваем остаток от деления (он в регистре dx) переменной X и выводим значение этой переменной по макрокоманде

outint X

которая эквивалентна процедуре WriteLn(X) языка Паскаль. Последним предложением в сегменте кода является макрокоманда

finish

Эта макрокоманда заканчивает выполнение нашей программы, она эквивалентна выходу программы на Паскале на конечный end.

И, наконец, директива

end start

заканчивает описание всего модуля на Ассемблере. Обратите внимание на параметр этой директивы – метку start. Она указывает входную точку программы, т.е. её первую выполняемую команду программы.

Сделаем теперь важные замечания к нашей программе. Во-первых, мы не проверяли, что команды сложения и вычитания дают правильный результат (для этого, как мы знаем, после выполнения этих команд нам было бы необходимо проверить флаг переполнения OF, т.к. наши числа мы считаем знаковыми). Во-вторых, команда длинного умножения располагает свой результат в двух регистрах (dx,ax), а в нашей программе мы брали результат произведения только из регистра ax, предполагая, что на регистре dx находятся только незначащие цифры произведения. По-хорошему надо было бы проверить, что в dx содержаться только нулевые биты, если ax  0, и только двоичные “1”, если

ax < 0. Другими словами, знак числа в регистре dx должен совпадать со знаком числа в регистре ax, для знаковых чисел это и есть признак того, что в регистре dx содержится незначащая часть произведения. И, наконец, мы не проверили, что не производим деления на ноль (в нашем случае что A<>8). В наших учебных программах мы иногда не будем делать таких проверок, но в “настоящих” программах, которые Вы будете создавать на компьютерах и предъявлять преподавателям, эти проверки являются обязательными.

Продолжая знакомство с языком Ассемблера, решим следующую задачу. Напишем фрагмент программы, в котором увеличивается на единицу целое число, расположенное в 23456710 байте оперативной памяти. Мы уже знаем, что запись в любой байт памяти возможна только тогда, когда этот байт расположен в одном из четырёх текущих сегментах. Сделаем, например, так, чтобы наш байт располагался в сегменте данных. Главное здесь – не путать сегменты данных, которые мы описываем в программе на Ассемблере, с активными сегментами, на начала которых установлены сегментные регистры. Описываемые в программе сегменты обычно размещаются загрузчиком на свободных участках оперативной памяти, и, как правило, при написании текста программы неизвестно их будущего месторасположение.15 Однако ничто не мешает нам любой участок оперативной памяти сделать сегментом, установив на него какой-либо сегментный регистр. Так мы и сделаем для решения нашей задачи, установив сегментный регистр DS на начало ближайшего сегмента, в котором будет находиться наш байт с адресом 23456710. Так как в сегментный регистр загружается адрес начала сегмента, делённый на 16, то нужное нам значение сегментного регистра можно вычислить по формуле: DS := 234567 div 16 = 14660. При этом адрес A нашего байта в сегменте (его смещение от начала сегмента) вычисляется по формуле: A := 234567 mod 16 = 7. Таким образом, для решения нашей задачи можно предложить следующий фрагмент программы:

mov ax,14660

mov ds,ax; Начало сегмента

mov bx,7; Смещение

inc byte ptr [bx]

Теперь, после изучения арифметических операций, перейдём к рассмотрению команд переходов, которые понадобятся нам для программирования условных операторов и циклов. После изучения нашего курса мы должны уметь отображать на Ассемблер любые конструкции языка Паскаль.

7.5. Переходы

В большинстве современных компьютеров реализован принцип последовательного выполнения команд. Это значит, что после выполнения текущей команды счётчик адреса будет указывать на следующую (ближайшую с большим адресом) команду в оперативной памяти.16  Изменить последовательное выполнение команд можно с помощью переходов, при этом следующая команда может быть расположена в другом месте оперативной памяти. Ясно, что без переходов компьютеры функционировать не могут: скорость центрального процессора так велика, что он очень быстро может по одному разу выполнить все команда в оперативной памяти.

Понимание переходов очень важно при изучении архитектуры ЭВМ, они позволяют уяснить логику работы центрального процессора. Все переходы можно разделить на два вида.

  1. Переходы, вызванные выполнением центральным процессором специальных команд переходов.
  2. Переходы, которые автоматически выполняет центральный процессор при наступлении определённых событий в центральной части компьютера или в его периферийных устройствах (устройствах ввода/вывода).

Начнём последовательное рассмотрение переходов для компьютеров нашей архитектуры. Напомним, что физический адрес начала следующей выполняемой команды зависит от значений двух регистров: сегментного регистра CS и счётчика адреса IP и вычисляется по формуле:

Aфиз := (CS*16 + IP)mod 220

Следовательно, для осуществления перехода необходимо в один или оба эти регистра занести новые значения. Отсюда будем выводить первую классификацию переходов: будем называть переход близким переходом, если при этом меняется только значение регистра IP, если же при переходе меняются значения обоих регистров, то такой переход будем называть дальним (межсегментным) переходом. 17

Следующей основой для классификации переходов будет служить способ изменения значения регистра. При относительном переходе происходит знаковое сложение содержимого регистра с некоторой константой, например,

IP := (IP + Const)mod 216

При абсолютном переходе происходит просто присваивание соответствующему регистру нового значения, например,

CS := Const

Опять же из соображений ценности практического использования в программировании, для сегментного регистра CS реализован только абсолютный переход, в то время как для счётчика адреса IP возможен как абсолютный, так и относительный переходы.

Далее будем классифицировать относительные переходы по величине той константы, которая прибавляется к значению счётчика адреса IP: при коротком переходе величина этой знаковой константы (напомним, что мы обозначаем её i8) не превышает по размеру одного байта (т.е. лежит в диапазоне от –128 до +127):

IP := (IP + i8)mod 216 ,

а при длинном переходе  эта константа имеет размер слова (двух байт):

IP := (IP + i16)mod 216

Кроме того, величина, используемая при абсолютном переходе для задания нового значения какого-либо из этих регистров, может быть прямой и косвенной. Прямая величина является просто числом (в нашей терминологии это непосредственный адрес), а косвенная – является адресом некоторой области памяти, откуда и будет извлекаться необходимое число, например,

IP := [m16]

Здесь на регистр IP заносится число, содержащееся в двух байтах памяти по адресу m16, т.е. это близкий длинный абсолютный косвенный переход.

Таким образом, каждый переход можно классифицировать по его свойствам: близкий – дальний, относительный – абсолютный, короткий – длинный, прямой – косвенный. Разумеется, не все из этих переходов реализуются в компьютере, так, мы уже знаем, что короткими или длинными бывают только относительные переходы, а относительные переходы бывают только прямыми.

7.6. Команды переходов

Изучим сначала команды переходов. Эти команды предназначены только для передачи управления в другое место программы, они не меняют никаких флагов.

7.6.1. Команды безусловного перехода

Рассмотрим сначала команды безусловного перехода, которые всегда передают управление в указанную в них точку программы. На языке Ассемблера все эти команды записываются в виде

jmp op1

Здесь op1 может иметь следующие форматы:

op1

Способ выполнения

Вид перехода

i8

IP := (IP + i8)mod 216

Близкий относительный короткий

i16

IP := (IP + i16)mod 216

Близкий относительный длинный

r16

IP := [r16]

Близкий абсолютный косвенный

m16

IP := [m16]

Близкий абсолютный косвенный

m32

IP := [m32], CS := [m32+2]

Дальний абсолютный косвенный

seg:off

IP := off,   CS := seg

Дальний абсолютный прямой

Здесь seg:off – это мнемоническое обозначение двух операндов в формате i16, разделённых двоеточием. Как видно из этой таблицы, многие потенциально возможные виды безусловного перехода (например, близкие абсолютные прямые, близкие абсолютные короткие и др.) не реализованы в нашей архитектуре. Это сделано исключительно для упрощения центрального процессора (не нужно реализовывать в нём эти команды) и для уменьшения размера программы (чтобы длина поля кода операции в командах не была слишком большой).

Рассмотрим теперь, как на языке Ассемблера задаются эти операнды команд безусловного перехода. Для указания близкого относительного перехода в команде обычно записывается метка команды, на которую необходимо выполнить переход, например:

jmp L; Перейти на команду, помеченную меткой L

Напомним, что вслед за меткой команды, в отличие от метки области памяти, ставится двоеточие. Так как значением метки является её смещение в том сегменте, где эта метка описана, то программе Ассемблера приходится самой вычислять необходимое смещение i8 или i16, которое необходимо записать на место операнда в команде на машинном языке 18, например:

L: add bx,bx ;  <─

 . . .    │

 . . .    │ i8 или i16 (со знаком !)

 . . .    │

jmp L; L = i8 или i16 <─┘

Здесь формат операнда (i8 или i16) выбирается программой Ассемблера автоматически, в зависимости от расстояния в программе между командой перехода и меткой. Если же метка L располагается в программе после команды перехода, то Ассемблер, ещё не зная истинного расстояния до этой метки, "на всякий случай" заменяет эту метку на операнд размера i16. Поэтому для тех программистов, которые знают, что смещение должно быть формата i8 и хотят сэкономить один байт памяти, Ассемблер предоставляет возможность задать размер операнда в явном виде:

jmp short L

Ясно, что это нужно делать только при острой нехватке оперативной памяти для программы. 19 Для явного указания дальнего перехода программист должен использовать оператор far ptr, например:

jmp far ptr L

Приведём фрагмент программы с различными видами командам безусловного перехода, в этом фрагменте описаны два кодовых сегмента (для иллюстрации дальних переходов) и один сегмент данных:

data segment

A1 dw L2;   Смещение команды с меткой L2 в своём сегменте

A2 dd Code1:L1; Это seg:off

. . .

data ends

code1 segment 

. . .

L1: mov ax,bx

. . .

code1 ends

code2 segment

assume cs:code2, ds:data

start:mov ax,data

mov ds,ax ; загрузка сегментного регистра DS

L2: jmp far ptr L1; дальний прямой абсолютный переход, op1=seg:off

. . .

jmp L1;  ошибка т.к. без far ptr

jmp L2; близкий относительный переход, op1=i8 или i16

jmp A1; близкий абсолютный косвенный переход, op1=m16

jmp A2; дальний абсолютный косвенный переход, op1=m32

jmp bx; близкий абсолютный косвенный переход, op1=r16

jmp [bx]; ошибка, нет выбора: op1=m16 или m32 ?

mov bx,A2

jmp dword ptr [bx]; дальний абсолютный косвенный переход op1=m32

. . .

code2 ends

Отметим одно важное преимущество относительных переходов перед абсолютными.  Значение i8 или i16 в команде относительного перехода зависит только от расстояния в байтах между командой перехода и точкой, в которую производится переход. При любом изменении в сегменте кода вне этого диапазона команд значения i8 или i16 не меняются.

Как видим, архитектура нашего компьютера обеспечивает большой спектр команд безусловного перехода. Напомним, что в нашей учебной машине УМ-3 была только одна команда безусловного перехода. На этом мы закончим наше краткое рассмотрение команд безусловного перехода. Напомним, что для усвоения материала по курсу Вам необходимо изучить соответствующий раздел учебника по Ассемблеру.

7.6.2. Команды условного перехода

Все команды условного перехода выполняются по схеме

if <условие перехода> then goto L

и производят близкий короткий относительный переход, если выполнено некоторое условие перехода, в противном случае продолжается последовательное выполнение команд программы. На Паскале условие перехода чаще всего задают в виде условного оператора

if op1 <отношение> op2 then goto L

где отношение – один из знаков операции отношения = (равно), <> (не равно), > (больше), < (меньше), <= (меньше или равно), >= (больше или равно). Если обозначить rez=op1–op2, то оператор условного перехода можно записать в эквивалентном виде сравнения с нулём

if rez <отношение> 0 then goto L

Все машинные команды условного перехода, кроме одной, вычисляют условие перехода, анализируя один, два или три флага из регистра флагов, и лишь одна команда условного перехода вычисляет условие перехода, анализируя значение регистра CX. Команда условного перехода в языке Ассемблер имеет вид

j<мнемоника перехода> i8; IP := (IP + i8)mod 216

Мнемоника перехода (это от одной до трёх букв) связана со значением анализируемых флагов (или регистра CX), либо со способом формирования этих флагов. Чаще всего программисты формируют флаги, проверяя отношение между двумя операндами op1 <отношение> op2, для чего выполняется команда вычитания или команда сравнения. Команда сравнения имеет мнемонический код операции cmp и такой же формат, как и команда вычитания:

cmp op1,op2

Она и выполняется точно так же, как команда вычитания за исключением того, что разность не записывается на место первого операнда. Таким образом, единственным результатом команды сравнения является формирование флагов, которые устанавливаются так же, как и при выполнении команды вычитания. Вспомним, что программист может трактовать результат вычитания (сравнения) как производимый над знаковыми или же беззнаковыми числами. Как мы уже знаем, от этой трактовки зависит и то, будет ли один операнд больше другого или же нет. Так, например, рассмотрим два коротких целых числа 0FFh и 01h. Как знаковые числа 0FFh = -1 < 01h = 1, а как беззнаковые числа 0FFh = 255 > 01h = 1.

Исходя из этого, принята следующая терминология: при сравнении знаковых целых чисел первый операнд может быть больше (greater) или меньше (less) второго операнда. При сравнении же беззнаковых чисел будем говорить, что первый операнд выше (above) или ниже (below) второго. Ясно, что действию "выполнить переход, если первый операнд больше второго" будут соответствовать разные машинные команды, если трактовать операнды как знаковые или же беззнаковые целые числа. Это учитывается в различных мнемониках этих команд.

Ниже в Таблице 7.1 приведены мнемоники команд условного перехода. Некоторые команды имеют разную мнемонику, но выполняются одинаково (переводятся программой Ассемблера в одну и ту же машинную команду), такие команды указаны в одной строке таблицы.

Таблица 7.1. Мнемоника команд условного перехода

КОП

Условие перехода

Логическое условие перехода

Результат (rez) команды вычитания или cоотношение операндов op1 и op2 команды сравнения

je

jz

ZF = 1

Rez = 0  или op1 = op2

(результат = 0, операнды равны)

jne

jnz

ZF = 0

rez <> 0 или op1 <> op2

Результат <> 0, операнды не равны

jg

jnle

(SF=OF) and (ZF=0)

rez > 0  или op1 > op2

Знаковый результат > 0, op1 больше op2

jge

jnl

SF = OF

rez >= 0 или op1 >= op2

Знаковый результат >= 0, т.е.

op1 больше или равен (не меньше) op2

jl

jnge

SF <> OF

rez < 0  или op1 < op2

Знаковый результат < 0, т.е.

op1 меньше (не больше или равен) op2

jle

jng

(SF<>OF) or (ZF=1)

rez <= 0 или op1 <= op2

Знаковый результат <= 0, т.е.

op1 меньше или равен(не больше) op2

ja

jnbe

(CF=0) and (ZF=0)

rez > 0  или op1 > op2

Беззнаковый результат > 0, т.е.

op1 выше (не ниже или равен) op2

jae

jnb

jnc

CF = 0

rez >= 0  или op1 >= op2

Беззнаковый результат >= 0, т.е.

op1 выше или равен (не ниже) op2

jb

jnae

jc

CF = 1

rez < 0  или op1 < op2

Беззнаковый результат < 0, т.е.

op1 ниже (не выше или равен) op2

jbe

jna

(CF=1) or (ZF=1)

rez >= 0  или op1 >= op2

Беззнаковый результат >= 0, т.е.

op1 ниже или равен (не выше) op2

js

SF = 1

Знаковый бит разультата (7-й или 15-ый, в зависимости от размера) равен единице

jns

SF = 0

Знаковый бит разультата (7-й или 15-ый, в зависимости от размера) равен нулю

jo

OF = 1

Флаг переполнения равен единице

jno

OF = 0

Флаг переполнения равен нулю

jp

jpe

PF = 1

Флаг чётности 20 равен единице

jnp

jpo

PF = 0

Флаг чётности равен единице

jcxz

CX = 0

Значение регистра CX равно нулю

В качестве примера рассмотрим, почему условному переходу jl/jnge соответствует логическое условие перехода SF<>OF. При выполнении команды сравнения  cmp op1,op2  или команды вычитания  sub op1,op2  нас будет интересовать трактовка операндов как знаковых целых чисел, поэтому возможны два случая, когда первый операнд меньше второго. Во-первых, если при выполнении операции вычитания op1-op2 результат получился правильным, т.е. не было переполнения (OF=0), то бит знака у правильного результата равен единице (SF=1). Во-вторых, при вычитании мог получиться неправильный результат, т.е. было переполнение (OF=0), но в этом случае знаковый бит результата будет неправильным, т.е. равным нулю. Видно, что в обоих случаях эти два флага не равны друг другу, т.е. должно выполняться условие SF<>OF, что и указано в нашей таблице. Для тренировки разберите правила формирования и других условий переходов.

Как видим, команд условного перехода достаточно много, поэтому понятно, почему для них реализован только один формат – близкий короткий относительный переход. Реализация других форматов команд условного перехода привела бы к резкому увеличению числа команд в языке машины и, как следствие, к усложнению центрального процессора и росту объёма программ. В то же время наличие только одного формата команд условного перехода может приводить к плохому стилю программирования. Пусть, например, надо реализовать на Ассемблере условный оператор языка Паскаль

if X>Y then goto L;

Соответствующий фрагмент на языке Ассемблера, реализующий этот оператор для знаковых X,Y

mov ax,X

cmp ax,Y

jg L

. . .

L:

может быть неверным, если расстояние между меткой и командой условного перехода велико (не помещается в байт).  В таком случае придётся использовать такой фрагмент на Ассемблере со вспомогательной меткой L1 и вспомогательной командой безусловного перехода:

mov ax,X

cmp ax,Y

jle L1

jmp L

L1:

. . .

L:

Таким образом, на самом деле мы вынуждены реализовывать такой фрагмент программы на языке Паскаль:

if X<=Y then goto L1; goto L; L1:;

Это, конечно, по необходимости, прививает плохой стиль программирования.

В качестве примера использования команд условного перехода рассмотрим программу, которая вводит знаковое число A в формате слова и вычисляет значение X по формуле

include io.asm

; файл с макроопределениями для макрокоманд ввода-вывода

data segment

A dw ?

X dw ?

Diagn db ′Ошибка – большое значение!$′

Data ends

Stack segment stack

db 128 dup (?)

stack ends

code segment

assume cs:code, ds:data, ss:stack

start:mov ax,data; это команда формата r16,i16

mov ds,ax ; загрузка сегментного регистра DS

inint A ; ввод целого числа

mov ax,A ; ax := A

mov bx,ax ; bx := A

inc ax ; ax := A+1

jo Error

cmp bx,2 ; Сравнение A и 2

jle L1 ; Вниз по первой ветви вычисления X

dec bx ; bx := A-1

jo Error

imul bx ; (dx,ax):=(A+1)*(A-1)

jo Error ; Произведение (A+1)*(A-1) не помещается в ax

L: mov X,ax ; Результат берётся только из ax

outint X;   Вывод результата

newline

finish

L1: jl L2; Вниз по второй ветви вычисления X

mov ax,4

jmp L; На вывод результата

L2: mov bx,7; Третья ветвь вычисления X

cwd     ; (dx,ax):= длинное (A+1) – иначе нельзя!

idiv bx; dx:=(A+1) mod 7, ax:=(A+1) div 7

mov ax,dx

jmp L; На вывод результата

Error:mov dx,offset Diagn

outstr

newline

finish

code ends

end start

В нашей программе мы сначала закодировали вычисление по первой ветви нашего алгоритма, затем по второй и, наконец, по третьей. Программист, однако, может выбрать и другую последовательность кодирования ветвей, это не влияет на суть дела. В нашей программе предусмотрена выдача аварийной диагностики, если результаты операций сложения (A+1), вычитания (A-1) или произведения (A+1)*(A-1) слишком велики и не помещается в одно слово.

Для увеличения и уменьшения операнда на единицу мы использовали команды

inc op1 и  dec op1

Здесь op1 может иметь формат r8, r16, m8 и m16. Например, команда  inc ax  эквивалентна команде  add ax,1 , но не меняет флага CF. Таким образом, после этих команд нельзя проверить флаг переполнения, чтобы определить, правильно ли выполнились такие операции над беззнаковыми числами.

Обратите также внимание, что мы использовали команду длинного деления, попытка использовать здесь короткое деление, например

L2: mov bh,7; Третья ветвь вычисления X

 idiv bh; ah:=(A+1) mod 7, al:=(A+1) div 7

может привести к ошибке. Здесь остаток от деления (A+1) на число 7 всегда поместится в регистр ah, однако частное (A+1) div 7 может не поместиться в регистр al (пусть A=27999, тогда (A+1) div 7 = 4000 – не поместится в регистр al).

При использовании команд условного перехода мы предполагали, что расстояние от точки перехода да нужной метки небольшое (формата i8), если это не так, то программа Ассемблера выдаст нам соответствующую диагностику об ошибке и нам придётся использовать "плохой стиль программирования", как объяснялось выше. В нашей программе это может случиться только тогда, когда суммарный размер кода, подставляемого вместо макрокоманд outint и finish, будет больше 128 байт (обязательно понять это!).

7.6.3. Команды цикла

Для организации циклов на Ассемблере вполне можно использовать команды условного перехода. Например, цикл языка Паскаль с предусловием  while X<0 do S;  можно реализовать в виде следующего фрагмента на Ассемблере

L: cmp X,0; Сравнить X с нулём

jge L1

;  Здесь будет оператор S

jmp L

L1: . . .

Оператор цикла с постусловием  repeat S1; S2;. . .Sk until X<0;  можно реализовать в виде фрагмента на Ассемблере

L: ;  S1

;  S2

. . .

;  Sk

cmp X,0; Сравнить X с нулём

jge L

. . .

В этих примерах мы считаем, что тело цикла по длине не превышает примерно 120 байт (это 30-40 машинных команд). Как видим, цикл с постусловием требует для своей реализации на одну команду меньше, чем цикл с предусловием.

Как мы знаем, если число повторений выполнения тела цикла известно до начала исполнения этого цикла, то в языке Паскаль наиболее естественно было использовать цикл с параметром. Для организации цикла с параметром в Ассемблере можно использовать специальные команды цикла. Команды цикла, по сути, тоже являются командами условного перехода и, как следствие, реализуют только близкий короткий относительный переход. Команда цикла

loop L; Метка L заменится на операнд i8

использует неявный операнд – регистр CX и её выполнение может быть так описано с использованием Паскаля:

Dec(CX); {Это часть команды loop, поэтому флаги не меняются!}

if CX<>0 then goto L;

Как видим, регистр CX (который так и называется регистром счётчиком цикла – loop counter), используется этой командой именно как параметр цикла. Лучше всего эта команда цикла подходит для реализации цикла с параметром языка Паскаль вида

for CX:=N downto 1 do S;

Этот оператор можно эффективно реализовать таким фрагментом на Ассемблере:

mov CX,N

jcxz L1

L: . . .; Тело цикла –

. . .; оператор S

loop L

L1: . . .

Обратите внимание, так как цикл с параметром языка Паскаль по существу является циклом с предусловием, то до начала его выполнение проверяется исчерпание значений для параметра цикла с помощью команды условного перехода  jcxz L1 , которая именно для этого и была введена в язык машины. Ещё раз напоминаем, что команды циклов не меняют флагов.

Описанная выше команда цикла выполняет тело цикла ровно N раз, где Nбеззнаковое число, занесённое в регистр-счётчик цикла CX перед началом цикла. К сожалению, никакой другой регистр нельзя использовать для этой цели (т.к. это неявный параметр команды цикла). Кроме того, в приведённом выше примере реализации цикла тело этого не может быть слишком большим, иначе команда  loop L  не сможет передать управление на метку L.

В качестве примера использования команды цикла решим следующую задачу. Требуется ввести беззнаковое число N<=500, затем ввести N знаковых целых чисел и вывести сумму тех из них, которые принадлежат диапазону –2000..5000. Можно предложить следующее решение этой задачи.

include io.asm

; файл с макроопределениями для макрокоманд ввода-вывода

data  segment

N dw ?

S dw 0; Начальное значение суммы = 0

T1 db ′Введите N<=500 $′

T2 db ′Ошибка – большое N!$′

T3 db ′Вводите целые числа′,10,13,′$′

T4 db ′Ошибка – большая сумма!$′

data  ends

stack segment stack

dw 64 dup (?)

stack ends

code segment

assume cs:code,ds:data,ss:stack

start:mov ax,data 

mov ds,ax

mov dx, offset T1; Приглашение к вводу

outstr

inint N

cmp  N,500

jbe L1

mov dx, offset T2; Диагностика от ошибке

Err: outstr

newline

finish

L1: mov cx,N; Счётчик цикла

jcxz Pech; На печать результата

mov dx,offset T3; Приглашение к вводу

outstr

newline

L2: inint ax; Ввод очередного числа

cmp ax,-2000

jl L3

cmp ax,5000

jg L3; Проверка диапазона

add S,ax; Суммирование

jno L3; Проверка на переполнение S

mov dx,offset T4

jmp Err

L3: loop L2

Pech: outch ′S′

outch ′=′

outint S

newline

finish

code ends

end start

В качестве ещё одного примера рассмотрим использование циклов при обработке массивов. Пусть необходимо составить программу для решения следующей задачи. Задана константа N=20000, надо ввести массивы X и Y по N беззнаковых чисел в каждом массиве и вычислить выражение

Для простоты будем предполагать, что каждое из произведений и вся сумма имеют формат dw (помещаются в слово). Ниже приведена программа, решающая эту задачу.

include io.asm

N equ 20000; Аналог Const N=20000; Паскаля

data1 segment

T1 db ′Вводите числа массива $′

T2 db ′Сумма = $′

T3 db ′Ошибка – большое значение!′,10,13,′$′

S dw 0; искомая сумма

X dw N dup (?); 2*N байт

data1 ends

data2 segment

Y dw N dup (?); 2*N байт

data2 ends

st segment stack

dw 64 dup(?)

st ends

code segment

assume cs:code,ds:data1,es:date2,ss:st

begin_of_program:

mov ax,data1

mov ds,ax; ds – на начало data1

mov ax,data2

mov es,ax;  es – на начало data2

mov dx, offset T1; Приглашение к вводу

outstr

outch ′X′ 

newline

mov cx,N; счётчик цикла

mov bx,0; индекс массива

L1: inint X[bx];ввод очередного элемента X[i]

add bx,2; увеличение индекса, это i:=i+1

loop L1

outstr; Приглашение к вводу

outch ′Y′ 

newline

mov cx,N; счётчик цикла

mov bx,0; индекс массива

L2: inint ax

mov Y[bx],ax; ввод очередного элемента es:Y[bx]

add bx,2; увеличение индекса

loop L2

mov bx,offset X; указатель на X[1]

mov si,offset Y+2*N-2; указатель на Y[N]

L3: mov ax,[bx]; первый сомножитель

mul word ptr es:[si]; умножение на Y[N-i+1]

jc Err; большое произведение

add S,ax

jc Err; большая сумма

add bx,type X; это bx:=bx+2

sub si,2; это i:=i-1

loop L3; цикл суммирования

mov dx, offset T2

outstr

outword S

newline

finish

Err: mov dx,T3

outstr

finish

code ends

end begin_of_program

Подробно прокомментируем эту программа. Количество элементов массивов мы задали, используя директиву эквивалентности  N equ 20000 , это есть указание программе Ассемблера о том, что всюду в программе, где встретится имя N, надо подставить вместо него операнд этой директивы – число 20000. Таким образом, это почти полный аналог описания константы в языке Паскаль.21 Под каждый из массивов директива dw зарезервирует 2*N байт памяти.

Заметим теперь, что оба массива не поместятся в один сегмент данных (в сегменте не более примерно 32000 слов, а у нас в сумме 40000 слов), поэтому массив X мы размещаем в сегменте data1, а массив Y – в сегменте data2. Директива assume говорит, что на начала этих сегментов будут соответственно указывать регистры ds и es, что мы и обеспечили в самом начале программы. При вводе массивов мы использовали индексный регистр bx, в котором находится смещение текущего элемента массива от начала этого массива.

При вводе массива Y мы для учебных целей вместо предложения

L2: inint Y[bx];ввод очередного элемента

записали два предложения

L2: inint ax

mov Y[bx],ax;ввод очередного элемента

Это мы сделали, чтобы подчеркнуть: при доступе к элементам массива Y Ассемблер учитывает то, что имя Y описано в сегменте data2 и автоматически (используя информацию из директивы assume) поставит перед командой  mov Y[bx],ax  специальную однобайтную команду  es: . Эту команду называют префиксом программного сегмента, так что на языке машины у нас будут две последовательные, тесно связанные команды:

 es:   mov Y[bx],ax 

В цикле суммирования произведений для доступа к элементам массивов мы использовали другой приём, чем при вводе – регистры-указатели bx и si, в этих регистрах находятся адреса очередных элементов массивов. Напомним, что адрес – это смещение элемента относительно начала сегмента (в отличие от индекса элемента – это смещение от начала массива).

При записи команды умножение

mul word ptr es:[si]; умножение на Y[N-i+1]

мы вынуждены явно задать размер второго сомножителя и записать префикс программного сегмента es:, так как по виду операнда [si] Ассемблер не может сам "догадаться", что это элемент массива Y размером в слово и из сегмента data2.

В команде

add bx,type X; это bx:=bx+2

для задания размера элемента массива мы использовали оператор type. Параметром этого оператора является имя из нашей программы, значением оператора  type <имя>  является целое число – тип данного имени. Для имён областей памяти это длина этой области в байтах (для массива это почти всегда длина одного элемента), для меток команд это отрицательное число –1, если метка расположена в том же сегменте, что и оператор type, или отрицательное число –2 для меток из других сегментов. Все остальные имена имеют тип ноль.

Вы, наверное, уже почувствовали, что программирование на Ассемблере сильно отличается от программирования на языке высокого уровня (например, на Паскале). Чтобы подчеркнуть это различие, рассмотрим пример задачи, связанной с обработкой матрицы, и решим её на Паскале и на Ассемблере.

Пусть дана прямоугольная матрица целых чисел и надо найти сумму элементов, которые расположены в строках, начинающихся с отрицательного значения. Для решения этой задачи на Паскале можно предложить следующий фрагмент программы

Const N=20; M=30;

Var X: array[1..N,1..M] of integer;

Sum,i,j: integer;

. . .

{ Ввод матрицы X }

Sum:=0;

for i:=1 to N do

   if X[i,1]<0 then

for j:=1 to M do Sum:=Sum+X[i,j];

Сначала обратим внимание на то, что переменные i и j несут в программе на Паскале двойную нагрузку: это одновременно и счётчики циклов, и индексы элементов массива. Такое совмещение функций упрощает понимание программы и делает её очень компактной по внешнему виду, но не проходит даром: чтобы по индексам элемента массива вычислить его адрес в сегменте, приходится выполнить достаточно сложные действия. Например, адрес элемента X[i,j] приходится вычислять так:

Адрес(X[i,j])= Адрес(X[1,1])+2*M*(i-1)+2*(j-1)

Эту формулу легко понять, учитывая, что матрица хранится в памяти по строкам (сначала первая строка, затем вторая и т.д.), и каждая строка имеет длину 2*M байт. Буквальное вычисление адресом элементов по приведённой выше формуле (а именно так чаще всего и делает Паскаль-машина) приводит к весьма неэффективной программе. При программировании на Ассемблере лучше всего разделить функции счётчика цикла и индекса элементов. В качестве счётчика лучше всего использовать регистр cx (он и специализирован для этой цели), а адреса лучше хранить в индексных регистрах (bx, si и di). Исходя из этих соображений, можно так переписать программу на Паскале, предвидя её будущий перенос на Ассемблер.

Const N=20; M=30;

Var   X: array[1..N,1..M] of integer;

  Sum,cx,oldcx: integer; bx: integer;

. . .

  { Ввод матрицы X }

  Sum:=0; bx:=X[1,1]; {Так в Паскале нельзя}

  for cx:=N downto 1 do

 if bx<0 then begin oldcx:=cx;

for cx:=M downto 1 do begin

Sum:=Sum+bx; bx:=bx+2 {Так в Паскале нельзя}

end;

 cx:=oldcx

 end

 else bx:=bx+2*M {Так в Паскале нельзя}

Теперь осталось переписать этот фрагмент программы на Ассемблере:

N equ 20

M equ 30

oldcx equ di

Data segment

X dw N*M dup (?)

Sum dw ?

. . .

Data ends

. . .

; Ввод матрицы X

mov Sum,0

mov bx,offset X; Адрес X[1,1]

mov cx,N

L1: cmp word ptr [bx],0

jge L3

mov oldcx,cx

mov cx,M

L2: mov ax,[bx]

add Sum,ax

add bx,2

loop L2

mov cx,oldcx

jmp L4

L3: add bx,2*M

L4: loop L1

Приведённый пример очень хорошо иллюстрирует стиль мышления программиста на Ассемблере. Для доступа к элементам обрабатываемых данных применяются указатели (ссылочные переменные, адреса), и используются операции над этими адресами (адресная арифметика). Получающиеся программы могут максимально эффективно использовать все особенности архитектуры используемого компьютера. Применение адресом и адресной арифметики свойственно и некоторым языкам высокого уровня (например, языку С), который ориентирован на использование особенности машинной архитектуры для написания более эффективных программ.

Вернёмся к описанию команд цикла. В языке Ассемблера есть и другие команды цикла, которые могут производить досрочный (до исчерпания счётчика цикла) выход из цикла. Как и для команд условного перехода, для мнемонических имен некоторых из них существуют синонимы, которые мы будем разделять в описании этих команд символом /.

Команда

loopz/loope L

выполняется по схеме

Dec(CX); if (CX<>0) and (ZF=1) then goto L;

А команда

loopnz/loopne L

выполняется по схеме

Dec(CX); if (CX<>0) and (ZF=0) then goto L;

В этих командах необходимо учитывать, что операция Dec(CX) является частью команды цикла и не меняет флага ZF.

Как видим, досрочный выход из таких циклов может произойти при соответствующих значениях флага нуля ZF. Такие команды используются в основном при работе с массивами, для усвоения этого материала Вам необходимо изучить соответствующий раздел учебника по Ассемблеру.

7.7. Работа со стеком

Прежде, чем двигаться дальше в описании команд перехода, нам необходимо изучить понятие стека и рассмотреть команды работы со стеком.

Стеком называется сегмент памяти, на начало которого указывает сегментный регистр SS. При работе программы в регистр SS можно последовательно загружать адреса начал нескольких сегментов, поэтому иногда говорят, что в программе несколько стеков. Однако в каждый момент стек только один – тот, на который сейчас указывает регистр SS. Именно этот стек мы и будем иметь в виду.

Кроме начала, у стека есть текущая позиция – вершина стека, её смещение от начала сегмента стека записано в регистре SP (stack pointer). Следовательно, как мы уже знаем, физический адрес вершины стека можно получить по формуле Афиз = (SS*16 + SP)mod 220.

Стек есть аппаратная реализация абстрактной структуры данных стек, с которой Вы познакомились в прошлом семестре. В стек можно записывать (и, соответственно, читать из него) только машинные слова, чтение и запись байтов не предусмотрена в архитектуре рассматриваемого нами компьютера. Это, конечно, не значит, что в стеке нельзя хранить байты, двойные слова и т.д., просто нет машинных команд для записи в стек и чтения из стека данных этих форматов.

В соответствие с определением понятия стек последнее записанное в него слово будет читаться из стека первым. Это так называемое правило "последний пришёл – первый вышел" (английское сокращение LIFO).22 Обычно стек принято изображать "растущим" снизу-вверх. Как следствие получается, что конец стека фиксирован и расположен снизу, а вершина двигается вверх (при записи в стек) и вниз (при чтении из стека).

В каждый момент времени регистр SP указывает на последнее слово, записанное в стек. Обычно стек изображают, как показано на рис. 7.1.

Начало стека SS 

Вершина стека SP 

Конец стека

SP для пустого стека   

Рис. 7.1. Так мы будем изображать стек.

На нашем рисунке, как обычно, стек растёт снизу-вверх, занятая часть стека закрашена. В начале работы программы, когда стек пустой, регистр SP указывает на первое слово за концом стека. Особым является случай, когда стек имеет максимальный размер 216 байт, в этом случае значение регистра SP для пустого стека равно нулю, т.е. совпадает со значением этого регистра и для полного стека, поэтому стеки максимального размера использовать не рекомендуется, так как будет затруднён контроль пустоты и переполнения стека.

Обычно для резервирования памяти под стек на языке Ассемблера описывается специальный сегмент стека. В наших предыдущих программах мы делали это таким образом:

stack segment stack

dw 64 dup (?)

stack ends

Имя сегмента стека и способ резервирования памяти может быть любым, например, можно описать такой стек:

st_1 segment stack

db 128 dup (?)

st_1 ends

То, что этот сегмент будет при выполнении программы использоваться именно как сегмент стека, указывается параметром stack директивы segment. Этот параметр является служебным словом языка Ассемблера и, вообще говоря, не должен употребляться ни в каком другом смысле. 23

В нашем последнем примере размер сегмента стека установлен в 64 слова, поэтому в начале работы регистр SP будет иметь значение 128, т.е., как мы и говорили ранее, указывает на первое слово за концом стека. Области памяти в стеке обычно не имеют имён, так как доступ к ним, как правило, производится только с использованием регистров.

Обратим здесь внимание на важное обстоятельство. Перед началом работы со стеком необходимо загрузить в регистры SS и SP требуемые значения, однако сама программа это сделать не может, т.к. при выполнении самой первой команды программы стек уже должен быть доступен (почему это так мы узнаем в нашем курсе позже, когда будем изучать механизм прерываний). Поэтому в рассмотренных выше примерах программ мы сами не загружали в регистры SS и SP никаких начальных значений. Как мы узнаем позже, перед началом выполнения нашей программы этим регистрам присвоит значения специальная системная программа загрузчик, которая размещает нашу программу в памяти и передаёт управление на команду, помеченную той меткой, которая указана в конце нашего модуля в качестве параметра директивы end. Разумеется, позже при работе программы мы и сами можем загрузить в регистр SS новое значение, это будет переключением на другой сегмент стека.

Рассмотрим сначала те команды работы со стеком, которые не являются командами перехода. Команда

push op1

где op1 может иметь форматы r16, m16, CS,DS,SS,ES, записывает в стек слово, определяемое своим операндом. Это команда выполняется по правилу:

SP := (SP – 2)mod 216 ; <SS,SP> := op1

Здесь запись <SS,SP> обозначает адрес в стеке, вычисляемый по формуле

Афиз = (SS*16 + SP)mod 220 .  

Особым случаем является команда

push SP

В младших моделях нашего семейства она выполняется, как описано выше, а в старших – по схеме

<SS,SP> := SP; SP := (SP – 2)mod 216

Следовательно, если мы хотим, чтобы наша программа правильно работала на всех моделях семейства, надо с осторожностью использовать в программе команду  push SP .

Команда

pop op1

где op1 может иметь форматы r16, m16, SS, DS, ES, читает из стека слово и записывает его в место памяти, определяемое своим операндом. Это команда выполняется по правилу:

op1 := <SS,SP>; SP := (SP + 2)mod 216

Команда

pushf

записывает в стек регистр флагов FLAGS, а команда

popf

наоборот, читает из стека слово и записывает его в регистр флагов FLAGS. Эти команды удобны для сохранения в стеке и восстановления значения регистра флагов.

В старших моделях нашего семейства появились две новые удобные команды работы со стеком. Команда

pusha

последовательно записывает в стек регистры AX,CX,DX,BX,SP (этот регистр записывается до его изменения), BP,SI и DI. Команда

popa

последовательно считывает из стека и записывает значения в эти же регистры (но, естественно, в обратном порядке). Эти команды предназначены для сохранения в стеке и восстановления значений сразу всех этих регистров.

Команды записи в стек не проверяют того, что стек уже полон, для надёжного программирования это должен делать сам программист. Например, для проверки того, что стек уже полон, и писать в него нельзя, можно использовать команду сравнения

cmp SP,0; стек уже полон ? 

и выполнить условный переход, если регистр SP равен нулю. Особым случаем здесь будет стек максимального размера 216 байт, для него значение регистра SP=0 как для полного, так и для пустого стека (обязательно понять это!), поэтому не рекомендуется использовать стек максимального размера.

Аналогично для проверки того, что стек уже пуст, и читать из него нельзя, следует использовать команду сравнения

cmp SP,K; стек пуст ?

где Kчётное число – размер стека в байтах. Если размер стека в байтах нечётный, то стек полон при SP=1, т.е. в общем случае необходима проверка SP<2. Обычно избегают задавать стеки нечётной длины, для них труднее проверить и пустоту стека.

В качестве примера использования стека рассмотрим программу для решения следующей задачи. Необходимо вводить целые беззнаковые числа до тех пор, пока не будет введено число ноль (признак конца ввода). Затем следует вывести в обратном порядке то из введённых чисел, которые принадлежат диапазону [2..100] (сделаем спецификацию, что таких чисел может быть не более 300). Ниже приведено возможное решение этой задачи.

include io.asm

st segment stack

db 128 dup (?); это для системных нужд

dw 300 dup (?); это для хранения наших чисел

st ends

code segment

assume cs:code,ds:code,ss:st

T1 db ′Вводите числа до нуля$′

T2 db ′Числа в обратном порядке:′,10,13,′$′

T3 db ′Ошибка – много чисел!′,10,13,′$′

program_start:

mov ax,code

mov ds,ax

mov dx, offset T1; Приглашение к вводу

outstr

newline

sub cx,cx; хороший способ для cx:=0

L: inint ax

cmp ax,0; проверка конца ввода

je Pech; на вывод результата

cmp ax,2

jb L

cmp ax,100

ja L; проверка диапазона

cmp cx,300; в стеке уже 300 чисел ?

je Err

push ax; запись числа в стек

inc cx; счетчик количества чисел в стеке

jmp L

Pech: jcxz Kon; нет чисел в стеке

mov dx, offset T2

outstr

L1: pop ax

outword ax,10; ширина поля вывода=10

loop L1

Kon: finish

Err: mov dx,T3

outstr

finish

code ends

end program_start

Заметим, что в нашей программе нет собственно переменных, а только строковые константы, поэтому мы не описали отдельный сегмент данных, а разместили эти строковые константы в кодовом сегменте. Можно считать, что сегменты данных и кода в нашей программе совмещены. Мы разместили строковые константы в начале сегмента кода, перед входной точкой программы, но с таким же успехом можно разместить эти строки и в конце кодового сегмента после последней макрокоманды finish.

Обратите внимание, как мы выбрали размер стека: 128 байт мы зарезервировали для системных нужд (как уже упоминалось, стеком будут пользоваться и другие программы, подробнее об этом будет рассказано далее) и 300 слов мы отвели для хранения введённых нами чисел. При реализации этой программы может возникнуть желание определять, что введено слишком много чисел, анализируя переполнение стека. Другими словами, вместо проверки

cmp cx,300; в стеке уже 300 чисел ?

je Err

казалось бы, можно было поставить проверку исчерпания стека

cmp SP,2; стек уже полон ?

jb Err

Это, однако, может повлечь за собой тяжёлую ошибку. Дело в том, что в стеке может остаться совсем мало места, а, как мы знаем, стек использует не только наша, но и другие программы, которые в этом случае будут работать неправильно.

Теперь, после того, как мы научились работать со стеком, вернёмся к дальнейшему рассмотрению команд перехода.

7.8. Команды вызова процедуры и возврата из процедуры

Команды вызова процедуры по-другому называются командами перехода с возвратом, что более правильно, так как их можно использовать и без процедур. По своей сути это команды безусловного перехода, которые перед передачей управления в другое место программы запоминают в стеке адрес следующей за ними команды. На языке Ассемблера эти команды имеют следующий вид:

call op1

где op1 может иметь следующие форматы: i16, r16, m16, m32 и i32. Как видим, по сравнению с командой безусловного перехода здесь не реализован только близкий короткий относительный переход  сall i8 , он практически бесполезен в практике программирования, так как почти всегда тело процедуры находится достаточно далеко от точки вызова этой процедуры. Таким образом, как и команды безусловного перехода, команды вызова процедуры бывают близкими (внутрисегментными) и дальними (межсегментными). Близкий вызов процедуры выполняется по следующей схеме:

Встек(IP); jmp op1

Здесь запись Встек(IP)обозначает действие "записать значение регистра IP в стек". Заметим, что отдельной команды  push IP  в языке машины нет. Дальний вызов процедуры выполняется по схеме:

Встек(CS); Встек(IP); jmp op1

Для возврата на команду программы, адрес которой находится на вершине стека, предназначена команда возврата из процедуры, по сути, это тоже команда безусловного перехода. Команда возврата из процедуры имеет следующий формат:

ret [i16]; Параметр может быть опущен

На языке машины у этой команды есть две модификации, отличающиеся кодами операций: близкий и дальний возврат из процедуры. Нужный код операции выбирается программой Ассемблера автоматически, по контексту использования команды возврата, о чём мы будем говорить далее. Если программист опускает параметр этой команды i16, то Ассемблер автоматически полагает i16=0.

Команда близкого возврата из процедуры выполняется по схеме:

Изстека(IP); SP:=(SP+i16)mod 216

Здесь, по аналогии с командой вызова процедуры, запись Изстека(IP)обозначает операцию "считать из стека слово и записать его в регистр IP".

Команда дальнего возврата из процедуры выполняется по схеме:

Изстека(IP); Изстека(CS); SP:=(SP+i16)mod 216 

Действие SP:=(SP+i16)mod 216 приводит к тому, что указатель вершины стека SP устанавливается на некоторое другое место в стеке. В большинстве случаев этот операнд имеет смысл только для чётных i16>0 и SP+i16<=K, где K – размер стека. В этом случае из стека удаляются i16 div 2 слов, что можно трактовать как очистку стека от данного количества слов (уничтожение соответствующего числа локальных переменных). Возможность очистки стека, как мы увидим, будет весьма полезной при программировании процедур на Ассемблере.

7.9. Программирование процедур на Ассемблере

В языке Ассемблера есть понятие процедуры – это участок программы, который начинается директивой

<имя процедуры> proc [<спецификация процедуры>]

и заканчивается директивой

<имя процедуры> endp

Вложенность процедур, в отличие от языка Паскаль, не допускается. Имя процедуры имеет тип метки, хотя за ним и не стоит двоеточие. Вызов процедуры обычно производится командой call, а возврат из процедуры – командой ret.

Спецификация процедуры – это константа –2 (этой служебной константе в Ассемблере присвоено имя far) или –1 (этой служебной константе в Ассемблере присвоено имя near).24 Если спецификация опущена, то имеется в виду ближняя (near) процедура. Спецификация процедуры – это единственный способ повлиять на выбор Ассемблером конкретного кода операции для команды возврата ret внутри этой процедуры: для близкой процедуры это близкий возврат, а для дальней – дальний возврат. Отметим, что для команды ret, расположенной вне процедуры Ассемблером выбирается ближний возврат.

Изучение программирования процедур на Ассемблере начнём со следующей простой задачи: пусть надо ввести массивы X и У знаковых целых чисел, массив X содержит 100 чисел, а массив Y содержит 200 чисел. Затем необходимо вычислить величину

Будем предполагать, что массивы находятся в одном сегменте данных, а переполнение результата при сложении будем для простоты игнорировать (не выдавать диагностику). Для данной программы естественно реализовать процедуру суммирования элементов массива и дважды вызывать эту процедуру для массивов X и Y. Текст нашей процедуры мы, как и в Паскале, будем располагать перед текстом основной программы (начало программы, как мы знаем, помечено меткой, указанной в директиве end нашего модуля).

Заметим, что, вообще говоря, мы будем писать функцию, но в языке Ассемблера различия между процедурой и функцией не синтаксическое, а чисто семантическое, т.е. о том, что это функция, а не процедура, знает программист, но не программа Ассемблера, поэтому далее мы часто будем использовать обобщённый термин процедура.

Перед тем, как писать процедуру, необходимо составить соглашение о связях между основной программой и процедурой.25 Это соглашение включает в себя способ передачи параметров, возврата результата работы и некоторую другую информацию. Так, мы "договоримся" с процедурой, что суммируемый массив слов будет располагаться в сегменте данных, адрес первого элемента перед вызовом процедуры будет записан в регистр bx, а количество элементов – в регистр cx. Сумма элементов массива при возврате из процедуры должна находится в регистре ax. При этих соглашениях о связях у нас получится следующая программа (для простоты вместо команд для ввода массивов вы указали только комментарий).

include io.asm

data  segment

X dw 100 dup(?)

Y dw 200 dup(?)

Sum dw ?

data ends

stack segment stack

dw 64 dup (?)

stack ends

code segment

assume cs:code,ds:data,ss:stack

Summa proc

; соглашение о связях: bx – адрес первого элемента

; cx=количество элементов, ax – ответ (сумма)

sub ax,ax; сумма:=0

L: add ax,[bx]

add bx,2

loop L

ret

Summa endp

start:mov ax,data

mov ds,ax

; здесь команды для ввода массивов X и У

mov bx, offset X; адрес начала X

mov cx,100; число элементов в X

call Summa

mov Sum,ax; сумма массива X

mov bx, offset Y; адрес начала Y

mov cx,200; число элементов в Y

call Summa

add Sum,ax; сумма массивов X и Y

outint Sum

newline

finish

code ends

end start

Если попытаться один к одному переписать эту программу на Турбо-Паскале, то получится примерно следующее:

Program S(input,output);

Var X: array[1..100] of integer;

Y: array[1..200] of integer;

bx: integer; Sum,cx,ax: integer;

Procedure Summa;

  Label L;

Begin

  ax:=0;

L: ax := ax + bx; bx:=bx+2; {так в Паскале нельзя}

  dec(cx); if cx<>0 then goto L

End;

Begin {Ввод массивов X и Y}

cx:=100; bx:=X[1]; {так в Паскале нельзя} 26

Summa; Sum:=ax;

cx:=200; bx:=Y[1]; {так в Паскале нельзя}

Summa; Sum:=Sum+ax; Writeln(Sum)

End.

Как видим, это очень плохой стиль программирования, так как неявными параметрами процедуры являются глобальные переменные. Решая эту задачу на Паскале, мы бы написали, например, такую программу:

Program S(input,output);

Type  Mas= array[1..N] of integer;

    {так в Паскале нельзя, N – не константа}

Var   X,Y: Mas;

Sum: integer;

Function Summa(Var A: Mas, N: integer): integer;

  Var i,S: integer;

Begin S:=0; for i:=1 to N do S:=S+A[i]; Summa:=S End;

Begin {Ввод массивов X и Y}

Sum:=Summa(X,100); Sum:=Sum+Summa(Y,200); Writeln(Sum)

End.

Однако для того, чтобы так же хорошо писать на Ассемблере, нам понадобятся другие соглашения о связях между процедурой и основной программой. Вспомним, что хорошо написанная процедура в языке Паскаль получает все свои аргументы как фактические параметры и не использует имён глобальных переменных. При программировании процедур на языке Ассемблера мы будем использовать так называемые стандартные соглашения о связях.

7.9.1. Стандартные соглашения о связях

Сначала поймём необходимость существования некоторых стандартных соглашений о связях между процедурой и основной программой. Действительно, иногда программист просто не сможет "договориться", например, с процедурой, как она должна принимать свои параметры. В качестве первого примера можно привести так называемые библиотеки стандартных процедур. В этих библиотеках собраны готовые процедуры, реализующие алгоритмы для некоторой предметной области (например, для работы с матрицами). Такие библиотеки обычно поставляется в виде набора так называемых объектных модулей, что исключает возможность вносить изменения в исходный текст этих процедур (с объектными модулями мы познакомимся далее в нашем курсе).

Другим примером является написание частей программы на нескольких языках программирования, при этом чаще всего основная программа пишется на некотором языке высокого уровня (Фортране, Паскале, С и т.д.), а процедура – на Ассемблере. Вспомним, что когда мы говорили об областях применения Ассемблера, то одной из таких областей и было написание процедур, которые вызываются из программ на языках высокого уровня. Например, для языка Турбо-Паскаль такая, как говорят, внешняя, функция может быть описана следующим образом:

Function Summa(Var A: Mas, N: integer): integer;

External;

Служебное слово External является указанием на то, что эта функция описана не в данной программе и Паскаль-машина должна вызвать эту внешнюю функцию, как-то передать ей параметры и получить результат работы функции. Если программист пишет эту функцию на Ассемблере, то он конечно никак не может "договориться" с Паскаль-машиной, как он хочет получать параметры и возвращать результат работы своей функции.

Именно для таких случаев и разработаны стандартные соглашения о связях. При этом если процедура или функция, написанная на Ассемблере, соблюдает эти стандартные соглашения о связях, то это гарантирует, что эту процедуру или функцию можно будет вызывать из программы, написанной на другом языке программирования, если в нём тоже соблюдаются такие же стандартные соглашения о связях.

Рассмотрим типичные стандартные соглашения о связях, обычно они включают следующие пункты.

  1. Фактические параметры перед вызовом процедуры или функции записываются в стек.27 При передаче параметра по значению в стек записывается это значение, а в случае передачи параметра по ссылке в стек записывается адрес начала фактического параметра.28 Порядок записи фактических параметров в стек может быть прямым (сначала записывается первый параметр, потом второй и т.д.) или обратным (когда, наоборот, сначала записывается последний параметр, потом предпоследний и т.д.). В разных языках программирования этот порядок различный. Так, в языке С это обратный порядок, а в большинстве других языков программирования высокого уровня – прямой. 29
  2. Если в процедуре или функции необходимы локальные переменные, то место им отводится в стеке. Обычно это делается путём увеличения размера стека, для чего, как мы уже знаем, надо уменьшить значение регистра SP на число байт, которые занимают эти локальные переменные.
  3. Функция возвращает своё значение в регистрах al, ax или в паре регистров <dx,ax>, в зависимости от величины этого значения. Для возврата значений, превышающих двойное слово, устанавливаются специальные соглашения.
  4. Если в процедуре или функции изменяются регистры, то в начале работы необходимо запомнить значения этих регистров в локальных переменных, а перед возвратом – восстановить эти значения (для функции, естественно, не запоминаются и не восстанавливаются регистр(ы), на котором(ых) возвращается результат её работы). Обычно также не запоминаются и не восстанавливаются регистры для работы с вещественными числами.
  5. Перед возвратом из процедуры и функции стек очищается от всех локальных переменных, в том числе и от фактических параметров (вспомним, что в языке Паскаль формальные параметры, в которые передаются соответствующие им фактические параметры, тоже являются локальными переменными процедур и функций!).

Участок стека, в котором процедура или функция размещает свои локальные переменные (в частности, фактические параметры) называется стековым кадром (stack frame). Стековый кадр начинает строить основная программа перед вызовом процедуры или функции, помещая туда фактические параметры. Затем команда передачи управления с возвратом call помещает в стек адрес возврата (это одно слово для близкой процедуры и два – для дальней). Далее уже сама процедура или функция продолжает построение стекового кадра, размещая в нём свои локальные переменные.

Заметим, что если построением стекового кадра занимаются как основная программа, так и процедура (функция), то полностью разрушить стековый кадр должна процедура (функция), так что при возврате в основную программу стековый кадр будет уже уничтожен.30

Перепишем теперь нашу последнюю программу с использованием стандартного соглашения о связях. Будем предполагать, что передаваемый по ссылке адрес фактического параметра-массива занимает одно слово (т.е. является смещением в сегменте данных). Для хранения стекового кадра (локальных переменных функции) зарезервируем в стеке 32 слова. Ниже показано возможное решение этой задачи.

include io.asm

data  segment

X dw 100 dup(?)

Y dw 200 dup(?)

Sum dw ?

data ends

stack segment stack

dw 64 dup (?); для системных нужд

dw 32 dup (?); для стекового кадра

stack ends

code segment

assume cs:code,ds:data,ss:stack

Summa proc  near

; стандартные соглашение о связях

push bp

mov bp,sp; база стекового кадра

push bx

push ax

push cx;  запоминание регистров

sub sp,2;  порождение локальной переменной

S equ word ptr [bp-8]

; имя S будет эквивалентным адресу локальной переменной

mov cx,[bp+4]; cx:=длина массива

mov bx,[bp+6]; bx:=адрес первого элемента

mov S,0; сумма:=0

L: mov ax,[bx];сложение двумя командами,

add S,ax;   так как нет формета память-память

add bx,2

loop L

mov ax,S; результат функции

add sp,2; уничтожение локальной переменной

pop cx

pop ax

pop bx

pop bp; восстановление регистров cx, bx и bp

ret 2*2

; возврат с очисткой стека от фактических параметров

Summa endp

start:mov ax,data

mov ds,ax

; здесь команды для ввода массивов X и У

mov ax, offset X; адрес начала X

push ax; первый фактический параметр

mov ax,100

push ax; второй фактический параметр

call Summa

mov Sum,ax; сумма массива X

mov ax, offset Y; адрес начала Y

push ax; первый фактический параметр

mov ax,200

push ax; второй фактический параметр

call Summa

add Sum,ax; сумма массивов X и Y

outint Sum

newline

finish

code ends

end start

Подробно прокомментируем эту программу. Первый параметр функции у нас передаётся по ссылке, а второй – по значению. После выполнения команды вызова процедуры  call Summa  стековый кадр имеет вид, показанный на рис. 7.2. После полного формирования стековый кадр будет иметь вид, показанный на рис. 7.3.

Начало стека SS 

Вершина стека SP 

Начало стекового кадра

Адрес возврата

Число элементов N

Адрес начала массива

Рис. 7.2. Вид стекового кадра при входе в функцию Summa.

Начало стека SS 

Вершина стека SP 

База стекового кадра bp 

Начало стекового кадра

Локальная переменная S

bp-8

Значение регистра cx

bp-6

Значение регистра ax

bp-4

Значение регистра bx

bp-2

Значение регистра bp

bp+0

Адрес возврата

bp+2

Число элементов N

bp+4

Адрес начала массива

bp+6

Рис. 7.3. Вид полного стекового кадра (справа показаны смещения слов кадра относительно значения регистра bp).

Сначала отметим особое значение, которое имеет индексный регистр bp при работе со стеком. В архитектуре нашего компьютера это единственный индексный регистр, который предписывает по умолчанию осуществлять запись и чтение данных из сегмента стека. Так команда нашей программы

mov cx,[bp+4]; cx:=длина массива

читает в регистр cx слово, которое расположено по физическому адресу

Афиз = (SS*16 + (4 + <bp>)mod 216)mod 220,

а не по адресу

Афиз = (DS*16 + (4 + <bp>)mod 216)mod 220,

как происходит при использовании на месте bp любого другого индексного регистра, т.е. bx, si или di.

Таким образом, если установить регистр bp внутрь стекового кадра, то его легко использовать для доступа к локальным переменным процедуры или функции. Так мы и поступили в нашей программе, поставив регистр bp примерно на средину стекового кадра. Теперь, отсчитывая смещения от регистра bp вниз, например [bp+4], мы получаем доступ к фактическим параметрам, а, отсчитывая смещение вверх – доступ к сохранённым значениям регистров и локальной переменной, например [bp-8]это адрес локальной переменной, которую в программе на Паскале мы назвали именем S (см. рис. 7.3).

Обратите внимание, что локальные переменные в стековом кадре не имеют имён, что может быть не совсем удобно. В нашем примере мы присвоили локальной переменной имя S при помощи директивы эквивалентности

S equ word ptr [bp-8]

И теперь всюду вместо имени S Ассемблер будет подставлять выражение word ptr [bp-8], которое имеет, как нам и нужно, тип слова. Для порождение этой локальной переменной мы отвели ей место в стеке с помощью команды

sub sp,2;  порождение локальной переменной

т.е. просто уменьшили значение регистра-указателя вершины стека на два байта. Этой же цели можно было бы достичь, например, более короткой (но менее понятной для нашей цели) командой

push ax;  порождение локальной переменной

Перед возвратом из функции мы начали разрушение стекового кадра, как этого требуют стандартные соглашения о связях. Сначала командой

add sp,2; уничтожение локальной переменной

мы уничтожили локальную переменную, затем восстановили из стека старые значения регистров cx, bx и bp (заметьте, что регистр bp нам больше не понадобится в нашей функции). И, наконец, команда возврата

ret 2*2; возврат с очисткой стека

удаляет из стека адрес возврата и значение двух слов – фактических параметров функции. Уничтожение стекового кадра завершено.

Продолжение изучения стандартных соглашений о связях мы начнём со следующего замечания. В различных системах программирования стандартные соглашения о связях могут несколько различаться. Например, результат значения функции может возвращаться не на регистре ax, как в нашем последнем примере, а на вершине стека. В этом случае функция должна запоминать и восстанавливать регистр ax наравне с другими регистрами, а полное разрушение стекового кадра будет производить основная программа путем чтения результата работы функции из стека.

Важной особенностью использования стандартных соглашений о связях является и то, что они позволяют производить рекурсивный вызов процедур и функций, причём рекурсивный и не рекурсивный вызовы "по внешнему виду" не отличаются друг от друга. В качестве примера рассмотрим реализацию функции вычисления факториала от неотрицательного целого числа, при этом будем предполагать, что значение факториала поместится в слово. На языке Турбо-Паскаль эта функция имеет следующий вид:

Function Factorial(N: word): word;

Begin 

  if N<=1 then Factorial:=1

  else Factorial:=N*Factorial(N-1)

End;

Реализуем теперь эту функцию в виде близкой процедуры на Ассемблере:

Factorial proc near; стандартные соглашение о связях

push bp

mov bp,sp; база стекового кадра

push dx

N equ word ptr [bp+4]; фактический параметр N

mov ax,1; Factorial(N<=1)

cmp N,1

jbe Vozv

mov ax,N

dec ax; N-1

push ax

call Factorial; Рекурсия

mul N; Factorial(N-1)*N

Vozv: pop dx

pop bp

ret 2

Factorial endp

Начало стека SS

Вершина стека SP 

Начало второго кадра

Конец первого кадра

Начало первого кадра

Значение регистра dx

Значение регистра bp

Адрес возврата

N=4

Значение регистра dx

Значение регистра bp

Адрес возврата

N=5

Рис. 7.4. Два стековых кадра функции Factorial.

Рассмотрим вызов этой функции Factorial для вычисления факториала числа 5. Такой вызов можно в основной программе сделать, например, следующими командами:

mov ax,5

push ax

call Factorial

outword ax

На рис. 7.4 показан вид стека, когда произведён первый рекурсивный вызов функции, в стеке при этом два стековых кадра.

В качестве ещё одного примера рассмотрим реализацию с помощью процедуры следующего алгоритма: задана константа N=30000, найти скалярное произведение двух массивов, содержащих по  N беззнаковых целых чисел.

На языке Паскаль это можно записать, например, следующим образом: 31

Const N=30000;

Type  Mas = array[1..N] of word;

Var   A,B: Mas; S: word;

Procedure SPR(var X,Y: Mas; N: integer; var Scal: word);

  Var i: integer;

Begin Scal:=0; for i:=1 to N do Scal:=Scal+X[i]*Y[i] end;

Перед реализацией этой процедуры SPR на Ассемблере (со стандартными соглашениями о связях) необходимо решить следующие вопросы. Во-первых, сделаем нашу процедуру дальней, чтобы она могла располагаться в любом сегменте памяти нашей программы. Во-вторых, массивы A и B оба не поместятся в один сегмент данных, поэтому нам придётся описать два сегмента данных и поместить в один из них массив A, а в другой сегмент – массив B:

N equ 30000

D1 segment

A dw N dup (?)

S dw ?

D1 ends

D2 segment

B dw N dup (?)

D2 ends

При передаче таких массивов по ссылке нам придётся заносить в стек дальний адрес каждого массива в виде двух чисел <сегмент,смещение>. То же самое придётся делать и для передаваемой по ссылке переменной S, куда будет помещаться вычисленное значение скалярного произведения. Далее надо решить, как информировать обратившуюся к процедуре основную программу о том, что скалярное произведение не может быть получено правильно, так как не помещается в переменную S. Давайте, например, выделим значение 216-1 (это знаковое число –1) для случая переполнения результата. Эта проблема является типичной в практике программирования: желательно, чтобы каждая процедура и функция выдавали код возврата, который показывает, правильно ли завершилась работа. Таким образом, значение –1 свидетельствует об ошибке, а все остальные значения переменной S будут означать правильное завершение работы нашей процедуры (т.е. правильное значение скалярного произведение, равное 216-1 мы тоже, к сожалению, объявим ошибочным).

Напишем теперь фрагмент программы для вызова процедуры скалярного произведения:

mov ax,D1

push ax

mov ax,offset A

push ax; Полный адрес массива A

mov ax,D2

push ax

mov ax,offset B

push ax; Полный адрес массива B

mov ax,N

push ax; Длина массивов

mov ax,D1

push ax

mov ax,offset S

push ax; Полный адрес S

call SPR

Для такого вызова при входе в процедуру стековый кадр будет иметь вид, показанный на рис. 7.5.

Вершина стека SP 

Начало стекового кадра

IP адреса возврата

CS адреса возврата

Адрес S в D1

Адрес сегмента D1

Число элементов N

Адрес массива B в D2

Адрес сегмента D2

Адрес массива A в D1

Начало стекового кадра

Адрес сегмента D1

Рис. 7.5. Стековый кадр при входе в процедуру скалярного произведения.

Теперь опишем нашу дальнюю процедуру:

SPR proc far

push bp; база стекового

mov bp,sp; кадра

; сохранение остальных регистров

push ds

push es

.186

pusha ;в стек ax,cx,dx,bx,sp,bp,si,di

sub bx,bx; локальная сумма

mov cx,[bp+10]; Выбор N

mov ds,[bp+18]; Сегмент D1

mov si,[bp+16]; Адрес A

mov es,[bp+14]; Сегмент D2

mov di,[bp+12]; Адрес B

L: mov ax,[si]; A[i]

mul word ptr es:[di]; A[i]*B[i]

jc Err; при переполнении

add bx,ax

jc Err; при переполнении

add di,2

add si,2

loop L

Vozv: mov ds,[bp+8]; Сегмент D1

mov si,[bp+6]; Адрес S

mov [si],bx; Результат в S

; восстановление регистров

popa ;из стека ax,cx,dx,bx,sp,bp,si,di

pop es

pop ds

pop bp

ret 2*7; Очистка 7 слов из стека

Err: mov bx,-1;Код ошибки

jmp Vozv

SPR endp

В этом примере для экономии текста программы мы использовали команды  pusha  и  popa  из языка команд старшей модели нашего семейства ЭВМ, о чём предупредили Ассемблер директивой .186 .

На этом мы закончим изучение процедур в языке Ассемблера.

8. Система прерываний.

Далее мы продолжим изучение переходов. Как мы уже упоминали, некоторые переходы производятся не при выполнении команд, а могут делаться центральным процессором автоматически при возникновении определённых условий. Если компьютер обладает такими способностями, то говорят, что в этом компьютере реализована система прерываний. Все современные компьютеры имеют систему прерываний, и сейчас мы начнём изучать, что это такое.

Сначала введём понятие события (возникшей ситуации). События могут возникать как в центральном процессоре (например, деление на ноль, попытка выполнить машинную команду с несуществующим кодом операции, выполнение некоторых особых команд и т.д.), так и в периферийных (xa trung tam) устройствах (например, нажата кнопка мыши, на печатающем устройстве кончилась бумага, получен сигнал по линиям связи и др.). Ясно, что при возникновении события продолжать выполнение программы может быть либо бессмысленно (деление на ноль), либо нежелательно, так как нужно срочно предпринять какие-то действия, для выполнения которых текущая программа просто не предназначена (например, надо отреагировать на нажатие кнопки мыши, на сигнал от встроенного таймера и т.д.).

В архитектуре компьютера предусмотрено, что каждое устройство, в котором произошло событие (центральный процессор, память, устройства ввода/вывода) генерирует сигнал прерывания – электрический импульс, который приходит на специальную электронную схему центрального процессора. Сигнал прерывания, связанный с каждым из событий, имеет свой номер, чтобы отличить его от сигналов, связанных с другими событиями. По месту возникновения сигналы прерывания бывают внутренними (в центральном процессоре) и внешними (в периферийных устройствах).

Получив такой сигнал, центральный процессор автоматически предпринимает некоторые действия, которые называются аппаратной реакцией на сигнал прерывания. Надо сказать, что, хотя такая реакция, конечно, сильно зависит от архитектуры компьютера, всё же можно указать какие-то общие черты, присущие (von co) всем ЭВМ. Сейчас мы рассмотрим, что обычно входит в аппаратную реакцию центрального процессора на сигнал прерывания.

Сначала надо сказать, что центральный процессор "смотрит", пришел ли сигнал прерывания, только после выполнения очередной команды, таким образом, этот сигнал ждёт завершения текущей команды.32 Исключением из этого правила являются команды halt и wait. Команда halt останавливает выборку команд центральным процессором, и только сигнал прерывания может вывести компьютер из этого "ничегонеделания". Команда wait в младшей модели нашего семейства ждёт окончания операции с вещественными числами, которые мы не рассматриваем. Кроме того, прерывание не возникает после выполнения команды-префикса программного сегмента, т.к. она существенно влияет на следующую за ней команду.

К описанному выше правилу начала аппаратной реакции на сигнал прерывания необходимо сделать существенное замечание. Дело в том, что большинство современных ЭВМ отступают от принципа фон Неймана последовательного выполнения команд. Напоминаем, что согласно этому принципу очередная команда начинала выполняться только после полного завершения текущей команды.

Современные компьютеры могут одновременно выполнять несколько команд программы (а наиболее "продвинутые" из них – даже несколько команд из разных программ). Компьютеры, обладающие такими возможностями, называются конвейерными,(nguoi mang tai) они могут одновременно выполнять до восьми и более команд. Для конвейерных ЭВМ необходимо уточнить, когда начинается аппаратная реакция на сигнал прерывания. Обычно это происходит после полного завершения любой из выполняющихся в данный момент команд. Выполнение остальных команд прерывается и в дальнейшем их необходимо повторить с начала. Понятно, что конвейерные ЭВМ весьма "болезненно" относятся к сигналам прерывания, так как при этом приходится повторять заново несколько последних частично выполненных команд прерванной программы. Несколько более подробно о конвейерных ЭВМ мы поговорим в конце нашей книги.

Итак, после окончания текущей команды центральный процессор анализирует номер сигнала прерывания (для нашего компьютера это целое беззнаковое число формата i8). Для некоторых из этих номеров сигнал прерывания игнорируется, и центральный процессор переходит к выполнению следующей команды программы. Говорят, что прерывания с такими номерами в данный момент запрещены или замаскированы(nguy trang). Для компьютера нашей архитектуры можно замаскировать некоторые прерывания от внешних устройств (кроме прерывания с номером 2), установив в ноль значение специального флага прерывания IF в регистре флагов FLAGS (это можно выполнить командой  cli ). Для компьютеров некоторых других архитектур можно замаскировать каждое прерывание по отдельности, установив в ноль соответствующий этому прерыванию бит в специальном регистре маски прерываний. Говорят, что прерывания с определёнными номерами можно закрывать (маскировать) и открывать (разрешать, снимать с них маску).

В том случае, если прерывание игнорируется (замаскировано), сигнал прерывания, тем не менее, продолжает оставаться на входе соответствующей схемы центрального процессора до тех пор, пока маскирование этого сигнала не будет снято, или же на вход центрального процессора придёт следующий сигнал прерывания. В последнем случае первый сигнал безвозвратно теряется, что может быть очень опасно, так как мы не прореагировали должным образом на некоторое событие, и оно прошло для нас незамеченным. Отсюда следует, что маскировать сигналы прерываний от внешних устройств можно только на некоторое весьма короткое время, после чего необходимо открыть возможность реакции на такие прерывания.

Разберёмся теперь, зачем вообще может понадобиться замаскировать прерывания. Дело в том, что, если произошедшее прерывание не замаскировано то, как мы вскоре увидим, центральный процессор прерывает выполнение текущей программы и переключается на выполнение некоторой в общем случае другой программы. Это может быть нежелательно и даже опасно, если текущая программа занята срочной работой, которую нельзя прерывать даже на короткое время. Например, эта программа может обрабатывать некоторое важное событие с другим номером прерывания, или же управлять каким-либо быстрым процессом во внешнем устройстве (линия связи с космическим аппаратом, химический реактор и т.д.).

С другой стороны, необходимо понять, что должны существовать и специальные немаскируемые сигналы прерывания. В качестве примера такого сигнала можно привести сигнал о неисправности (hu hong) в работе самого центрального процессора, ясно, что маскировать его бессмысленно. Другим примером может служить сигнал о том, что выключилось электрическое питание компьютера. Надо сказать, что в этом случае компьютер останавливается не мгновенно (khoanh khac, choc lat), какую-то долю(phan) секунды он ещё может работать за счёт энергии конденсаторов (cai tu dien, may tich dien) в блоке питания. Этого времени хватит на выполнение нескольких десятков или даже сотен тысяч команд и можно принять важные решения: послать сигнал тревоги, спасти ценные данные в энергонезависимой памяти (такая память называется статической), переключится на резервный блок питания и т.д. Кроме того, бессмысленно маскировать сигналы прерываний, которые выдаются при выполнении некоторых специальных команд, т.к. основным назначением этих команд и является выдача сигнала прерывания. Для нашего компьютера, как уже упоминалось, существует только одно немаскируемое прерывание от внешних устройств с номером 2.

Продолжим теперь рассмотрение аппаратной реакции на незамаскированное прерывание. Сначала центральный процессор автоматически запоминает в некоторой области памяти (обычно в текущем стеке) самую необходимую (минимальную) информацию о прерванной программе. Во многих книгах по архитектуре ЭВМ это называется малым упрятыванием(giau kin) информации о считающейся в данный момент программе, что хорошо отражает смысл такого действия. Для нашего компьютера в стек последовательно записываются значения трёх регистров центрального процессора, это регистр флагов (FLAGS), кодовый сегментный регистр (CS) и счётчик адреса (IP). Как видим, эти действия при минимальном упрятывании похожи на действия при выполнении команды перехода с возвратом call, да и назначение у них одно – обеспечить возможность возврата в прерванное место текущей программы. Из этого следует, что стек должен быть у любой программе, даже если она сама им и не пользуется.33

После выполнения минимального упрятывания центральный процессор по определённым правилам находит (вычисляет) адрес оперативной памяти, куда надо передать управление для обработки сигнала прерывания с данным номером. Говорят, что на этом месте оперативной памяти находится программа реакции (процедура обработки прерывания, обработчик) сигнала прерывания с данным номером.

Для компьютера нашей архитектуры определение адреса начала процедуры-обработчика прерывания с номером N производится по следующему правилу. В начале оперативной памяти расположен так называемый вектор прерываний – массив из 256 элементов (по числу возможных номеров прерываний от 0 до 255). Каждый элемент этого массива состоит из двух машинных слов (т.е. имеет формат m32)  и содержит дальний адрес процедуры-обработчика. Таким образом, адрес процедуры-обработчика прерывания с номером N находится в двух словах, расположенных по физическим адресам 4*N и 4*N+2. Можно сказать, что для перехода на процедуру-обработчика необходимо выполнить безусловный переход

jmp dword ptr [4*N]; IP:=[4*N], CS:=[4*N+2]

Заметим, что на самом деле это аналог дальнего перехода с возвратом, так как в стек уже занесена информация о точке возврата в прерванную программу.

Непосредственно перед переходом на процедуру-обработчика центральный процессор закрывает (маскирует) внешние прерывания, так что обработчик начинает своё выполнение в режиме запрета прерываний. Это гарантирует, что, начав свою работу, процедура-обработчик не будет тут же прервана другим сигналом прерывания. Для нашей архитектуры центральный процессор устанавливает в ноль флаги IF и TF регистра флагов. Как мы уже говорили, значение флага IF=0 маскирует все прерывания от внешних устройств, кроме прерывания с номером 2. Флаг TF устанавливается равным нулю потому, что при значении TF=1 центральный процессор всегда посылает сам себе сигнал прерывания с номером N=1 после выполнения каждой команды. Этот флаг используется для пошагового выполнения (трассировки) программы, Вы будете изучать эту тему в курсе "Системное программное обеспечение".

На этом аппаратная реакция на незамаскированное прерывание заканчивается. Заметим, что некоторым аналогом аппаратной реакции ЭВМ на прерывание в живой природе является безусловный рефлекс. Безусловный рефлекс позволяет живому существу "автоматически" (а, следовательно, быстро, "не раздумывая") реагировать на произошедшее событие. Например, если человек обжигает пальцы на огне, то сначала он автоматически отдёргивает руку, а лишь потом начинает разбираться, что же произошло. Так и компьютер по сигналу прерывания автоматически "не раздумывая" переключается на процедуру-обработчика этого сигнала.

Итак, после завершения аппаратной реакции на незамаскированный сигнал прерывания начинает работать процедура-обработчик прерывания с данным номером, эта процедура выполняет программную реакцию на прерывание. Аналогом программной реакции на прерывание в живой природе можно считать условный рефлекс. Как у живого организма можно выработать условный рефлекс на некоторый внешний раздражитель, так и компьютер можно "научить", как реагировать на то или иное событие, написав процедуру-обработчика сигнала прерывания с номером, соответствующим этому событию.

Рассмотрим теперь схему работы процедуры-обработчика прерывания. Напомним, что эта процедура начинает выполняться в режиме с закрытыми прерываниями от внешних устройств. Как мы говорили выше, долго работать в таком режиме очень опасно, и следует как можно скорее разрешить (открыть) прерывания, для нашего компьютера это установка в единицу флаг IF (это можно выполнить командой  sti )

Действия, выполняемые в режиме с закрытыми прерываниями, обычно называются минимальной программной реакцией на прерывание. Как правило, минимальная программная реакция включает в себя следующие действия.

  1. Для прерванной программы запоминается вся информация, необходимая для возврата в эту программу. Это все адресуемые регистры (в том числе сегментные регистры и регистры для работы с вещественными числами), а также некоторые системные регистры (последнее сильно зависит от архитектуры конкретного компьютера). Вся эта информация запоминается в специальной области памяти, связанной с прерванной программой, обычно это область памяти называется информационным полем программы или контекстов программы. 34
  2. Выполняются самые необходимые действия, связанные с произошедшим событием. Например, если нажата или отпущена клавиша на клавиатуре, то это надо где-то зафиксировать (например, запомнить в очереди введённых с клавиатуры символов). Если этого не сделать на этапе минимальной реакции и открыть прерывания, то процедура-обработчик может быть надолго прервана новым сигналом, который произведёт переключение на какую-то другую процедуру-обработчика, за время работы которой уже может быть нажата другая клавиша, а информация о нажатой ранее клавише таким образом будет потеряна.

После выполнения минимальной программной реакции процедура-обработчик включает (разрешает) прерывания – в нашей архитектуре устанавливает IF=1. Далее производится полная программная реакция на прерывания, т.е. процедура-обработчик выполняет все необходимые действия, связанные с происшедшим событием. Вообще говоря, допускается, что на этом этапе наша процедура-обработчик может быть прервана другим сигналом прерывания.35 В этом случае процедура-обработчик должна при каждом входе в неё резервировать память под свой контекст, где будут запоминаться данные, необходимые для возврата в эту процедуру.

Закончив полную обработку сигнала прерывания, процедура-обработчик должна вернуть управление программе, прерванной последним сигналом прерывания.36 Для этого сначала необходимо из контекста прерванной программы восстановить значение всех её регистров (кроме регистров FLAGS, CS и IP). После этого надо произвести возврат на следующую команду прерванной программы, для чего в нашем компьютере можно использовать специальную команду языка машины – команду выхода из прерывания

iret

Эта команда без параметров выполняется по схеме:

Изстека(IP); Изстека(CS); Изстека(FLAGS)

Напомним, что уже восстановлены регистры SS и IP прерванной программы, т.е. из её стека можно читать.

В Таблице 8.1 изображено начало вектора прерываний для компьютера изучаемой нами архитектуры.

Таблица 8.1. Начало вектора прерываний

Номер

Описание события

N=0

Ошибка в команде деления

N=1

Установлен флаг TF=1

N=2

Немаскируемое внешнее прерывание

N=3

Выполнена команда int

N=4

Выполнена команда into и OF=1

N=5

. . .

N=6

Команда с плохим кодом операции

. . .

Продолжим теперь изучение переходов, вызванных командами прерываний, выполнение каждой такой команды в нашей архитектуре всегда вызывает прерывание (исключением является команда  into , которую бы рассмотрим далее). Каждая команда прерывания реализует дальний косвенный переход (понять это!).

Сначала рассмотрим команды, о которых упоминается в Таблице 8.1. Команда  int  является самой короткой (длиной в один байт) командой, которая всегда вызывает прерывание с номером N=3. В основном эта команда используется при работе отладчика (sua loi kiem tra)– специальной программы, облегчающей программисту разработку новых программ. Отладчик ставит в программный код отлаживаемой программы так называемые контрольные точки – это те места, в которых отлаживаемая программа должна передать управление программе-отладчику. Для такой передачи хорошо подходит команда  int , если программа-отладчик реализована в виде обработчика прерывания с номером N=3. Более подробно с работой отладчика Вы будете знакомиться в курсе следующего семестра "Системное программное обеспечение".

Команда  into  реализует условное прерывание: при выполнении этой команды прерывание происходит только в том случае, если флаг OF=1, иначе продолжается последовательное выполнение программы. Основное назначение команды  into  – эффективно реализовать надёжное программирование при обработке целых знаковых чисел. Как мы знаем, при выполнении операций сложения и вычитания со знаковыми числами возможна ошибка, при этом флаг переполнения устанавливается в единицу. Кроме того, вспомним, что флаг переполнения устанавливается в единицу и при операциях умножения, если значащие биты результата попадают в старшую часть произведения.

При надёжном программировании проверку флага переполнения необходимо ставить после каждой такой команды. Для такой проверки хорошо подходит команда  into , так как эта самая короткая (однобайтная) команда условного перехода по значению OF=1. При этом, правда, обработку аварийной ситуации должна производить процедура-обработчик прерывания с номером N=4.

Рассмотрим в качестве примера простейшую реализацию такой процедуры-обработчика прерывания. Для простоты эта процедура-обработчик будет фрагментом нашей программы и располагается в сегменте кода. При возникновении ошибки будет просто выдаваться аварийная диагностика, и продолжаться выполнение нашей программы (естественно, с неверным результатом). Заметим, что наш обработчик прерывания не является процедурой в смысле языка Ассемблер.

include io.asm

data  segment

A dw ?

X dw 

Old dw ?

 Dw ?

Diagn db ′Ошибка – большое значение!$′

Data ends

st segment stack

dw 64 dup (?)

st ends

code segment

assume cs:code, ds:data, ss:st

start:mov ax,data

mov ds,ax

; инициализация обработчика into

mov ax,0

mov es,ax; es - на вектор прерываний

My_into equ word ptr es:[4*4]

; сохранения адреса старой процедуры into

mov ax,My_into

mov Old,ax

mov ax,My_into+2

mov Old+2,ax;

; занесение нового адреса процедуры into

cli ; Закрыть прерывания

mov My_into,offset Error; Начало

mov My_into+2,code; процедуры-обработчика

sti Открыть прерывания

; собственно начало программы

mov ax,data

mov ds,ax

inint A

inint X

mov ax,A

add ax,X; Возможно переполнение

into

imul X; Возможны значащие биты в DX

into

mov X,ax; X:=X*(A+X)

outint X

; восстановление старого адреса into

Voz: cli ; Закрыть прерывания

mov ax,Old

mov My_into,ax

mov ax,Old+2

mov My_into+2,ax

sti Открыть прерывания

finish

; Начало нашей процедуры-обработчика

Error:

; Минимальная программная реакция

push ds; Сохранение регистров

push dx

push ax

sti Открыть прерывания

; Полная программная реакция

mov ax,data

mov ds,ax

mov dx,offset Diagn

outstr

newline

pop ax; Восстановление регистров

pop dx

pop ds

iret ; Возврат из прерывания

code ends

end start

Обратите внимание, что при выполнении некоторых групп команд работу нашей программы нельзя прерывать, иначе может возникнуть ситуация, когда в вектор прерывания не занесётся полностью вся необходимая информация, а уже произойдёт переключение на другую программу по пришедшему сигналу прерывания. В программировании такие группы команд называются критическими секциями программы. В нашей программе критические сеции заключены в рамки, в начале каждой критической секции стоит команда запрета прерывания от внешних устройств  cli , а в конце секции – команда открытия прерываний  sti .

После выдачи диагностики об ошибке наша процедура-обработчик может не продолжать выполнение программы, а, например, завершать выполнение программы. Для этого вместо предложения

iret ; Возврат из прерывания

надо поставить два предложения

add SP,3*2; Очистка стека от IP, CS и FLAGS

jmp Voz

И, наконец, рассмотрим команду, которая всегда вызывает прерывание с номером N, заданным в качестве её операнда:

int op1

Здесь op1 имеет формат i8. Заметим, что с помощью этой команды можно вызвать прерывание с любым номером, например прерывание, соответствующее делению на ноль или плохому коду операции. Более того, прерывания с номерами большими 31, в нашей архитектуре можно вызвать, только выполняя команду  int  с соответствующим параметром-номером прерывания. Используя эти команды, легко отлаживать процедуры-обработчики прерываний, но основное назначение таких команд состоит в другом.

Дело в том, что в большинстве программ необходимо выполнять некоторые широко распространённые действия (обмен данными с внешними устройствами, выполнение стандартных процедур и многое другое). Обычно процедуры, реализующие эти действия, оформляются в виде библиотеки стандартных процедур и всегда находятся в оперативной памяти компьютера. Так как адреса этих процедур часто меняются, то лучше всего присвоить каждой такой процедуре свой номер N и оформлять такие процедуры в виде обработчиков прерываний с этим номером. В этом случае вызов конкретной процедуры с номером N следует производить командой  int N .

Исходя из описанного выше, такие команды прерывания (а часто и соответствующие им процедуры) обычно называют системными вызовами (системными функциями оп