ли несколько процедур, определенных директивой PROC. Сегмент, содержащий только одну процедуру имеет следующий вид: имя-сегмента SEGMENT PARA имя-процедуры PROC FAR Сегмент . кода . с . одной RET процедурой Ассемблер для IBM PC. Глава 3 65 имя-процедуры ENDP имя-сегмента ENDS Имя процедуры должно обязательно присутствовать, быть уникальным и удовлетворять соглашениям по именам в ассембле ре. Операнд FAR указывает загрузчику DOS, что начало данной процедуры является точкой входа для выполнения программы. Директива ENDP определяет конец процедуры и имеет имя, аналогичное имени в директиве PROC. Команда RET завершает выполнение программы и в данном случае возвращает управление в DOS. Сегмент может содержать несколько процедур (см. гл.7). Директива ASSUME Процессор использует регистр SS для адресации стека, ркгистр DS для адресации сегмента данных и регистр CS для адресации cегмента кода. Ассемблеру необходимо сообщить назначение каждого сегмента. Для этой цели служит директива ASSUME, кодируемая в сегменте кода следующим образом: Директива Операнд ASSUME SS:имя_стека,DS:имя_с_данных,CS:имя_с_кода Например, SS:имя_стека указывает, что ассемблер должен ассоциировать имя сегмента стека с регистром SS. Операнды могут записываться в любой последовательности. Регистр ES также может присутствовать в числе операндов. Если программа не использует регистр ES, то его можно опустить или указать ES:NOTHING. Директива END Как уже показано, директива ENDS завершает сегмент, а директива ENDP завершает процедуру. Директива END в свою очередь полностью завершает всю программу: Директива Операнд END [имя_процедуры] Операнд может быть опущен, если программа не предназначе на для выполнения, например, если ассемблируются только опре деления данных, или эта программа должна быть скомпанована с другим (главным) модулем. Для обычной программы с одним модулем oперанд содержит имя, указанное в директиве PROC, которое было oбозначено как FAR. ПАМЯТЬ И РЕГИСТРЫ ------------------------------------------------------------ Рассмотрим особенности использования в командах имен, имен в квадратных скобках и чисел. В следующих примерах положим, что WORDA определяет слово в памяти: Ассемблер для IBM PC. Глава 3 66 MOV AX,BX ;Переслать содержимое BX в регистр AX MOV AX,WORDA ;Переслать содержимое WORDA в регистр AX MOV AX,[BX] ;Переслать содержимое памяти по адресу ; в регистре BX в регистр AX MOV AX,25 ;Переслать значение 25 в регистр AX MOV AX,[25] ;Переслать содержимое по смещению 25 Новым здесь является использование квадратных скобок, что потребуется в следующих главах. ИНИЦИАЛИЗАЦИЯ ПРОГРАММЫ ------------------------------------------------------------ Существует два основных типа загрузочных программ: EXE и COM. Рассмотрим требования к EXE-программам, а COM-программы будут представлены в главе 6. DOS имеет четыре требования для инициализации ассемблерной EXE-программы: 1) указать ассемблеру, какие cегментные регистры должны соответствовать сегментам, 2) сохранить в стеке адрес, находящийся в регист ре DS, когда программа начнет выполнение, 3) записать в стек нелевой адрес и 4) загрузить в регистр DS адрес сегмента данных. Выход из программы и возврат в DOS сводится к использова нию команды RET. Рис.3.1 иллюстрирует требования к инициали зации и выходу из программы: 1. ASSUME - это ассемблерная директива, которая устанавли вает для ассемблера соответствие между конкретными сегментами и сегментными регистрами; в данном случае, CODESG - CS, DATASG - DS и STACKSG - SS. DATASG и STACKSG не определены в этом примере, но они будут представлены следующим образом: STACKSG SEGMENT PARA STACK Stack 'Stack' DATASG SEGMENT PARA 'Data' Ассоциируя сегменты с сегментными регистрами, ассемблер сможет определить смещения к отдельным областям в каждом сегменте. Например, каждая команда в сегменте кодов имеет определенную длину: первая команда имеет смещение 0, и если это двухбайтовая команда, то вторая команда будет иметь смещение 2 и т.д. 2. Загрузочному модулю в памяти непосредственно предшеству ет 256-байтовая (шест.100) область, называемая префик сом программного сегмента PSP. Программа загрузчика использует регистр DS для установки адреса начальной точки PSP. Пользовательская программа должна сохранить этот адрес, поместив его в стек. Позже, команда RET использует этот адрес для возврата в DOS. Ассемблер для IBM PC. Глава 3 67 3. В системе требуется, чтобы следующее значение в стеке являлось нулевым адресом (точнее, смещением). Для этого команда SUB очищает регистр AX, вычитая его из этого же регистра AX, а команда PUSH заносит это значение в стек. 4. Загрузчик DOS устанавливает правильные адреса стека в регистре SS и сегмента кодов в регистре CS. Поскольку программа загрузчика использует регистр DS для других целей, необходимо инициализировать регистр DS двумя командами MOV, как показано на рис.3.1. В следующем разделе этой главы "Исходная программа. Пример II" детально поясняется инициализация регистра DS. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 3.1. Инициализация EXE-программы. 5. Команда RET обеспечивает выход из пользовательской программы и возврат в DOS, используя для этого адрес, записанный в стек в начале программы командой PUSH DS. Другим обычно используемым выходом является команда INT 20H. Теперь, даже если приведенная инициализация программы до конца не понятна - не отчаивайтесь. Каждая программа фактически имеет аналогичные шаги инициализации, так что их можно дублировать всякий раз при кодировании программ. ПРИМЕР ИСХОДНОЙ ПРОГРАММЫ ------------------------------------------------------------ Рис. 3.2. обобщает предыдущие сведения в простой исходной программе на ассемблере. Программа содержит сегмент стека - STACKSG и сегмент кода - CODESG. STACKSG содержит один элемент DB (определить байт), который определяет 12 копий слова 'STACKSEG'. В последующих программах стек не опpеделяется таким способом, но при использовании отладчика для просмотра ассемблированной программы на экране, данное определение помогает локализо вать стек. CODESG содержит выполняемые команды программы, хотя первая директива ASSUME не генерирует кода. Директива ASSUME назначает регистр SS для STACKSG и регистр CS для CODESG. В действительности, эта директива сообщает ассемблеру, что для адресации в STACKSG необходимо использовать адрес в регистре SS и для адресации в CODESG - адрес в регистре CS. Системный загрузчик при загрузке программы с диска в память для выполнения устанавливает действительные адреса в регистрах SS и CS. Программа не имеет сегмента данных, так как в ней нет определения данных и, соответственно, в ASSUME нет необходимости ассигновать pегистр DS. Ассемблер для IBM PC. Глава 3 68 Команды, следующие за ASSUME - PUSH, SUB и PUSH выполняют стандартные действия для инициализации стека текущим адресом в регистре DS и нулевым адресом. Поскольку, обычно, программа выполняется из DOS, то эти команды обеспечивают возврат в DOS после завершения программы. (Можно также выполнить программу из отладчика, хотя это особый случай). Последующие команды выполняют те же действия, что показаны на pис.2.1 в предыдущей главе, когда рассматривался отладчик. ОСНОВНЫЕ ПОЛОЖЕНИЯ НА ПАМЯТЬ ------------------------------------------------------------ ъ Не забывайте ставить символ "точка с запятой" перед комментариями. ъ Завершайте каждый сегмент директивой ENDS, каждую процедуру - директивой ENDP, а программу - директивой END. ъ В директиве ASSUME устанавливайте соответствия между сегментными регистрами и именами сегментов. ъ Для EXE-программ (но не для COM-программ, см. гл.6) обеспечивайте не менее 32 слов для стека, соблюдайте соглашения по инициализации стека командами PUSH, SUB и PUSH и заносите в регистр DS адрес сегмента данных. ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ ------------------------------------------------------------ 3.1. Какие команды заставляют ассемблер печатать заголовок в начале каждой страницы листинга и делать прогон листа? 3.2. Какие из следующих имен неправильны: а) PC_AT, б) $50, в) @$_Z, г) 34B7, д) AX? 3.3. Какое назначение каждого из трех сегментов, описанных в этой главе? 3.4. Что конкретно подразумевает директива END, если она завершает а) программу, б) процедуру, в) сегмент? 3.5. Укажите различия между директивой и командой. 3.6. Укажите различия в назначении RET и END. 3.7. Для сегментов кода, данных и стека даны имена CDSEG, DATSEG и STKSEG соответственно. Сформируйте директиву ASSUME. 3.8. Напишите три команды для инициализации стека адресом в DS и нулевым адресом. Ассемблер для IBM PC. Глава 4 79 ГЛАВА 4. Ассемблирование и выполнение программ ------------------------------------------------------------ Ассемблирование и выполнение программ Цель: показать процессы ассемблирования, компановки и выполнения программ. ВВЕДЕНИЕ ------------------------------------------------------------ В данной главе объясняется, как ввести в компьютер исходный ассемблерный текст программы, как осуществить ассемблирование, компановку и выполнение программы. Кроме того, показана генерация таблицы перекрестных ссылок для целей отладки. ВВОД ПРОГРАММЫ ------------------------------------------------------------ На рис.3.2. был показан только исходный текст программы, предназначенный для ввода с помощью текстового редактора. Теперь можно использовать DOS EDLIN или другой текстовый редактор для ввода этой программы. Если вы никогда не пользовались программой EDLIN, то именно сейчас необходимо выполнить ряд упражнений из руководства по DOS. Для запуска программы EDLIN вставте дискету DOS в дисковод A и форматизованную дискету в дисковод B. Чтобы убедиться в наличии на дискете свободного места для исходного текста, введите CHKDSK B:. Для винчестера во всех следующих примерах следует использовать C: вместо B:. Для ввода исходной программы EXASM1, наберите команду EDLIN В:EXASM1.ASM [Return] В результате DOS загрузит EDLIN в памяти и появится сообщение "New file" и приглашение "*-". Введите команду I для ввода строк, и затем наберите каждую ассемблерную команду так, как они изобpажены на рис. 3.2. Хотя число пробелов в тексте для ассемблера не существенно, старайтесь записывать метки, команды, операнды и комментарии, выровнен ными в колонки, программа будет более yдобочитаемая. Для этого в EDLIN используется табуляция через каждые восемь позиций. После ввода программы убедитесь в ее правильности. Затем наберите E (и Return) для завершения EDLIN. Можно проверить наличие программы в каталоге на диске, введите DIR B: (для всех файлов) или DIR B:EXASM1.ASM (для одного файла) Ассемблер для IBM PC. Глава 4 80 Если предполагается ввод исходного текста большего объема, то лучшим применением будет полноэкранный редактор. Для получения распечатки программы включите принтер и установите в него бумагу. Вызовите программу PRINT (для DOS 2.0 и старше). DOS загрузит программу в память и распечатает текст на принтере: PRINT B:EXASM1.ASM [Return] Программа EXASM.ASM еще не может быть выполнена - прежде необходимо провести ее ассемблирование и компановку. В следующем pазделе показана эта же программа после ассемблирования и пояснены этапы ассемблирования и получения листинга. ПОДГОТОВКА ПРОГРАММЫ ДЛЯ ВЫПОЛНЕНИЯ ------------------------------------------------------------ После ввода на диск исходной программы под именем EXASM1.ASM необходимо проделать два основных шага, прежде чем программу можно будет выполнить. Сначала необходимо ассемблиpовать программу, а затем выполнить компановку. Программисты на языке бейсик могут выполнить программу сразу после ввода исходного текста, в то время как для ассемблера и компиллярных языков нужны шаги трансляции и компановки. Шаг ассемблирования включает в себя трансляцию исходного кода в машинный объектный код и генерацию OBJ-модуля. Вы уже встречали примеры машинного кода в главе 2 и примеры исxодно го текста в этой главе. OBJ-модуль уже более приближен к исполнительной форме, но еще не готов к выполнению. Шаг компановки включает преобразо вание OBJ-модуля в EXE (исполнимый) модуль, содержащий машинный код. Прогрпмма LINK, находящаяся на диске DOS, выполняет следующее: 1. Завершает формирование в OBJ-модуле адресов, которые остались неопределенными после ассемблирования. Во мно гих следующих программах такие адреса ассемблер отмеча ет как ----R. 2. Компанует, если необходимо, более одного отдельно ассем блированного модуля в одну загрузочную (выполнимую) про грамму; возможно две или более ассемблерных программ или ассемблерную программу с программами, написанными на языках высокого уровня, таких как Паскаль или Бейсик. 3. Инициализирует EXE-модуль командами загрузки для выполнения. После компановки OBJ-модуля (одного или более) в EXE-модуль, можно выполнить EXE-модуль любое число раз. Но, если необходимо внести некоторые изменения в EXE-модуль, следует скорректировать исходную программу, ассемблировать ее в другой OBJ-модуль и выполнить компановку OBJ-модуля в Ассемблер для IBM PC. Глава 4 81 новый EXE-модуль. Даже, если эти шаги пока остаются непо нятными, вы обнаружите, что, получив немного навыка, весь процесс подготовки EXE-модуля будет доведен до автоматизма. Заметьте: определенные типы EXE-программ можно преобразовать в oчень эффективные COM-программы. Предыдущие примеры, однако, не cовсем подходят для этой цели. Данный вопрос рассматривается в главе 6. АССЕМБЛИРОВАНИЕ ПРОГРАММЫ ------------------------------------------------------------ Для того, чтобы выполнить исходную ассемблерную програм му, необходимо прежде провести ее ассемблирование и затем компановку. На дискете с ассемблерным пакетом имеются две версии aссемблера. ASM.EXE - сокращенная версия с отсутстви ем некоторых незначительных возможностей и MASM.EXE - полная версия. Если размеры памяти позволяют, то используйте версию MASM (подробности см. в соответствующем руководстве по ассемблеру). Для ассемблирования, вставте ассемблерную дискету в дисковод A, а дискету с исходной программой в дисковод B. Кто имеет винчестер могут использовать в следующих примеpах C вместо A и B. Простейший вариант вызова программы это ввод команды MASM (или ASM), что приведет к загрузке программы ассемблера с диска в память. На экране появится: source filename [.ASM]: object filename [filename.OBJ]: source listing [NUL.LST]: cross-reference [NUL.CRF]: Курсор при этом расположится в конце первой строки, где необходимо указать имя файла. Введите номер дисковода (если он не определен умолчанием) и имя файла в следующем виде: B:EXASM1. Не следует набирать тип файла ASM, так как ассем блер подразумевает это. Во-втором запросе предполагается аналогичное имя файла (но можно его заменить). Если необходимо, введите номер дисковода B:. Третий запрос предполагает, что листинг ассемблирования программы не требуется. Для получения листинга на дисководе B наберите B: и нажмите Return. Последний запрос предполагает, что листинг перекрестных cсылок не требуется. Для получения листинга на дисководе B, наберите B: и нажмите Return. Если вы хотите оставить значения по умолчанию, то в трех последних запросах просто нажмите Return. Ниже приведен пример запросов и ответов, в результате которых ассемблер должен cоздать OBJ, LST и CRF-файлы. Введите ответы так, как показано, за исключением того, что номер дисковода может быть иной. source filename [.ASM]:B:EXASM1 [Return] Ассемблер для IBM PC. Глава 4 82 object filename [filename.OBJ]:B: [Return] source listing [NUL.LST]:B: [Return] cross-reference [NUL.CRF]:B: [Return] Всегда необходимо вводить имя исходного файла и, обычно, запрашивать OBJ-файл - это требуется для компановки программы в загрузочный файл. Возможно потребуется указание LST-файла, особенно, если необходимо проверить сгенерирован ный машинный код. CRF-файл полезен для очень больших программ, где необходимо видеть, какие команды ссылаются на какие поля данных. Кроме того, ассемблер генерирует в LST-файле номера строк, которые используются в CRF-файле. В приложении 4 "Режимы ассемблирования и редактирования" перечислены режимы (опции) для ассемблера версий 1.0 и 2.0. Ассемблер преобразует исходные команды в машинный код и выдает на экран сообщения о возможных ошибках. Типичными ошибками являются нарушения ассемблерных соглашений по именам, неправильное написание команд (например, MOVE вместо MOV), а также наличие в опеpандах неопределенных имен. Программа ASM вадает только коды ошибок, которые объяснены в руководстве по ассемблеру, в то время как программа МASM выдает и коды ошибок, и пояснения к ним. Всего имеется около 100 сообщений об ошибках. Ассемблер делает попытки скорректировать некоторые ошибки, но в любом случае следует перезагрузить текстовый редактор, исправить исходную программу (EXASM1.ASM) и повторить ассемблирование. На рис. 4.1. показан листинг, полученный в результате асcемблирования программы и записанный на диск под именем EXASM1.LST. В начале листинга обратите внимание на реакцию ассемблера на директивы PAGE и TITLE. Никакие директивы, включая SEGMENT, PROC, ASSUME и END не генерируют машинных кодов. Листинг содержит не только исходный текст, но также слева транслированный машинный код в шестнадцатиричном формате. В самой левой колонке находится шест.адреса команд и данных. Сегмент стека начинается с относительного адреса 0000. В действительности он загружается в память в соответствии с адpесом в регистре SS и нулевым смещением относительно этого адpеса. Директива SEGMENT устанавливает 16-кратный адрес и указывает ассемблеру, что это есть начало стека. Сама директива не генерирует машинный код. Команда DB, также находится по адресу 0000, содержит 12 копий слова 'STACKSEG'; машинный код представлен шест.0C (десятичное 12) и шест. представлением ASCII символов. (В дальнейшем можно использовать отладчик для просмотра результатов в памяти). Сегмент стека заканчивается по адресу шест. 0060, который эквивалентен десятичному значению 96 (12х8). ------------------------------------------------------------ ------------------------------------------------------------ Рис. 4.1. Листинг ассемблирования программы Ассемблер для IBM PC. Глава 4 83 Сегмент кода также начинается с относительного адреса 0000. Он загружается в память в соответствии с адресом в pегистре CS и нулевым смещением относительно этого адреса. Поскольку ASSUME является директивой ассемблеру, то первая команда, которая генерирует действительный машинный код есть PUSH DS - однобайтовая команда (1E), находящаяся на нулевом смещении. Следующая команда SUB AX,AX генерирует двухбайто вый машинный код (2B C0), начинающийся с относительного адреса 0001. Пробел между байтами только для удобочитаемос ти. В данном примере встречаются одно-, двух- и трехбайтовые команды. Последняя команда END содержит операнд BEGIN, который имеeт отношение к имени команды PROC по смещению 0000. Это есть адрес сегмента кодов, с которого начинается выполнение после загрузки программы. Листинг ассемблирования программы EXASM1.LST, имеет по директиве PAGE шиpину 132 символа и может быть распечатан. Многие принтеры могут печатать текст сжатым шрифтом. Включите ваш принтер и введите команду MODE LPT1:132,6 Таблица идентификаторов За листингом ассемблирования программы следует таблица идентификаторов. Первая часть таблицы содержит определенные в программе сегменты и группы вместе с их размером в байтах, выравниванием и классом. Вторая часть содержит идентификато ры - имена полей данных в сегменте данных (в нашем примере их нет) и метки, назначенные командам в сегменте кодов (одна в нашем примере). Для того, чтобы ассемблер не создавал эту таблицу, следует указать параметр /N вслед за командой MASM, т.е. MASM/N. Двухпроходный ассемблер В процессе трансляции исходной программы ассемблер делает два просмотра исходного текста, или два прохода. Одной из основных причин этого являются ссылки вперед, что происходит в том случае, когда в некоторой команде кодирует ся метка, значение которой еще не определено ассемблером. В первом проходе ассемблер просматривает всю исходную прогpамму и строит таблицу идентификаторов, используемых в программе, т.е. имен полей данных и меток программы и их относительных aдресов в программе. В первом проходе подчитывается объем объектного кода, но сам объектный код не генерируется. Во втором проходе ассемблер использует таблицу идентифи каторов, построенную в первом проходе. Так как теперь уже известны длины и относительные адреса всех полей данных и команд, то ассемблер может сгенерировать объектный код для каждой команды. Ассемблер создает, если требуется, файлы: OBJ, LST и CRF. Ассемблер для IBM PC. Глава 4 84 КОМПАНОВКА ПРОГРАММЫ ------------------------------------------------------------ Если в результате ассемблирования не обнаружено ошибок, то cледующий шаг - компановка объектного модуля. Файл EXASM1.OBJ содержит только машинный код в шестнадцатеричной форме. Так как программа может загружаться почти в любое место памяти для выполнения, то ассемблер может не определить все машинные адреса. Кроме того, могут использоваться другие (под) программы для объединения с основной. Назначением программы LINK является завершение определения адресных ссылок и объединение (если требуется) нескольких программ. Для компановки ассемблированной программы с дискеты, вставте дискету DOS в дисковод A, а дискету с программой в дисковод B. Пользователи винчестерского диска могут загрузить компановщик LINK прямо с дисковода C. Введите команду LINK и нажмите клавишу Return. После загрузки в память, компановщик выдает несколько запросов (аналогично MASM), на которые необходимо ответить: Запрос компановщика Ответ Действие Object Modules [.OBJ]: B:EXASM1 Компанует EXASM1.OBJ Run file [EXASM1.EXE]: B: Создает EXASM1.EXE List file [NUL.MAP]: CON Создает EXASM1.MAP Libraries [.LIB]: [Return] По умолчанию Первый запрос - запрос имен объектных модулей для компа новки, тип OBJ можно опустить. Второй запрос - запрос имени исполнимого модуля (файла), (по умолчанию A:EXASM1.EXE). Ответ B: требует, чтобы компановщик создал файл на дисководе В. Практика сохранения одного имени (при разных типах) файла упрощает работу с программами. Третий запрос предполагает, что LINK выбирает значение по yмолчанию - NUL.MAP (т.е. MAP отсутствует). MAP-файл содержит таблицу имен и размеров сегментов и ошибки, которые обнаружит LINK. Типичной ошибкой является неправильное определение сегмента стека. Ответ CON предполагает, что таблица будет выведена на экран, вместо записи ее на диск. Это позволяет сэкономить место в дисковой памяти и сразу просмотреть таблицу непосредственно на экране. В нашем примере MAP-файл содержит следующую информацию: Start Stop Length Name 00000H 00015H 0016H CODESG 00020H 0007FH 0060H STACKSG Ассемблер для IBM PC. Глава 4 85 Для ответа на четвертый запрос - нажмите Return, что укажет компановщику LINK принять остальные параметры по yмолчанию. Описание библиотечных средств можно найти в руководстве по DOS. На данном этапе единственной возможной ошибкой может быть yказание неправильных имен файлов. Исправить это можно только перезапуском программы LINK. В приложении 4 перечис лен ряд pежимов компановщика LINK. ВЫПОЛНЕНИЕ ПРОГРАММЫ ------------------------------------------------------------ После ассемблирования и компановки программы можно (наконец-то!) выполнить ее. На рис. 4.2 приведена схема команд и шагов для ассемблирования, компановки и выполнения программы EXASM1. Если EXE-файл находится на дисководе B, то выполнить ее можно командой: B:EXASM1.EXE или B:EXASM1 DOS предполагает, что файл имеет тип EXE (или COM), и загружает файл для выполнения. Но так как наша программа не вырабатывает видимых результатов, выполним ее трассировкой под отладчиком DEBUG. Введите DEBUG B:EXASM1.EXE В результате DOS загрузит программу DEBUG, который, в свою очередь, загрузит требуемый EXE-модуль. После этого отладчик выдаст дефис (-) в качестве приглашения. Для просмотра сегмента стека введите D SS:0 Эту область легко узнать по 12-кратному дублированию константы STACKSEG. Для просмотра сегмента кода введите D CS:0 Сравните машинный код с листингом ассемблера: 1E2BC050B823010525008BD803 ... Непосредственные операнды, приведенные в листинге ассемблирования как 0123 и 0025 в памяти представлены в виде 2301 и 2500 соответственно. В данном случае листинг ассемблирования не вполне соответствует машинному коду. Все двухбайтовые адреса (слова) и непосредственные операнды в машинном коде хранятся в обратном порядке. Ассемблер для IBM PC. Глава 4 86 Введите R для просмотра содержимого регистров и выполните прогpамму с помощью команды T (трассировка). Обратите внимание на воздействие двух команд PUSH на стек - в вершине стека теперь находится содержимое регистра DS и нулевой адрес. В процессе пошагового выполнения программы обратите внимание на содержимое регистров. Когда вы дойдете до команды RET, можно ввести Q (Quit - выход) для завершения работы отладчика. Используя команду dir, можно проверить наличие ваших файлов на диске: DIR B:EXASM1.* ------------------------------------------------------------ ------------------------------------------------------------ Рис. 4.2. Схема ассемблирования, компановки и выполнения программы. В результате на экране появится следующие имена файлов: EXASM1.BAK (если для корректировки EXASM1.ASM использовался редактор EDLIN), EXASM1.ASM, EXASM1.OBJ, EXASM1.LST, EXASM1.EXE и EXASM1.CRF. Последовательность этих файлов может быть иной в зависимости от того, что уже находится на диске. Очевидно, что разработка ряда программ приведет к занятию дискового пространства. Для проверки оставшегося свободного места на диске полезно использовать команду DOS CHKDSK. Для удаления OBJ-, CRF-, BAK- и LST-файлов с диска следует использовать команду ERASE (или DEL): ERASE B:EXASM1.OBJ, ... Следует оставить (сохранить) ASM-файл для последующих изменений и EXE-файл для выполнения. В следующем разделе представлено определение данных в сегменте данных. Позже будет описана таблица перекрестных cсылок. ПРИМЕР ИСХОДНОЙ ПРОГРАММЫ ------------------------------------------------------------ Особенность программы, приведенной на рис. 4.1, состоит в том, что она не содержит определения данных. Обычно все программы имеют определенные константы, рабочие поля для арифметических вычислений и области для операций ввода-вывода. В главе 2 (рис.2.3) была рассмотрена программа в машинных кодах, в которой были определены два поля данных. В этой главе на рис. 4.3 приводится аналогичная программа, но на этот раз написанная на языке ассемблера и для краткости уже ассемблированная. Эта программа знакомит с несколькими новыми особенностями. Ассемблер для IBM PC. Глава 4 87 Сегмент стека содержит директиву DW (Define Word - опреде лить cлово), описывающая 32 слова, в которых генерируется неопределенное значение обозначенное знаком вопроса (?). Определение размера стека в 32 слова является наиболее реальным, так как в больших программах может потребоваться много "прерываний" для ввода-вывода и вызовов подпрограмм - все они используют стек. Определение стека дублированием константы 'STACKSEG' в примере на pис. 3.2 необходимо лишь для удобства при работе с отладчиком DEBUG. Замечание: Определяйте размер стека не менее 32 слов. При малых размерах стека ни ассемблер, ни компановщик не смо- гут определить этого и выполнение программы может разрушить ся самым непредсказуемым образом. В примере на рис. 4.3 определен сегмент данных DATASG, начинающийся по относительному адресу 0000. Этот сегмент содержит три значения в формате DW. Поле FLDA определяет слово (два байта), содержащее десятичное значение 250, которое ассемблер транслирует в шест. 00FA (см. на рисунке слева). Поле FLDB определяет слово с десятичным значением 125, котоpое транслируется в шест. 007D. Действительные значения этих двух констант в памяти - FA00 и 7D00 соответственно, что можно проверить c помощью отладчика DEBUG. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 4.3. Листинг ассемблирования программы с сегментом данных. Поле FLDC определяет слово с неизвестным значением, обозначенным знаком вопроса (?). Сегмент кода в данном примере имеет имя CODESG и отли- чается новыми особенностями, связанными с сегментом данных. Во-первых, директива ASSUME указывает на определние DATASG через регистр DS. Данной программе не требуется регистр ES, но некоторые программисты описывают его для стандартизации. Во-вторых, после команд PUSH, SUB и PUSH, которые инициали- зируют стек, следуют две команды, обеспечивающие адресацию сегмента данных: 0004 B8 ---- R MOV AX,DATASG 0007 8E D8 MOV DS,AX Первая команда MOV загружает DATASG в регистр AX. Конечно, на самом деле команда не может загрузить сегмент в регистр - она загружает лишь адрес сегмента DATASG. Обратите внимание на машинный код слева: B8 ---- R Четыре дефиса говорят о том, что ассемблер не может опреде лить aдрес DATASG; он определяется лишь когда объектная программа будет скомпанована и загружена для выполнения. Ассемблер для IBM PC. Глава 4 88 Поскольку загpузчик может расположить программу в любом месте памяти, асcемблер оставляет данный адрес открытым и показывает это символом R; компановщик должен будет подста вить в это место действительный адрес. Вторая команда MOV пересылает содержимое регистра AX в регистр DS. Таким образом, данная программа имеет директиву ASSUME, которая соотносит регистр DS с сегментом данных, и команды, инициализирующие регистр DS относительным адресом DATASG. Могут возникнуть два вопроса по поводу этой программы. Во-первых, почему не использовать одну команду для инициали зации регистра DS, например, MOV DS,DATASG ? Дело в том, что не существует команд для непосредственной переcылки данных из памяти в регистр DS. Следовательно, для инициализации DS необходимо кодировать две команды. Во-вторых, почему программа инициализирует регистр DS, а регистры SS и CS нет? Оказывается, регистры SS и CS инициализируются автоматически при загрузке программы для выполнения, а ответственность за инициализацию регистра DS и, если требуется ES, лежит полностью на самой программе. Пока все эти требования могут показаться весьма туман ными, но cейчас нет необходимости понимать их. Все последую щие программы используют аналогичную стандартную инициализа цию стека и сегмента данных. Поэтому можно просто копировать данные коды для каждой новой программы. Действительно, вы можете сохранить на диске стандартную часть программы и для каждой новой программы копировать эту часть с новым именем, и, используя затем редактор, записать дополнительные команды. В качестве упражнения, создайте с помощью вашего редактора программу, приведенную на рис. 4.3, выполните ее ассемблирование и компановку. Затем с помощью отладчика DEBUG просмотрите сегмент кодов, сегмент данных, регистры и проделайте пошаговое выполнение программы. ФАЙЛ ПЕРЕКРЕСТНЫХ ССЫЛОК ------------------------------------------------------------ В процессе трансляции ассемблер создает таблицу идентификаторов (CRF), которая может быть представлена в виде листинга перекрестных ссылок на метки, идентификаторы и переменные в программе. Для получения данного фала, необходимо на четвертый запрос ассемблера, oтветить B:, полагая, что файл должен быть создан на диске B: cross-reference [NUL.CRF]:B: [Return] Ассемблер для IBM PC. Глава 4 89 Далее необходимо преобразовать полученный CRF-файл в отсортиpованную таблицу перекрестных ссылок. Для этого на ассемблерном диске имеется соответствующая программа. После успешного ассемблирования введите команду CREF. На экране появится два запроса: Cref filename [.CRF]: List filename [cross-ref.REF]: На первый запрос введите имя CRF-файла, т.е. B:EXASM1. На второй запрос можно ввести только номер дисковода и получить имя по умолчанию. Такой выбор приведет к записи CRF в файл перекрестных ссылок по имени EXASM1.REF на дисководе B. Для распечатки файла перекрестных ссылок используйте команду DOS PRINT. В приложении 4 приведен ряд режимов программы CREF. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 4.4. Таблица перекрестных ссылок На рис. 4.4 показана таблица перекрестных ссылок для программы, приведенной на рис. 4.3. Все идентификаторы в таблице предcтавлены в алфавитном порядке и для каждого из них указаны номеpа строк в исходной программе, где они определены и имеют ссылки. Имена сегментов и элементов данных представлены в алфавитном поpядке. Первое число справа в формате n# указывает на номер строки в LST-файле, где определен соответствующий идентификатор. Еще правее находятся числа, указывающие на номера строк, где имеются cсылки на этот идентификатор. Например, CODESG определен в строке 17 и имеет ссылки на строках 19 и 32. ОСНОВНЫЕ ПОЛОЖЕНИЯ НА ПАМЯТЬ ------------------------------------------------------------ ъ Ассемблер преобразует исходную программу в OBJ-файл, а компановщик - OBJ-файл в загрузочный EXE-файл. ъ Внимательно проверяйте запросы и ответы на них для программ (M)ASM, LINK и CREF прежде чем нажать клавишу Return. Будьте особенно внимательны при указании диско вода. ъ Программа CREF создает распечатку перекрестных ссылок. ъ Удаляйте ненужные файлы с вашего диска. Регулярно пользуйтесь программой CHKDSK для проверки свободного места на диске. Кроме того периодически создавайте резервные копии вашей программы, храните резервную дискету и копируйте ее заново для последующего программирования. ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ ------------------------------------------------------------ Ассемблер для IBM PC. Глава 4 90 4.1. Введите команду MASM и ответьте на запросы для ассемблирования программы по имени TEMPY.ASM с получением файлов LST, OBJ и CRF, полагая, что дискета с программой находится на дисководе B. 4.2. Введите команды для программы TEMPY (из вопроса 4.1) а) для выполнения через отладчик DEBUG, б) для непосредст венного выполнения из DOS. 4.3. Объясните назначение каждого из следующих файлов: а) file.BAK, б) file.ASM, в) file.LST, г) file.CRF, д) file.OBJ, е) file.EXE, ж) file.MAP. 4.4. Напишите две команды для инициализации регистра DS, полагая, что имя сегмента данных - DATSEG. 4.5. Составте ассемблерную программу для: - пересылки шест. 30 (непосредственное значение) в регистр AL; - сдвига содержимого регистра AL на оди бит влево (команда SHL); - пересылки шест. 18 (непосредственное значение) в регистр BL; - умножения регистра AL на BL (команда MUL BL). Не забывайте команду RET. В программе нет необходимости определять и инициализировать сегмент данных. Не забы вайте также копировать стандартную часть программы (ос нову программы) и использовать редактор для ее разви тия. Выполните ассемблирование и компановку. Используя отладчик DEBUG, проверте сегмент кодов, регистры и про делайте пошаговое выполнение (трассировку) программы. 4.6. Модифицируйте программу из вопроса 4.5 для: - определения однобайтовых элементов (директива DB) по имени FLDA, содержащего шест. 28, и по имени FLDB, содержащего шест. 14; - определения двухбайтового элемента (директива DW) по имени FLDC, не имеющего значения; - пересылки содержимого поля FLDA в регистр AL и сдвига на один бит; - умножения содержимого регистра AL на значение в поле FLDB (MUL FLDB); - пересылки результата из регистра AX в поле FLDC. Для данной программы необходим сегмент данных. Выполни те ассемблирование, компановку программы и тестирование с помощью отладчика DEBUG. Ассемблер для IBM PC. Глава 5 104 ГЛАВА 5. Определение Данных ------------------------------------------------------------ Определение Данных Цель: Показать методам определения констант и рабочих полей в ассемблерной программе. ВВЕДЕНИЕ ------------------------------------------------------------ Сегмент данных предназначен для определения констант, рабочих полей и областей для вводв-вывода. В соответствии с имеющимися директивами в ассемблере разрешено определение данных различной длины: например, директива DB определяет байт, а директива DW oпределяет слово. Элемент данных может содержать непосредственное значение или константу, определен ную как символьная строка или как числовое значение. Другим способом определения константы является непосред ственное значение, т.е. указанное прямо в ассемблерной команде, например: MOV AL,20H В этом случае шестнадцатеричное число 20 становится частью ма шинного объектного кода. Непосредственное значение ограничено oдним байтом или одним словом, но там, где оно может быть применено, оно является более эффективным, чем использование конcтанты. ДИРЕКТИВЫ ОПРЕДЕЛЕНИЯ ДАННЫХ ------------------------------------------------------------ Ассемблер обеспечивает два способа определения данных: во-первых, через указание длины данных и, во-вторых, по их cодержимому. Рассмотрим основной формат определения данных: [имя] Dn выражение ъ Имя элемента данных не обязательно (это указывается квадратными скобками), но если в программе имеются ссылки на некоторый элемент, то это делается посредством имени. Правила написания имен приведены в разделе "Формат кодирования" в главе 3. ъ Для определения элементов данных имеются следующие директивы: DB (байт), DW (слово), DD (двойное слово), DQ (учетверенное слово) и DT (десять байт). ъ Выражение может содержать константу, например: FLD1 DB 25 или знак вопроса для неопределенного значения, например Ассемблер для IBM PC. Глава 5 105 FLDB DB ? Выражение может содержать несколько констант, разделенных запятыми и ограниченными только длиной строки: FLD3 DB 11, 12, 13, 14, 15, 16, ... Ассемблер определяет эти константы в виде последовательности cмежных байт. Ссылка по имени FLD3 указывает на первую константу, 11, по FLD3+1 - на вторую, 12. (FLD3 можно представить как FLD3+0). Например команда MOV AL,FLD3+3 загружает в регистр AL значение 14 (шест. 0E). Выражение допускает также повторение константы в следующем формате: [имя] Dn число-повторений DUP (выражение) ... Следующие три примера иллюстрируют повторение: DW 10 DUP(?) ;Десять неопределенных слов DB 5 DUP(14) ;Пять байт, содержащих шест.14 DB 3 DUP(4 DUP(8));Двенадцать восмерок В третьем примере сначала генерируется четыре копии десятич ной 8 (8888), и затем это значение повторяется три раза, давая в pезультате двенадцать восмерок. Выражение может содержать символьную строку или числовую константу. Символьные строки Символьная строка используются для описания данных, таких как, например, имена людей или заголовки страниц. Содержимое строки oтмечается одиночными кавычками, например, 'PC' или двойными кавычками - "PC". Ассемблер переводит символьные строки в объектный код в обычном формате ASCII. Символьная строка определяется только директивой DB, в котоpой указывается более двух символов в нормальной последо вательности слева направо. Следовательно, директива DB представляет единственно возможный формат для определения символьных данных. На рис. 5.1 приведен ряд примеров. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 5.1. Определение символьных строк и числовых величин. Числовые константы Ассемблер для IBM PC. Глава 5 106 Числовые константы используются для арифметических величин и для aдресов памяти. Для описания константы кавычки не ставятся. Ассемблер преобразует все числовые константы в шестнадцитеричные и записывает байты в объектном коде в обратной последовательности - справа налево. Ниже показаны различные числовые форматы. Десятичный формат. Десятичный формат допускает десятичные цифры от 0 до 9 и обозначается последней буквой D, которую можно не указывать, например, 125 или 125D. Несмотря на то, что ассемблер позволяет кодирование в десятичном формате, он преобразует эти значения в шест. объектный код. Например, десятичное число 125 преобразуется в шест. 7D. Шестнадцатиричный формат. Шест. формат допускает шест. цифры от 0 до F и обозначается последней буквой H. Так как ассемблер полагает, что с буквы начинаются идентификаторы, то первой цифрой шест. константы должна быть цифра от 0 до 9. Например, 2EH или 0FFFH, которые ассемблер преобразует соответственно в 2E и FF0F (байты во втором примере записы ваются в объектный код в обратной последовательности). Двоичный формат. Двоичный формат допускает двоичные цифры 0 и 1 и обозначается последней буквой B. Двоичный формат обычно используется для более четкого представления битовых значений в логических командах AND, OR, XOR и TEST. Десятичное 12, шест. C и двоичное 1100B все генерируют один и тот же код: шест. 0C или двоичное 0000 1100 в зависимости от того, как вы рассматриваете содержимое байта. Восмеричный формат. Восмеричный формат допускает восмерич ные цифры от 0 до 7 и обозначается последней буквой Q или O, например, 253Q. На сегодня восмеричный формат используется весьма редко. Десятичный формат с плавающей точкой. Этот формат поддер живается только ассемблером МASM. При записи символьных и числовых констант следует помнить, что, например, символьная константа, определенная как DB '12', представляет символы ASCII и генерирует шест. 3132, а числовая константа, oпределенная как DB 12, представ ляет двоичное число и генерирует шест. 0C. Рис. 5.1 иллюстрирует директивы для определения различных символьных строк и числовых констант. Сегмент данных был ассемблирован для того, чтобы показать сгенерированный объектный код (слева). ДИРЕКТИВА ОПРЕДЕЛЕНИЯ БАЙТА (DB) ------------------------------------------------------------ Ассемблер для IBM PC. Глава 5 107 Из различных директив, определяющих элементы данных, наиболее полезной является DB (определить байт). Символьное выражение в диpективе DB может содержать строку символов любой длины, вплоть до конца строки (см. FLD2DB и FLD7DB на рис. 5.1). Обратите внимание, что константа FLD2DB содержит символьную строку 'Personal Computer'. Объектный код показывает символы кода ASCII для каждого байта. Шест. 20 представляет символ пробела. Числовое выражение в директиве DB может содержать одну или более однобайтовых констант. Один байт выражается двумя шест. цифpами. Наибольшее положительное шест. число в одном байте это 7F, все "большие" числа от 80 до FF представляют отрицательные значения. В десятичном исчислении эти пределы выражаются числами +127 и -128. В примере на рис. 5.1 числовыми константами являются FLD3DB, FLD4DB, FLD5DB и FLD8DB. Поле FLD6DB представляет смесь из числовых и строковых констант, используемых для построения таблицы. ДИРЕКТИВА ОПРЕДЕЛЕНИЯ СЛОВА (DW) ------------------------------------------------------------ Директива DW определяет элементы, которые имеют длину в одно слово (два байта). Символьное выражение в DW ограничено двумя символами, которые ассемблер представляет в объектном коде так, что, например, 'PC' становится 'CP'. Для определения символьных строк директива DW имеет ограниченное применение. Числовое выражение в DW может содержать одно или более двухбайтовых констант. Два байта представляются четырьмя шест. цифрами. Наибольшее положительное шест. число в двух байтах это 7FFF; все "большие" числа от 8000 до FFFF представляют отрицательные значения. В десятичном исчислении эти пределы выражаются числами +32767 и -32768. В примере на рис. 5.1 поля FLD1DW и FLD2DW определяют числовые константы. Поле FLD3DW определяет адрес - в данном случае смещение на адрес FLD7DB. В результате генерируется объектный код 0021 (R обозначает перемещаемость). Проверяя выше по рисунку, видно, что относительный адрес поля FLD7DB действительно 0021. Поле FLD4DW определяет таблицу из пяти числовых констант. Заметим, что объектный код для каждой константы имеет длину в oдно слово (два байта). Для форматов директив DW, DD и DQ ассемблер преобразует константы в шест. объектный код, но записывает его в обратной последовательности. Таким образом десятичное значение 12345 преобразуется в шест.3039, но записывается в объектном коде как 3930. ДИРЕКТИВА ОПРЕДЕЛЕНИЯ ДВОЙНОГО СЛОВА (DD) ------------------------------------------------------------ Ассемблер для IBM PC. Глава 5 108 Директива DD определяет элементы, которые имеют длину в два cлова (четыре байта). Числовое выражение может содержать одну или более констант, каждая из которых имеет максимум четыре байта (восемь шест. цифр). Наибольшее положительное шест. число в четырех байтых это 7FFFFFFF; все "большие" числа от 80000000 до FFFFFFFF представляют отрицательные значения. В десятичном исчислении эти пределы выражаются числами +2147483647 и -2147483648. В примере на рис. 5.1 поле FLD3DD определяет числовую константу. В поле FLD4DD генерируется разница между двумя адресами, в данном случае результатом является длина поля FLD2DB. Поле FLD5DD определяет две числовые константы. Ассемблер преобразует все числовые константы в директиве DD в шест. представление, но записывает объектный код в обратной последовательности. Таким образом десятичное значение 12345 преобразуется в шест. 00003039, но записывается в oбъектном коде как 39300000. Символьное выражение директивы DD ограничено двумя символами. Ассемблер преобразует символы и выравнивает их слева в четырехбайтовом двойном слове, как показано в поле FLD2DD в объектном коде. ДИРЕКТИВА ОПРЕДЕЛЕНИЯ УЧЕТВЕРЕННОГО СЛОВА (DQ) ------------------------------------------------------------ Директива DQ определяет элементы, имеющие длину четыре слова (восемь байт). Числовое выражение может содержать одну или более констант, каждая из которых имеет максимум восемь байт или 16 шест.цифр. Наибольшее положительное шест. число - это семерка и 15 цифр F. Для получения представления о величине этого числа, покажем, что шест. 1 и 15 нулей эквивалентен следующему десятичному числу: 1152921504606846976 В примере на рис. 5.1 поля FLD2DQ и FLD3DQ иллюстрируют числовые значения. Ассемблер преобразует все числовые кон станты в директиве DQ в шест. представление, но записывает объектный код в обратной последовательности, как и в дирек- тивах DD и DW. Обработка ассемблером символьных строк в директиве DQ aналогично директивам DD и DW. ДИРЕКТИВА ОПРЕДЕЛЕНИЯ ДЕСЯТИ БАЙТ (DT) ------------------------------------------------------------ Директива DT определяет элементы данных, имеющие длину в десять байт. Назначение этой директивы связано с "упакованными десятичными" числовыми величинами (см. гл.13). По директиве DT генерируются различные константы, в зависимости от версии ассемблера; для практического применения ознакомьтесь с руководством по вашему aссемблера. Ассемблер для IBM PC. Глава 5 109 На рис. 5.1 приведены примеры директивы DT для неопределенного элемента и для двухсимвольной константы. Программа на рис.5.1 содержит только сегмент данных. Xотя асcемблер не выдает сообщений об ошибках, в таблице LINK MAP появится предупреждение: "Warning: No STACK Segment", а компановщик LINK выдаст "There were 1 errors detected" (Обнаружена 1 ошибка). Несмотря на это предупреждение можно использовать отладчик DEBUG для просмотра объектного кода, как показано на рис. 5.2. Правая сторона дампа отчетливо показывает символьные данные, как, например, "Personal Computer". НЕПОСРЕДСТВЕННЫЕ ОПЕРАНДЫ ------------------------------------------------------------ На рис. 2.1 в главе 2 было показано использование непосредственных операндов. Команда MOV AX,0123H пересылает непосредственную шест. константу 0123 в регистр AX. Трехбайтный объектный код для этой команды есть B82301, где B8 обозначает "переслать непосредственное значение в регистр AX", a следующие два байта содержат само значение. Многие команды имеют два операнда: первый может быть регистр или адрес памяти, а второй - непосредственная константа. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 5.2. Дамп сегмента данных. Использование непосредственного операнда более эффектив но, чем oпределение числовой константы в сегменте данных и организация cсылки на нее в операнде команды MOV, например, Сегмент данных: AMT1 DW 0123H Сегмент кодов: MOV AX,AMT1 Длина непосредственных операндов Длина непосредственной константы зависит от длины первого операнда. Например, следующий непосредственный операнд является двухбайтовым, но регистр AL имеет только один байт: MOV AL,0123H (ошибка) однако, если непосредственный операнд короче, чем получающий операнд, как в следующем примере ADD AX,25H (нет ошибки) то ассемблер расширяет непосредственный операнд до двух байт, 0025 и записывает объектный код в виде 2500. Ассемблер для IBM PC. Глава 5 110 Непосредственные форматы Непосредственная константа может быть шестнадцатиричной, напpимер, 0123H; десятичной, например, 291 (которую ассемблер конвертирует в шест.0123); или двоичной, например, 100100011В (которая преобразуется в шест. 0123). Ниже приведен список команд, которые допускают непосредственные операнды: Команды пересылки и сравнения: MOV, CMP. Арифметические команды: ADC, ADD, SBB, SUB. Команды сдвига: RCL, RCR, ROL, ROR, SHL, SAR, SHR. Логические команды: AND, OR, TEST, XOR. На рис. 5.3 приведены примеры допустимых команд с непосредственными операндами. В последующих главах будут объяснены команды арифметического переноса, сдвига и логические команды. Поскольку сейчас данные примеры не предназначены для выполнения, в них опущено определение стека и инициализация сегментных регистров. Для создания элементов, длинее чем два байта, можно использовать цикл (см. гл.7) или строковые команды (см. гл.11). ------------------------------------------------------------ ------------------------------------------------------------ Рис. 5.3. Команды с непосредственными данными. ДИРЕКТИВА EQU ------------------------------------------------------------ Директива EQU не определяет элемент данных, но определяет значение, которое может быть использовано для постановки в других командах. Предположим, что в сегменте данных закодирована следующая директива EQU: TIMES EQU 10 Имя, в данном случае TIMES, может быть представлено любым допустимым в ассемблере именем. Теперь, в какой-бы команде или директиве не использовалось слово TIMES ассемблер подставит значение 10. Например, ассемблер преобразует директиву FIELDA DB TIMES DUP (?) в FIELDA DB 10 DUP (?) Имя, связанное с некоторым значением с помощью директивы EQU, может использоваться в командах, например: COUNTR EQU 05 Ассемблер для IBM PC. Глава 5 111 ... MOV CX,COUNTR Ассемблер заменяет имя COUNTR в команде MOV на значение 05, cоздавая операнд с непосредственным значением, как если бы было закодировано MOV CX,05 ;Ассемблер подставляет 05 Здесь приемущество директивы EQU заключается в том, что многие команды могут использовать значение, определенное по имени COUNTR. Если это значение должно быть изменено, то изменению подлежит лишь одна директива EQU. Естественно, что использование директивы EQU разумно лишь там, где подстановка имеет смысл для ассемблера. В директиве EQU можно использовать символические имена: 1. TP EQU TOTALPAY 2. MPY EQU MUL Первый пример предполагает, что в сегменте данных программы опpеделено имя TOTALPAY. Для любой команды, содержащей операнд TP, ассемблер заменит его на адрес TOTALPAY. Второй пример показывает возможность использования в программе слова MPY вместо обычного мнемокода MUL. ОСНОВНЫЕ ПОЛОЖЕНИЯ НА ПАМЯТЬ ------------------------------------------------------------ ъ Имена элементов данных в программе должны быть уникаль ны и по возможности наглядны. Например, элемент для зарплаты служащего может иметь имя EMPWAGE. ъ Для определения символьных строк используйте директиву DB, так как ее формат допускает строки длиннее двух байт и формирует их в нормальной последовательности (слева-направо). ъ Будьте внимательны при указании десятичных и шест. значений. Сравните, например, сложение содержимого регистра AX с десятичным 25 и с шест. 25: ADD AX,25 ;Прибавить 25 ADD AX,25H ;Прибавить 37 ъ Помните, что директивы DW, DD и DQ записывают числовое значение в объектном коде в обратной последовательности байт. Ассемблер для IBM PC. Глава 5 112 ъ Используйте элементы DB для операций с полурегистрами (AL, AH, BL и т.д.) и DW для операций с полными регистрами (AX, BX, CX и т.д.). Числовые элементы, определенные директивами DD и DQ имеют специальное применение. ъ Следите за соответствием непосредственных операндов размеру регистра: однобайтовая константа - однобайтовый регистр (AL, BH), двухбайтовая константа - полный регистр (AX, BX). ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ ------------------------------------------------------------ 5.1. Какова длина в байтах для элементов данных, определен ных директивами: а) DW, б) DD, в) DT, г) DB, д) DQ? 5.2. Определите символьную строку по имени TITLE1, содержащую константу RGB Electronics. 5.3. Определите следующие числовые значения в элементах данных с именами от FLDA до FLDE: a) четырехбайтовый элемент, содержащтй шест. эквивалент десятичного числа 115; b) однобайтовый элемент, содержащий шест. эквивалент десятичного числа 25; c) двухбайтовый элемент, содержащий неопределенное значение; d) однобайтовый элемент, содержащий двоичной эквивалент десятичного числа 25; e) директиву DW, содержащую последовательные значения 16, 19, 20, 27, 30. 5.4. Покажите сгенерированный шест. объектный код для а) DB '26' и б) DB 26. 5.5. Определите ассемблерный шест. объектный код для а) DB 26H, б) DW 2645H, в) DD 25733AH, г) DQ 25733AH. 5.6. Закодируйте следующие команды с непосредственными операндами: а) загрузить 320 в регистр AX; б) сравнить поле FLDB с нулем; в) прибавить шест. 40 к содержимому регистра BX; г) вычесть шест. 40 из регистра CX; д) сдвинуть содержимое поля FLDB на один бит влево; е) сдвинуть содержимое регистра CH на один бит вправо. 5.7. Введите и ассемблируйте элементы данных и команды из вопросов 5.2, 5.3 и 5.6. Стек для этого упражнения не требуется. Также не следует выполнять компановку. Для проверки ассемблированного кода используйте отладчик DEBUG. Распечатайте LST-файл (листинг), если в результа Ассемблер для IBM PC. Глава 5 113 те ассемблирования не будет сообщений об ошибках. Не забудте команду MODE LPT1:132,6 для установки ширины печати. Ассемблер для IBM PC. Глава 6 123 ГЛАВА 6. Программы в COM-файлах ------------------------------------------------------------ Программы в COM-файлах Цель: Объяснить назначение и использование COM-файлов и перевод ассемблерных программ в формат COM-файлов. ВВЕДЕНИЕ ------------------------------------------------------------ До сих пор вы писали, ассемблировали и выполняли програм мы в EXE-формате. Компановщик LINK автоматически генерирует особый формат для EXE-файлов, в котором присутствует специальный начальный блок (заголовок) pазмером не менее 512 байт. (В главе 22 рассматривается содержимое начальных блоков). Для выполнения можно также создавать COM-файлы. Примером часто используемого COM-файла является COMMAND.COM. Програм ма EXE2BIN.COM в оперативной системе DOS преобразует EXE- файлы в COM-файлы. Фактически эта программа создает BIN (двоичный) файл, поэтому она и называется "преобразователь EXE в Вin (EXE-to-BIN)". Выходной Вin-файл можно переимено вать в COM-файл. РАЗЛИЧИЯ МЕЖДУ ПРОГРАММАМИ В EXE и COM-файлах ------------------------------------------------------------ Несмотря на то, что EXE2BIN преобразует EXE-файл в COM-файл, cуществуют определенные различия между программой, выполняемой как EXE-файл и программой, выполняемой как COM-файл. Размер программы. EXE-программа может иметь любой размер, в то время как COM-файл ограничен размером одного сегмента и не превышает 64К. COM-файл всегда меньше, чем соответствую щий EXE-файл; одна из причин этого - отсутствие в COM-файле 512-байтового начального блока EXE-файла. Сегмент стека. В EXE-программе определяется сегмент сте ка, в то время как COM-программа генерирует стек автоматичес ки. Таким образом при создании ассемблерной программы, которая будет преобразована в COM-файл, стек должен быть опущен. Сегмент данных. В EXE программе обычно определяется сег мент данных, а регистр DS инициализируется адресом этого сегмента. В COM-программе все данные должны быть определены в сегменте кода. Ниже будет показан простой способ решения этого вопроса. Ассемблер для IBM PC. Глава 6 124 Инициализация. EXE-программа записывает нулевое слово в стек и инициализирует регистр DS. Так как COM-программа не имеет ни стека, ни сегмента данных, то эти шаги отсутствуют. Когда COM-программа начинает работать, все сегментные ре гистры содержат адрес префикса программного сегмента (PSP), - 256-байтового (шест. 100) блока, который резервируется операционной системой DOS непосредственно перед COM или EXE программой в памяти. Так как адресация начинается с шест. смещения 100 от начала PSP, то в программе после оператора SEGMENT кодируется директива ORG 100H. Обработка. Для программ в EXE и COM форматах выполняется ассемблирование для получения OBJ-файла, и компановка для получения EXE-файла. Если программа создается для выполнения как EXE-файл, то ее уже можно выполнить. Если же программа создается для выполнения как COM-файл, то компановщиком будет выдано сообщение: Warning: No STACK Segment (Предупреждение: Сегмент стека не определен) Это сообщение можно игнорировать, так как определение стека в программе не предполагалось. Для преобразования EXE-файла в COM-файл используется программа EXE2BIN. Предположим, что EXE2BIN имеется на дисководе A, а скомпанованный файл по имени CALC.EXE - на дисководе B. Введите EXE2BIN B:CALC,B:CALC.COM Так как первый операнд всегда предполагает EXE файл, то можно не кодировать тип EXE. Второй операнд может иметь другое имя (не CALC.COM). Если не указывать тип COM, то EXE2BIN примет по умолчанию тип BIN, который впоследствии можно переименовать в COM. После того как преобразование будет выполнено можно удалить OBJ- и EXE-файлы. Если исходная программа написана для EXE-формата, то мож но, используя редактор, заменить команды в исходном тексте для COM файла. ПРИМЕР COM-ПРОГРАММЫ ------------------------------------------------------------ Программа EXCOM1, приведенная на рис. 6.1, аналогична программе на рис. 4.3, но изменена согласно требований COM- формата. Обратите внимание на следующие изменения в этой COM-программе: ъ Стек и сегмент данных отсутствует. ъ Оператор ASSUME указывает ассемблеру установить относи тельные адреса с начала сегмента кодов. Регистр CS также содержит этот адрес, являющийся к тому же адресом префикса программного сегмента (PSP). Директива ORG служит для резервирования 100 (шест.) байт от начально го адреса под PSP. Ассемблер для IBM PC. Глава 6 125 ъ Директива ORG 100H устанавливает относительный адрес для начала выполнения программы. Программный загрузчик использует этот адрес для командного указателя. ъ Команда JMP используется для обхода данных, определен ных в программе. Ниже показаны шаги для обработки и выполнения этой программы: MASM [ответы на запросы обычные] LINK [ответы на запросы обычные] EXE2BIN B:EXCOM1,B:EXCOM1.COM DEL B:EXCOM1.OBJ,B:EXCOM1.EXE (удаление OBJ и EXE-файлов) Размеры EXE- и COM-программ - 788 и 20 байт соответствен но. Учитывая такую эффективность COM-файлов, рекомендуется все небольшие программы создавать для COM-формата. Для трассировки выполнения программы от начала (но не включая) команды RET введите DEBUG B:EXCOM1.COM. Некоторые программисты кодируют элементы данных после команд так, что первая команда JMP не требуется. Кодирование элементов данных перед командами позволяет ускорить процесс ассемблирования и является методикой, рекомендуемой в руководстве по ассемблеру. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 6.1. Пример COM-программы. СТЕК ДЛЯ COM-ПРОГРАММЫ ------------------------------------------------------------ Для COM-файла DOS автоматически определяет стек и устанав ливает oдинаковый общий сегментный адрес во всех четырех сегментных pегистрах. Если для программы размер сегмента в 64К является достаточным, то DOS устанавливает в регистре SP адрес конца cегмента - шест.FFFE. Это будет верх стека. Если 64К байтовый сегмент не имеет достаточно места для стека, то DOS устанавливает стек в конце памяти. В обоих случаях DOS записывает затем в стек нулевое слово. Возможность использования стека зависит от размера про граммы и ограниченности памяти. С помощью команды DIR можно определить pазмер файла и вычислить необходимое пространство для стека. Все небольшие программы в этой книге в основном расчитаны на COM-формат. ОСОБЕННОСТЬ ОТЛАДКИ ------------------------------------------------------------ Несоблюдение хотя бы одного требования COM-формата может послужить причиной неправильной работы программы. Если EXE2BIN обнаруживает oшибку, то выдается сообщение о Ассемблер для IBM PC. Глава 6 126 невозможности преобразования файла без указания конкретной причины. Необходимо проверить в этом случае директивы SEGMENT, ASSUME и END. Если опущен ORG 100H, то на данные в префиксе программного сегмента будут установлены неправиль ные ссылки с непредсказуемым результатом при выполнении. При выполнении COM-программы под управлением отладчика DEBUG необходимо использовать команду D CS:100 для просмотра данных и команд. Не следует выполнять в отладчике команду RET; предпочтительнее использовать команду Q отладчика. Некоторые программисты используют INT 20H вместо команды RET. Попытка выполнить EXE-модуль программы, написанной для COM-формата, не имеет успеха. ОСНОВНЫЕ ПОЛОЖЕНИЯ НА ПАМЯТЬ ------------------------------------------------------------ ъ Объем COM-файла ограничен 64К. ъ COM-файл меньше, чем соответствующий EXE-файл. ъ Программа, написанная для выполнения в COM-формате не содержит стека и сегмента данных и не требует инициали зации регистра DS. ъ Программа, написанная для выполнения в COM-формате использует директиву ORG 100H после директивы SEGMENT для выполнения с адреса после префикса программного сегмента. ъ Программа EXE2BIN преобразует EXE-файл в COM-файл, обусловленный указанием типа COM во втором операнде. ъ Операционная система DOS определяет стек для COM-прог раммы или в конце программы, если позволяет размер, или в конце памяти. ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ ------------------------------------------------------------ 6.1. Каков максимальный размер COM-файла? 6.2. Какие сегменты можно определить в программе, которая будет преобразована в COM-файл? 6.3. Как обходится COM-файл при выполнении с фактом отсут ствия определения стека? 6.4. Программа в результате компановки получала имя SAMPLE.EXE. Напишите команду DOS для преобразования ее в COM-файл. Ассемблер для IBM PC. Глава 6 127 6.5. Измените программу из вопроса 4.6 для COM-формата, обра ботайте ее и выполните под управлением отладчика DEBUG. Ассемблер для IBM PC. Глава 7 132 ГЛАВА 7. Логика и Организация Программы ------------------------------------------------------------ Логика и Организация Программы Цель: Раскрыть механизм передачи управления в программе (циклы и переходы) для логических сравнений и программной организации. ВВЕДЕНИЕ ------------------------------------------------------------ До этой главы примеры выполнялись последовательно команда за командой. Однако, программируемые задачи редко бывают так просты. Большинство программ содержат ряд циклов, в которых несколько команд повторяются до достижения определенного требования, и различные проверки, определяюшие какие из нескольких действий следует выполнять. Обычным требованием является проверка - должна ли программа завершить выполнение. Эти требования включают передачу управления по адресу команды, которая не находится непосредственно за выполняемой в текущий момент командой. Передача управления может осущест вляться вперед для выполнения новой группы команд или назад для повторения уже выполненных команд. Некоторые команды могут передавать управление, изменяя нормальную последовательность шагов непосредственной модификацией значения смещения в командном указателе. Ниже приведены четыре способа передачи управления (все будут рассмотрены в этой главе): Безусловный переход: JMP Цикл: LOOP Условный переход: Jnnn (больше,меньше,равно) Вызов процедуры: CALL Заметим, что имеется три типа адресов: SHORT, NEAR и FAR. Адресация SHORT используется при циклах, условных пеpеходах и некоторых безусловных переходах. Адресация NEAR и FAR используется для вызовов процедур (CALL) и безусловных переходов, которые не квалифицируются , как SHORT. Все три типа передачи управления воздействуют на содержимое регистра IP; тип FAR также изменяет регистр CS. КОМАНДА JMP ------------------------------------------------------------ Одной из команд обычно используемых для передачи управле ния является команда JMP. Эта команда выполняет безусловный переход, т.е. обеспечивает передачу управления при любых обстоятельствах. Ассемблер для IBM PC. Глава 7 133 В COM-программе на рис. 7.1 используется команда JMP. В pегистры AX, BX, и CX загружается значение 1, и затем в цикле выполняются следующие операции: прибавить 1 к регистру AX, прибавить AX к BX, удвоить значение в регистре CX. Повторение цикла приводит к увеличению содержимого регистра AX: 1,2,3,4..., регистра BX: 1,3,6,10..., и регистра CX: 1,2,4,8... Начало цикла имеет метку, в данном случае, A20: - двоетичие oбозначает, что метка находится внутри процедуры (в данном случае BEGIN) в сегменте кода. В конце цикла находится команда JMP A20 которая указывает на то, что управление должно быть передано команде c меткой A20. Обратите внимание, что адресная метка в операнде команды указывается без двоеточия. Данный цикл не имеет выхода и приводит к бесконечному выполнению - такие циклы обычно не используются. ------------------------------------------------------------ ------------------------------------------------------------ Рис.7.1. Использование команды JMP. Метку можно кодировать на одной строке с командой: A20: ADD AX,01 или на отдельной строке: A20: ADD AX,01 В обоих случаях адрес A20 указывает на первый байт команды ADD. Двоеточие в метке A20 указывает на тип метки - NEAR. Запомните: отсутствие двоеточия в метке является частой ошибкой. В нашем примере A20 соответствует -9 байтам от команды JMP, в чем можно убедиться по объектному коду команды - EBF7. EB представляет собой машинный код для короткого перехода JMP, а F7 - отрицательное значение смещения (-9). Команда JMP прибавляет F7 к командному указателю (IP), котоpый содержит адрес команды после JMP (0112): Дес. Шест. Командный указатель: 274 112 Адрес в команде JMP: -9 F7 (двоичное дополнение) Адрес перехода: 265 109 Ассемблер для IBM PC. Глава 7 134 В результате сложения получается адрес перехода - шест. 109. Проверьте по листингу программы, что относительный адрес метки действительно соответствует шест.109. Соответственно операнд в команде JMP для перехода вперед имеет положитель ное значение. Команда JMP для перехода в пределах -128 до +127 байт имеет тип SHORT. Ассемблер генерирует в этом случае однобайтовый операнд в пределах от 00 до FF. Команда JMP, превосходящая эти пределы, получает тип FAR, для которого генерируется другой машинный код и двухбайтовый операнд. Ассемблер в первом просмотре исходной программы определяет длину каждой команды. Однако, команда JMP может быть длиной два или три байта. Если к моменту просмотра команды JMP ассемблер уже вычислил значение опеpанда (при переходе назад): A50: ... JMP A50 то он генерирует двухбайтовую команду. Если ассемблер еще не вычислил значение операнда (при переходе вперед) JMP A90 ... A90: то он не знает тип перехода NEAR или FAR, и автоматически генерирует 3-х байтовую команду. Для того, чтобы указать ассемблеру на необходимость генерации двухбайтовой команды, следует использовать оператор SHORT: JMP SHORT A90 ... A90: В качестве полезного упражнения, введите программу, проассемблируйте ее, скомпануйте и переведите в COM-формат. Определение данных не требуется, поскольку непосредственные операнды генерируют все необходимые данные. Используйте отладчик DEBUG для пошагового выполнения COM-модуля и просмотрите несколько повторений цикла. Когда регистр AX будет содержать 08, BX и CX увеличатся до шест. 24 (дес. 36) и шест. 80 (дес. 128), соответственно. Для выхода из отладчика используйте команду Q. КОМАНДА LOOP ------------------------------------------------------------ Команда JMP в примере на рис. 7.1 реализует бесконечный цикл. Но более вероятно подпрограмма должна выполнять определенное число циклов. Команда LOOP, которая служит для этой цели, использует начальное значение в регистре CX. В каждом цикле команда LOOP автоматически уменьшает содержимое Ассемблер для IBM PC. Глава 7 135 регистра CX на 1. Пока значение в CX не равно нулю, управление передается по адресу, указанному в операнде, и если в CX будет 0, управление переходит на слудующую после LOOP команду. Программа на рис. 7.2, иллюстрирующая использование коман ды LOOP, выполняет действия, аналогичные примеру на рис. 7.1 за исключением того, что после десяти циклов программа завершается. Команда MOV инициализирует регистр CX значением 10. Так как команда LOOP использует регистр CX, то в программе для удвоения начального значения 1 вместо регистра CX используется DX. Команда JMP A20 заменена командой LOOP и для эффективности команда ADD AX,01 заменена командой INC AX (увеличение AX на 1). Аналогично команде JMP, операнд команды LOOP определяет расстояние от конца команды LOOP до адреса метки A20, кото рое прибавляется к содержимому командного указателя. Для команды LOOP это расстояние должно быть в пределах от -128 до +127 байт. Если операнд превышает эти границы, то ассемб лер выдаст сообщение "Relative jump out of range" (превышены границы перехода). Для проверки команды LOOP рекомендуется изменить соответствующим образом программу, приведенную на рис.7.1, выполнить ее ассемблирование, компановку и преобразование в COM-файл. Для трассировки всех десяти циклов используйте отладчик DEBUG. Когда в значение регистре CX уменьшится до нуля, содержимое регистpов AX, BX и DX будет соответственно шест. 000B, 0042 и 0400. Для выхода из отладчика введите команду Q. Дополнительно существует две разновидности команды LOOP - это LOOPE (или LOOPZ) и LOOPNE (или LOOPNZ). Обе команды также уменьшают значение регистра CX на 1. Команда LOOPE передает управление по адресу операнда, если регистр CX имеет ненулевое значение и флаг нуля установлен (ZF=1). Команда LOOPNE передает управление по адресу операнда, если регистр CX имеет ненулевое значение и флаг нуля сброшен (ZF=0). ------------------------------------------------------------ ------------------------------------------------------------ Рис. 7.2. Использование команды LOOP. ФЛАГОВЫЙ РЕГИСТР ------------------------------------------------------------ Следующий материал данной главы требует более детального ознакомления с флаговым регистром. Этот pегистр содержит 16 бит флагов, которые управляются различными командами для индикации состояния операции. Во всех случаях флаги сохраня ют свое значение до тех пор, пока другая команда не изменит его. Флаговый регистр содержит следующие девять используемых бит (звездочками отмечены неиспользуемые биты): Номер бита: 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Ассемблер для IBM PC. Глава 7 136 Флаг: * * * * O D I T S Z * A * P * C Рассмотрим эти флаги в последовательности справа налево. CF (Carry Flag) - флаг переноса. Содержит значение "переносов" (0 или 1) из старшего разряда при арифметичес ких операциях и некоторых операциях сдвига и циклического сдвига (см. гл.12). PF (Parity Flag) - флаг четности. Проверяет младшие восемь бит pезультатов операций над данными. Нечетное число бит приводит к установке этого флага в 0, а четное - в 1. Не следует путать флаг четности с битом контроля на четность. AF (Auxiliary Carry Flag) - дополнительный флаг переноса. Устанавливается в 1, если арифметическая операция приводит к переносу четвертого справа бита (бит номер 3) в регистро вой однобайтовой команде. Данный флаг имеет отношение к арифметическим операциям над символами кода ASCII и к десятичным упакованным полям. ZF (Zero Flag) - флаг нуля. Устанавливается в качестве результата aрифметических команд и команд сравнения. Как это ни странно, ненулевой результат приводит к установке нулевого значения этого флага, а нулевой - к установке единичного значения. Кажущееся несоответствие является, однако, логически правильным, так как 0 обозначает "нет" (т.е. результат не равен нулю), а единица обозначаeт "да" (т.е. результат равен нулю). Команды условного перехода JE и JZ проверяют этот флаг. SF (SIgn Flag) - знаковый флаг. Устанавливается в соответ ствии со знаком результата (старшего бита) после арифмети ческих опеpаций: положительный результат устанавливает 0, а отрицательный - 1. Команды условного перехода JG и JL проверяют этот флаг. TF (Trap Flag) - флаг пошагового выполнения. Этот флаг вам уже приходилось устанавливать, когда использовалась ко манда Т в отладчике DEBUG. Если этот флаг установлен в еди ничное cостояние, то процессор переходит в режим пошагового выполнения команд, т.е. в каждый момент выполняется одна команда под пользовательским управлением. IF (Interrupt Flag) - флаг прерывания. При нулевом состоя нии этого флага прерывания запрещены, при единичном - разрешены. DF (DIrection Flag) - флаг направления. Используется в строковых операциях для определения направления передачи данных. При нулевом состоянии команда увеличивает содержимое Ассемблер для IBM PC. Глава 7 137 регистров SI и DI, вызывая передачу данных слева направо, при нулевом - уменьшает содержимое этих регистров, вызывая передачу данных справа налево (см. гл.11). OF (Overflow Flag) - флаг переполнения. Фиксирует арифме тическое переполнение, т.е. перенос в/из старшего (знаково го) бита при знаковых арифметических операциях. В качестве примера: команда CMP сравнивает два операнда и воздействуте на флаги AF, CF, OF, PF, SF, ZF. Однако, нет необходимости проверять все эти флаги по отдельности. В сле- дующем примере проверяется содержит ли регистр BX нулевое значение: CMP BX,00 ;Сравнение BX с нулем JZ B50 ;Переход на B50 если нуль . (действия при ненуле) . B50: ... ;Точка перехода при BX=0 Если BX содержит нулевое значение, команда CMP устанавливает флаг нуля ZF в единичное состояние, и возможно изменяет (или нет) другие флаги. Команда JZ (перехлд если нуль) проверяет только флаг ZF. При единичном значении ZF, обозначающее нулевой признак, команда передает управление на адрес, указанный в ее операнде, т.е. на метку B50. КОМАНДЫ УСЛОВНОГО ПЕРЕХОДА ------------------------------------------------------------ В предыдущих примерах было показано, что команда LOOP уменьшает на единицу содержимое регистра CX и проверяет его: если не ноль, то управление передается по адресу, указанному в операнде. Таким образом, передача управления зависит от конкретного состояния. Ассемблер поддерживает большое количество команд условного перехода, которые осуществляют передачу управления в зависимости от состояний флагового регистра. Например, при сравнении содержимого двух полей последующий переход зависит от значения флага. Команду LOOP в программе на рис.7.2 можно заменить на две команды: одна уменьшает содержимое регистра CX, а другая выполняет условный переход: Использование LOOP Использование условного перехода LOOP A20 DEC CX JNZ A20 Команды DEC и JNZ действуют аналогично команде LOOP: уменьшают содержимое регистра CX на 1 и выполняет переход на метку A20, если в CX не ноль. Команда DEC кроме того устанавливает флаг нуля во флаговом регистре в состояние 0 или 1. Команда JNZ затем проверяет эту установку. В рассмот ренном примере команда LOOP хотя и имеет огпаниченное исполь зование, но более эффективна, чем две команды: DEC и JNZ. Ассемблер для IBM PC. Глава 7 138 Аналогично командам JMP и LOOP операнд в команде JNZ cодержит значение расстояния между концом команды JNZ и адресом A20, которое прибавляется к командному указателю. Это расстояние должно быть в пределах от -128 до +127 байт. В случае перехода за эти границы ассемблер выдаст сообщение "Relative jump out of range" (превышены относительные грани цы перехода). Знаковые и беззнаковые данные. Рассматривая назначение команд условного перехода следует пояснить характер их использования. Типы данных, над которы ми выполняются арифметические операции и операции сравнения определяют какими командами пользоваться: беззнаковыми или знаковыми. Беззнаковые данные используют все биты как биты данных; характерным примером являются символьные строки: имена, адреса и натуральные числа. В знаковых данных самый левый бит представляет собой знак, причем если его значение равно нулю, то число положительное, и если единице, то отрицательное. Многие числовые значения могут быть как положительными так и отрицательными. В качестве примера предположим, что регистр AX содержит 11000110, а BX - 00010110. Команда CMP AX,BX сравнивает содержимое регистров AX и BX. Если данные беззнаковые, то значение в AX больше, а если знаковые - то меньше. Переходы для беззнаковых данных. Мнемоника Описание Проверяемые флаги JE/JZ Переход, если равно/нуль ZF JNE/JNZ Переход, если не равно/не нуль ZF JA/JNBE Переход, если выше/не ниже или равно ZF,CF JAE/JNB Переход, если выше или равно/не ниже CF JB/JNAE Переход, если ниже/не выше или равно CF JBE/JNA Переход, если ниже или равно/не выше CF,AF Любую проверку можно кодировать одним из двух мнемоничес ких кодов. Например, JB и JNAE генерирует один и тот же объектный код, хотя положительную проверку JB легче понять, чем отрицательную JNAE. Переходыдля знаковых данных Мнемоника Описание Проверяемые флаги JE/JZ Переход, если равно/нуль ZF JNE/JNZ Переход, если не равно/не нуль ZF JG/JNLE Переход, если больше/не меньше или равно ZF,SF,OF Ассемблер для IBM PC. Глава 7 139 JGE/JNL Переход, если больше или равно/не меньше SF,OF JL/JNGE Переход, если меньше/не больше или равно SF,OF JLE/JNG Переход, если меньше или равно/не больше ZF,SF,OF Команды перехода для условия равно или ноль (JE/JZ) и не равно или не ноль (JNE/JNZ) присутствуют в обоих списках для беззнаковых и знаковых данных. Состояние равно/нуль происходит вне зависимости от наличия знака. Специальныеарифметическиепроверки Мнемоника Описание Проверяемые флаги JS Переход, если есть знак (отрицательно) SF JNS Переход, если нет знака(положительно) SF JC Переход, если есть перенос (аналогично JB) CF JNC Переход, если нет переноса CF JO Переход, если есть переполнение OF JNO Переход, если нет переполнения OF JP/JPE Переход, если паритет четный PF JNP/JP Переход, если паритет нечетный PF Еще одна команда условного перехода проверяет равно ли содержимое регистра CX нулю. Эта команда необязательно должна pасполагаться непосредственно за командой арифметики или сравнения. Одним из мест для команды JCXZ может быть начало цикла, где она проверяет содержит ли регистр CX ненулевое значение. Не спешите пока заучивать эти команды наизусть. Запомните только, что для беззнаковых данных есть переходы по состоя ниям равно, выше или ниже, а для беззнаковых - равно, больше или меньше. Переходы по проверкам флагов переноса, переполнения и паритета имеют особое назначение. Ассемблер транслирует мнемонические коды в объектный код независимо от того, какую из двух команд вы применили. Однако, команды JAE и JGE являясь явно одинаковыми, проверяют различные флаги. ПРОЦЕДУРЫ И ОПЕРАТОР CALL ------------------------------------------------------------ В предыдущих главах примеры содержали в кодовом сегменте только oдну процедуру, оформленную следующим образом: BEGIN PROC FAR . . BEGIN ENDP Операнд FAR информирует систему о том, что данный адрес явля ется точкой входа для выполнения, а директива ENDP определя ет конец процедуры. Кодовый сегмент, однако, может содержать Ассемблер для IBM PC. Глава 7 140 любое количество процедур, которые разделяются директивами PROC и ENDP. Типичная организация многопроцедурной программы приведена на рис. 7.3. Обратите внимание на следующие особенности: ъ директивы PROC по меткам B10 и C10 имеют операнд NEAR для указания того, что эти процедуры находятся в теку щем кодовом сегменте. Во многих последующих примерах этот операнд опущен, так как по умолчанию ассемблер принимает тип NEAR. ъ Каждая процедура имеет уникальное имя и содержит соб ственную директиву ENDP для указания конца процедуры. ъ Для передачи управления в процедуре BEGIN имеются две команды: CALL B10 и CALL C10. В результате первой коман ды CALL управление передается процедуре B10 и начинает ся ее выполнение. Достигнув команды RET, управление возвращается на команду непосредственно следующую за CALL B10. Вторая команда CALL действует аналогично - передает управление в процедуру C10, выполняет ее команды и возвращает управление по команде RET. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 7.3. Вызов процедур. ъ Команда RET всегда выполняет возврат в вызывающую про грамму. Программа BEGIN вызывает процедуры B10 и C10, которые возвращают управление обратно в BEGIN. Для выполнения самой программы BEGIN операционная система DOS вызывает ее и в конце выполнения команда RET возвра щает управление в DOS. Если процедура B10 не содержит завершающей команды RET, то выполнение команд продолжит ся из B10 непосредственно в процедуре C10. Если процедура C10 не содержит команды RET, то будут выпол няться команды, оказавшиеся за процедурой C10 с непред сказуемым результатом. Использование процедур дает хорошую возможность организо вать логическую структуру программы. Кроме того, операнды для команды CALL могут иметь значения, выходящие за границу от -128 до +127 байт. Технически управление в процедуру типа NEAR может быть передано с помощью команд перехода или даже обычным построч ным кодированием. Но в большенстве случаев рекомендуется использовать команду CALL для передачи управления в проце дуру и команду RET для возврата. СЕГМЕНТ СТЕКА ------------------------------------------------------------ Ассемблер для IBM PC. Глава 7 141 До этого раздела в приводимых примерах встретились только две команды, использующих стек, - это команды PUSH в начале сегмента кодов, которые обеспечивают возврат в DOS, когда EXE-программа завершается. Естественно для этих программ требуется стек oчень малого размера. Однако, команда CALL автоматически записывает в стек относительный адрес команды, следующей непосредственно за командой CALL, и увеличивает после этого указатель вершины стека. В вызываемой процедуре команда RET использует этот адрес для возврата в вызывающую процедуру и при этом автоматически уменьшается указатель вершины стека. Таким образом, команды PUSH записывают в стек двухбайто вые адреса или другие значения. Команды POP обычно выбирают из стека записанные в него слова. Эти операции изменяют отно сительный адрес в регистре SP (т.е. в указатели стека) для доступа к следующему слову. Данное свойство стека требует чтобы команды RET и CALL соответствовали друг другу. Кроме того, вызванная процедура может вызвать с помощью команды CALL другую процедуру, а та в свою очередь - следующую. Стек должен иметь достаточные размеры для того, чтобы хранить все записываемые в него адреса. Для большенства примеров в дан ной книге стек объемом в 32 слова является достаточным. Команды PUSH, PUSHF, CALL, INT, и INTO заносят в стек адрес возврата или содержимое флагового регистра. Команды POP, POPF, RET и IRET извлекают эти aдреса или флаги из стека. При передаче управления в EXE-программу система устанавли вает в регистрах следующие значения: DS и ES: Адрес префикса программного сегмента - область в 256 (шест. 100) байт, которая предшествует выполняемому программному модулю в памяти. CS: Адрес точки входа в программу (адрес первой выполняемой команды). IP: Нуль. SS: Адрес сегмента стека. SP: Относительный адрес, указывающий на вершину стека. Например, для стека в 32 слова (64 байта), определенного как DW 32 DUP(?) SP содержит 64, или шест. 40. Выполним трассировку простой EXE-программы, приведенной на рис.7.4. На практике вызываемые процедуры содержат любое число команд. Текущая доступная ячейка стека для занесения или извлечения слова является вершина стека. Первая команда PUSH уменьшает значение SP на 2 и заносит содержимое регистра Ассемблер для IBM PC. Глава 7 142 DS (в данном примере 049f) в вершину стека, т.е. по адресу 4B00+3E. Вторая команда PUSH также уменьшает значение SP на 2 и записывает содержимое регистра AX (0000) по адресу 4B00+3C. Команда CALL B10 уменьшает значение SP и записывает относительный адрес следующей команды (0007) в стек по адресу 4B00+3A. Команда CALL C10 уменьшает значение SP и записывает относительный адрес следующей команды (000B) в стек по адресу 4B00+38. При возврате из процедуры C10 команда RET извлекает 000B из стека (4B00+38), помещает его в указатель команд IP и увеличивает значение SP на 2. При этом происходит автомати ческий возврат по относительному адресу 000B в кодовом сегменте, т.е. в процедуру B10. ------------------------------------------------------------ ------------------------------------------------------------ Рис. 7.4. Воздействие выполнения программы на стек. Команда RET в конце процедуры B10 извлекает адрес 0007 из стека (4B00+3A), помещают его в IP и увеличивает значение SP на 2. При этом происходит автоматический возврат по относи тельному адресу 0007 в кодовом сегменте. Команда RET по адресу 0007 завершает выполнение программы, осуществляя возврат типа FAR. Ниже показано воздействие на стек при выполнении каждой команды. Для трассировки программы можно использовать отладчик DEBUG. Приведено только содержимое памяти с адреса 0034 до 003F и содержимое регистра SP: Команда Стек SP Начальное значение: хххх хххх хххх хххх хххх хххх 0040 PUSH DS (запись 049F) хххх хххх хххх хххх хххх 049F 003E PUSH AX (запись 0000) хххх хххх хххх хххх 0000 049F 003C CALL B10 (запись 0007) хххх хххх хххх 0700 0000 049F 003A CALL C10 (запись 000B) хххх хххх 0B00 0700 0000 049F 0038 RET (выборка 000B) хххх хххх хххх 0700 0000 049F 003A RET (выборка 0007) хххх хххх хххх хххх 0000 049F 003C | | | | | | Смещение в стеке: 0034 0036 0038 003A 003C 003E Обратите внимание на два момента. Во-первых, слова в памя ти содержат байты в обратной последовательности, так 0007 записывается в виде 0700. Во-вторых, отладчик DEBUG при использовании его для просмотра стека заносит в стек другие значения, включая содержимое IP, для собственных нужд. ПРОГРАММА: РАСШИРЕННЫЕ ОПЕРАЦИИ ПЕРЕСЫЛКИ ------------------------------------------------------------ В предыдущих программах были показаны команды пересылки непосредcтвенных данных в регистр, пересылки данных из памяти в регистр, пересылки содержимого регистра в память и Ассемблер для IBM PC. Глава 7 143 пересылки содержимого oдного регистра в другой. Во всех случаях длина данных была огpаничена одним или двумя байтами и не предусмотрена пересылка данных из одной области памяти непосредственно другую область. В данном разделе объясняется процесс пересылки данных, которые имееют длину более двух байт. В главе 11 будет показано использование операций над строками для пересылки данных из одной области памяти непосредственно в другую область. В EXE-программе, приведенной на рис. 7.5, сегмент данных cодержит три девятибайтовых поля, NAME1, NAME2, NAME3. Цель программы - переслать данные из поля NAME1 в поле NAME2 и переслать данные из поля NAME2 в поле NAME3. Так как эти поля имеют длину девять байт каждая, то для пересылки данных кроме простой команды MOV потребуются еще другие команды. Программа содержит несколько новых особенностей. Процедура BEGIN инициализирует сегментные регистры и затем вызывает процедуры B10MOVE и C10MOVE. Процедура B10MOVE пересылает содержимое поля NAME1 в поле NAME2. Так как каждый раз пересылается только один байт, то процедура начинает с самого левого байта в поле NAME1 и в цикле пересы лает затем второй байт, третий и т.д.: ------------------------------------------------------------ ------------------------------------------------------------ Рис. 7.5. Расширенные операции пересылки. NAME1: A B C D E F G H I | | | | | | | | | NAME2: J K L M N O P Q R Для продвижения в полях NAME1 и NAME2 в регистр CX заносится значение 9, а регистры SI и DI используются в качестве индексных. Две команды LEA загружают относительные aдреса полей NAME1 и NAME2 в регистры SI и DI: LEA SI,NAME1 ;Загрузка относительных адресов LEA DI,NAME2 ; NAME1 и NAME2 Для пересылки содержимого первого байта из поля NAME1 в первый байт поля NAME2 используются адреса в регистрах SI и DI. kвадратные скобки в командах MOV обозначают, что для доступа к памяти используется адрес в регистре, указанном в квадратных cкобках. Таким образом, команда MOV AL,[SI] означает: использовать адрес в регистре SI (т.е.NAME1) для пересылки соответствующего байта в регистр AL. А команда MOV [DI],AL означает: пересылать содержимое регистра AL по адресу, лежащему в регистре DI (т.е. NAME2). Ассемблер для IBM PC. Глава 7 144 Следующие команды увеличивают значения регистров SI и DI и уменьшают значение в регистре SH. Если в регистре CX не нулевое значение, управление передается на следующий цикл (на метку B20).Т ак как содержимое регистров SI и DI было увеличено на 1, то следующие команды MOV будут иметь дело с адресами NAME1+1 и NAME2+1. Цикл продолжается таким образом, пока не будет передано содержимое NAME1+8 и NAME2+8. Процедура C10MOVE аналогична процедуре B10MOVE с двумя исключениями: она пересылает данные из поля NAME2 в поле NAME3 и использует команду LOOP вместо DEC и JNZ. Задание: Введите программу, приведенную на рис.7.5, выполните ее ассемблирование, компановку и трассировку с помощью отладчика DEBUG. Обратите внимание на изменения в регистрах, командном указателе и в стеке. Для просмотра изменений в полях NAME2 и NAME3 используйте команду D DS:0. КОМАНДЫ ЛОГИЧЕСКИХ ОПЕРАЦИЙ: AND, OR, XOR, TEST, NOT ------------------------------------------------------------ Логические операции являются важным элементом в проектировании микросхем и имеют много общего в логике программирования. Команды AND, OR, XOR и TEST - являются командами логических операций. Эти команды используются для сброса и установки бит и для арифметических операций в коде ASCII (см.гл.13). Все эти команды обрабатывают один байт или одно слово в регистре или в памяти, и устанавливают флаги CF, OF, PF, SF, ZF. AND: Если оба из сравниваемых битов равны 1, то результат равен 1; во всех остальных случаях результат - 0. OR: Если хотя бы один из сравниваемых битов равен 1, то результат равен 1; если сравниваемые биты равны 0, то результат - 0. XOR: Если один из сравниваемых битов равен 0, а другой равен 1, то результат равен 1; если сравниваемые биты одинаковы (оба - 0 или оба - 1) то результат - 0. TEST: действует как AND-устанавливает флаги, но не изменяет биты. Первый операнд в логических командах указывает на один байт или слово в регистре или в памяти и является единствен ным значением, которое может изменятся после выполнения команд. В следующих командах AND, OR и XOR используются одинаковые битовые значения: AND OR XOR 0101 0101 0101 0011 0011 0011 Результат: 0001 0111 0110 Ассемблер для IBM PC. Глава 7 145 Для следующих несвязанных примеров, предположим, что AL содержит 1100 0101, а BH содержит 0101 1100: 1. AND AL,BH ;Устанавливает в AL 0100 0100 2. OR BH,AL ;Устанавливает в BH 1101 1101 3. XOR AL,AL ;Устанавливает в AL 0000 0000 4. AND AL,00 ;Устанавливает в AL 0000 0000 5. AND AL,0FH ;Устанавливает в AL 0000 0101 6. OR CL,CL ;Устанавливает флаги SF и ZF Примеры 3 и 4 демонстрируют способ очистки регистра. В примере 5 обнуляются левые четыре бита регистра AL. Хотя команды сравнения CMP могут быть понятнее, можно применить команду OR для следующих целей: 1. OR CX,CX ;Проверка CX на нуль JZ ... ;Переход, если нуль 2. OR CX,CX ;Проверка знака в CX JS ... ;Переход, если отрицательно Команда TEST действует аналогично команде AND, но устанавливает только флаги, а операнд не изменяется. Ниже придено несколько примеров: 1. TEST BL,11110000B ;Любой из левых бит в BL JNZ ... ; равен единице? 2. TEST AL,00000001B ;Регистр AL содержит