Программа на ассемблере представляет собой совокупность блоков памяти, называемых сегментами памяти. Программа может состоять из одного или нескольких таких блоков-сегментов. Каждый сегмент содержит совокупность предложений языка, каждое из которых занимает отдельную строку кода программы.Предложения ассемблера бывают четырех типов:1)Pкоманды или инструкции, представляющие собой символические аналоги машинных команд. В процессе трансляции инструкции ассемблера преобразуются в соответствующие команды системы команд микропроцессора;2)Pмакрокоманды. Это оформляемые определенным образом предложения текста программы, замещаемые во время трансляции другими предложениями;3)Pдирективы, являющиеся указанием транслятору ассемблера на выполнение некоторых действий. У директив нет аналогов в машинном представлении;4)Pстроки комментариев, содержащие любые символы, в том числе и буквы русского алфавита. Комментарии игнорируются транслятором. Предложения, составляющие программу, могут представлять собой синтаксическую конструкцию, соответствующую команде, макрокоманде, директиве или комментарию. Для того чтобы транслятор ассемблера мог распознать их, они должны формироваться по определенным синтаксическим правилам. Для этого лучше всего использовать формальное описание синтаксиса языка наподобие правил грамматики. Наиболее распространенные способы подобного описания языка программирования синтаксические диаграммы и расширенные формы Бэкуса-Наура. Для практического использования более удобны синтаксические диаграммы. К примеру, синтаксис предложений ассемблера можно описать с помощью синтаксических диаграмм, показанных на следующих рисунках.Рис.P4. Формат предложения ассемблераРис.P5. Формат директивРис.P6. Формат команд и макрокомандНа этих рисунках:1)Pимя метки идентификатор, значением которого является адрес первого байта того предложения исходного текста программы, которое он обозначает;2)Pимя идентификатор, отличающий данную директиву от других одноименных директив. В результате обработки ассемблером определенной директивы этому имени могут быть присвоены определенные характеристики;3)Pкод операции (КОП) и директива это мнемонические обозначения соответствующей машинной команды, макрокоманды или директивы транслятора;4)Pоперанды части команды, макрокоманды или директивы ассемблера, обозначающие объекты, над которыми производятся действия. Операнды ассемблера описываются выражениями с числовыми и текстовыми константами, метками и идентификаторами переменных с использованием знаков операций и некоторых зарезервированных слов.Как использовать синтаксические диаграммы? Очень просто: для этого нужно всего лишь найти и затем пройти путь от входа диаграммы (слева) к ее выходу (направо). Если такой путь существует, то предложение или конструкция синтаксически правильны. Если такого пути нет, значит, эту конструкцию компилятор не примет. При работе с синтаксическими диаграммами обращайте внимание на направление обхода, указываемое стрелками, так как среди путей могут быть и такие, по которым можно идти справа налево. По сути, синтаксические диаграммы отражают логику работы транслятора при разборе входных предложений программы.Допустимыми символами при написании текста программ являются:1)Pвсе латинские буквы: А Z, а z. При этом заглавные и строчные буквы считаются эквивалентными;2)Pцифры от 0 до 9;3)Pзнаки ?, @, S, _, &;4)Pразделители.Предложения ассемблера формируются из лексем, представляющих собой синтаксически неразделимые последовательности допустимых символов языка, имеющие смысл для транслятора.Лексемами являются следующие.1.PИдентификаторы последовательности допустимых символов, использующиеся для обозначения таких объектов программы, как коды операций, имена переменных и названия меток. Правило записи идентификаторов заключается в следующем: идентификатор может состоять из одного или нескольких символов. В качестве символов можно использовать буквы латинского алфавита, цифры и некоторые специальные знаки _, ?, $, @. Идентификатор не может начинаться символом цифры. Длина идентификатора может быть до 255 символов, хотя транслятор воспринимает лишь первые 32, а остальные игнорирует. Регулировать длину возможных идентификаторов можно с использованием опции командной строки mv. Кроме этого, существует возможность указать транслятору на то, чтобы он различал прописные и строчные буквы либо игнорировал их различие (что и делается по умолчанию). Для этого применяются опции командной строки /mu, /ml, /mx.2.PЦепочки символов последовательности символов, заключенные в одинарные или двойные кавычки.3.PЦелые числа в одной из следующих систем счисления: двоичной, десятичной, шестнадцатеричной. Отождествление чисел при записи их в программах на ассемблере производится по определенным правилам:1)Pдесятичные числа не требуют для своего отождествления указания каких-либо дополнительных символов, например 25 или 139;2)Pдля отождествления в исходном тексте программы двоичных чисел необходимо после записи нулей и единиц, входящих в их состав, поставить латинское «b», например 10010101 b;3)PШестнадцатеричные числа имеют больше условностей при своей записи:а)Pво-первых, они состоят из цифр 0 9, строчных и прописных букв латинского алфавита а, b, с, d, е, Гили Д В, С, D, Е, Еб)Pво-вторых, у транслятора могут возникнуть трудности с распознаванием шестнадцатеричных чисел из-за того, что они могут состоять как из одних цифр 0 9 (например, 190845), так и начинаться с буквы латинского алфавита (например, efl5). Для того, чтобы «объяснить» транслятору, что данная лексема не является десятичным числом или идентификатором, программист должен специальным образом выделять шестнадцатеричное число. Для этого на конце последовательности шестнадцатеричных цифр, составляющих шестнадцатеричное число, записывают латинскую букву «h». Это обязательное условие. Если шестнадцатеричное число начинается с буквы, то перед ним записывается ведущий нуль: 0 efl5 h.Таким образом, мы разобрались с тем, как конструируются предложения программы ассемблера. Но это лишь самый поверхностный взгляд.Практически каждое предложение содержит описание объекта, над которым или при помощи которого выполняется некоторое действие. Эти объекты называются операндами. Их можно определить так: операнды это объекты (некоторые значения, регистры или ячейки памяти), на которые действуют инструкции или директивы, либо это объекты, которые определяют или уточняют действие инструкций или директив.Операнды могут комбинироваться с арифметическими, логическими, побитовыми и атрибутивными операторами для расчета некоторого значения или определения ячейки памяти, на которую будет воздействовать данная команда или директива.Рассмотрим подробнее характеристику операндов в нижеприведенной классификации:1)Pпостоянные или непосредственные операнды число, строка, имя или выражение, имеющие некоторое фиксированное значение. Имя не должно быть перемещаемым, т.Pе. зависеть от адреса загрузки программы в память. К примеру, оно может быть определено операторами equ или =;2)Pадресные операнды, задают физическое расположение операнда в памяти с помощью указания двух составляющих адреса: сегмента и смещения (рис.P7);Рис.P7. Синтаксис описания адресных операндов3)Pперемещаемые операнды любые символьные имена, представляющие некоторые адреса памяти. Эти адреса могут обозначать местоположение в памяти некоторых инструкций (если операнд метка) или данных (если операнд имя области памяти в сегменте данных).Перемещаемые операнды отличаются от адресных тем, что они не привязаны к конкретному адресу физической памяти. Сегментная составляющая адреса перемещаемого операнда неизвестна и будет определена после загрузки программы в память для выполнения.Счетчик адреса специфический вид операнда. Он обозначается знаком S. Специфика этого операнда в том, что когда транслятор ассемблера встречает в исходной программе этот символ, то он подставляет вместо него текущее значение счетчика адреса. Значение счетчика адреса или, как его иногда называют, счетчика размещения представляет собой смещение текущей машинной команды относительно начала сегмента кода. В формате листинга счетчику адреса соответствует вторая или третья колонка (в зависимости от того, присутствует или нет в листинге колонка с уровнем вложенности). Если взять в качестве примера любой листинг, то видно, что при обработке транслятором очередной команды ассемблера счетчик адреса увеличивается на длину сформированной машинной команды. Важно правильно понимать этот момент. К примеру, обработка директив ассемблера не влечет за собой изменения счетчика. Директивы, в отличие от команд ассемблера,P это лишь указания транслятору на выполнение определенных действий по формированию машинного представления программы, и для них транслятором не генерируется никаких конструкций в памяти.При использовании подобного выражения для перехода не забывайте о длине самой команды, в которой это выражение используется, так как значение счетчика адреса соответствует смещению в сегменте команд данной, а не следующей за ней команды. В нашем примере команда jmp занимает 2 байта. Но будьте осторожны, длина команды зависит от того, какие в ней используются операнды. Команда с регистровыми операндами будет короче команды, один из операндов которой расположен в память. В большинстве случаев эту информацию можно получить, зная формат машинной команды и анализируя колонку листинга с объектным кодом команды;4) регистровый операнд это просто имя регистра. В программе на ассемблере можно использовать имена всех регистров общего назначения и большинства системных регистров;5)Pбазовый и индексный операнды. Этот тип операндов используется для реализации косвенной базовой, косвенной индексной адресации или их комбинаций и расширений;6)Pструктурные операнды используются для доступа к конкретному элементу сложного типа данных, называемого структурой.Записи (аналогично структурному типу) используются для доступа к битовому полю некоторой записи.Операнды являются элементарными компонентами, из которых формируется часть машинной команды, обозначающая объекты, над которыми выполняется операция. В более общем случае операнды могут входить как составные части в более сложные образования, называемые выражениями. Выражения представляют собой комбинации операндов и операторов, рассматриваемые как единое целое. Результатом вычисления выражения может быть адрес некоторой ячейки памяти или некоторое константное (абсолютное) значение.Возможные типы операндов мы уже рассмотрели. Перечислим теперь возможные типы операторов ассемблера и синтаксические правила формирования выражений ассемблера, и дадим краткую характеристику операторов.1.PАрифметические операторы. К ним относятся:1)Pунарные «+» и « »;2)Pбинарные «+» и « »;3)Pумножения «*»;4)Pцелочисленного деления «/»;5)Pполучения остатка от деления «mod».Эти операторы расположены на уровнях приоритета 6,7,8 в таблице 4.Рис.P8. Синтаксис арифметических операций2. Операторы сдвига выполняют сдвиг выражения на указанное количество разрядов (рис.P9).Рис.P9. Синтаксис операторов сдвига3.PОператоры сравнения (возвращают значение «истина» или «ложь») предназначены для формирования логических выражений (рис.P10 и табл. 3). Логическое значение «истина» соответствует цифровой единице, а «ложь» нулю.Рис.P10. Синтаксис операторов сравненияТаблица 3. Операторы сравнения4.PЛогические операторы выполняют над выражениями побитовые операции (рис.P11). Выражения должны быть абсолютными, т.Pе. такими, численное значение которых может быть вычислено транслятором.Рис.P11. Синтаксис логических операторов5.PИндексный оператор []. Скобки тоже являются оператором, и транслятор их наличие воспринимает как указание сложить значение выражение_1 за этими скобками с выражение_2, заключенным в скобки (рис.P12).Рис.P12. Синтаксис индексного оператораЗаметим, что в литературе по ассемблеру принято следующее обозначение: когда в тексте речь идет о содержимом регистра, то его название берут в круглые скобки. Мы также будем придерживаться этого обозначения.6.PОператор переопределения типа ptr применяется для переопределения или уточнения типа метки или переменной, определяемых выражением (рис.P13).Тип может принимать одно из следующих значений: byte, word, dword, qword, tbyte, near, far.Рис.P13. Синтаксис оператора переопределения типа7.PОператор переопределения сегмента «:» (двоеточие) заставляет вычислять физический адрес относительно конкретно задаваемой сегментной составляющей: «имя сегментного регистра», «имя сегмента» из соответствующей директивы SEGMENT или «имя группы» (рис.P14). При обсуждении сегментации мы говорили о том, что микропроцессор на аппаратном уровне поддерживает три типа сегментов кода, стека и данных. В чем заключается такая аппаратная поддержка? К примеру, для выборки на выполнение очередной команды микропроцессор должен обязательно посмотреть содержимое сегментного регистра cs и только его. А в этом регистре, как мы знаем, содержится (пока еще не сдвинутый) физический адр
ЛЕКЦИЯ P16. Программы на Ассемблере / Информатика и информационные технологии: конспект лекций
Комментариев нет:
Отправить комментарий