[C] Dmitri Gribenko Содержание
Эта книга ориентирована на программистов, которые уже знают C на достаточном уровне. Почему так? Вряд ли зная только пару несколько языков вроде Perl или Python кто-то захочет изучать ассемблер. Используя ассемблер и C вместе, применяя каждый язык для определённых целей, можно добиться очень хороших результатов. К тому же, программисты C уже имеют некоторые знания об архитектуре, способе организации памяти и других вещах, которые поначалу сложно понять. Поэтому изучать ассемблер после C несомненно легче, чем после других языков высокого уровня. В C есть понятие "указатель", программист должен сам управлять выделением памяти в куче и так далее — все эти знания пригодятся при изучении ассемблера, они помогут получить более целостную картину об архитектуре, а также иметь более представление о том, как выполняются их программы на C. Но эти знания требуют углубления и структурирования. Хочу подчеркнуть, что для чтения этой книги никаких знаний о Linux не требуется (кроме, разумеется, "как создать текстовый файл" и "как запустить программу в консоли"). Да и вообще, единственное, в чем выражается ориентированность на Linux — это используемый синтаксис ассемблера. Программисты на асемблере в DOS и Windows используют синтаксис Intel, но в системах *nix принято использовать синтаксис AT&T. Именно синтаксисом AT&T написаны ассемблерные части ядра Linux, в синтаксисе AT&T компилятор GCC выводит ассемблерные листинги и т. д. Большую часть информации из этой книги можно использовать для программирования не только в *nix, но и в Windows — нужно только уточнить некоторые системно-зависимые особенности. Вы вероятно уже слышали такое понятие, как "архитектура x86". Вообще оно довольно размыто, и вот почему. Само название x86 или 80x86 происходит от принципа, по которому Intel давала названия своим процессорам:
Этот список можно продолжить. Принцип наименования, где каждому поколению процессоров давалось имя, заканчивающееся на 86, создал термин "x86". Но если посмотреть внимательнее, то мы увидим, что "процессором x86" можно назвать и древний 16-битный 8086, и новый Pentium 4. Поэтому 32-битные расширения были названы архитектурой IA-32 (сокращение от Intel Architecture, 32-bit). Конечно же, возможность запуска 16-битных программ осталась, и она успешно (и не очень) используется в 32-битных версиях Windows. Так как Linux является полностью 32-битной операционной системой, то мы будем рассматривать только 32-битный режим. Теперь, определившись наконец с предметом изучения, рассмотрим, что входит в понятие "архитектура системы". Это, в первую очередь, те понятия, с которыми придется работать программисту. А нас больше всего интересует набор команд и способы хранения и обращения к данным, над которыми будут оперировать команды. Также в архитектуру входят некоторые более абстрактные понятия (например, принцип сегментации памяти, реальный и защищённый режим) и технологии вообще (например, конвейер). Регистр — это небольшой объем очень быстрой памяти, размещенной на процессоре. Она предназначена для хранения результатов промежуточных вычислений, а также некоторой информации для управления работой процессора. Так как регистры размещены непосредственно на процессоре, то доступ к данным в регистрах обычно в несколько раз быстрее доступа к данным в оперативной памяти. Программисту доступны 16 пользовательских и 16 системных регистров. Они называются пользовательскими регистрами:
Имея опыт программирования на C, я думаю, что вы слышали (а может и
использовали) структуры данных типа стек. В микропроцессоре стек работает
похожим образом: это область памяти, у которой определена вершина (на неё
указывает
Содержимое стека Адреса в памяти . . . . . . +----------------+ 0x0000F040 | | +----------------+ 0x0000F044 <--- вершина стека (указывает %esp) | данные | +----------------+ 0x0000F048 | данные | +----------------+ 0x0000F04C . . . . . . +----------------+ 0x0000FFF8 | данные | +----------------+ 0x0000FFFC | данные | +----------------+ 0x00010000 <--- дно стека
Стек растёт в сторону младших адресов. Это значит, что последний записанный в стек элемент будет расположен по адресу младше остальных элементов стека. Что же происходит при помещении нового элемента в стек? (Принцип работы команды push)
. . . . . . +----------------+ 0x0000F040 <--- новая вершина стека (%esp) | новый элемент | +----------------+ 0x0000F044 <--- старая вершина стека | данные | +----------------+ 0x0000F048 . . . . . . +----------------+ 0x0000FFFC | данные | +----------------+ 0x00010000 <--- дно стека
Когда мы достаём элемент из стека, эти действия совершаются в обратном порядке: (Принцип работы команды pop)
. . . . . . +-----------------+ 0x0000F040 <--- старая вершина стека | верхний элемент | ------------------------------- записывается в регистр ---> +-----------------+ 0x0000F044 <--- новая вершина стека (%esp) | данные | +-----------------+ 0x0000F048 . . . . . . +-----------------+ 0x0000FFFC | данные | +-----------------+ 0x00010000 <--- дно стека
Память — что про неё ещё скажешь? В C после вызова
Правда, нужно отметить ещё одну деталь. Программный код расположен в памяти, поэтому вы тоже можете получить его адрес. Стек — это тоже блок памяти, и вы можете получить указатель на какой-то элемент стека, который находится под вершиной. Таким образом можно организовать доступ к произвольным элементам стека. Оперативная память — это массив битовых значений, 0 и 1. О порядке битов в байте мы говорить не будем, так как вы не можете указать адрес отдельного бита, лишь только адрес байта, содержащего этот бит. А как в памяти располагаются байты в слове? Предположим, что у нас есть число 0x01020304. Его можно записать в виде байтовой последовательности: начиная со старшего байта: 0x01 0x02 0x03 0x04 big-endian начиная с младшего байта: 0x04 0x03 0x02 0x01 little-endian Вот эта байтовая последовательность располагается в оперативной памяти, адрес всего слова в памяти — адрес первого байта этой последовательности. Если первым располагается младший байт (мы начинаем запись с "меньшего конца") — такой порядок байт называется little-endian или интеловским. Именно он используется в процессорах x86. Если первым располагается старший байт (мы начинаем запись с "большего конца") — такой порядок байт называется big-endian. У little-endian есть одно важное достоинство. Посмотрите на запись числа 0x00000033: 0x33 0x00 0x00 0x00 Если мы прочитаем его как двухбайтовое значение, получим 0x0033. Если прочитаем как однобайтовое — получим 0x33. При записи этот трюк тоже работает. Конечно же, мы не можем прочитать число 0x11223344 как байт, потому что получим 0x44, что неверно. Поэтому считываемое число должно помещаться в целевой диапазон значений. Ссылки по теме:
При изучении нового языка принято писать самой первой программу, выводящую на экран строку "Hello, world!". Сейчас мы не ставим перед собой задачу понять всё написанное. Главное — посмотреть, как оформляются программы на ассемблере и научиться их компилировать. Вспомним, как вы писали hello world на C. Скорее всего, приблизительно так: #include <stdio.h> int main(int argc, char* argv[]) { printf("Hello, world!\n"); exit(0); }
Вот только
Как вы уже наверное знаете, стандартный вывод (stdout), в который выводит
данные WRITE(2) Руководство программиста Linux WRITE(2) ИМЯ write - писать в файловый дескриптор ОБЗОР #include <unistd.h> ssize_t write(int fd, const void *buf, size_t count); ОПИСАНИЕ write пишет count байт в файл, на который ссылается файловый дескриптор fd из буфера, на который указывает buf. А вот и сама программа: #include <unistd.h> int main(int argc, char* argv[]) { char str[] = "Hello, world!\n"; write(1, str, sizeof(str) - 1); exit(0); } Почему sizeof(str) - 1? Потому что строка в C заканчивается нулевым байтом, а его нам печатать не нужно.
Теперь скопируйте следующий текст в файл .data /* поместить следующее в сегмент данных */ hello_str: /* наша строка */ .string "Hello, world!\n" /* длина строки */ .set hello_str_length, . - hello_str - 1 .text /* поместить следующее в сегмент кода */ .globl main /* main -- глобальный символ, который видно за пределами этого файла */ .type main, @function /* main -- функция (а не данные) */ main: movl $4, %eax /* помещаем номер системного вызова write = 4 в регистр %eax */ movl $1, %ebx /* первый параметр -- в регистр %ebx номер файлового дескриптора stdout = 1 */ movl $hello_str, %ecx /* второй параметр -- в регистр %ecx указатель на строку */ movl $hello_str_length, %edx /* третий параметр -- в регистр %edx длина строки */ int $0x80 /* вызываем прерывание 0x80 */ movl $1, %eax /* номер системного вызова exit = 1 */ movl $0, %ebx /* передаём 0 как значение параметра */ int $0x80 /* вызываем exit(0) */ .size main, .-main /* размер функции main */ Напоминаю, сейчас наша задача — скомпилировать первую программу. Подробное объяснение этого кода будет потом.
Если компиляция прошла успешно, GCC ничего не выводит на экран. Теперь запускаем нашу программу. Также проверяем, что она корректно завершилась со статусом 0.
Теперь я советую прочитать главу про отладчик GDB. Он вам понадобится для исследования работы ваших программ. Возможно, сейчас вы не всё поймете, но эта глава специально расположена в конце, так как задумана больше как справочная, нежели обучающая. Для того, чтобы научиться работать с отладчиком, с ним нужно просто работать. Команды ассемблера — это те инструкции, которые будет исполнять процессор. По сути, это самый низкий уровень программирования процессора. Каждая команда состоит из операции (что делать?) и операндов (аргументов). Операции мы будем рассматривать отдельно. А операнды у всех операций задаются в одном и том же формате. Операндов может быть от 0 (то есть нет вообще) до 3. В роли операнда могут выступать:
ВажноЕсли вы забудете знак $ когда записываете непосредственное числовое значение, компилятор будет интерпретировать его как абсолютный адрес. Это не вызовет ошибок компиляции, но скорее всего приведёт в Segmentation fault при выполнении.
Почти у каждой команды можно определить операнд-источник (команда читает его) и операнд-назначение (команда записывает в него результат). Общий синтаксис команды ассемблера такой:
Для того, чтобы привести пример команды я, немного забегая наперед, расскажу об
одной операции. Команда movl $4, %eax /* помещаем номер системного вызова write = 4 в регистр %eax */
Как мы видим, источник — это непосредственное значение 4, а назначение
— регистр
Таким образом, чтобы записать movb $42, %al Важной особенностью всех команд является то, что они не могут работать с двумя операндами, находящимися в памяти. Хотя бы один из них следует сначала загрузить в регистр, а затем выполнять необходимую операцию. Как формируется указатель на ячейку памяти? Синтаксис:
Вычисленный адрес будет равен
Ещё один важный нюанс: команды нужно помещать в секцию кода. Для этого перед
командами нужно указать директиву .text movl $42, %eax ... ну и другие команды...
Существуют директивы ассемблера, которые размещают в памяти данные, определенные программистом. Аргументы этих директив — список выражений, разделенных запятыми.
Например: .byte 0x10, 0xf5, 0x42, 0x55 .long 0xaabbaabb .short -123, 456 Также существуют директивы для размещения в памяти строковых литералов:
Строка-аргумент этих директив может содержать стандартные escape-последовательности, которые вы использовали в C, например, "\n", "\r", "\t", "\\", "\"" и т. д.
Данные нужно помещать в секцию данных. Для этого перед данными нужно поместить
директиву .data .string "Hello, world\n" ... ещё много-много данных...
Если некоторые данные не предполагается изменять в ходе выполнения программы,
их можно поместить в специальную секцию данных только для чтения при помощи
директивы .section .rodata .string "program version 0.314"
Также приведу небольшую таблицу, которая сопоставляет типы данных в C на IA-32 и в ассемблере. Хочу заметить, что размер этих типов в C в других архитектурах может отличаться.
Отдельных объяснений требует колонка "выравнивание". Выравнивание задано у каждого фундаментального типа данных (типа данных, которым процессор может оперировать непосредственно). Например, выравнивание word — 4 байта. Это значит, что данные типа word должны располагаться по адресу, кратному 4 (например, 0x00000100, 0x03284478). Архитектура рекомендует, но не требует выравнивания: доступ к невыровненным данным может быть медленнее, но принципиальной разницы нет и ошибки это не вызовет.
Для соблюдения выравнивания в распоряжении программиста есть директива .p2align
Директива Второй и третий аргумент являются необязательными. Примеры: .data .string "Hello, world\n" /* мы вряд ли захотим считать, сколько символов занимает эта строка, и является ли следующий адрес выровненным */ .p2align 2 /* выравниваем по границе 4 байта для следующего .long */ .long 123456
Вы наверное заметили, что мы не присвоили имен нашим данным. Как же к ним обращаться? Очень просто — нужно поставить метку. Метка — это просто константа, значение которой — адрес. hello_str: .string "Hello, world!\n" Сама метка, в отличие от данных, места в памяти программы не занимает. Когда компилятор встречает в исходном коде метку, он запоминает текущий адрес и читает код дальше. В результате компилятор помнит все метки, и адреса, на которые они указывают. Программист может ссылаться на метки в своём коде. Существует специальная "метка", которая указывает на текущий адрес. Это метка "." (точка). Значение метки как константы — это всегда адрес. А если вам нужна константа с каким-то другим значением? Тогда мы приходим к более общему понятию "символа". Символ — это просто некоторая константа. Причем он может быть определен в одном файле, а использован — в других.
Возьмём
Обратите анимание на параметр
nm(1) выводит список символов в объектном файле. В первой
колонке выводится значение символа, во второй — его тип, в третьей
— имя. Возьмем символ
Для создания нового символа используется директива
Например, определим символ .set foobar, 42 Ещё пример из hello.s: hello_str: /* наша строка */ .string "Hello, world!\n" /* длина строки */ .set hello_str_length, . - hello_str - 1
Сначала определяется символ
Часто требуется просто зарезервировать место в памяти для данных, без
инициализации какими-то значениями. Например, у вас есть переменная, значение
которой определяется параметрами командной строки. Действительно, вы вряд ли
сможете дать ей какое-то осмысленное начальное значение, разве что 0. Такие
данные называются неинциализированными и для них выделена специальная секция
под названием Хорошо, но известные нам директивы размещения данных требуют указания инициализирующего значения. Поэтому для неинициализированных данных используются специальные директивы: .space
Директива
Также эту директиву можно использовать для размещения инициализированных
данных, для этого существует параметр Например: .bss long_var_1: /* по размеру как .long */ .space 4 buffer: /* какой-то буфер в 1024 байта */ .space 1024 struct: /* какая-то структура размером 20 байт */ .space 20
Содержание Синтаксис: mov
Команда /* * Это просто примеры использования команды mov, * ничего толкового этот код не делает */ .data some_var: .long 0x00000072 other_var: .long 0x00000001, 0x00000002, 0x00000003 .text .globl main main: movl $0x48, %eax /* помещаем число 0x00000048 в %eax */ movl $some_var, %eax /* помещаем в %eax значение метки some_var -- то есть адрес числа в памяти например, у меня %eax стал равен 0x08049589 */ movl some_var, %eax /* а теперь обращаемся к содержимому переменной в %eax теперь 0x00000072 */ movl other_var + 4, %eax /* other_var указывает на 0x00000001 размер одного long -- 4 байта значит, other_var + 4 указывает на 0x00000002 в %eax теперь 0x00000002 */ movl $1, %ecx /* помещаем число 1 в %ecx */ movl other_var(,%ecx,4), %eax /* помещаем в %eax первый (нумерация с нуля) элемент массива, пользуясь %ecx как индексным регистром */ movl $other_var, %ebx /* в %ebx адрес other_var */ movl 4(%ebx), %eax /* обращаемся по адресу %ebx + 4 в %eax снова 0x00000002 */ movl $other_var + 4, %eax /* в %eax адрес, по которому расположен 0x00000002 */ movl $0x15, (%eax) /* записываем по этому адресу число 0x00000015 */ Внимательно следите, когда вы загружаете адрес переменной, а когда обращаетесь к значению переменной по её адресу. Например: movl other_var + 4, %eax /* забыли знак $, в результате в %eax находится число 0x00000002 */ movl $0x15, (%eax) /* пытаемся записать по адресу 0x00000002 -> получаем Segmentaion fault */ movl 0x48, %eax /* забыли $, и пытаемся обратиться по адресу 0x00000048 -> Segmentaion fault */
lea
Команда .data some_var: .long 0x00000072 .text leal 0x32, %eax /* аналогично movl $0x32, %eax */ leal some_var, %eax /* аналогично movl $some_var, %eax */ leal $0x32, %eax /* вызовет ошибку при компиляции, так как $0x32 не является адресом */ leal $some_var, %eax /* аналогично, ошибка компиляции */ leal 4(%esp), %eax /* помещаем в %eax адрес предыдущего элемента в стеке фактически, %eax = %esp + 4 */
Предусмотрено две специальные команды для работы со стеком,
push
При описании работы стека, я уже писал о принципе работы команды push и о
принципе работы команды pop.
Важный нюанс: pushb 0x10 GCC вам ответит, что:
Согласно ABI, в Linux стек выровнен по long. Сама архитектура этого не требует, это только соглашение между программами, но не рассчитывайте что другие библиотеки подпрограмм или операционная система захотят работать с невыровненным стеком. Что это всё значит? Если вы резервируете место в стеке, количество байт должно быть кратно размеру long, то есть 4. Например, вам нужно 2 байта в стеке под short. Но вы должны резервировать 4 байта для того, чтобы соблюдать выравнивание. А теперь примеры: .text pushl $0x10 /* поместили в стек число 10 */ pushl $0x20 /* поместили в стек число 20 */ popl %eax /* достали 20 в %eax */ popl %ebx /* достали 10 в %ebx */ pushl %eax popl %ebx /* странный способ сделать movl %eax, %ebx */ movl $0x00000010, %eax pushl %eax /* положили в стек 4 байта*/ popw %ax /* достали 2 байта */ popw %bx /* и ещё 2 байта */ /* в %ax находится 0x0010, в %bx находится 0x0000 такой код сложен для понимания, его следует избегать */ pushl %eax /* поместили %eax в стек -> %esp уменьшился на 4 */ addl $4, %esp /* увеличили %esp на 4, таким образом привели стек в исходное состояние */
Интересный вопрос: какое значение помещает в стек вот эта команда pushl %esp
Если вы ещё раз посмотрите на алгоритм, то она должна поместить уже уменьшенное
значение Арифметических команд в нашем распоряжении довольно много. Синтаксис: inc Принцип работы:
Команда
Примеры: .text movl $72, %eax incl %eax /* в %eax число 73 */ decl %eax /* в %eax число 72 */ movl $48, %eax addl $16, %eax /* в %eax число 64 */ movb $5, %al movb $5, %bl mulb %bl /* в регистре %ax произведение %al * %bl = 25 */ Это скучно, — скажете вы. Хорошо. Давайте подумаем, какой будет результат выполнения следующего кода на C: char x, y; x = 250; y = 14; x = x + y; printf("%d", (int) x); Блльшинство сразу скажет, что результат (250 + 14 = 264) больше, чем может поместиться в одном байте. И что же напечатает программа? 8. Давайте рассмотрим, что происходит при сложении в двоичной системе. 11111010 250 + 00001110 + 14 ---------- --- 1 00001000 264 | | +------+ = 8
Получается, что результат занимает 9 бит, а в переменную может поместиться
только 8 бит. Это называется переполнение — перенос из старшего бита
результата. В C переполнение не может быть перехвачено. Но в микропроцессоре
эта ситуация регистрируется и её можно обработать. Когда происходит
переполнение, устанавливается флаг cf. Команды условного
прехода movb $0, %ah /* %ah = 0 */ movb $250, %al /* %al = 250 */ addb $14, %al /* %al = %al + 14 происходит переполнение, устанавливается флаг cf в %al число 8 */ jnc no_carry /* если переполнения не было, переходим на метку */ movb $1, %ah /* %ah = 1 */ no_carry: /* %ax = 264 = 0x0108 */
Этот код выдаёт правильную сумму в регистре
Для выполнения некоторых арифметических операций можно использовать команду
Вспомним, как формируется адрес операнда:
Вычисленный адрес будет равен Чем это нам удобно? Так мы можем получить команду с двумя операндами-источниками и одним результатом: movl $10, %eax movl $7, %ebx leal 5(%eax), %ecx /* %ecx = %eax + 5 = 15 */ leal -3(%eax), %ecx /* %ecx = %eax - 3 = 10 */ leal (%eax,%ebx), %ecx /* %ecx = %eax + %ebx*1 = 17 */ leal (%eax,%ebx,2), %ecx /* %ecx = %eax + %ebx*2 = 24 */ leal 1(%eax,%ebx,2), %ecx /* %ecx = %eax + %ebx*2 + 1 = 25 */ leal (,%eax,8), %ecx /* %ecx = %eax*8 = 80 */ leal (%eax,%eax,2), %ecx /* %eax = %eax + %eax*2 = %eax*3 = 30 */ leal (%eax,%eax,4), %ecx /* %eax = %eax + %eax*4 = %eax*5 = 50 */ leal (%eax,%eax,8), %ecx /* %eax = %eax + %eax*8 = %eax*9 = 90 */
Вспомните, что при сложении командой Синтаксис:
Принцип работы:
Напишем программу для вычисления суммы чисел от 1 до 10 (конечно же, есть формула суммы арифметической прогрессии — но ведь это только пример). .data printf_format: .string "%d\n" .text .globl main main: movl $0, %eax /* в %eax будет результат, поэтому в начале обнулим его */ movl $10, %ecx /* 10 шагов цикла */ sum: addl %ecx, %eax /* %eax = %eax + %ecx */ loop sum /* %eax = 55, %ecx = 0 */ /* * следующий код выводит число в %eax на экран и завершает программу */ pushl %eax pushl $printf_format call printf addl $8, %esp movl $0, %eax ret На C это бы выглядело так: #include <stdio.h> int main() { int eax, ecx; eax = 0; ecx = 10; do { eax += ecx; } while(--ecx); printf("%d\n", eax); }
Команда cmp
Команда ВажноОбратите внимание на порядок операндов в записи команды: сначала второй, потом первый.
Сравнили, установили флаги, — и что дальше? А у нас есть целое семейство jump-команд, которые передают управление другим командам. Эти команды называются командами условного перехода. Каждой из них поставлено в соответствие условие, которое она проверяет. Синтаксис:
Команды
Таким образом,
Теперь пример использования этих команд: .text /* вот тут пропущен код, который получает некоторое значение в %eax пусть нас интересует случай, когда %eax == 15 */ cmpl $15, %eax /* сравниваем */ jne not_equal: /* если не равно -- уходим на метку not_equal */ /* тут мы окажемся только если переход не сработал, а значит %eax == 15 */ not_equal: /* а тут мы окажемся в любом случае */ Сравните с кодом на C: if(eax == 15) { /* тут мы окажемся только если переход не сработал, а значит %eax == 15 */ } /* а тут мы окажемся в любом случае */
Кроме команд условного перехода, область применения которых ясна сразу, ещё
существует команда безусловного перехода. Эта команда чем-то похожа на
оператор jmp
Эта команда передаёт управление на Все инструкции для написания произвольных циклов я уже объяснил, поэтому сейчас я сначала приведу программу, а потом объяснение к ней. Почитайте её код и комментарии и попытайтесь разобраться, что она делает. Если сразу что-то непонятно — не страшно, сразу после исходного кода находится более подробное объяснение.
Рассмотрим программу для нахождения максимального элемента массива. Сначала мы
заносим в регистр .data printf_format: .string "%d\n" array: .long 10, 15, 148, 12, 151, 3, 72 array_end: .text .globl main main: movl $0, %eax /* в %eax будет результат в начале максимальное значение -- 0 */ movl $array, %ebx /* в %ebx адрес текущего элемента массива */ loop_start: /* начало цикла */ cmpl %eax, (%ebx) /* сравниваем текущий элемент массива и текущее максимальное значение в %eax */ jbe less /* если текущий элемент массива меньше или равен максимальному, обходим следующий код */ movl (%ebx), %eax /* а вот если элемент массива больше максимального, значит он и есть новый максимум */ less: addl $4, %ebx /* увеличиваем %ebx на размер одного элемента массива, 4 байта */ cmpl $array_end, %ebx /* сравниваем адрес текущего элемента и адрес конца массива */ je loop_end /* если они равны -- выходим из цикла */ jmp loop_start /* иначе повторяем цикл снова */ loop_end: /* * следующий код выводит число в %eax на экран и завершает программу */ pushl %eax pushl $printf_format call printf addl $8, %esp movl $0, %eax ret Этот код соответствует приблизительно следующему на C: #include <stdio.h> int main() { int array[] = { 10, 15, 148, 12, 151, 3, 72 }; int *array_end = &array[sizeof(array) / sizeof(int)]; int max = 0; int *p = array; do { if(*p > max) { max = *p; } } while(++p != array_end); printf("%d\n", max); } Возможно, такой способ обхода массива не очень привычен для вас. В C принято использовать переменную с номером текущего элемента, а не указатель на него. Никто не запрещает пойти этим же путём и на ассемблере: .data printf_format: .string "%d\n" array: .long 10, 15, 148, 12, 151, 3, 72 array_end: array_size: .long (array_end - array)/4 /* количество элементов массива */ .text .globl main main: movl $0, %eax /* в %eax будет результат в начале максимальное значение -- 0 */ movl $0, %ecx /* начинаем просмотр с нулевого элемента */ loop_start: /* начало цикла */ cmpl %eax, array(,%ecx,4) /* сравниваем текущий элемент массива и текущее максимальное значение в %eax */ jbe less /* если текущий элемент массива меньше или равен максимальному, обходим следующий код */ movl array(,%ecx,4), %eax /* а вот если элемент массива больше максимального, значит он и есть новый максимум */ less: incl %ecx /* увеличиваем на 1 номер текущего элемента */ cmpl array_size, %ecx /* сравниваем номер текущего элемента и общее количество элементов */ je loop_end /* если они равны -- выходим из цикла */ jmp loop_start /* иначе повторяем цикл снова */ loop_end: /* * следующий код выводит число в %eax на экран и завершает программу */ pushl %eax pushl $printf_format call printf addl $8, %esp movl $0, %eax ret
Рассматривая код этой программы, вы, наверное, уже поняли как создавать произвольный циклы в ассемблере, наподобие do{} while(); в C. Ещё раз повторю эту конструкцию, выкинув весь код, не относящийся к циклу: loop_start: /* начало цикла */ /* вот тут находится тело цикла */ cmpl ... /* что-то сравниваем для принятия решения о выходе из цикла */ je loop_end /* подбираем соответствующую команду условного перехода для выхода из цикла */ jmp loop_start /* иначе повторяем цикл снова */ loop_end: В C есть ещё один вид цикла, с проверкой условия перед входом в тело цикла: while(){}. Немного изменив предыдущий код, получаем следующее: loop_start: /* начало цикла */ cmpl ... /* что-то сравниваем для принятия решения о выходе из цикла */ je loop_end /* подбираем соответствующую команду условного перехода для выхода из цикла */ /* вот тут находится тело цикла */ jmp loop_start /* переходим к проверке условия цикла */ loop_end: Кто-то скажет: а ещё есть цикл for()! Но цикл for(init; cond; incr) { body; } эквивалентен такой конструкции: init; while(cond) { body; incr; } Таким образом нам хватит и уже рассмотренных двух видов циклов. Кроме обычных арифметических вычислений, мы можем выполнять и логические, то есть побитовые. and
Команды
Команда
Команда testb $0b00001000, %al je not_set /* нужные биты установлены */ not_set: /* биты не установлены */
Команду testl %eax, %eax je is_zero /* %eax != 0 */ iz_zero: /* %eax == 0 */
Intel Optimization Manual рекомендует использовать
Ещё следует упомянуть об одном трюке с xorl %eax, %eax /* теперь %eax == 0 */
Почему применяют
Иногда для обнуления регистра применяют команду subl %eax, %eax /* теперь %eax == 0 */
К логическим командам также можно отнести команды сдвигов: /* Shift arithmetic left/Shift logical left */ sal/shl
Принцип работы команды До сдвига: +---+ +----------------------------------+ | ? | | 10001000100010001000100010001011 | +---+ +----------------------------------+ Флаг CF Операнд Сдвиг влево на 1 бит: +---+ +----------------------------------+ | 1 | <-- | 00010001000100010001000100010110 | <-- 0 +---+ +----------------------------------+ Флаг CF Операнд Сдвиг влево на 3 бита: +----+ +---+ +----------------------------------+ | 10 | | 0 | <-- | 01000100010001000100010001011000 | <-- 000 +----+ +---+ +----------------------------------+ Улетели Флаг CF Операнд вникуда
Принцип работы команды До сдвига: +----------------------------------+ +---+ | 10001000100010001000100010001011 | | ? | +----------------------------------+ +---+ Операнд Флаг CF Логический сдвиг вправо на 1 бит: +----------------------------------+ +---+ 0 --> | 01000100010001000100010001000101 | --> | 1 | +----------------------------------+ +---+ Операнд Флаг CF Логический сдвиг вправо на 3 бита: +----------------------------------+ +---+ +----+ 000 --> | 00010001000100010001000100010001 | --> | 0 | | 11 | +----------------------------------+ +---+ +----+ Операнд Флаг CF Улетели вникуда Эти две команды называются командами логического сдвига потому что они работают с операндом как с массивом бит. Каждый "выдвигаемый" бит попадает в флаг cf, причём с другой стороны операнда "вдвигается" бит 0. Таким образом, в регистре cf оказывается самый последний "выдвинутый" бит. Такое поведение вполне допустимо для работы с беззнаковыми числами, но числа со знаком будут обработаны неверно из-за того, что знаковый бит может быть потерян.
Для работы с числами со знаком существуют команды арифметического сдвига.
Команды До сдвига: +----------------------------------+ +---+ | 10001000100010001000100010001011 | | ? | +----------------------------------+ +---+ Операнд Флаг CF старший бит равен 1 ==> ==> значение отрицательное ==> ==> "вдвигаем" бит 1 ---+ | +-------------------------------+ | V Арифметический сдвиг вправо на 1 бит: +----------------------------------+ +---+ 1 --> | 11000100010001000100010001000101 | --> | 1 | +----------------------------------+ +---+ Операнд Флаг CF Арифметический сдвиг вправо на 3 бита: +----------------------------------+ +---+ +----+ 111 --> | 11110001000100010001000100010001 | --> | 0 | | 11 | +----------------------------------+ +---+ +----+ Операнд Флаг CF Улетели вникуда
Многие программисты C знают об умножении и делении на степени двойки (2, 4, 8…) при помощи сдвигов. Этот трюк отлично работает и в ассемблере, используйте его для оптимизации. Кроме сдвигов обычных, существуют циклические сдвиги: /* Rotate right */ ror Объясню на примере циклического сдвига влево на три бита: три старших ("левых") бита "выдвигаются" из регистра влево и "вдвигаются" в него справа. При этом в флаг CF записывается самый последний "выдвинутый" бит.
Принцип работы команды До сдвига: +---+ +----------------------------------+ | ? | | 10001000100010001000100010001011 | +---+ +----------------------------------+ Флаг CF Операнд Циклический сдвиг влево на 1 бит: +---+ 1 1 +----------------------------------+ | 1 | <--+--- | 00010001000100010001000100010111 | ---+ +---+ | +----------------------------------+ | Флаг CF V Операнд ^ | | +------------------->--->--->----------------+ 1 Циклический сдвиг влево на 3 бита: +---+ 0 100 +----------------------------------+ | 0 | <--+--- | 01000100010001000100010001011100 | ---+ +---+ | +----------------------------------+ | Флаг CF V Операнд ^ | | +------------------->--->--->----------------+ 100
Принцип работы команды До сдвига: +----------------------------------+ +---+ | 10001000100010001000100010001011 | | ? | +----------------------------------+ +---+ Операнд Флаг CF Циклический сдвиг вправо на 1 бит: +----------------------------------+ 1 1 +---+ +--- | 11000100010001000100010001000101 | ---+--> | 1 | | +----------------------------------+ | +---+ ^ Операнд V Флаг CF | | +-------------------<---<---<----------------+ 1 Циклический сдвиг вправо на 3 бита: +----------------------------------+ 011 0 +---+ +--- | 01110001000100010001000100010001 | ---+--> | 0 | | +----------------------------------+ | +---+ ^ Операнд V Флаг CF | | +-------------------<---<---<----------------+ 011
Существует ещё один вид сдвигов: циклический сдвиг через флаг CF. Эти команды рассматривают флаг CF как продолжение операнда. /* Rotate through carry right */ rcr
Принцип работы команды До сдвига: +---+ +----------------------------------+ | X | | 10001000100010001000100010001011 | +---+ +----------------------------------+ Флаг CF Операнд Циклический сдвиг влево через CF на 1 бит: X +---+ +----------------------------------+ +-<- | 1 | <--- | 0001000100010001000100010001011X | ---+ | +---+ +----------------------------------+ | V Флаг CF Операнд ^ | | +------------------------------>--->--->----------------+ Циклический сдвиг влево через CF на 3 бита: X10 +---+ +----------------------------------+ +-<- | 0 | <--- | 01000100010001000100010001011X10 | ---+ | +---+ +----------------------------------+ | V Флаг CF Операнд ^ | | +------------------------------>--->--->----------------+
Принцип работы команды До сдвига: +----------------------------------+ +---+ | 10001000100010001000100010001011 | | X | +----------------------------------+ +---+ Операнд Флаг CF Циклический сдвиг влево через CF на 1 бит: +----------------------------------+ +---+ X +--- | X1000100010001000100010001000101 | ---> | 1 | ->-+ | +----------------------------------+ +---+ | ^ Операнд Флаг CF V | | +-------------------<---<---<---------------------------+ Циклический сдвиг влево через CF на 3 бита: +----------------------------------+ +---+ 11X +--- | 11X10001000100010001000100010001 | ---> | 0 | ->-+ | +----------------------------------+ +---+ | ^ Операнд Флаг CF V | | +-------------------<---<---<---------------------------+
Эти сложные циклические сдвиги вам редко понадобятся в реальной работе. Но уже сейчас нужно знать что такие инструкции существуют, чтобы не изобретать велосипед потом. Ведь в языке C циклический сдвиг производится приблизительно так: int main() { int a = 0x11223344; int shift_count = 8; a = (a << shift_count) | (a >> (32 - shift_count)); printf("%x\n", a); }
Под термином подпрограмма я буду подразумевать и функции (которые возвращают значение), и процедуры (которые void proc(...)). Подпрограммы нужны для достижения одной простой цели — избежать дублирования кода. В ассемблере есть две команды для организации подпрограмм. call
Используется для вызова подпрограммы, код которой находится по адресу
Для возврата из подпрограммы используется команда ret
ret Принцип работы:
Существует несколько способов передачи аргументов в подпрограмму.
Рассмотрим передачу аргументов через стек подробнее. Предположим, нам нужно написать подпрограмму, принимающую три аргумента типа long (4 байта). Код: sub: pushl %ebp movl %esp, %ebp /* пролог закончен, можно начинать работу */ subl $8, %esp /* резервируем место для локальных переменных */ movl 8(%ebp), %eax /* что-то делаем с параметрами */ movl 12(%ebp), %eax movl 16(%ebp), %eax /* эпилог */ movl %ebp, %esp popl %ebp ret main: pushl $0x00000010 /* помещаем параметры в стек */ pushl $0x00000020 pushl $0x00000030 call sub /* вызываем подпрограмму */ addl $12, %esp
С вызовом всё ясно: помещаем аргументы в стек и даём команду
Мы сохраняем значение регистра . . . . . . +----------------------+ 0x0000F040 <-- новое значение %ebp | старое значение %ebp | +----------------------+ 0x0000F044 <-- %ebp + 4 | адрес возврата | +----------------------+ 0x0000F048 <-- %ebp + 8 | 0x00000030 | +----------------------+ 0x0000F04C <-- %ebp + 12 | 0x00000020 | +----------------------+ 0x0000F050 <-- %ebp + 16 | 0x00000010 | +----------------------+ 0x0000F054 . . . . . .
Используя адрес в 8(%ebp) = 0x00000030 12(%ebp) = 0x00000020 16(%ebp) = 0x00000010 Как видите, если идти от вершины стека в сторону аргументов, то мы будем встречать аргументы в обратном порядке по отношению к тому, как их туда поместили. Нужно сделать одно из двух: или помещать аргументы в обратном порядке (чтобы доставать их в прямом порядке), или учитывать обратный порядок аргументов в подпрограмме. В C принято при вызове помещать аргументы в обратном порядке. Так как операционная система Linux и большинство библиотек для неё написаны именно на C, я советую использовать "сишный" способ передачи аргументов и в ваших ассемблерных программах.
Подпрограмме могут понадобится собственные локальные переменные. Их принято
держать в стеке. Для того, чтобы зарезервировать для них место, мы просто
уменьшим регистр . . . . . . +------------------------+ 0x0000F038 <-- %ebp - 8 | локальная переменная 2 | +------------------------+ 0x0000F03C <-- %ebp - 4 | локальная переменная 1 | +------------------------+ 0x0000F040 <-- %ebp | старое значение %ebp | +------------------------+ 0x0000F044 <-- %ebp + 4 | адрес возврата | +------------------------+ 0x0000F048 <-- %ebp + 8 | 0x00000030 | +------------------------+ 0x0000F04C <-- %ebp + 12 | 0x00000020 | +------------------------+ 0x0000F050 <-- %ebp + 16 | 0x00000010 | +------------------------+ 0x0000F054 . . . . . . Вы не можете делать никаких предположений о содержимом локальных переменных. Никто их для вас не инициализировал нулем. Можете для себя считать, что там находятся случайные значения.
При возврате из процедуры мы восстанавливаем старое значение ВажноСразу после того, как вы восстановили значение%esp в эпилоге, вы должны
считать, что локальные переменные уничтожены. Хотя они ещё не перезаписаны, но
они несомненно будут затёрты последующими командами
push . Поэтому вы не должны сохранять указатели на
локальные переменные дальше эпилога своей функции.
Остаётся одна маленькая проблема: в стеке всё ещё находятся аргументы для подпрограммы. Это можно решить одним из следующих способов:
В C используется последний способ. Так как мы поместили в стек 3 значения типа
long по 4 байта каждый, мы должны увеличить
Заметьте, что не всегда обязательно выравнивать стек командой
Строго говоря, все эти действия с
И последнее: если вы хотите использовать вашу подпрограмму за пределами данного
файла, не забудьте сделать её глобальной с помощью директивы
Посмотрим на код, который выводил содержимое регистра PRINTF(3) Linux Programmer's Manual PRINTF(3) NAME printf - formatted output conversion SYNOPSIS #include <stdio.h> int printf(const char *format, ...);
.data printf_format: .string "%d\n" .text pushl %eax /* аргумент, подлежащий печати */ pushl $printf_format /* аргумент format */ call printf /* вызов printf() */ addl $8, %esp /* выровняли стек */ Обратите внимание на обратный порядок аргументов и очистку стека от аргументов. Важно
Значения регистров глобальны, вызывающая и вызываемая подпрограмма видят одни и
те же регистры. Конечно же подпрограмма может изменять значения любых
пользовательских регистров, но она обязана при возврате восстановить значения
регистров Также внимания требует флаг df. При вызове подпрограмм флаг должен быть равен 0. Подпрограмма при возврате также должна установить флаг в 0. Коротко: если вам вдруг нужно установить этот флаг для какой-то операции, сбросьте его сразу как только он вам уже не нужен.
До этого момента мы обходились общим термином "подпрограмма". Но если
подпрограмма — функция, она должна как-то передать возвращаемое значение.
Это принято делать при помощи регистра
Рассмотрим программу посложнее. Итак, программа для печати таблицы умножения.
Размер таблицы умножения вводит пользователь. Нам понадобится вызвать функцию
.data input_prompt: .string "enter size (1-255): " scanf_format: .string "%d" printf_format: .string "%5d " printf_newline: .string "\n" size: .long 0 .text .globl main main: /* просим пользователя ввести размер таблицы */ pushl $input_prompt /* format */ call printf /* вызов printf */ /* читаем размер таблицы в переменную size */ pushl $size /* указатель на переменную size */ pushl $scanf_format /* format */ call scanf /* вызов scanf */ addl $12, %esp /* выровняли стек одной командой сразу после двух функций */ movl $0, %eax /* в регистре %ax команда mulb будет выдавать результат, но печатаем мы весь %eax поэтому два старших байта %eax должны быть нулевыми */ movl $0, %ebx /* номер строки */ print_line: incl %ebx /* увеличиваем номер строки на 1 */ cmpl size, %ebx ja print_line_end /* если номер строки больше запрошенного размера -- заканчиваем цикл */ movl $0, %ecx /* номер колонки */ print_num: incl %ecx /* увеличиваем номер колонки на 1 */ cmpl size, %ecx ja print_num_end /* если номер колонки больше запрошенного размера -- заканчиваем цикл */ movb %bl, %al /* команда mulb ожидает второй операнд в %al */ mulb %cl /* вычисляем %ax = %cl * %al */ pushl %ebx /* сохраняем используемые регистры перед вызовом printf */ pushl %ecx pushl %eax /* что печатать */ pushl $printf_format /* format */ call printf /* вызов printf */ addl $8, %esp /* выровняли стек */ popl %ecx /* восстанавливаем регистры */ popl %ebx jmp print_num /* переходим в начало цикла */ print_num_end: pushl %ebx /* сохраняем регистр */ pushl $printf_newline /* печатаем новую символ новой строки */ call printf addl $4, %esp popl %ebx /* восстановили регистр */ jmp print_line /* в начало цикла */ print_line_end: movl $0, %eax /* завершаем программу */ ret
Теперь напишем рекурсивную функцию для вычисления факториала. Она основана на следующей формуле: 0! = 1n! = n * (n-1)!
.data printf_format: .string "%d\n" .text /* int factorial(int) */ factorial: pushl %ebp movl %esp, %ebp /* достаём аргумент в %eax */ movl 8(%ebp), %eax /* факториал 0 равен 1 */ cmpl $0, %eax jne not_zero movl $1, %eax jmp return not_zero: /* следующие 4 строки вычисляют: %eax = factorial(%eax - 1) */ decl %eax pushl %eax call factorial addl $4, %esp /* достаём в %ebx аргумент и вычисляем %eax = %eax * %ebx */ movl 8(%ebp), %ebx mull %ebx /* результат в паре %edx:%eax, но старшие 32 бита мы выбрасываем, так как они не помещаются в int */ return: movl %ebp, %esp popl %ebp ret .globl main main: pushl %ebp movl %esp, %ebp pushl $5 call factorial pushl %eax pushl $printf_format call printf /* стек можно не выравнивать, это будет сделано во время эпилога */ movl $0, %eax /* завершаем программу */ movl %ebp, %esp popl %ebp ret
Любой программист знает, что если существует очевидное итеративное (при помощи циклов) решение задачи, то ему следует отдавать предпочтение перед рекурсивным. Итеративный алгоритм нахождения факториала даже проще, чем рекурсивный; он следует из определения факториала: n! = 1 * 2 * … * n Говоря проще, нужно перемножить все числа от 1 до n. Функция на то и функция, что её можно заменить, при этом не изменяя вызывающий код. Для запуска следующего кода просто замените функцию из предыдущей программы вот этой новой версией: factorial: movl 4(%esp), %ecx cmpl $0, %ecx jne not_zero movl $1, %eax ret not_zero: movl $1, %eax loop_start: mull %ecx loop loop_start ret
Что я сделал? Сначала я переписал рекурсию в виде цикла. Потом я увидел, что
мне больше не нужен кадр стека, так как я не вызываю других функций и ничего не
помещаю в стек. Поэтому я убрал пролог и эпилог, при этом регистр
В результате я так увлекся, что решил написать 64-битную версию этой функции.
Она возвращает результат в паре .data printf_format: .string "%llu\n" .text /* long long int factorial(int) */ .type factorial, @function factorial: movl 4(%esp), %ecx cmpl $0, %ecx jne not_zero movl $1, %eax ret not_zero: movl $1, %esi /* младшие 32 бита */ movl $0, %edi /* старшие 32 бита */ loop_start: movl %esi, %eax /* загружаем младшие биты для умножения */ mull %ecx /* %eax:%edx = младшие биты * %ecx */ movl %eax, %esi /* записываем младшие биты обратно в %esi */ movl %edi, %eax /* загружаем старшие биты */ movl %edx, %edi /* записываем в %edi старшие биты предыдущего умножения, теперь результат умножения младших битов в %esi:%edi, а старшие биты в %eax для следующего умножения */ mull %ecx /* %eax:%edx = старшие биты * %ecx */ addl %eax, %edi /* складываем полученный результат со старшими битами предыдущего умножения */ loop loop_start movl %esi, %eax /* результат возвращаем в паре %eax:%edx */ movl %edi, %edi ret .size factorial, .-factorial .globl main main: pushl %ebp movl %esp, %ebp pushl $20 call factorial pushl %edi pushl %esi pushl $printf_format call printf /* стек можно не выравнивать, это будет сделано во время эпилога */ movl $0, %eax /* завершаем программу */ movl %ebp, %esp popl %ebp ret Нам нужно умножить 64-битное число на 32-битное. Мы будем это делать как при умножении "в столбик": %edi %esi * %ecx --------------------- %edi*%ecx %esi*%ecx A | /|\ | +--<--<--<--+ старших 32 бита
Но произведение 2 5 25 * 3 = 75 * 3 ---- 15 + 6 ---- 7 5
Задание: напишите программу-считалочку. Есть числа от 0 до m, которые
располагаются по кругу. Счёт начинается с элемента 0. Каждый n-й элемент
удаляют. Счёт продолжается с элемента, следующего за удалённым. Напишите
программу, выводящую список вычеркнутых элементов. Подсказка: используйте
Программа, которая не взаимодействует с внешним миром вряд ли может сделать что-то полезное. Вывести сообщение на экран, почитать данные из файла, установить сетевое соединение — это всё примеры действий, которые программа не может совершить без помощи операционной системы. В Linux пользовательский интерфейс ядра организован через системные вызовы. Системный вызов можно рассматривать как функцию, которую для вас выполняет операционная система.
Теперь наша задача состоит в том, чтобы разобраться, как происходит системный
вызов. Каждый системный вызов имеет свой номер. Все они перечислены в файле
Системные вызовы считывают свои параметры из регисторв. Номер системного
вызова нужно поместить в регистр
Таким образом, используя все регистры общего назначения, можно передать максимум 6 параметров. Системный вызов производится вызовом прерывания 0x80. Такой способ вызова (с передачей параметров через регистры) называется fastcall. В других системах (например, *BSD) могут применяться другие способы вызова. Следует отметить, что не следует использовать системные вызовы везде где только можно без особой необходимости. В разных версиях ядра порядок аргументов у некоторых системных вызовов отличается и это приводит к багам, которые довольно трудно найти. Поэтому стоит использовать функции стандартной библиотеки C, ведь их сигнатуры не изменяются, что обеспечивает портабельность кода на C. Почему бы нам не воспользоваться этим и не "заложить фундамент" переносимости наших ассемблерных программ? Только если вы пишете маленький участок самого нагруженного кода и для вас недопустим overhead, вносимый вызовом стандартной библиотеки C — только тогда стоит использовать системные вызовы напрямую. В качестве примера можете посмотреть код программы Hello world. Объявляя структуры в C вы не задумывались о том, как располагаются в памяти её элементы. В ассемблере понятия "структура" нет, зато есть "блок памяти", его адрес и смещение в этом блоке. Объясню на примере: +------+------+------+------+ | 0x23 | 0x72 | 0x45 | 0x17 | +------+------+------+------+ Пусть этот блок памяти размером 4 байта расположен по адресу 0x00010000. Это значит, что адрес байта 0x23 равен 0x00010000. Соответственно, адрес байта 0x72 равен 0x00010001. Говорят что байт 0x72 расположен по смещению 1 от начала блока памяти. Тогда байт 0x45 расположен по смещению 2, а байт 0x17 — по смещению 3. Таким образом, адрес элемента = базовый адрес + смещение. Приблизительно так в ассемблере организована работа со структурами: к базовому адресу структуры прибавляется смещение, по которому находится нужный элемент. Теперь вопрос: как определить смещение? В C компилятор руководствуется следующими правилами:
Примеры (внизу указано смещение элементов в байтах; заполнители обозначены XX): struct Выравнивание структуры: 1, размер: 1 { +----+ char c; | c | }; +----+ 0 struct Выравнивание структуры: 2, размер: 4 { +----+----+----+----+ char c; | c | XX | s | short s; +----+----+----+----+ }; 0 2 struct Выравнивание структуры: 4, размер: 8 { +----+----+----+----+----+----+----+----+ char c; | с | XX XX XX | i | int i; +----+----+----+----+----+----+----+----+ }; 0 4 struct Выравнивание структуры: 4, размер: 8 { +----+----+----+----+----+----+----+----+ int i; | i | c | XX XX XX | char c; +----+----+----+----+----+----+----+----+ }; 0 4 struct Выравнивание структуры: 4, размер: 12 { +----+----+----+----+----+----+----+----+----+----+----+----+ char c; | c | XX XX XX | i | s | XX XX | int i; +----+----+----+----+----+----+----+----+----+----+----+----+ short s; 0 4 8 }; struct Выравнивание структуры: 4, размер: 8 { +----+----+----+----+----+----+----+----+ int i; | i | c | XX | s | char c; +----+----+----+----+----+----+----+----+ short s; 0 4 6 }; Обратите внимание на два последние примера: элементы структур одни и те же, только расположены в разном порядке. Но размер структур получился разный!
Напишем программу, которая выводит размер файла. Для этого потребуется вызвать
функцию STAT(2) Системные вызовы STAT(2) ИМЯ stat, fstat, lstat - получить статус файла КРАТКАЯ СВОДКА #include <sys/types.h> #include <sys/stat.h> #include <unistd.h> int stat(const char *file_name, struct stat *buf); ОПИСАНИЕ stat возвращает информацию о файле, заданном с помощью file_name и заполняет буфер buf. Все эти функции возвращают структуру stat, которая содержит такие поля: struct stat { dev_t st_dev; /* устройство */ ino_t st_ino; /* inode */ mode_t st_mode; /* режим доступа */ nlink_t st_nlink; /* количество жестких ссылок */ uid_t st_uid; /* ID пользователя-владельца */ gid_t st_gid; /* ID группы-владельца */ dev_t st_rdev; /* тип устройства */ /* (если это устройство) */ off_t st_size; /* общий размер в байтах */ unsigned long st_blksize; /* размер блока ввода-вывода */ /* в файловой системе */ unsigned long st_blocks; /* количество выделенных блоков */ time_t st_atime; /* время последнего доступа */ time_t st_mtime; /* время последней модификации */ time_t st_ctime; /* время последнего изменения */ }; Так, теперь осталось только вычислить смещение поля st_size… Но что это за типы — dev_t, ino_t? Какого они размера? Следует заглянуть в заголовочный файл и узнать, что обозначено при помощи typedef. Я сделал так:
Далее, ищу в выводе препроцессора определение dev_t, нахожу: typedef __dev_t dev_t; Ищу __dev_t: __extension__ typedef __u_quad_t __dev_t; Ищу __u_quad_t: __extension__ typedef unsigned long long int __u_quad_t; Значит, sizeof(dev_t) = 8. Мы бы могли и дальше продолжать искать, но в реальности всё немного по-другому. Если вы посмотрите на определение struct stat (cpp /usr/include/sys/stat.h | less), вы увидите поля с именами __pad1, __pad2, __unused4 и другие (зависит от системы). Эти поля не используются, они нужны для совместимости, и поэтому в man они не описаны. Так что самый верный способ не ошибиться — это просто попросить компилятор C посчитать это смещение для нас (вычитаем из адреса поля адрес структуры, получаем смещение): #include <sys/types.h> #include <sys/stat.h> #include <unistd.h> #include <stdio.h> int main() { struct stat t; printf("sizeof = %d, offset = %d\n", sizeof(t), ((void *) &t.st_size) - ((void *) &t)); } На моей системе программа напечатала "sizeof = 88, offset = 44". На вашей системе это значение может отличаться по описанным причинам. Теперь у нас есть все нужные данные об этой структуре, пишем программу: .data str_usage: .string "usage: %s filename\n" printf_format: .string "%u\n" .text .globl main main: pushl %ebp movl %esp, %ebp subl $88, %esp /* выделили 88 байт под struct stat */ cmpl $2, 8(%ebp) /* argc == 2? */ je args_ok /* нам передали не 2 аргумента, выводим usage */ movl 12(%ebp), %ebx /* помещаем в %ebx адрес массива argv */ pushl (%ebx) /* argv[0] */ pushl $str_usage call printf movl $1, %eax /* выходим с кодом 1 */ jmp return args_ok: leal -88(%ebp), %ebx /* помещаем адрес структуры в регистр %ebx */ pushl %ebx movl 12(%ebp), %ecx /* помещаем в %ecx адрес массива argv */ pushl 4(%ecx) /* argv[1] -- имя файла */ call stat cmpl $0, %eax /* stat() возвратил 0? */ je stat_ok /* stat() возвратил ошибку, вызываем perror(argv[1]) */ movl 12(%ebp), %ecx pushl 4(%ecx) call perror movl $1, %eax jmp return stat_ok: pushl 44(%ebx) /* нужное нам поле по смещению 44 */ pushl $printf_format call printf movl $0, %eax /* выходим с кодом 0 */ return: movl %ebp, %esp popl %ebp ret
Обратите внимание на обработку ошибок: если передано не 2 аргумента —
выводим usage и выходим, если
Наверное, могут возникнуть некоторые сложности с пониманием, как расположены
. . . . . . +------------------------+ 0x0000EFE4 <-- %ebp - 88 | struct stat | +------------------------+ 0x0000F040 <-- %ebp | старое значение %ebp | +------------------------+ 0x0000F044 <-- %ebp + 4 | адрес возврата | +------------------------+ 0x0000F048 <-- %ebp + 8 | argc | +------------------------+ 0x0000F04C <-- %ebp + 12 +-------------+ +-------------+ | указатель на argv[0] | ---------------------------------> | argv[0] | -----> | "./program" | +------------------------+ 0x0000F050 <-- %ebp + 16 +-------------+ +-------------+ . . | argv[1] | -\ . . +-------------+ \ +-------------+ . . | argv[2] = 0 | \-> | "test-file" | +-------------+ +-------------+
Таким образом, в стек помещается два параметра: Напишем программу, которая читает со стандартного ввода всё до конца файла, а потом выводит введённые строки в обратном порядке. Для этого мы во время чтения будем помещать строки в связный список, а потом пройдем этот список в обратном порядке и напечатаем строки. ВажноСохраните исходный код этой программы в файл с расширением.S — да, S в верхнем регистре.
.data printf_format: .string "<%s>\n" #define READ_CHUNK 128 .text /* char *read_str(int *is_eof) */ read_str: pushl %ebp movl %esp, %ebp pushl %ebx /* сохраняем регистры */ pushl %esi movl $0, %ebx /* прочитано байт */ movl $READ_CHUNK, %ecx /* размер буфера */ pushl %ecx call malloc movl %eax, %esi /* указатель на начало буфера */ decl %ecx /* в конце должен быть нулевой байт, зарезервируем место для него */ pushl stdin /* мы будем вызывать fgetc() всегда с этим аргументом */ 1: /* read_start */ call fgetc /* читаем 1 символ */ cmpl $0xa, %eax /* новая строка '\n'? */ je 2f /* read_end */ cmpl $-1, %eax /* EOF? */ je 4f /* eof_yes */ movb %al, (%esi,%ebx,1) /* записываем прочитанный символ в буфер */ incl %ebx /* счётчик прочитанных байт */ cmpl %ecx, %ebx /* буфер заполнен? */ jne 1b /* read_start */ addl $READ_CHUNK, %ecx /* увеличиваем размер буфера */ pushl %ecx /* размер */ pushl %esi /* указатель на буфер */ call realloc addl $8, %esp /* убрали аргументы */ movl %eax, %esi /* результат в %eax -- новый указатель */ jmp 1b /* read_start */ 2: /* read_end */ 3: /* eof_no */ movl 8(%ebp), %eax /* *is_eof = 0 */ movl $0, (%eax) jmp 5f /* eof_end */ 4: /* eof_yes */ movl 8(%ebp), %eax /* *is_eof = 1 */ movl $1, (%eax) 5: /* eof_end */ movb $0, (%esi,%ebx,1) /* записываем в конец буфера '\0' */ movl %esi, %eax /* результат в %eax */ addl $4, %esp /* убрали аргумент fgetc() */ popl %esi /* восстанавливаем регистры */ popl %ebx movl %ebp, %esp popl %ebp ret /* struct list_node { struct list_node *prev; char *str; }; */ .globl main main: pushl %ebp movl %esp, %ebp subl $4, %esp /* int is_eof; */ movl $0, %edi /* в %edi будем хранить указатель на предыдущую структуру */ 1: /* read_start */ leal -4(%ebp), %eax /* %eax = &is_eof; */ pushl %eax call read_str movl %eax, %esi /* указатель на прочитанную строку помещаем в %esi */ pushl $8 /* выделяем 8 байт под структуру */ call malloc movl %edi, (%eax) /* указатель на предыдущую структуру */ movl %esi, 4(%eax) /* указатель на строку */ movl %eax, %edi /* теперь эта структура -- предыдущая */ addl $8, %esp /* убрали аргументы */ cmpl $0, -4(%ebp) /* is_eof == 0? */ jne 2f jmp 1b 2: /* read_end */ 3: /* print_start */ /* теперь мы просматриваем список в обратном порядке, так что в %edi адрес текущей структуры */ pushl 4(%edi) /* указатель на строку из текущей структуры */ pushl $printf_format call printf /* выводим на экран */ addl $4, %esp /* убрали из стека только $printf_format */ call free /* освободили память, которую занимает строка */ pushl %edi /* указатель на структуру -- для освобождения памяти */ movl (%edi), %edi /* заменяем указатель в %edi на следующий */ call free /* освобождаем память, которую занимает структура */ addl $8, %esp /* убрали аргументы */ cmpl $0, %edi /* адрес новой структуры == NULL? */ je 4f jmp 3b 4: /* print_end */ movl $0, %eax /* выходим с кодом 0 */ return: movl %ebp, %esp popl %ebp ret
ПодсказкаДля того, чтобы послать с клавиатуры сигнал о конце файла, нажмите Ctrl-D.
Заметьте, что мы ввели 4 строки: "aaa", "bbbb", "ccccc", "".
В этой программе я использовал некоторый новый синтаксис, но я надеюсь, что от
этого программа не стала менее понятной. Во-первых, вы видите директиву
препроцессора #define. Препроцессор C может быть использован для обработки
исходного кода на ассемблере: нужно всего лишь использовать расширение файла с
исходным кодом
Поэтому используя текстовые метки, приходится каждый раз придумывать уникальное имя. А можно использовать метки-числа, компилятор преобразует их в уникальные имена сам. Чтобы поставить метку, просто используйте любое положительное число в качестве имени. Чтобы сослаться на метку, которая определена ранее, используйте "Nb" (мнемоническое значение — backward), а чтобы сослаться на метку, которая определена дальше в коде, используйте "Nf" (мнемоническое значение — forward). При обработке данных часто приходится иметь дело с цепочками данных. Цепочка, как подсказывает название, это массив данных: несколько переменных одного размера, расположенных друг за другом в памяти. В C вы использовали массив и индексную переменную, например argv[i]. Но в ассемблере для последовательной обработки цепочек есть специализированные команды. Синтаксис: lods stos
Странно, — скажет кто-то, — откуда эти команды знают, где брать
данные и куда их записывать? Ведь у них и аргументов-то нет! Вспомните про
регистры Направление просмотра цепочки задаётся флагом df: 0 — просмотр вперед, 1 — просмотр назад.
Итак, команда
Команда Вот пример программы, которая работает с цепочечными командами. Конечно же, она занимается бестолковым делом, но в противном случае она была бы гораздо сложнее. Она увеличивает каждый байт строки str_in на 1, то есть заменяет a на b, b на с и так далее. .data printf_format: .string "%s\n" str_in: .string "abc123()!@!777" .set str_in_length, .-str_in .bss str_out: .space str_in_length .text .globl main main: pushl %ebp movl %esp, %ebp movl $str_in, %esi /* цепочка-источник */ movl $str_out, %edi /* цепочка-приёмник */ movl $str_in_length - 1, %ecx /* длина строки без нулевого байта (нулевой байт не обрабатываем) */ 1: lodsb /* загружаем байт из источника в %al */ incb %al /* производим какую-то операцию с %al */ stosb /* сохраняем %al в приёмнике */ loop 1b movsb /* копируем нулевой байт */ /* важно: сейчас %edi указывает на конец цепочки-приёмника */ pushl $str_out pushl $printf_format call printf /* выводим на печать */ movl $0, %eax movl %ebp, %esp popl %ebp ret
Но с цепочками мы часто выполняем довольно стандартные действия. Например, при копировании блоков памяти мы просто пересылаем байты из одной цепочки в другую, без обработки. При сравнении строк мы сравниваем элементы двух цепочек. При вычислении длины строки в C мы считаем байты до тех пор пока не встретим нулевой байт. Эти действия очень просты, но в тоже время используются очень часто, поэтому были введены следующие команды: movs cmps scas Размер элементов цепочки, которые обрабатывают эти команды, зависит от использованного суффикса команды.
Команда
Команда
Команда После того, как эти команды выполнили своё основное действие, они увеличивают/уменьшают индексные регистры на размер элемента цепочки. Подчеркну тот факт, что эти команды обрабатывают только один элемент цепочки. Таким образом, нужно организовать что-то вроде цикла для обработки всей цепочки. Для этих целей существуют префиксы команд: rep repe/repz repne/repnz
Эти префиксы ставятся перед командой, например:
Также следует указать команды для управления флагом df: cld std
Вооружившись новыми знаниями попробуем заново изобрести функцию
.data printf_format: .string "%s\n" str_in: .string "abc123()!@!777" .set str_in_length, .-str_in .bss str_out: .space str_in_length .text /* void *my_memcpy(void *dest, const void *src, size_t n); */ my_memcpy: pushl %ebp movl %esp, %ebp pushl %esi pushl %edi movl 8(%ebp), %edi /* цепочка-назначение */ movl 12(%ebp), %esi /* цепочка-источник */ movl 16(%ebp), %ecx /* длина */ rep movsb movl 8(%ebp), %eax /* возвращаем dest */ popl %edi popl %esi movl %ebp, %esp popl %ebp ret .globl main main: pushl %ebp movl %esp, %ebp pushl $str_in_length pushl $str_in pushl $str_out call my_memcpy pushl $str_out pushl $printf_format call printf movl $0, %eax movl %ebp, %esp popl %ebp ret
Вы наверное будете удивлены если я вам скажу, что эта реализация
/* void *my_memcpy(void *dest, const void *src, size_t n); */ my_memcpy: pushl %ebp movl %esp, %ebp pushl %esi pushl %edi movl 8(%ebp), %edi /* цепочка-назначение */ movl 12(%ebp), %esi /* цепочка-источник */ movl 16(%ebp), %edx /* длина */ movl %edx, %ecx shrl $2, %ecx /* делим на 2^2 = 4, теперь в %ecx количество 4-байтных кусочков */ rep movsl movl %edx, %ecx andl $3, %ecx /* $3 == $0b11, оставляем только два младших бита, то есть остаток от деления на 4 */ jz 1f /* если результат 0, обходим цепочечную команду */ rep movsb 1: movl 8(%ebp), %eax /* возвращаем dest */ popl %edi popl %esi movl %ebp, %esp popl %ebp ret
Теперь .data printf_format: .string "%u\n" str_in: .string "abc123()!@!777" .text /* size_t my_strlen(const char *s); */ my_strlen: pushl %ebp movl %esp, %ebp pushl %edi movl 8(%ebp), %edi /* цепочка */ movl $0xffffffff, %ecx xorl %eax, %eax /* %eax = 0 */ repne scasb notl %ecx decl %ecx movl %ecx, %eax popl %edi movl %ebp, %esp popl %ebp ret .globl main main: pushl %ebp movl %esp, %ebp pushl $str_in call my_strlen pushl %eax pushl $printf_format call printf movl $0, %eax movl %ebp, %esp popl %ebp ret
Как реализованы другие стандартные цепочечные функции можно посмотреть файле
В заключение обсуждения цепочечных команд хочу сказать следующее: не следует заново изобретать стандартные функции, как мы это только что сделали. Это всего лишь пример и объяснение как они работают. В реальных программах используйте цепочечные команды когда производите нестандартную обработку цепочек и цепочечные команды вам реально смогут помочь. Оператор switch языка C можно переписать на ассемблере несколькими способами. Рассмотрим несколько вариантов, какие могут быть значения у case:
Рассмотрим решение для первого случая. Вспомним, что команда
.data printf_format: .string "%u\n" .text .globl main main: pushl %ebp movl %esp, %ebp movl $1, %eax /* получаем в %eax некоторое интересующее нас значение */ /* мы предусмотрели случаи только для 0, 1, 3, поэтому */ cmpl $3, %eax /* если %eax больше 3 (как беззнаковое), */ ja case_default /* то переходим к default */ jmp *jump_table(,%eax,4) /* переходим по адресу, содержащемуся в памяти jump_table + %eax*4 */ .section .rodata .p2align 4 jump_table: /* массив адресов */ .long case_0 /* адрес этого элемента массива: jump_table + 0 */ .long case_1 /* jump_table + 4 */ .long case_default /* jump_table + 8 */ .long case_3 /* jump_table + 12 */ .text case_0: movl $5, %ecx /* тело case-блока */ jmp switch_end /* как break, переходим в конец switch */ case_1: movl $15, %ecx jmp switch_end case_3: movl $35, %ecx jmp switch_end case_default: movl $100, %ecx switch_end: pushl %ecx /* выводим %ecx на экран, выходим */ pushl $printf_format call printf movl $0, %eax movl %ebp, %esp popl %ebp ret Этот код эквивалентен следующему коду на C: #include <stdio.h> int main() { unsigned int a, c; a = 1; switch(a) { case 0: c = 5; break; case 1: c = 15; break; case 3: c = 35; break; default: c = 100; break; } printf("%u\n", c); }
Смотрите: в секции
Заметьте, что тут нам понадобились значения 0, 1, 3, которые укладываются в
маленький промежуток [0; 3]. Так как для значения 2 не предусмотрено особой
обработки, в массиве адресов Теперь рассмотрим случай, когда значения для веток case находятся на большом расстоянии друг от друга. Очевидно, что способ с массивом сдресов не подходит, иначе массив бы занимал большое количество памяти и содержал в основном адреса ветки default. В этом случае лучшее, что может сделать программист — это выразить switch как последовательное сравнение со всеми перечисленными значениями. Если значений довольно много, то придётся применить немного логики: приблизительно прикинуть, какие ветки будут исполняться чаще всего, и отсортировать их в таком порядке в коде. Это нужно для того, чтобы наиболее часто исполняемые ветки испольнялись после маленького числа сравнений. Допустим, у нас есть варианты 5, 38, 70 и 1400, причём 70 будет появляться чаще всего: .data printf_format: .string "%u\n" .text .globl main main: pushl %ebp movl %esp, %ebp movl $70, %eax /* получаем в %eax некоторое интересующее нас значение */ cmpl $70, %eax je case_70 cmpl $5, %eax je case_5 cmpl $38, %eax je case_38 cmpl $1400, %eax je case_1400 case_default: movl $100, %ecx jmp switch_end case_5: movl $5, %ecx jmp switch_end case_38: movl $15, %ecx jmp switch_end case_70: movl $25, %ecx jmp switch_end case_1400: movl $35, %ecx switch_end: pushl %ecx pushl $printf_format call printf movl $0, %eax movl %ebp, %esp popl %ebp ret Единственное, на что хочется обратить внимание — это расположение ветки default: если все сравнения оказались ложными, то код default выполняется "автоматически". Наконец, третий, комбинированый, вариант. Путь варианты 35, 36, 37, 39, 1200, 1600 и 7000. Тогда мы видим промежуток [35; 39] и ещё три числа. Тогда код будет выглядеть приблизительно так: movl $1, %eax /* получаем в %eax некоторое интересующее нас значение */ cmpl $35, %eax jb case_default cmpl $39, %eax ja switch_compare jmp *jump_table-35(,%eax,4) .section .rodata .p2align 4 jump_table: .long case_35 .long case_36 .long case_37 .long case_default .long case_39 .text switch_compare: cmpl $1200, %eax jmp case_1200 cmpl $1600, %eax jmp case_1600 cmpl $7000, %eax jmp case_7000 case_default: /* ... */ jmp switch_end case_35: /* ... */ jmp switch_end ... ещё код ... switch_end: Снова-таки, имеет смысл переставить некоторые части этого кода, если вы заранее знаете, какие значения вам придётся обрабатывать чаще всего. brainfuck (далее сокращённо bf) — это эзотерический язык программирования, то есть, язык, предназначенный не для практического применения, а придуманный как головоломка, как задача, которая заставляет программиста думать нестандартно. Команды bf управляют массивом целых чисел с неограниченным набором ячеек, есть понятие текущей ячейки.
В начальном состоянии все ячейки содержат значение 0, а текущей является крайняя левая ячейка. Вот несколько программ с объяснениями: +>+>+ Устанавливает первые три ячейки в 1 [-] Обнулаяет текущкю ячейку [>>>+<<<-] Перемещает значение текущей ячейки в ячейку, расположеную "тремя шагами правее"
Интерпретация программы состоит из двух шагов: загрузка программы и собственно исполнение. Во время загрузки следует проверить корректность программы (соответствие []) и расположить код программы в памяти в удобном для выполнения виде. Для этого каждой команде присвоен номер операции, начиная с 0 — для того, чтобы можно было выполнять операции при помощи помощи перехода по массиву адресов, как в switch. Большинство программ на bf содержат последовательности одинаковых команд < > + -, которые можно выполнять не по одной, а все сразу. Например, выполняя код +++++ можно выполнить пять раз увеличение на 1, или один раз увеличение на 5. Таким образом, довольно простыми средствами можно сильно оптимизировать выполнение программы. Вот программы, которые вызовут ошибки загрузки программы: [ No matching ']' found for a '[' ] No matching '[' found for a ']' А эти программы вызовут ошибки выполнения: < Memory underflow +[>+] Memory overflow
Рассмотрим такой код на языке C: if(((a > 5) && (b < 10)) || (c == 0)) { do_something(); } В принципе, булевое выражение можно вычислять как обычное арифметическое, то есть, по такой схеме:
Такой способ вычисления называется полным. Можем ли мы вычислить значение
этого выражения быстрее? Смотрите, если if(c == 0) { goto do_it; } if((a > 5) && (b < 10)) { goto do_it; } goto dont_do_it; do_it: do_something(); dont_do_it:
В принципе, можно пойти дальше: если if(c == 0) { goto do_it; } if(a > 5) { if(b < 10) { goto do_it; } } goto dont_do_it; do_it: do_something(); dont_do_it: Такой способ вычисления выражений называется сокращённым или "ленивым" (от англ. lazy evaluation), потому что позволяет вычислить выражение, не проверяя всех входящих в него подвыражений. Можно вывести такие формальные правила:
В принципе, ленивое вычисление булевых выражений помогает написать более быстрый (а часто и более простой) код. С другой стороны, возникают проблемы, если одно из подвыражений при вычислении вызывает сторониие эффекты (англ. side effetcs), например вызов функции: if(foo() || (c == 0)) { do_something(); }
Если мы используем ленивое вычисление и оказывается, что Теперь переёдем к тому, как это реализовывается на ассемблере. Начнём с полного вычисления: cmpl $5, a /* так, а что дальше? */
Действительно, нам нужно сохранить результат сравнения в переменную. Из
команд, анализирующих флаги мы знаем только семейство
Требуется заметить, что команды Тогда полное вычисление будет выглядеть так: cmpl $5, a seta %al cmpl $10, b setb %bl andb %bl, %al cmpl $0, c sete %bl orb %bl, %al jz is_false is_true: ... is_false: ...
Обратите внимание, что команда [1] Intel® 64 and IA-32 Architectures Software Developer's Manual, 4.1 Instructions (N-Z), PUSH [2] Intel® 64 and IA-32 Architectures Optimization Reference Manual, 3.5.1.3 Using LEA [3] Intel® 64 and IA-32 Architectures Optimization Reference Manual, 3.5.1.7 Compares [4] Intel® 64 and IA-32 Architectures Optimization Reference Manual, 3.5.1.6 Clearing Registers and Dependency Breaking Idioms
Целью отладки программы является удаление багов из программы. Для этого вам
скорее всего понадобится исследовать состояние переменных во время выполнения,
а также и сам процесс выполнения (какие условия сработали и т. д.). Тут
отладчик — наш первый помощник. Конечно же, в C достаточно много
возможностей отладки без непосредственной остановки программы: от простого
Вы можете начать отладку с определиня точки останова (breakpoint), если вы уже приблизительно знаете, какой участок кода хотите исследовать. Этот способ используется больше всего: ставим точку останова, запускам программу и проходим её выполнение по шагам, попутно исследуя необходимые переменные и регистры. Вы также можете просто запустить прогорамму под отладчиком и поймать момент, когда она вылетает с Segmentation fault — так можно узнать, какая инструкция пытается получить доступ к памяти, рассмотреть по-подробнее, что это за переменная и т. д. Теперь можно исследовать этот код ещё раз, пройти его по шагам, поставив точку останова чуть раньше момента сбоя.
Начнём с простого. Возьмём программу hello
world и скомпилируем её с отладочной информацией при помощи ключа
Запускаем gdb:
GDB запустился, загрузил вашу программу, вывел на экран приглашение
b — сокращение от break. Все команды в GDB можно сокращать, если это не создаёт двусмысленных расшифровок. Запускам программу командой run. Эта же команда используется для перезапуска сначала уже запущенной программы.
GDB остановил программу и ждёт команд. Вы видите команду вашей программы, которая будет выполнена следующей, имя функции, которая сейчас исполняется, имя файла и номер строки. Для пошагового исполнения у нас есть две команды: step (сокращённо s) и next (сокращённо n). Команда step производит выполнение программы с заходом в подпрограммы. Конмада next выполняет пошагово только инструкции текущей подпрограммы.
Итак, инструкция на строке 17 выполнена, мы ожидаем, что в регистре %eax находится число 4. Для вывода на экран различных выражений используется команда print (сокращённо p). В отличие от команд ассемблера, GDB в записи регистров использует знак $ вместо %. Посмотрим, что в регистре %eax:
Действительно 4! :) GDB нумерует все выведенные выражения. Сейчас мы видим первое выражение ($1), которое равно 4. Теперь к этому выражению можно обращаться по имени. Также можно производить простые вычисления:
Пока мы игрались с командой print, мы уже забыли, какая инструкция исполняется следующей. Команда info line выводит информацию об указанной строке кода. Без аргументов выводит информацию о текущей строке кода.
Команда list (сокращённо l) выводит на экран исходный код вашей программы. В качестве аргументов ей можно передать:
Если передавать один аргумент, то команда list выведет 10 строк исходного кода вокруг этого места. Передавая два аргумента вы указываете строку начала и строку конца листинга.
Запомните эту команду: list *$eip. С её помощью вы всегда можете просмотреть исходный код вокруг инструкции, которая сейчас выполняется. Выполняем нашу программу дальше:
Не правда ли, утомительно каждый раз нажимать n? Если просто нажать Enter, GDB повторит последнюю команду:
Ещё одна удобная команда, о которой стоит знать — это info registers. Конечно же, её можно сократить до i r. Ей можно передать параметр — список регистров, которые необходимо напечатать. Например, находясь в защищённом режиме, нам вряд ли будут интересны значения сегментных регистров.
Так, а кроме регистров у нас ещё ведь есть память, и частный случай памяти
— стек. Как их посмотреть? Команда x/
То же самое, только в шестнадцатеричном виде:
Напечатаем 8 верхних слов (4 байта) из стека (для "погружения в стек" читаем слева направо и сверху вниз):
Было бы хорошо, если бы GDB отображал значение какого-то выражения
автоматически. Это делает команда display/
frame si, ni display/i $eip display/12i $eip-7 (gdb) define ir Type commands for definition of "ir". End with a line saying just "end". >info registers >end (gdb) define test Redefine command "test"? (y or n) y Type commands for definition of "test". End with a line saying just "end". >x/x $esp >x/x $esp+4 >x/x $esp+8 >end (gdb) test 0xbfeba95c: 0xb7e8aea8 0xbfeba960: 0x00000001 0xbfeba964: 0xbfeba9d4
Книги и спецификации: Программы: Tutorials and FAQs:
А также:
Электропочта автора - gribozavr?gmail.com
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||