Программирование на языке Assembler в FASM
В начале было слово… Если точнее то было просто предложение от Kinder-а написать статью посвящённую макросам в FASM. Я согласился попробовать, но рассматривать макросы отдельно от синтаксиса как-то не очень правильно, а синтаксис без примеров разобрать сложно и в результате получилось сочинение о том как писать программы в FASM.
В этом сочинении будут рассмотрены основные моменты отличающие FASM от sдругих компиляторов, правила по которым пишутся макросы и форматы выходных файлов создаваемые FASM-ом. Так же в рамках данного сочинения мы создадим несколько контролов в виде макросов.
Основы.
Данный раздел является вольным
пересказом соответствующего раздела
руководства, поставляемого с
компилятором.
Данная статья посвящена использованию макросов в компиляторе FASM. Для начала вопрос: «Что такое макрос?» (поскольку я не могу услышать Ваш ответ прямо сейчас, когда пишу эту статью, отправляйте свои ответы мне по электронной почте, если Ваше мнение отличается от моего мнения).
Макрос — это инструкция препроцессору компилятора развернуть, встретившееся в коде программы, имя макроса (возможно с параметрами) в последовательность строк кода ассемблера с использованием переданных параметров (если таковые заданы).
Далее предлагаю Вам ознакомиться с основными директивами, используемыми внутри определений макросов.
Внутри определений макросов можно использовать инструкции if и else при этом каждая инструкция if должна закрываться инструкцией end if. Пример из руководства, поставляемого вместе с компилятором:
macro mov op1,op2
{
if op1 in <ds,es,fs,gs,ss> & op2 in <cs,ds,es,fs,gs,ss>
push op2
pop op1
else
mov op1,op2
end if
}</cs,ds,es,fs,gs,ss></ds,es,fs,gs,ss>
Этот макрос является расширением инструкции процессора mov. В данном случае если оба операнда макроса являются сегментными регистрами используется связка «push — pop», в любом другом случае используется стандартная инструкция «mov op1,op2». Оператор in позволяет проверить соответствие операнда нескольким значениям в угловых скобках.
Можно ещё более расширить эту инструкцию для пересылки трёх значений второго в первый, а третьего во второй:
macro mov op1,op2,op3
{
if arg3 eq
mov op1,op2
else
mov op1,op2
mov op2,op3
end if
}
В данном случае нас интересует инструкция eq, которая позволяет проверить эквивалентен ли операнд какому либо значению, в нашем случае мы проверяем его отсутствие, и если он отсутствует, то подставляется ветвь if иначе подставляется ветвь else.
Директива purge позволяет отменить последнее определение макроса.
Кроме уже изложенного в определение макроса можно передавать заранее неизвестное количество операндов (пар операндов и т.д.), для этого необходимо заключить операнды, количество которых заранее неизвестно, в квадратные скобки. Например для вызова процедур написан макрос STDCALL:
macro stdcall proc,[arg];
{ reverse
push arg
common
call proc }
Операндами этого макроса служат один обязательный (proc) и несколько необязательных параметров (arg). Директива reverse сообщает препроцессору, что следующие строки необходимо повторить столько раз, сколько параметров arg передано макросу начиная с последнего параметра. Директива common сообщает препроцессору, что следующие строки необходимо повторить только один раз. Директива forward сообщает препроцессору, что следующие строки необходимо повторить столько раз, сколько параметров arg передано макросу начиная с первого параметра. Действие директив common, forward и reverse заканчивается другой директивой common, forward или re-verse соответственно или закрывающейся фигурной скобкой. Если ни одна из этих директив не встречается в определении макроса, то макрос развернётся для всех параметров начиная с первого. Неизвестное количество параметров можно передать и другому макросу:
macro invoke proc,[arg]
{ common
if ~ arg eq
stdcall [proc],arg
else
call [proc]
end if }
В этом примере при выполнении ветви if в макрос stdcall кроме параметра [proc] передаются все полученные параметры arg.
Внутри макроопределения может использоваться оператор #, который может использоваться для составления операторов ассемблера, например условного перехода:
macro jif op1,cond,op2,label
{
cmp op1,op2
j#cond label
}
При выполнении макроса jif ax,ae,10h,exit макрос будет развёрнут в следующую конструкцию:
cmp ax,10h
jae exit
Так же этот оператор можно использовать и для составления имён переменных или макросов внутри макроопределений:
macro ver [name]
{
name#.mas: times 10 db 0
}
Теперь при вызове данного макроса в секции данных
ver Chif,Rab
Мы будем иметь два массива из 10 байт каждый, с именами Chif.mas и Rab.mas.
Аналогично можно создать и переменные и макросы внутри определения макроса. Однако определить макрос внутри макроса обычным путём:
Macro mac1
{
macro mac2
{
... ... ...
}
}
препроцессор не позволит использовать данную конструкцию, выход в использовании директивы fix она эквивалентна директиве equ, но препроцессор обрабатывает fix позже чем equ, что и позволяет использовать подобную конструкцию:
Macro mac1
{
macro mac2
m_
... ... ...
_m
}
m_ fix {
_m fix }
Синтаксис компилятора ФАСМ несколько отличается от синтаксиса других компиляторов, но отличия незначительны и в основном касаются макроязыка.
Средства макроязыка мы рассмотрим ниже, здесь же я хотел бы отметить только то, что передача адреса переменной производится указанием имени переменной без каких либо скобок или префиксов, а её содержимого написанием имени переменной в квадратных скобках.
mov eax,var; записываем в регистр еах адрес переменной var mov eax,[var]; записываем в регистр еах значение переменной var
В этой части мы рассмотрим, основы
синтаксиса данного компилятора и
рассмотрим каркасные приложения для
основных форматов исполняемых файлов.
Итак, что необходимо для работающего приложения?
Во-первых мы должны указать компилятору какого формата должен быть создаваемый файл. Это делается директивой format после, которой следует указание форматов:
- PE формат исполняемых файлов Windows. Далее должно следовать уточнение GUI (графический интерфейс), console (консольное приложение) и native (если Вы знаете, что это такое сообщите мне). Если выбран графический интерфейс, то следует также указать версию графического интерфейса 4.0, а так же зарезервированное слово DLL, если собирается динамическая библиотека.
- MZ формат исполняемых файлов MS DOS.
- COFF или MS COFF (для линковки продуктами Microsoft)для создания объектного файла, который в дальнейшем будет линковаться к другому проекту или к ресурсам.
- ELF формат для создания исполняемых файлов UNIX подобных систем (Linux).
Как Вы наверно поняли, я не знаком с файлами ELF типа и в данной статье мы не будем его рассматривать. Если директива format не указана, компилятор соберёт файл в формате com.
После указания формата выходного файла мы должны указать компилятору точку начала программы. Это делается с помощью директивы entry после которой указывается метка, с которой начинается код программы. Например entry start.
Так же, в случае необходимости, мы должны указать на начало секций данных, кода, импорта, экспорта или ресурсов. Для этого существует директива section, после которой в кавычках следует название секции, далее без скобок тип секции (данные или код) и атрибуты (запись, чтение исполняемый код). Более подробно когда какие атрибуты указывать Вы прочитаете ниже т.к. для разных форматов выходных файлов эти атрибуты отличаются.
Консольные приложения
Вот простой пример консольного приложения:
format PE console
entry start
include 'include\kernel.inc'
include 'include\macro\stdcall.inc'
include 'include\macro\import.inc'
section '.data' data readable writeable
h4 db Консоль'
w1 dd 0
output dd 0
input dd 0
_class db 'FCAPTION',0
podskazka db 'Консоль',0
section '.code' code readable executable
start:
invoke GetStdHandle,STD_OUTPUT_HANDLE
mov [output],eax
invoke GetStdHandle,STD_INPUT_HANDLE
mov [input],eax
invoke WriteConsole,[output],h4,7,w1,0
invoke ReadConsole,[input],_class,2,w1,0
invoke ExitProcess,0
section '.idata' import data readable
_library kernel32,'KERNEL32.DLL',\
user32,'USER32.DLL',\
gdi32,'GDI32.DLL',\
advapi32,'ADVAPI32.DLL',\
comctl32,'COMCTL32.DLL',\
comdlg32,'COMDLG32.DLL',\
shell32,'SHELL32.DLL',\
wsock32,'WSOCK32.DLL';,\
include 'C:\FASM135\147\INCLUDE\apia\kernel32.inc'
include 'C:\FASM135\147\INCLUDE\apia\user32.inc'
include 'C:\FASM135\147\INCLUDE\apia\gdi32.inc'
include 'C:\FASM135\147\INCLUDE\apia\advapi32.inc'
include 'C:\FASM135\147\INCLUDE\apia\comctl32.inc'
include 'C:\FASM135\147\INCLUDE\apia\comdlg32.inc'
include 'C:\FASM135\147\INCLUDE\apia\shell32.inc'
include 'C:\FASM135\147\INCLUDE\apia\wsock32.inc'
В данном примере создаётся три секции: данных, кода и секция импортируемых функций. Секцию импорта я создаю при помощи макроса _library, в стандартной поставке такого макроса нет, но если написать без подчёркивания перед library то всё скомпилируется правильно. Причина проста, я пользуюсь FASM-ом с версии 1.35, а тогда такого макроса еще не было (а сам я ещё не смог бы его написать) и для совместимости с ранее написанными программами я включил два варианта этого макроса. В ранней версии, необходимо было записывать все используемые в приложении функции вручную, теперь же работу по подключению только используемых функций берёт на себя компилятор, хотя за такое удобство приходится платить некоторым увеличением времени компиляции. Более подробно о принципе работы этого и других макросов будет написано в соответствующем разделе ниже.
Название секции импорта «.idata», хотя название можно изменить и это не повлияет на работоспособность программы, т.к. мы указали назначение этой секции import data, далее следует указание атрибутов, в данном случае readable, что означает для чтения и этого достаточно, если Вы не собираетесь менять содержимое этой секции.
Следующей рассмотрим секцию данных. У нас секция данных имеет название «.data», далее следует указание назначения секции data, что означает секцию данных, атрибуты указаны readable writeable, т.е. эта область памяти будет доступна для чтения и записи. Если указать только первый атрибут (readable) при выполнении программы произойдёт ошибка «Программа выполнила недопустимую операцию».
Последней рассмотрим секцию кода, она имеет название «.code» назначение секции code, т.е. исполняемая часть программы, атрибуты readable executable, что означает, что из секции кода мы можем читать данные (под данными может подразумеваться и коды инструкций и определённые в этой секции данные) и можем выполнять содержимое этой секции.
Кроме рассмотренных секций, консольное приложение может иметь секции экспортируемых функций и секцию ресурсов.
Это пожалуй всё, что необходимо знать для начала о консольных приложениях. Да ещё я считаю лишний раз напомнить, что хоть консольное приложение и напоминает внешне программы DOS-а, использование прерываний в нём не допускается т.к. это всё же приложение Windows, естественно выполняться такое приложение может только в Windows.
В отличии от консольных приложений, GUI приложения должны содержать как минимум одну процедуру обработки сообщений, приходящих к окну. Вот простой пример оконного приложения:
format PE GUI 4.0
entry start
include 'include\kernel.inc'
include 'include\user.inc'
include 'include\macro\stdcall.inc'
include 'include\macro\import.inc'
include 'include\macro\resource.inc'
section '.data' data readable writeable
Avtor db 'Автор:Пороткин Алексей Сергеевич',0
Progr db 'Программа построения графиков',0
MyMessage db 'Отклик',0
hinstance dd 0
h4 db 'Сообщение',0
w1 dd 0
msg MSG
wc WNDCLASS
pt dd 0
hDC dd 0
ws equ WS_VISIBLE+WS_CAPTION+WS_MINIMIZEBOX+WS_SYSMENU
_class db 'FCAPTION',0
podskazka db 'Графическое приложение',0
section '.code' code readable executable
start:
invoke GetModuleHandle,0
mov [hinstance],eax
invoke LoadIcon,eax,17
mov [wc.hIcon],eax
invoke LoadCursor,0,IDC_ARROW
mov [wc.hCursor],eax
mov [wc.style],0
mov [wc.lpfnWndProc],WindowProc
mov [wc.cbClsExtra],0
mov [wc.cbWndExtra],0
mov eax,[hinstance]
mov [wc.hInstance],eax
mov [wc.hbrBackground],6;COLOR_BTNFACE+1
mov [wc.lpszMenuName],0
mov [wc.lpszClassName],_class
invoke RegisterClass,wc
invoke CreateWindowEx,0,_class,podskazka,ws,10,10,680,450,NULL,NULL,[hinstance],NULL
msg_loop:
invoke GetMessage,msg,NULL,0,0
or eax,eax
jz end_loop
invoke TranslateMessage,msg
invoke DispatchMessage,msg
jmp msg_loop
end_loop:
invoke ExitProcess,[msg.wParam]
;include 'include\macro\lib.asm'
proc WindowProc, hwnd,wmsg,wparam,lparam
enter
push ebx esi edi
cmp [wmsg],WM_DESTROY
je wmdestroy
cmp [wmsg],WM_CREATE
je wmcreate
defwndproc:
invoke DefWindowProc,[hwnd],[wmsg],[wparam],[lparam]
jmp finish
wmcreate:
jmp ext
wmdestroy:
invoke PostQuitMessage,0
ext: xor eax,eax
finish:
pop edi esi ebx
return
section '.idata' import data readable writeable
library kernel,'KERNEL32.DLL',\
user,'USER32.DLL'
;shell,'SHELL32.DLL',\
;gdi,'gdi32.dll'
kernel:
import GetModuleHandle,'GetModuleHandleA',\
ExitProcess,'ExitProcess',lstrcpy,'lstrcpyA',\
FindFirstChangeNotification,'FindFirstChangeNotificationA',\
FindNextChangeNotification,'FindNextChangeNotification',\
FindCloseChangeNotification,'FindCloseChangeNotification'
user:
import RegisterClass,'RegisterClassA',\
CreateWindowEx,'CreateWindowExA',\
DefWindowProc,'DefWindowProcA',\
SetWindowLong,'SetWindowLongA',\
RedrawWindow,'RedrawWindow',\
GetMessage,'GetMessageA',\
MessageBox,'MessageBoxA',\
TranslateMessage,'TranslateMessage',\
DispatchMessage,'DispatchMessageA',\
SendMessage,'SendMessageA',\
LoadCursor,'LoadCursorA',\
LoadIcon,'LoadIconA',\
LoadMenu,'LoadMenuA',\
SetMenu,'SetMenu',\
InsertMenu,'InsertMenuA',\
CreateMenu,'CreateMenu',\
DrawMenuBar,'DrawMenuBar',\
PostQuitMessage,'PostQuitMessage',\
FindWindow,'FindWindowA',\
FindWindowEx,'FindWindowExA',\
LoadImageA,'LoadImageA',\
CreatePopupMenu,'CreatePopupMenu',\
AppendMenu,'AppendMenuA',\
DestroyMenu,'DestroyMenu',\
GetCursorPos,'GetCursorPos',\
SetForegroundWindow,'SetForegroundWindow',\
TrackPopupMenu,'TrackPopupMenu',\
PostMessage,'PostMessageA',\
DestroyWindow,'DestroyWindow',\
ShowWindow,'ShowWindow',GetDC,'GetDC'
section '.rsrc' resource data readable
directory RT_ICON,icons,\
RT_GROUP_ICON,group_icons
icons:
resource 1,LANG_NEUTRAL,icon_data
group_icons:
resource 17,LANG_NEUTRAL,main_icon
icon main_icon,icon_data,'mp\lv\lv.ico'
Так же, как и в примере с консольным приложением, в первой строке указана директива format PE, но вместо console, как в предыдущем примере, дано указание GUI 4.0 компилятору собирать приложение с графическим интерфейсом версии 4.0.
Приложение из нашего примера ничего полезного не делает, оно просто создаёт окно, которое реагирует только на нажатие двух системных кнопок в верхнем правом углу окна «Свернуть» и «Закрыть». Приложение содержит секции данных, кода, импорта и ресурсов. После указания точки входа в программу entry start подключаются файлы содержащие макросы и определения констант и структур Windows. Затем следует секция данных, определение которой дано в предыдущем разделе, и секция кода. В секции кода мы получаем хендл нашего модуля (GetModuleHandle), загружаем иконку (LoadIcon), определённую в секции ресурсов, загружаем стандартный курсор Windows (LoadCursor) и заполняем структуру wc для дальнейшей регистрации класса нашего окна (RegisterClass). После регистрации класса окна мы создаём окно зарегистрированного класса (CreateWindowEx). В структуре wc имеется член .lpfnWndProc, в который мы записываем адрес начала процедуры обработки событий окна WindowProc. Далее следует цикл обработки сообщений, посылаемых окну системой Windows.
Процедура обработки сообщений получает от Windows четыре параметра:
proc WindowProc, hwnd, wmsg, wparam, lparam
где:
hwnd — хендл нашего окна
wmsg — код сообщения, которое Windows послало нашему окну
wparam и lparam — уточняющие параметры посланного сообщения.
proc это не директива компилятора, а макрос содержащий, часть пролога процедуры. Он определён следующим образом:
macro proc name,[arg]
{ common
name:
virtual at ebp+8
if ~ arg eq
forward
local ..arg
..arg dd ?
arg equ ..arg
common
end if
..ret = $ - (ebp+8)
end virtual
local ..dynamic_data,..dynamic_size
dynamic_data equ ..dynamic_data
dynamic_size equ ..dynamic_size
virtual at ebp - dynamic_size
dynamic_data: }
Таким образом следующая строка proc Win,param будет развёрнута в следующую конструкцию:
Win:
virtual at ebp+8
local ..param
..param dd ?
param equ ..param
..ret = $ - (ebp+8)
end virtual
local ..dynamic_data,..dynamic_size
dynamic_data equ ..dynamic_data
dynamic_size equ ..dynamic_size
virtual at ebp - dynamic_size
dynamic_data: }
Более подробно это означает, что мы определяем метку Win, которая означает начало процедуры. В следующей строке записана директива virtual at ebp+8, которая должна заканчиваться директивой end virtual. Внутри этого определения помещаются переменные, которые будут размещаться с адреса указанного после at, в нашем примере это ebp+8. Это означает, что в нашем примере запись «mov param,eax» будет заменена на «mov [ebp+8],eax«. Если бы в определении процедуры было две или более переменных, то адрес каждой последующей переменной увеличивался бы на размер предыдущей переменной. Таким образом:
virtual at ebp+8
param1 dd ?
param2 db ?
param3 dd ?
end virtual
определит три переменные с адресами
param1 = ebp+8+0,
param2 = ebp+8+4,
param2 = ebp+8+5.
У некоторых читателей может возникнуть вопрос: «А зачем все эти пляски?». Ответ прост: регистр ebp указывает на вершину стека и все переменные, передаваемые в процедуру, находятся выше (в смысле в памяти с адресами больше чем вершина стека т.к. вершина стека сдвигается вниз когда в стек помещаются данные и вверх, когда данные из стека изымаются) текущей вершины стека.
Первой, в определении переменных внутри virtual — end virtual записана директива local, которая указывает компилятору, что следующие за ней через запятую метки, локальны в данном макросе.
Последней, внутри описания виртуальных переменных, следует определение макропеременной ..ret = $ — (ebp+8), которая фактически содержит количество переданных процедуре байт параметров. Она используется при написании эпилога процедуры для очистки стека при возврате управления инструкции, следующей за вызовом данной процедуры.
После определения виртуальных переменных, передаваемых процедуре в качестве параметров, определяются локальные макропеременные, которые используются во второй части пролога процедуры. Я уже несколько раз использовал термин — макропеременная. Макропеременная отличается от переменных, используемых в программе, тем, что она существует только во время компиляции и используется как константа, которая может иметь разные значения в разных частях программы.
После определения макропеременных начинается блок определения виртуальных переменных, однако переменных в этом макросе нет. После макроса proc необходимо ставить макрос enter, который содержит заключительную часть пролога, а между ними могут располагаться локальные переменные. Для того, что бы имена переменных были локальными перед ними ставится точка. Например .param. Макрос enter определён следующим образом:
macro enter
{ dynamic_size = $ - dynamic_data
end virtual
enter dynamic_size,0
}
Таким образом dynamic_size — это размер памяти отведённой под локальные переменные. Последняя инструкция, в прологе процедуры, enter dynamic_size,0. Это единственная строка, которая попадёт в исполняемый код программы. Завершаться процедура должна макросом return, который определён следующим образом:
macro return
{ leave
ret ..ret }
Полагаю здесь не должно быть сложностей с пониманием макроса.
Процедура должна правильно обрабатывать поступившие сообщения. Те сообщения, которые мы хотим обработать сами, выделяются в первых строках процедуры и управление передаётся на те участки кода, которые должны производить необходимые действия, а те сообщения, которые нам нет необходимости обрабатывать, мы доверяем обработать системе Windows (Def-WindowProc).
Хочу обратить Ваше внимание на то, что в данной программе используются глобальные метки (wmdestroy, wmcreate, defwndproc), что не очень удобно в программах содержащих несколько процедур (большинство оконных процедур обрабатывают одни и те же сообщения), поэтому рекомендуется внутри процедур использовать локальные метки (.wmdestroy, .wmcreate, .defwndproc).
Теперь пришло время посмотреть на секцию импорта. Она отличается от рассмотренной в предыдущем разделе здесь мы используем макрос library, который определён следующим образом:
macro library [label,string]
{ forward
local _label
dd 0,0,0,rva _label,rva label
common
dd 0,0,0,0,0
forward
_label db string,0 }
Для того, чтобы было более понятно вспомним, как в нашем примере используется этот макрос:
library kernel,'KERNEL32.DLL',\
user,'USER32.DLL'
Таким образом, макрос library создаёт заголовок таблицы импорта, вначале записывая смещение названия библиотеки DLL, а затем смещение, с которого начинаются имена импортируемых функций.
Далее следуют макросы import, определённые следующим образом:
macro import [label,string]
{ forward
local _label
label dd rva _label
common
dd 0
forward
_label dw 0
db string,0 }
Он создаёт тело таблицы импорта для каждой из импортируемых библиотек.
Вначале создавая таблицу смещений имён импортируемых функций, а затем записывая имена импортируемых функций. Более подробно о структуре PE-файла Вы должны прочитать в соответствующей литературе (например в туториалах, которые написал Iczelion).
После таблицы импорта создаётся таблица ресурсов:
section '.rsrc' resource data readable
directory RT_ICON,icons,\
RT_GROUP_ICON,group_icons
icons:
resource 1,LANG_NEUTRAL,icon_data
group_icons:
resource 17,LANG_NEUTRAL,main_icon
icon main_icon,icon_data,'mp\lv\lv.ico'
В нашем примере мы используем только одну иконку.
Динамическая библиотека — это приложение GUI, который может содержать как исполняемый код, так и ресурсы. Это приложение не предназначено для самостоятельного запуска, оно используется другими приложениями для хранения часто используемых процедур, шрифтов и многого другого.
Мы рассмотрим создание динамической библиотеки на примере процедуры, возвращающей строку, содержащую текущую дату. Мы создадим два модуля один файл динамической библиотеки (dll2.dll) и файл использующий созданную нами библиотеку (usedll.exe).
Вот файл динамической библиотеки:
format PE GUI 4.0 DLL
entry DllEntryPoint
include 'include\kernel.inc'
include 'include\user.inc'
include 'include\macro\stdcall.inc'
include 'include\macro\import.inc'
include 'c:\fasm135\include\lib\strings.mac'
include 'include\macro\export.inc'
section '.data' data readable writeable
_outs: times 60 db 0
Date SYSTEMTIME
day db 'День:',0
mon db ' Месяц:',0
year db ' Год:',0
h4: times 20 db 0
DllState db 'Состояние библиотеки DLL',0
DllStart db 'Загружена',0
DllStop db 'Выгружена',0
bf: times 20 db 0
section '.code' code readable executable
proc DllEntryPoint, hinstDLL,fdwReason,lpvReserved
enter
cmp [fdwReason],DLL_PROCESS_ATTACH
je .start
cmp [fdwReason],DLL_PROCESS_DETACH
je .stop
jmp .stp
.start:
invoke MessageBox,0,DllStart,DllState,MB_OK
jmp .stp
.stop:
invoke MessageBox,0,DllStop,DllState,MB_OK
jmp .stp
.stp:
mov eax,TRUE
return
proc Wind
enter
push ebx esi edi
invoke GetLocalTime,Date
mov ebx,_outs
StringCopyHTML ebx,day
add ebx,eax
xor eax,eax
mov ax,[Date.wDay]
stdcall IntToString,h4,eax
StringCopyHTML ebx,h4
add ebx,eax
StringCopyHTML ebx,mon
add ebx,eax
xor eax,eax
mov ax,[Date.wMonth]
stdcall IntToString,h4,eax
StringCopyHTML ebx,h4
add ebx,eax
StringCopyHTML ebx,year
add ebx,eax
xor eax,eax
mov ax,[Date.wYear]
stdcall IntToString,h4,eax
StringCopyHTML ebx,h4
mov eax,_outs
pop edi esi ebx
return
proc IntToString,lpOutBuf,var
len dd 0
enter
push ebx esi edx ecx esi
;jmp .ex
cmp [var],0
jne .norr
mov eax,[lpOutBuf]
mov dx,030h
mov [eax],dx
jmp .ex
.norr:
mov eax,10
mov [len],eax
xor eax,eax
xor edx,edx
xor ecx,ecx
mov esi,bf
mov eax,[var]
cmp eax,0
jne .ll
mov eax,48
mov [esi],al
inc esi
jmp .ext
.ll:
div [len]
add dl,48
mov [esi],dl
inc esi
inc ecx
xor edx,edx
cmp eax,0
jne .ll
.ext:
mov [esi],dl
mov eax,[lpOutBuf]
cmp ecx,0
je .ex
.l: dec esi
mov dl,[esi]
mov [eax],dl
inc eax
dec ecx
cmp ecx,0
jne .l
mov dl,0
mov [eax],dl
.ex: pop esi ecx edx esi ebx
return
section '.idata' import data readable writeable
_library kernel32,'KERNEL32.DLL',\
user32,'USER32.DLL';,\
include 'C:\FASM135\147\INCLUDE\apia\kernel32.inc'
include 'C:\FASM135\147\INCLUDE\apia\user32.inc'
section '.edata' export data readable
export 'dll2.dll',Wind,'Wind'
section '.reloc' fixups data discardable
Первые строки format PE GUI 4.0 DLL и entry DllEntryPoint указывают компилятору создать РЕ-файл динамической библиотеки с точкой входа на метке DllEntryPoint.
Как Вы могли заметить динамическая библиотека практически ни чем не отличается от обычной программы Windows, кроме того, что входная процедура вызывается системой в четырёх случаях:
- Когда динамическая библиотека загружается в адресное пространство процесса (параметр fdwReason = DLL_PROCESS_ATTACH = 1);
- Когда динамическая библиотека выгружается из адресного пространства процесса (параметр fdwReason = DLL_PROCESS_ DETACH = 0);
- Когда создается новый поток в рамках динамической библиотеки (параметр fdwReason = DLL_ THREAD_ATTACН = 2);
- Когда разрушается (прекращается) поток в рамках динамической библиотеки (параметр fdwReason = DLL_ THREAD_DETACH = 3).
В обработке стартовой процедуры мы определяем значение параметра fdwReason и если динамическая библиотека была загружена или выгружена выдаём соответствующее сообщение.
В конце файла мы создаём секцию экспорта нашей библиотеки:
section '.edata' export data readable
export 'dll2.dll',Wind,'Wind'
section '.reloc' fixups data discardable
В таблице мы задаём имя файла динамической библиотеки и имена экспортируемых процедур.
Макрос export определён следующим образом:
macro export dllname,[label,string]
{ common
local module,addresses,names,ordinal,count
count = 0
forward
count = count+1
common
dd 0,0,0,rva module,1
dd count,count,rva addresses,rva names,rva ordinal
addresses:
forward
dd rva label
common
names:
forward
local name
dd rva name
common
ordinal: count = 0
forward
dw count
count = count+1
common
module db dllname,0
forward
name db string,0 }
Сперва, объявляются локальные метки и подсчитывается количество экспортируемых процедур:
common
local module,addresses,names,ordinal,count
count = 0
forward
count = count+1
common
Затем заносится смещение RVA имени библиотеки:
dd 0,0,0,rva module,1
Следующая строка заносит общее количество экспортируемых функций, количество функций экспортируемых по имени (при использовании этого макроса все функции экспортируются по имени), смещение начала массива смещений функций, смещение начала массива смещений имен экспортируемых функций и смещение массива смещений ординалов функций.
dd count,count,rva addresses,rva names,rva ordinal
Далее объявляется метка начала массива смещений экспортируемых функций и создаётся массив их смещения:
addresses:
forward
dd rva label
Следом объявляется метка начала массива смещений имён экспортируемых функций и создаётся сам массив:
common
names:
forward
local name
dd rva name
Затем объявляется метка начала массива смещений ординалов функций и создаётся массив ординалов экспортируемых функций:
common
ordinal: count = 0
forward
dw count
count = count+1
Ну и в конце макроса записывается имя динамической библиотеки и создаётся массив имен экспортируемых функций:
common
module db dllname,0
forward
name db string,0
Для более подробного ознакомления со структурой секции экспорта необходимо читать специальную литературу по структуре РЕ — файлов.
Теперь давайте посмотрим, на программу вызывающую нашу динамическую библиотеку:
format PE GUI 4.0
entry start
include 'include\kernel.inc'
include 'include\user.inc'
include 'include\macro\stdcall.inc'
include 'include\macro\import.inc'
section '.data' data readable writeable
Avtor db 'Автор:Пороткин Алексей Сергеевич',0
podskazka db 'Функция Wind возвратила указатель на строку:',0
section '.code' code readable executable
start:
invoke Wind
invoke MessageBox,0,eax,podskazka,MB_OK
invoke ExitProcess,0
section '.idata' import data readable writeable
library kernel,'KERNEL32.DLL',\
user,'USER32.DLL',\
MyDll,'C:\FASM135\mp\Dll2\Dll2.DLL'
kernel:
import ExitProcess,'ExitProcess'
user:
import MessageBox,'MessageBoxA'
MyDll:
import Wind,'Wind'
Обычное графическое приложение не имеющее своего окна и ресурсов размером 2 кБ. Импортирует только три функции две предоставляемые системой Windows и одна написанной нами динамической библиотекой. Как видите подключение созданной нами динамической библиотеки, ничем не отличается от подключения стандартных библиотек Windows. В этом и заключается вся прелесть использования ФАСМ-а, он не берёт на себя слишком много, что в купе с гибким макроязыком позволяет сделать очень многое максимально просто.
Для примера напишем программу, выводящую МессаджБокс с текущей датой. Модуль на ассемблере будет составлять строку символов, а модуль на С++ будет выводить эту строку в МессаджБокс.
Вот модуль на ассемблере:
format MS COFF
;public _WinMainCRTStartup
public _outs
public ?Wind@@YAPADXZ
extrn '__imp__GetLocalTime@4' as GetLocalTime:dword
include 'include\kernel.inc'
include 'include\macro\stdcall.inc'
include 'c:\fasm135\include\lib\strings.mac'
include 'c:\fasm135\include\lib\strings.asm'
section '.text' code readable executable
; _WinMainCRTStartup:
proc ?Wind@@YAPADXZ
enter
push ebx esi edi
invoke GetLocalTime,Date
mov ebx,_outs
StringCopyHTML ebx,day
add ebx,eax
xor eax,eax
mov ax,[Date.wDay]
stdcall IntToString,h4,eax
StringCopyHTML ebx,h4
add ebx,eax
StringCopyHTML ebx,mon
add ebx,eax
xor eax,eax
mov ax,[Date.wMonth]
stdcall IntToString,h4,eax
StringCopyHTML ebx,h4
add ebx,eax
StringCopyHTML ebx,year
add ebx,eax
xor eax,eax
mov ax,[Date.wYear]
stdcall IntToString,h4,eax
StringCopyHTML ebx,h4
add ebx,eax
mov eax,_outs
pop edi esi ebx
return
section '.data' data readable writeable
h4 db 'Сообщение',0
Date SYSTEMTIME
day db 'День:',0
mon db ' Месяц:',0
year db ' Год:',0
_outs: times 30 db 0
Обратите внимание на строку 2, где закомментировано определение точки входа в программу (_WinMainCRTStartup)если эту строку раскомментировать, то точка входа в программу будет именно в модуле на ассемблере. Результат работы функции записывается в переменную _outs и адрес (указатель на строку) возвращаем в регистре еах. В этом модуле используются макросы копирования строки в строку (StringCopyHTML ebx,day). Этот макрос не входит в поставку компилятора и содержится в файлах strings.mac и strings.asm он просто копирует строку (не включая нулевой символ), указатель на которую передаётся вторым параметром, в строку, указатель которой передаётся вторым параметром, после его выполнения в регистре еах количество скопированных символов. Эта процедура выдаёт строку типа: «День: 28 Месяц: 10 Год:2003». Для использования объектного модуля созданного на ассемблере необходимо в проект на С++ добавить созданный нами объектный файл (Project->Add to project->Files. . . в появившемся окне необходимо выбрать тип файлов obj и указать используемый файл). Теперь рассмотрим текст программы на MS Visual C++ 5.0:
#include «windows.h»
extern char * __cdecl Wind(void);
LPSTR cmsk,dat;
int PASCAL WinMain(HANDLE hInstance,HANDLE hPrevInstance,LPSTR lpszCmdParam,int nCmdShow)
{
dat=Wind();
MessageBox(0,dat,dat,MB_OK);
}
Здесь ничего сложного: подключаем файл «windows.h», затем объявляем внешнюю процедуру, возвращающую указатель на строку символов с нулём в конце, объявляем переменную dat, как указатель на строку символов, и наконец функция WinMain в которой вызываем нашу функцию (Wind) на ассемблере и выводим результат в мессаджбокс. Внимательный читатель скажет: «Стоп, но в модуле на ассемблере функцию мы объявили как ?Wind@@YAPADXZ, а в модуле на С++ вызываем Wind». Всё правильно. Просто MS Visual C++ 5.0, к объявленным внешним (находящимся в скомпилированных модулях) процедурам добавляет дополнительные символы, для контроля соответствия типов передаваемых результатов из процедуры и переменных в процедуру. Вот краткая структура имени функций формируемых MS Visual C++:
Префикс | Объявленное имя переменной | Разделитель | Тип вызова процедуры | Тип результата | Тип параметров | Постфикс |
? | Wind | @@Y | A | PAD | X | Z |
Причём постфикс изменяется в зависимости от наличия передаваемых в функцию параметров. Если параметры передаются, то постфикс «@Z», а если параметры не передаются то просто «Z».
Типы вызова процедуры следующие:
__cdecl | A |
__fastcall | I |
__stdcall | G |
Типы результата и передаваемых переменных имеют одинаковые обозначения:
Тип результата | Размер | Обозначение |
char | 1 | D |
unsigned char | 1 | E |
short | 2 | F |
unsigned short | 2 | G |
enum | 2 | ?AW4__unnamed@@ |
long | 4 | J |
unsigned long | 4 | K |
int | 4 | H |
unsigned int | 4 | I |
float | 4 | M |
double | 8 | N |
long double | 10 | O |
bool | 1 | _N |
Причём если передаётся (получается) не параметр, а его адрес (например char *) то перед обозначением переменной добавляется PA. Если параметры, получаемые из процедуры или передаваемые в процедуру, отсутствуют, вместо них ставится X.
Читатель может сказать: «Это как же нужно мозг морщить, чтобы всё запомнить и не перепутать ничего при составлении имени процедуры?». Такая работа имеет основное свойство: она не особо интеллектуальна, но муторна и действия при её решении вполне укладываются в рамках алгоритма. Отсюда вывод: компьютер на то и создан, что бы выполнять подобные задачи так пусть сам, и добавляет все эти префиксы, постфиксы и т.п. Напишем макрос, который будет объявлять процедуру составляя её имя из имени которое мы ему передаём и добавляя к нему все необходимые префиксы.
Использовать переменные длиннее 4 байт мы не будем, но думаю Вы сами сможете модернизировать макросы под свои нужды если понадобится.
Для начала мы должны определить символьные константы, соответствующие типам вызова процедуры и типам получаемых и возвращаемых параметров:
; константы типов вызовов процедур
__cdecl fix A
__fastcall fix I
__stdcall fix G
; константы типов переменных
void fix X
char$ fix PAD
char fix D
unsigned_char$ fix PAE
unsigned_char fix E
short$ fix PAF
short fix F
unsigned_short$ fix PAG
unsigned_short fix G
long$ fix PAJ
long fix J
unsigned_long$ fix PAK
unsigned_long fix K
int$ fix PAH
int fix H
unsigned_int$ fix PAI
unsigned_int fix I
float$ fix PAM
float fix M
Далее следует определение макроса:
macro exp_proc calltype,returns,name,[arg,type]
{
dr fix
forward
dr fix dr#type
common
if type eq void
public ?#name#@@Y#calltype#returns#dr#Z
?#name#@@Y#calltype#returns#dr#Z:
else
public ?#name#@@Y#calltype#returns#dr#@Z
?#name#@@Y#calltype#returns#dr#@Z:
end if
common
virtual at ebp+8
if ~ arg eq
forward
local ..arg
..arg dd ?
arg equ ..arg
common
end if
..ret = $ - (ebp+8)
end virtual
local ..dynamic_data,..dynamic_size
dynamic_data equ ..dynamic_data
dynamic_size equ ..dynamic_size
virtual at ebp - dynamic_size
dynamic_data:
}
В первой строке мы очищаем временную символьную константу, далее следует указание препроцессору обработать строку «dr fix dr#type» для всех значений параметров type начиная с первого. Эта строчка, просто создаёт константу содержащую все символы соответствующие всем получаемым процедурой параметрам. Например если в процедуру передаётся два параметра типа int, то dr будет эквивалентно HH. Далее следует указание препроцессору следующие строки обработать только один раз (common) в этих строках мы делаем видимой из других модулей программы метку (название) нашей процедуры и собственно следует содержимое макроса proc, рассмотренного ранее.
Полагаю, этот макрос не должен вызвать затруднений. Сложности в понимании может вызвать только строка «?#name#@@Y#calltype#returns#dr#@Z», объясню её более подробно. Сперва стоит знак вопроса (посмотрите табличку со структурой имени процедуры), после которого, значок номера (#), он говорит препроцессору, что далее следует символьная константа, которую следует склеить в одну метку с предыдущим текстом. Если константы с указанным именем не существует, то она включается, как есть. Рассмотрим последовательность действий препроцессора. Метка состоит из вопросительного знака, затем (без разделителей) добавляется, передаваемая макросу переменная name, после неё добавляется текст @@Y,после текста добавляется передаваемая макросу переменная calltype, затем переменная returns, потом составленная нами константа dr, и наконец постфикс @Z (или просто Z, если в процедуру не передаются параметры).
Всё. Макрос создан. Однако это ещё не всё. С таким определением процедуры не всегда можно использовать стандартные макросы enter и return т.к. тип вызова __cdecl предполагает, что стек после завершения работы процедуры будет очищаться вызывающей процедурой т.е. модулем написанным на С++, а стандартный макрос return сам очищает стек. Вот макрос, содержащий эпилог процедуры для типа вызова __cdecl:
macro cdecl_ret
{
sub ebp,dynamic_size
mov esp,ebp
pop ebp
ret
}
Но не только эпилог нужно изменить, но и пролог тоже:
macro cdecl_enter
{
dynamic_size = $ - dynamic_data
end virtual
push ebp
mov ebp,esp
add ebp,dynamic_size
}
Полагаю эти два коротеньких макроса не вызовут затруднений.
Ну и пример использования данных макросов:
exp_proc __cdecl,char$,Wi,first,int,second,int
cdecl_enter
push ebx esi edi
mov eax,[first]
stdcall IntToString, _outs,eax
mov eax,_outs
pop edi esi ebx
cdecl_ret
Функция IntToString преобразует 32-х битное без знаковое число (второй параметр) в строку (адрес строки передаётся первым параметром).
Модуль на С++ будет выглядеть следующим образом:
#include
extern char * __cdecl Wind(void);
extern char * __cdecl Wi(int c,int b);
LPSTR cmsk,dat;
int PASCAL WinMain(HANDLE hInstance,HANDLE hPrevInstance,LPSTR lpszCmdParam,int nCmdShow)
{
dat=Wi(12,30);
MessageBox(0,dat,dat,MB_OK);
Wind();
MessageBox(0,dat,dat,MB_OK);
}
Думаю больше пояснений не нужно.
Формат исполняемых файлов MZ
Вот простейший пример программы:
format MZ
push cs
pop ds
mov ah,9
mov dx,hello
int 21h
mov ax,4C00h
int 21h
hello db 'Hello world!',24h
Как видите ничего сложного.
org 100h ;Указание загрузить программу начиная с адреса 100h
use16 ;Создавать 16-ти битный код
mov ah,9
mov dx,hello
int 21h
int 20h
hello db 13,10,'Привет всем$'
Думаю здесь всё понятно.
[C] pas
Источник: wasm.ru от 06.01.2004