Для выполнения программ компьютер временно записывает программу и данные в основную память. Это память, которую люди имеют в виду, когда утверждают, что их компьютер имеет, например, 512К памяти. Компьютер имеет также ряд pегистров, которые он использует для временных вычислений.
Минимальной единицей информации в компьютере является бит. Бит может быть выключен, так что его значение есть нуль, или включен, тогда его значение равно единице. Единственный бит не может представить много информации в отличие от группы битов. Группа из девяти битов представляет собой байт; восемь битов которого содержат данные и один бит - контроль на четность. Восемь битов обеспечивают основу для двоичной арифметики и для представления символов, таких как буква A или символ *. Восемь битов дают 256 различных комбинаций включенных и выключенных состояний: от "все выключены" (00000000) до "все включены" (11111111). Например, сочетание включенных и выключенных битов для представления буквы A выглядит как 01000001, а для cимвола * - 00101010 (это можно не запоминать). Каждый байт в памяти компьютера имеет уникальный адрес, начиная с нуля.
Требование контроля на честность заключается в том, что количество включенных битов в байте всегда должно быть нечетно. Контрольный бит для буквы A будет иметь значение единица, а для символа * - ноль. Когда команда обращается к байту в памяти, компьютер проверяет этот байт. Если число включенных битов является четным, система выдает сообщение об ошибке. Ошибка четности может явится результатом сбоя оборудования или случайным явлением, в любом случае, это бывает крайне редко.
Может появится вопрос, откуда компьютер "знает", что значения бит 01000001 представляют букву A. Когда на клавиатуре нажата клавиша A, система принимает сигнал от этой конкретной клавиши в байт памяти. Этот сигнал устанавливает биты в значения 01000001. Можно переслать этот байт в памяти и, если передать его на экран или принтер, то будет сгенерирована буква A. По соглажению биты в байте пронумерованы от 0 до 7 справа налево, как это показано для буквы A:
Номера бит: 7 6 5 4 3 2 1 0
Значения бит: 0 1 0 0 0 0 0 1
Число 2 в десятой степени равно 1024, что составляет один килобайт и обозначается буквой К. Например, компьютер с памятью в 512К содержит 512 х 1024, т.е. 524288 байт. Процессор в PC и в совместимых моделях использует 16-битовую архитектуру, поэтому он имеет доступ к 16-битовым значениям как в памяти, так и в регистрах. 16-битовое (двухбайтовое) поле называется словом. Биты в слове пронумерованы от 0 до 15 справа налево, как это показано для букв PC:
Номера бит: 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
Значения бит: 0 1 0
1 0
0 0 0 0
1 0 0 0
0 1 1
Для целей стандартизации в микрокомпьютерах используется aмериканский национальный стандартный код
для обмена информацией
ASCII (American National Standard Code for Information Interchange).
Читается как "аски" код (прим. переводчика). Именно по этой причине комбинация бит 01000001 обозначает
букву A. Наличие стандартного кода облегчает обмен данными между различными устройствами компьютера.
8-битовый рассширенный ASCII-код, используемый в PC обеспечивает представление 256 символов,
включая символы для нацио нальных алфавитов.
Так как компьютер может различить только нулевое и единичное состояние бита, то он работает системе
исчисления с базой 2 или в двоичной системе. Фактически бит унаследовал cвое название от английского
"BInary digiT" (двоичная цифра). Сочетанием двоичных цифр (битов) можно представить любое
значение. Значение двоичного числа определяется относительной позицией каждого бита и наличием
единичных битов. Ниже показано восьмибитовое число содержащее все единичные биты:
Позиционные веса: 128 64 32 16 8 4 2 1
Включенные биты: 1 1
1 1 1 1 1 1
Самый правый бит имеет весовое значение 1, следующая цифра влево - 2, следующая - 4 и т.д.
Общая сумма для восьми единичных битов в данном случае составит 1 + 2 + 4 + ... + 128,
или 255 (2 в восьмой степени - 1).
Для двоичного числа 01000001 единичные биты представляют значения 1 и 64, т.е. 65. Но 01000001
представляет также букву A! Действительно, здесь момент, который необходимо четко уяснить.
Биты 01000001 могут представлять как число 65, так и букву A:
- если программа определяет элемент данных для арифметических целей, то 01000001 представляет
двоичное число эквивалентное десятичному числу 65;
- если программа определяет элемент данных (один или более смежных байт), имея в виду описательный
характер, как, например, заголовок, тогда 01000001 представляет собой букву или "строку".
При програмировании это различие становится понятным, так как назначение каждого элемента данных
определено.
Двоичное число неограничено только восьмью битами. Так как процессор 8088 использует 16-битовую
архитектуру, oн автоматически оперирует с 16-битовыми числами. 2 в степени 16 минус 1 дает значение
65535, а немного творческого программирования позволит обрабатывать числа до 32 бит (2 в степени 32
минус 1 равно 4294967295) и даже больше.
Микрокомпьютер выполняет арифметические действия только в двоичном формате. Поэтому программист
на языке ассемблера должен быть знаком с двоичным форматом и двоичным сложением:
0 + 0 = 0
1 + 0 = 1
1 + 1 = 10
1 + 1 + 1 = 11
Обратное внимание на перенос единичного бита в последних двух операциях. Теперь, давайте сложим 01000001
и 00101010.
Букву A и символ *? Нет, число 65 и число 42:
Двоичные | Десятичные |
01000001 | 65 |
00101010 | 42 |
01101011 | 107 |
Проверьте, что двоичная сумма 01101011 действительно равна 107. Рассмотрим другой пример:
Двоичные | Десятичные |
00111100 | 60 |
00110101 | 53 |
01110001 | 113 |
+3 | 00000011 |
+2 | 00000010 |
+1 | 00000001 |
0 | 00000000 |
-1 | 11111111 |
-2 | 11111110 |
-3 | 11111101 |
Фактически нулевые биты в отрицательном двоичном числе определяют его величину: рассмотрите
позиционные значения нулевых битов как если это были единичные биты, сложите эти значения и прибавте
единицу.
Представим, что необходимо просмотреть содержимое некотоpых байт в памяти
Требуется oпределить содержимое четырех последовательных байтов (двух слов), которые имеют двоичные
значения. Так как четыре байта включают в себя 32 бита, то специалисты разработали
"стенографический" метод
представления двоичных данных. По этому методу каждый байт делится пополам и каждые
полбайта выражаются соответствующим значением. рассмотрим следующие четыре байта:
Двоичное | Десятичное |
0101 | 5 |
1001 | 9 |
0011 | 3 |
0101 | 5 |
1011 | 11 |
1001 | 9 |
1100 | 12 |
1110 | 14 |
Так как здесь для некоторых чисел требуется две цифры, расширим систему счисления так, чтобы
10=A, 11=B, 12=C, 13=D, 14=E, 15=F. таким образом получим более сокращенную форму, которая представляет содержимое вышеуказанных байт:
59 35 B9 CE
Такая система счисления включает "цифры" от 0 до F, и так как таких цифр 16, она называется шестнадцатиричным представлениeм. В таблице 1 приведены двоичные, десятичные и шестнадцатиричные значения чисел от 0 до 15.
Шестнадцатиричный формат нашел большое применение в языке ассемблера. В листингах ассемблирования программ в шестнадцатеричном формате показаны все адреса, машинные коды команд и содержимое констант. Также для отладки при использовании программы DOS DEBUG адреса и содержимое байтоа выдается в шестнадцатиричном формате.
Если немного поработать с шестнадцатиричным форматом, то можно быстро привыкнуть к нему. Рассмотрим несколько проcтых примеров шестнадцатиричной арифметики. Следует помнить, что после шестнадцатиричного числа F следует шестнадцатиричное 10, что равно десятичному числу 16.
6 | 5 | F | F | 10 | FF |
4 | 8 | 1 | F | 10 | 1 |
A | D | 10 | 1E | 20 | 100 |
Таблица 1. Двоичное, десятичное и шестнадцатиричное представления.
Заметьте также, что шест.20 эквивалентно десятичному 32, шест.100 - десятичному 256 и шест.100 - десятичному 4096.
Для индикации шест.числа в ассемблерной программе непосредственно после числа ставится символ "H",
например, 25H (десятичное значение 37).
Шест. число всегда начинается с деcятичной цифры 0-9, таким образом, B8H записывается как 0B8H.
Сегментом
называется область, которая начинается на границе параграфа, т.е. по любому адресу,
который делится на 16 без остатка. Хотя сегмент может располагаться в любом месте
памяти и иметь размер до 64 Кбайт, он требует столько памяти, cколько необходимо
для выполнения программы. Имеется три главных сегмента:
1.
Сегмент кодов. Сегмент кодов содержит машинные команды,
которые будут выполняться. Обычно первая выполняемая
команда находится в начале этого сегмента и операционная система передает управление
по адресу данного сегмента для выполнения программы. Регистр сегмента кодов
(CS) адресует данный сегмент.
2.
Сегмент данных. Сегмент данных содержит определенные
данные, константы и рабочие области, необходимые
программе. Регистр сегмента данных (DS) адресует данный сегмент.
3.
Сегмент стека. Стек содержит адреса возврата как для
программы для возврата в операционную систему, так и для вызовов подпрограмм для возврата в
главную программу. Регистр сегмента стека (SS) адресует данный сегмент.
Еще один сегментный регистр,
регистр дополнительного сегмента (ES), предназначен
для специального использования.
Внутри программы все адреса памяти относительны к началу
cегмента. Такие адреса называются
смещением от начала сегмента. Двухбайтовое смещение (16-бит) может быть в
пределах от шест. 0000 до шест. FFFF или от 0 до 65535. Для
обращения к любому адресу в программе, компьютер складывает
адрес в регистре сегмента и смещение. Например, первый байт
в сегменте кодов имеет смещение 0, второй байт - 01 и так
далее до смещения 65535.