Таблицы символов

  1. ASCII
  2. Кодовая страница 437
  3. Основная кодировка
  4. Альтернативная кодировка
  5. МС-ДОС 866, или Альтернативная модифицированная
  6. КОИ-8
  7. Управляющие символы

ASCII

American Standart Code for Information Interchange ─ Стандартный Американский код для обмена информаций ─ семиразрядная кодировка, определяющая знаки в диапазоне 20h─7Eh. Вследствие того, что стандарт разработан в «эпоху телетайпов», значения 00h─1Fh и 7Fh назначены управляющими знаками.

{Изображение кодировки ASCII}

Она была придумана для стандартизаций кодов символов, чтобы больше не было всевозможных «кракозябр» при передачи английских текстов между компьютерами. Со временем она стала замещать кодировку EBCDIC и как кодировку для внутреннего использования в компьютерах. Позже её начали брать как основу для последующих 8-битных кодировок, поэтому в передаче текстов на английском проблем возникнуть не должно (конечно же если не попытаться декодировать другой 7-битной кодировкой).

Те кодировки, которые основаны и полностью совместимы с ASCII, относят к Расширенному ASCII (Extended ASCII).

Управляющий символ можно набрать, зажав Control и нужную клавишу. Чтобы выяснить нужную клавишу, следует использовать диапазон таблицы 40h─5Fh, где они по порядку соответствуют управляющим. Другими словами, следует прибавить к номеру управляющего число 40h и нажать клавишу со знаком соответствующей сумме (например, для ввода DLE под номером 10h нужна клавиша со знаком 10h+40h=50h, то есть P). Control+Backspace добавляет управляющую DEL.

Кодировка 437

Кодировка 437 ─ это номер кодировки в «IBM Персональном компьютере®», где добавили 48 знаков для различных европейских языков, 48 знаков псевдографики, 16 отборных Греческих знаков и 15 математических знаков, 16 знаков для Игр и 15 для текстовых процессоров. Всё это скомпановано следующим образом:

{Знакогенератор видеоадаптера VGA}

Из всех управляющих смиволов, BIOS интерпретирует только CR, LF, TAB, BS и BEL.

Основная кодировка

Это стандартная кодировка для советских персональных ЦВМ, которая предоставляет кириллический русский алфавит и символы псевдографики. Первые 128 знаков и последний 255-й соответствуют кодировке 437. Эта кодировка была обязательна для реализаций на всех персональных ЦВМ, кроме клонов ПК IBM.

{Изображение Основной кодировки}

Кодировкой предусмотрены специальные псевдографические знаки для рисования таблиц, рамок и т. п. элементов, которые при составлений из подобных символов (| - + / \ _) будут выглядить не очень.

Альтернативная кодировка

В этой кодировке символы псевдографики расположены на тех же местах, где они были расположены в КС 437. Из-за этого между буквами «п» и «р» имеется разрыв в 48 знаков, но имеется совместимость с программным обеспечением для оригинального IBM ПК.

{Изображение Альтернативной кодировки}

МС-ДОС 866, или Альтернативная модифицированная

Это международная модификация и так Альтернативной кодировки, используемое в русской версий МС-ДОС 4.01. Ради поддержки других языков дублирующие стрелки и диагональные линий заменены на некоторые символы расширенной кириллицы и три знака из Расширенной ASCII.

{Изменения в Альтернативной модифицированной кодировке}

КОИ-8

Код обмена информаций ─ это русская кодировка для передачи информаций между суперкомпьютерами, в некотором числе использовалась и во Всемирной паутине (конкретно в письмах). Получена сложением двух семиразрядных кодировок КОИ-7, где набор 0 помещён в начало, а в конце ─ набор 1.

Во Всемирной паутине она известна в таком виде:

{КОИ-8 в паутине}

Чтобы понять, почему же кириллические буквы расположены вот таким образом, предлагаем ознакомиться с его составом.

3 вида КОИ-7

Во-первых, как расположены буквы алфавита. КОИ-7 разделена на два набора ─ набор 0 и 1. Семью битами можно обозначить всего 128 чисел, в латинском алфавите букв 26, в кириллице их 32. А ещё нужно разместить управляющие символы и различные технические знаки. Всего этого в 128 знаков уместить нельзя, поэтому набор 0 содержит латиницу (почти тот же ASCII), а набор 1 ─ кириллицу. Между ними переключаются с помощью символов SO (в 1) и SI (в 0). Дело в том, что КОИ-7 ─ это «проблемная» кодировка, и спроектирована она так, чтобы при неправильном декодирований читаемость текста сохранялась, что может случится при пониманий оборудованием только ASCII. Почти каждая кириллическая буква была поставлена в соответствие с латинской буквой по звучанию.

Помимо этих двух наборов раньше существовал ещё набор 2. В этом наборе таки попытались совместить оба алфавита. Ради этого пришлось пожертвовать строчными буквами, иначе не влезало. Так, для совместимости с набором 2, а в свою очередь и для совметимости с ASCII, строчные буквы пришлось поставить первее, а за ним уже и прописные.

В итоге всех этих стараний при декодирований «Друг мой эльф! Яшке б свез птиц южных чащ!» из набора 1 в ASCII или набор 0, появится «dRUG MOJ \LXF! q[KE B SWEZ PTIC @VNYH ^A]!». В компьютере ДВК возможно увидеть и обратное: используемый набор переключают сменой знакогенератора, а система всегда говорит на английском, и поэтому, например, сообщение «Invalid device» может показаться в виде «иНЖАЛИД ДЕЖИЦЕ».


Управляющие символы

Здесь приведены расшифровки аббревиатур управляющих символов, а также их номер и способ набора.

C0

Набор управляющих символов, который можно встретить в ASCII и других основаных на нём кодировках, имеет название C0.

╔══╤═══╤═══╤════════════════════════╤════════════════════════╤══════════════╗
║№ │Упр│Рус│       Расшифровка      │       На Русском       │   Написание  ║
╟──┼───┼───┼────────────────────────┼────────────────────────┼──────────────╢
║00│NUL│ПУС│NULL . . . . . . . . . .│ПУСТО . . . . . . . . . │Ctrl+@        ║
║01│SOH│НЗ │START OF HEADING. . . . │НАЧАЛО ЗАГОЛОВКА . . . .│Ctrl+A        ║
║02│STX│НТ │START OF TEXT. . . . . .│НАЧАЛО ТЕКСТА . . . . . │Ctrl+B        ║
║03│ETX│КТ │END OF TEXT . . . . . . │КОНЕЦ ТЕКСТА . . . . . .│Ctrl+C        ║
║04│EOT│КП │END OF TRANSMISSION. . .│КОНЕЦ ПЕРЕДАЧИ. . . . . │Ctrl+D        ║
║05│ENQ│КТМ│ENQUIRY . . . . . . . . │КТО ТАМ? . . . . . . . .│Ctrl+E        ║
║06│ACK│ДА │ACKNOWLEDGE. . . . . . .│ПОДТВЕРЖДЕНИЕ . . . . . │Ctrl+F        ║
║07│BEL│ЗВ │BELL. . . . . . . . . . │ЗВОНОК . . . . . . . . .│Ctrl+G        ║
║08│BS │ВШ │BACKSPACE. . . . . . . .│ВОЗВРАТ НА ШАГ. . . . . │Ctrl+H        ║
║09│TAB│ГТ │HORIZONTAL TABULATION . │ГОРИЗОНТАЛЬНАЯ ТАБУЛЯЦИЯ│Ctrl+I        ║
║0A│LF │ПС │LINE FEED. . . . . . . .│ПЕРЕВОД СТРОКИ. . . . . │Ctrl+J        ║
║0B│VT │ВТ │VERTICAL TAB. . . . . . │ВЕРТИКАЛЬНАЯ ТАБУЛЯЦИЯ .│Ctrl+K        ║
║0C│FF │ПФ │FORM FEED. . . . . . . .│ПЕРЕВОД ФОРМАТА . . . . │Ctrl+L        ║
║0D│CR │ВК │CARRIAGE RETURN . . . . │ВОЗВРАТ КАРЕТКИ. . . . .│Ctrl+M        ║
║0E│SO │ВЫХ│SHIFT-OUT. . . . . . . .│ВЫХОД . . . . . . . . . │Ctrl+N        ║
║0F│SI.│ВХ.│SHIFT-IN. . . . . . . . │ВХОД . . . . . . . . . .│Ctrl+O        ║
║10│DLE│АР1│DATA.LINK.ESCAPE . . . .│АВТОРЕГИСТР.ОДИН. . . . │Ctrl+P        ║
║11│DC1│СУ1│DEVICE.CONTROL.1. . . . │СИМВОЛ.УСТРОЙСТВА.ОДИН .│Ctrl+Q        ║
║12│DC2│СУ2│DEVICE.CONTROL.2 . . . .│СИМВОЛ.УСТРОЙСТВА.ДВА . │Ctrl+R        ║
║13│DC3│СУ3│DEVICE.CONTROL.3. . . . │СИМВОЛ.УСТРОЙСТВА.ТРИ. .│Ctrl+S        ║
║14│DC4│СУ4│DEVICE.CONTROL.4 . . . .│СИМВОЛ.УСТРОЙСТВА.ЧЕТЫРЕ│Ctrl+T        ║
║15│NAK│НЕТ│NEGATIVE.ACKNOWLEDGEMENT│ОТРИЦАНИЕ. . . . . . . .│Ctrl+U        ║
║16│SYN│СИН│SYNCHRONIZATION. . . . .│СИНХРОНИЗАЦИЯ . . . . . │Ctrl+V        ║
║17│ETB│КБ.│END.OF.TEXT.BLOCK . . . │КОНЕЦ.БЛОКА. . . . . . .│Ctrl+W        ║
║18│CAN│АН.│CANCEL . . . . . . . . .│АННУЛИРОВАНИЕ . . . . . │Ctrl+X        ║
║19│EM │КН │END OF MEDIUM . . . . . │КОНЕЦ НОСИТИЛЯ . . . . .│Ctrl+Y        ║
║1A│SUB│ЗМ │SUBSTITUTE CHARACTER . .│ЗАМЕНА СИМВОЛА. . . . . │Ctrl+Z        ║
║1B│ESC│АР2│ESCAPE. . . . . . . . . │АВТОРЕГИСТР ДВА. . . . .│Ctrl+[        ║
║1C│FS │РФ │FILE SEPARATOR . . . . .│РАЗДЕЛИТЕЛЬ ФАЙЛОВ. . . │Ctrl+\        ║
║1D│GS │РГ │GROUP SEPARATOR . . . . │РАЗДЕЛИТЕЛЬ ГРУПП. . . .│Ctrl+]        ║
║1E│RS │РЗ │RECORD SEPARATOR . . . .│РАЗДЕЛИТЕЛЬ ЗАПИСЕЙ . . │Ctrl+^        ║
║1F│US │РЭ │UNIT SEPARATOR. . . . . │РАЗДЕЛИТЕЛЬ ЭЛЕМЕНТОВ. .│Ctrl+_        ║
║7F│DEL│ЗБ │DELETE . . . . . . . . .│ЗАБОЙ . . . . . . . . . │Ctrl+Backspace║
╚══╧═══╧═══╧════════════════════════╧════════════════════════╧══════════════╝

C1

Набор управляющих C1 встречается в кодировках ISO-8859, Unicode и КОИ-8. Их можно набрать только Alt-кодами.

╔══╤════╤═══════════════════════════════════════╤════════════════╗
║№ │Упр.│Расшифровка                            │Десятичный номер║
╟──┼────┼───────────────────────────────────────┼────────────────╢
║80│PAD │Padding character . . . . . . . . . . .│. . . . . . .128║
║81│HOP │High octet preset. . . . . . . . . . . │ . . . . . . 129║
║82│BPH │Break permitted here. . . . . . . . . .│. . . . . . .130║
║83│NBH │No break here. . . . . . . . . . . . . │ . . . . . . 131║
║84│IND │Index . . . . . . . . . . . . . . . . .│. . . . . . .132║
║85│NEL │Next line. . . . . . . . . . . . . . . │ . . . . . . 133║
║86│SSA │Start of selected area. . . . . . . . .│. . . . . . .134║
║87│ESA │End of selected area . . . . . . . . . │ . . . . . . 135║
║88│HTS │Character tabulation set. . . . . . . .│. . . . . . .136║
║89│HTJ │Character Tabulation with Justification│ . . . . . . 137║
║8A│VTS │Vertical (Line) Tabulation set. . . . .│. . . . . . .138║
║8B│PLD │Partial line down. . . . . . . . . . . │ . . . . . . 139║
║8C│PLU │Partial line up . . . . . . . . . . . .│. . . . . . .140║
║8D│RI  │Reverse line feed. . . . . . . . . . . │ . . . . . . 141║
║8E│SS2 │Single Shift two. . . . . . . . . . . .│. . . . . . .142║
║8F│SS3 │Single Shift three . . . . . . . . . . │ . . . . . . 143║
║90│DCS │Device Control String . . . . . . . . .│. . . . . . .144║
║91│PU1 │Private Use one. . . . . . . . . . . . │ . . . . . . 145║
║92│PU2 │Private Use two . . . . . . . . . . . .│. . . . . . .146║
║93│STS │Set transmit state . . . . . . . . . . │ . . . . . . 147║
║94│CCH │Cancel character. . . . . . . . . . . .│. . . . . . .148║
║95│MW  │Message waiting. . . . . . . . . . . . │ . . . . . . 149║
║96│SPA │Start of guarded Area . . . . . . . . .│. . . . . . .150║
║97│EPA │End of guarded Area. . . . . . . . . . │ . . . . . . 151║
║98│SOS │Start of string . . . . . . . . . . . .│. . . . . . .152║
║99│SGCI│Single graphic character introducer. . │ . . . . . . 153║
║9A│SCI │Single character introducer . . . . . .│. . . . . . .154║
║9B│CSI │Control sequence introducer. . . . . . │ . . . . . . 155║
║9C│ST  │String terminator . . . . . . . . . . .│. . . . . . .156║
║9D│OSC │Operating system command . . . . . . . │ . . . . . . 157║
║9E│PM  │Privacy message . . . . . . . . . . . .│. . . . . . .158║
║9F│APC │Application program command. . . . . . │ . . . . . . 159║
╚══╧════╧═══════════════════════════════════════╧════════════════╝

ISO 8859

В семействе кодировок ISO 8859 имеется дополнительный управляющий символ ─ SHY, Soft hyphen, расположенный на позиций 0ADh, и набираемый сочетанием Alt+173. Этот символ указывает, где можно перенести дальнейший текст, предварительно поставив дефис.