Что такое язык ascii

Коды символов ASCII: таблицы, понятие, применение

Что такое язык ascii. Смотреть фото Что такое язык ascii. Смотреть картинку Что такое язык ascii. Картинка про Что такое язык ascii. Фото Что такое язык ascii

Часто бывает, в практике создания веб приложений, и при создании дизайна необходимо вставить какой-то спецсимвол, например копирайт, авторское право, стрелочку и т.д. Для этого используют ascii кодамы, которые, вставляют в контекст кода HTML. При выводе они отображаются как нормальные символы. В данной статье, ознакомимся с кодами символов ascii и научимся их применять при разработке сайтов.

Что мы сегодня узнаем?

Что такое ASCII коды?

Как всегда сразу по понятиям. Если вы понимаете, что такое ascii коды, отлично, можете посмотреть таблицы ascii кодов. Кому интересно узнать что такое ascii коды, выслушаем же мнение Википедии.

ASCII (англ. American Standard Code for Information Interchange) — американский стандартный код для обмена информацией. ASCII представляет собой кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов.

Таблицы ASCII кодов

Ниже предоставленные таблицы ascii кодов символов. Если вы не совсем понимаете, как их использовать, наберитесь терпения и прочтите последний пункт статьи.

Таблица ascii кодов: ASCII (American Standard Code for Information Interchange)

DecHexCharDecHexCharDecHexCharDecHexChar
00NUL3220(sp)6440@9660`
11SOH3321!6541A9761a
22STX3422«6642B9862b
33ETX3523#6743C9963c
44EOT3624$6844D10064d
55ENQ3725%6945E10165e
66ACK3826&7046F10266f
77BEL39277147G10367g
88BS4028(7248H10468h
99TAB4129)7349I10569i
10ALF422A*744AJ1066Aj
11BVT432B+754BK1076Bk
12CFF442C,764CL1086Cl
13DCR452D774DM1096Dm
14ESO462E.784EN1106En
15FSI472F/794FO1116Fo
1610DLE483008050P11270p
1711DC1493118151Q11371q
1812DC2503228252R11472r
1913DC3513338353S11573s
2014DC4523448454T11674t
2115NAK533558555U11775u
2216SYN543668656V11876v
2317ETB553778757W11977w
2418CAN563888858X12078x
2519EM573998959Y12179y
261ASUB583A:905AZ1227Az
271BESC593B;915B[1237B <
281CFS603C945E^1267E
311FUS633F?955F_1277FDEL

Расширенная таблица кодов ASCII

Другой случай, когда нужно реализовать подсветку кода (php, js, css, html…), пользовался регулярными выражениями в javascript, и получилось что звездочка (Asterisk), мешала работе js функции. Заменил ее ascii кодом и все стало работать как швейцарские часы.

Третий случай, когда вы создаете многоязычный сайт, в других странах, символы не входящие в стандарт их кодировки, могут выглядеть «крякозябрами», поэтому их нужно менять ascii кодами.

Источник

ASCII

Что такое язык ascii. Смотреть фото Что такое язык ascii. Смотреть картинку Что такое язык ascii. Картинка про Что такое язык ascii. Фото Что такое язык ascii

Что такое язык ascii. Смотреть фото Что такое язык ascii. Смотреть картинку Что такое язык ascii. Картинка про Что такое язык ascii. Фото Что такое язык ascii

ASCII (англ. American Standard Code for Information Interchange ) — американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов. В американском варианте английского языка произносится [э́ски], тогда как в Великобритании чаще произносится [а́ски]; по-русски произносится также [а́ски] или [аски́].

ASCII представляет собой кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов. Изначально разработанная как 7-битная, с широким распространением 8-битного байта ASCII стала восприниматься как половина 8-битной. В компьютерах обычно используют расширения ASCII с задействованным 8-м битом и второй половиной кодовой таблицы (например КОИ-8).

Содержание

Наложение символов

Благодаря символу BS (возврат на шаг) на принтере можно печатать один символ поверх другого. В ASCII было предусмотрено добавление таким образом диакритики к буквам, например:

Примечание: в старых шрифтах апостроф ‘ рисовался с наклоном влево, а тильда

была сдвинута вверх, так что они как раз подходили на роль акута и тильды сверху.

Если на символ накладывается тот же символ, то получается эффект жирного шрифта, а если на символ накладывается подчёркивание, то получается подчёркнутый текст.

Примечание: это используется, например, в справочной системе man.

Национальные варианты ASCII

Стандарт ISO 646 (ECMA-6) предусматривает возможность размещения национальных символов на месте @ [ \ ] ^ `

. В дополнение к этому, на месте # может быть размещён £, а на месте $¤. Такая система хорошо подходит для европейских языков, где нужны лишь несколько дополнительных символов. Вариант ASCII без национальных символов называется US-ASCII, или «International Reference Version».

Для некоторых языков с нелатинской письменностью (русского, греческого, арабского, иврита) существовали более радикальные модификации ASCII. Одним из вариантов был отказ от строчных латинских букв — на их месте размещались национальные символы (для русского и греческого — только заглавные буквы). Другой вариант — переключение между US-ASCII и национальным вариантом «на лету» с помощью символов SO (Shift Out) и SI (Shift In) — в этом случае в национальном варианте можно полностью устранить латинские буквы и занять всё пространство под свои символы. См. также КОИ-7.

Впоследствии оказалось удобнее использовать 8-битные кодировки (кодовые страницы), где нижнюю половину кодовой таблицы (0—127) занимают символы US-ASCII, а верхнюю (128—255) — дополнительные символы, включая набор национальных символов. Таким образом, верхняя половина таблицы ASCII до повсеместного внедрения Юникода активно использовалась для представления локализированных символов, букв местного языка. Отсутствие единого стандарта размещения кириллических символов в таблице ASCII доставляло множество проблем с кодировками (КОИ-8, Windows-1251 и другие). Другие языки с нелатинской письменностью тоже страдали из-за наличия нескольких разных кодировок.

В Юникоде первые 128 символов тоже совпадают с соответствующими символами US-ASCII.

Кодировка

Символ 0x5e в первой версии стандарта ASCII (1963) соответствовал стрелке вверх, а символ 0x5f — стрелке влево. Стандарт ECMA-6 (1965) заменил их на знак вставки (используемый также в роли циркумфлекса) и нижнюю черту (подчёркивание) соответственно.

Управляющие символы

Поскольку ASCII изначально предназначался для обмена информацией (по телетайпу), в нём, кроме информационных символов, используются символы-команды для управления связью. Это обычный набор спецсигналов, применявшийся и в других докомпьютерных средствах обмена сообщениями (азбука Морзе, семафорная азбука), дополненный с учётом специфики устройства.

(После названия каждого символа указан его 16-ричный код)

Структурные свойства таблицы

Представление ASCII в ЭВМ

На подавляющем большинстве современных компьютеров минимально адресуемая единица памяти — 8-битный байт, поэтому там используются 8-битные, а не 7-битные символы. Обычно символ ASCII расширяют до 8 бит, просто добавляя один нулевой бит в качестве старшего.

На компьютерах системы IBM/360, однако, в случае использования ASCII применялся другой метод: 6-й бит (если считать самый младший бит первым) перемещается в 7-й, а бывший 7-й «раздваивается» и копируется и в 8-й бит, и в 6-й. Получается такая таблица [1] :

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
0.NULSOHSTXETXEOTENQACKBELBSTABLFVTFFCRSOSI
1.DLEDC1DC2DC3DC4NAKSYNETBCANEMSUBESCFSGSRSUS
2.!«#$%&()*+,./
3.0123456789:;?
4.@ABCDEFGHIJKLMNO
5.PQRSTUVWXYZ[\]^_
6.`abcdefghijklmno
7.pqrstuvwxyz <|>
.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
0.NULSOMEOAEOMEQTWRURUBELLBKSPHTLFVTFFCRSOSI
1.DC0DC1DC2DC3DC4ERRSYNCLEMS0S1S2S3S4S5S6S7
2.
3.
4.BLANK!«#$%&()*+,./
5.0123456789:;?
6.
7.
8.
9.
A.@ABCDEFGHIJKLMNO
B.PQRSTUVWXYZ[\]
C.
D.
E.abcdefghijklmno
F.pqrstuvwxyzESCDEL

На тех компьютерах, где минимально адресуемой единицей памяти было 36-битное слово, поначалу использовали 6-битные символы (1 слово = 6 символов). После перехода на ASCII на таких компьютерах в одном слове стали размещать либо 5 семибитных символов (1 бит оставался лишним), либо 4 девятибитных символа.

ASCII-коды используются также для определения нажатой клавиши при программировании. Для стандартной QWERTY-клавиатуры таблица кодов выглядит следующим образом:

Источник

ASCII таблица

Что такое язык ascii. Смотреть фото Что такое язык ascii. Смотреть картинку Что такое язык ascii. Картинка про Что такое язык ascii. Фото Что такое язык ascii

ASCIIA merican S tandard C ode for I nformation I nterchange.

ASCII была разработана (1963 год) для кодирования символов, коды которых помещались в 7 бит (128 символов). Со временем кодировка была расширена до 8-ми бит (256 символов), коды первых 128-и символов не изменились.

Управляющие символы ASCII (код символа 0-31)

Первые 32 символа в ASCII-таблице не имеют печатных кодов и используются для управления периферийными устройствами, телетайпами, принтерами и т.д.

DECOCTHEXBINSymbolHTML NumberHTML NameDescription
00000x0000000000NUL \0& #000;Null char
10010x0100000001SOH& #001;Start of Heading
20020x0200000010STX& #002;Start of Text
30030x0300000011ETX& #003;End of Text
40040x0400000100EOT& #004;End of Transmission
50050x0500000101ENQ& #005;Enquiry
60060x0600000110ACK& #006;Acknowledgment
70070x0700000111BEL& #007;Bell
80100x0800001000BS& #008;Back Space
90110x0900001001HT \t& #009;Tab
100120x0A00001010LF \n& #010;Новая строка
110130x0B00001011VT& #011;Vertical Tab
120140x0C00001100FF& #012;Form Feed
130150x0D00001101CR \r& #013;Возврат каретки
140160x0E00001110SO& #014;Shift Out / X-On
150170x0F00001111SI& #015;Shift In / X-Off
160200x1000010000DLE& #016;Data Line Escape
170210x1100010001DC1& #017;Device Control 1 (oft. XON)
180220x1200010010DC2& #018;Device Control 2
190230x1300010011DC3& #019;Device Control 3 (oft. XOFF)
200240x1400010100DC4& #020;Device Control 4
210250x1500010101NAK& #021;Negative Acknowledgement
220260x1600010110SYN& #022;Synchronous Idle
230270x1700010111ETB& #023;End of Transmit Block
240300x1800011000CAN& #024;Cancel
250310x1900011001EM& #025;End of Medium
260320x1A00011010SUB& #026;Substitute
270330x1B00011011ESC& #027;Escape
280340x1C00011100FS& #028;File Separator
290350x1D00011101GS& #029;Group Separator
300360x1E00011110RS& #030;Record Separator
310370x1F00011111US& #031;Unit Separator
DECOCTHEXBINSymbolHTML NumberHTML NameDescription
Печатные символы ASCII (код символа 32-127)

Буквы, цифры, знаки препинания и другие символы расположенные на клавиатуре (англ.).

Источник

ASCII

Что такое язык ascii. Смотреть фото Что такое язык ascii. Смотреть картинку Что такое язык ascii. Картинка про Что такое язык ascii. Фото Что такое язык ascii

Таблица ASCII определяет коды для символов:

Содержание

История

Изначально (1963 год) ASCII была разработана для кодирования символов, коды которых помещались в 7 бит (128 символов; 2 7 =128); при этом старший 7-й бит (нумерация с нуля) использовался для контроля ошибок, возникших при передаче данных. Со временем — кодировка была расширена до 256 символов (2 8 =256); коды первых 128 символов не изменились. ASCII стала восприниматься как половина 8-битной кодировки, а «расширенной ASCII» называли ASCII с задействованным 8-м битом (например, КОИ-8).

Наложение символов

С помощью символа Backspace (BS) (возврат на один символ) на принтере можно печатать один символ поверх другого. В ASCII таким же способом можно добавить к буквам диакритические знаки, например:

Примечание. В старых шрифтах — апостроф «’» рисовался с наклоном влево (сравните: « ` » и « ´ »), а тильда «

» — была сдвинута вверх (сравните: «

» и « ˜ »), так что они как раз подходили на роль символов акут «´» и «тильда сверху».

Если в одной позиции дважды напечатать один и тот же символ — получится жирный символ; если в одной позиции напечатать символ, а затем подчёркивание «_» — получится подчёркнутый символ:

Эта техника до сих пор используется, например, в справочной системе man.

Национальные варианты ASCII

Стандарт ISO 646 (ECMA-6) предусматривает возможность размещения в ASCII национальных символов. Для этого предлагается заменять символы «@», «[», «\», «]», «^», «`», «<», «|», «>», «

». Также на месте знака решётки «#» может быть размещён символ фунта «£», а на месте символа доллара «$» — знак валюты «¤». Такая система хорошо подходит для европейских языков, так как в них используются символы латинского алфавита и лишь несколько дополнительных символов. Вариант ASCII, не содержащий национальных символов, называется «US-ASCII» или «international reference version».

Для некоторых языков (с нелатинской письменностью: русский, греческий, арабский, иврит и др.) существовали более радикальные модификации ASCII:

Впоследствии оказалось удобнее использовать 8-битовые кодировки (кодовые страницы), в которых нижнюю половину кодовой таблицы (0—127) занимают символы US-ASCII, а верхнюю (128—255) — дополнительные символы, включая набор национальных символов. Таким образом, верхняя половина таблицы ASCII (до повсеместного внедрения Юникода) активно использовалась для представления локализированных символов, букв местного языка. Отсутствие единого стандарта размещения кириллических символов в таблице ASCII доставляло множество проблем с кодировками (КОИ-8, Windows-1251 и др.). Носители других языков с нелатинской письменностью тоже страдали, из-за наличия нескольких разных кодировок.

Первые 128 символов стандарта Юникод — совпадают с соответствующими символами US-ASCII.

Таблица ASCII

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
0.NULSOHSTXETXEOTENQACKBELBSHTLFVTFFCRSOSI
1.DLEDC1DC2DC3DC4NAKSYNETBCANEMSUBESCFSGSRSUS
2.!«#$%&()*+,./
3.0123456789:;?
4.@ABCDEFGHIJKLMNO
5.PQRSTUVWXYZ[\]^_
6.`abcdefghijklmno
7.pqrstuvwxyz<|>

В первой версии стандарта ASCII (1963 год) — в позициях 0x5e (94) и 0x5f (95) располагались символы «стрелка вверх» и «стрелка влево», соответственно. Стандарт ECMA-6 (1965 год) заменил их на знак вставки и символ подчёркивание «_», соответственно.

В Советском Союзе стандарт был утвержден в виде таблицы международной ссылочной версии кода КОИ-7 Н0 ГОСТ 27463-87 (СТ СЭВ 356-86) «Системы обработки информации. 7-битные кодированные наборы символов». [2]

Управляющие символы

Таблица ASCII создавалась для обмена информацией по телетайпу. В набор были включены непечатаемые символы, используемые как команды для управления устройством телетайп. Аналогичные команды применялись и в других докомпьютерных средствах обмена сообщениями (азбука Морзе, семафорная азбука), учитывая специфику устройства.

Примечание: далее в списке — коды символов записаны в шестнадцатеричной системе счисления, после названий символов.

Сообщения, передаваемые по каналу связи, делились на две части:

«Заголовок» содержал: адреса отправителя и получателя, контрольную сумму и т. п. ; мог размещаться до «текста» или после. Термином «текст» называлась часть сообщения, предназначенная для печати.

Во многих языках программирования символ обозначается как «\n». Нажатие на клавишу ↵ Enter при выводе текста переводит строку.

В настоящее время символ вставляется нажатием комбинации клавиш Ctrl + Z и используется для обозначения конца файла в операционных системах «DOS» и «Windows».

ESC1BescapeЗнак того, что символ, следующий после «ESC», имеет какое-то другое (отличное от определённого в ASCII) значение. Обычно после символа «ESC» следуют управляющие последовательности; в операционной системе «DOS» они реализуются драйвером «ANSI.SYS».
DEL7Fdeleteстереть последний символСимволом «DEL» (состоящим в двоичном коде из всех единиц) можно было «забить» любой символ. Устройства и программы игнорировали «DEL» так же, как и «NUL».

Код этого символа происходит из первых текстовых процессоров с памятью на перфоленте: в них удаление символа происходило «забиванием» его кода дырочками (обозначавшими логические единицы).

Поддерживалось разделение данных на 4 уровня:

СимволКодРасшифровкаПереводОписание
FS1Cfile separatorразделитель файловсообщение могло состоять из файлов
GS1Dgroup separatorразделитель группфайлы могли состоять из групп
RS1Erecord separatorразделитель записейгруппы могли состоять из записей
US1Funit separatorразделитель юнитовзаписи могли состоять из юнитов

Структурные свойства таблицы

Представление ASCII в ЭВМ

На подавляющем большинстве современных компьютеров, минимально адресуемая единица памяти — байт (размером в 8 бит); поэтому там используются 8-битные, а не 7-битные символы. Обычно символ ASCII расширяют до 8 бит, просто добавляя один нулевой бит в качестве старшего.

На компьютерах IBM/360 однако (в случае использования ASCII) применялся другой метод: 6-й бит (если первым считать самый младший бит) перемещается в 7-й, а бывший 7-й «раздваивается» и копируется и в 8-й бит, и в 6-й. Получается такая таблица [3] :

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
0.NULSOMEOAEOMEQTWRURUBELLBKSPHTLFVTFFCRSOSI
1.DC0DC1DC2DC3DC4ERRSYNCLEMS0S1S2S3S4S5S6S7
2.
3.
4.BLANK!«#$%&()*+,./
5.0123456789:;?
6.
7.
8.
9.
A.@ABCDEFGHIJKLMNO
B.PQRSTUVWXYZ[\]
C.
D.
E.abcdefghijklmno
F.pqrstuvwxyzESCDEL

На компьютерах с минимально адресуемой единицей памяти в 36 бит — поначалу использовали 6-битные символы (1 слово = 6 символов). После перехода на ASCII на таких компьютерах в одном слове стали размещать либо 5 семибитовых символов (1 бит оставался лишним), либо 4 девятибитовых символа.

Коды ASCII используются в программировании как промежуточные кроссплатформенные коды нажатых клавиш (в противовес скан-кодам IBM PC и прочим внутренним кодам). Для раскладки клавиатуры QWERTY — таблица кодов выглядит так, как показано в следующей таблице.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *