«Сущности» HTML

В HTML используются сущности SGML, представляющие собой: знак амперсанда (&), после которого идёт имя сущности, чувствительное к регистру, в котором могут быть прописные и строчные латинские буквы, точки и дефисы, после которого можно поставить разделительную точку с запятой. Ставить точку с запятой нужно, если иначе последующий поток текста может быть воспринят как часть имени сущности. Консорциум Всемирной паутины рекомендует ставить этот разделитель всегда.

Также, в SGML ─ а соответственно и в HTML ─ существуют символические ссылки, где вместо имени идёт знак решётки (#) и либо десятичный порядковый номер символа из предопределённого набора символов документа (в HTML до версий 4 это был ISO Latin-1, а далее ─ Unicode, ISO 10646), либо некоторое слово. Мне известны следующие слова:

SPACE
Пробел обыкновенный
RE
Новая строка

Но вот браузерам ни один из них не известен.

Здесь сущности отсортированы в порядке возрастания версий HTML, когда их впервые добавили.

Документ также доступен в Unicode.

Содержание:

HTML 2

Базовые символы

В SGML некоторые знаки имеют особое значение: знак Меньше чем обозначает тег, а знак амперсанда обозначает сущность или символическую ссылку. Если после знака < или & не идёт буква, или не идёт она после последовательностей </, <! или &#, то их можно записать как есть. В гипертексте рекомендуется не писать так. Также, не лишним будет заменять знак Больше чем на сущность в значениях параметров атрибутов, ведь некоторые браузеры запрограмированы воспринимать любой знак Больше чем как знак окончания тега.

lt
< «Меньше чем» знак
gt
> «Больше чем» знак
amp
& Лигатура ET (амперсанд)
quot
" Кавычки машинные, для вставки в текст атрибутов

ISO Latin-1

Следующий список сущностей позволяет тебе ссылаться на соответственные символы из ISO 8859-1, «Latin-1». Это может быть полезно, если в документе использована другая кодировка, в котором нужного знака нет.

Agrave
À Прописная А с гревисом
Aacute
Á Прописная А с ударением
Acirc
 Прописная А с циркумфлексом
Atilde
à Прописная А с тильдой
Auml
Ä Прописная А с умляутом
Aring
Å Прописная А с кольцом
AElig
Æ Прописная лигатура AE
Ccedil
Ç Прописная С с седилой
Egrave
È Прописная Е с гревисом
Eacute
É Прописная Е с ударением
Ecirc
Ê Прописная Е с циркумфлексом
Euml
Ë Прописная Ё с умляутом
Igrave
Ì Прописная I с гревисом
Iacute
Í Прописная I с ударением
Icirc
Î Прописная I с циркумфлексом
Iuml
Ï Прописная I с умляутом
ETH
Ð Прописная Ез Исландская
Ntilde
Ñ Прописная N с тильдой
Ograve
Ò Прописная О с гревисом
Oacute
Ó Прописная О с ударением
Ocirc
Ô Прописная О с циркумфлексом
Otilde
Õ Прописная О с тильдой
Ouml
Ö Прописная О с умляутом
Oslash
Ø Прописная О зачёркнутая
Ugrave
Ù Прописная U с гревисом
Uacute
Ú Прописная U с ударением
Ucirc
Û Прописная U с циркумфлексом
Uuml
Ü Прописная U с умляутом
Yacute
Ý Прописная Y с ударением
THORN
Þ Прописной ТОРН Исландский
szlig
ß Лигатура З
agrave
à Строчная А с гревисом
aacute
á Строчная А с ударением
acirc
â Строчная А с циркумфлексом
atilde
ã Строчная А с тильдой
auml
ä Строчная А с умляутом
aring
å Строчная А с кольцом
aelig
æ Строчная лигатура АЕ
ccedil
ç Строчная С с седилой
egrave
è Строчная Е с гревисом
eacute
é Строчная Е с ударением
ecirc
ê Строчная Е с циркумфлексом
euml
ë Строчная Ё с умляутом
igrave
ì Строчная I с гревисом
iacute
í Строчная I с ударением
icirc
î Строчная I с циркумфлексом
iuml
ï Строчная I с умляутом
eth
ð Строчная Ез Исландская
ntilde
ñ Строчная N с тильдой
ograve
ò Строчная О с гревисом
oacute
ó Строчная О с ударением
ocirc
ô Строчная О с циркумфлексом
otilde
õ Строчная О с тильдой
ouml
ö Строчная О с умляутом
oslash
ø Строчная О зачёркнутая
ugrave
ù Строчная U с гревисом
uacute
ú Строчная U с ударением
ucirc
û Строчная U с циркумфлексом
uuml
ü Строчная U с умляутом
yacute
ý Строчная Y с ударением
thorn
þ Строчный ТОРН Исландский
yuml
ÿ Прописная Y с умляутом

Дополнение к ISO Latin-1

Для того, чтобы можно было ссылаться ко всем символам Latin-1, было предложено добавить ещё сущностей. Так стало возможным символически использовать все символы Latin-1 в документе с кодировкой, скажем, US-ASCII.

nbsp
  Не разрываемый пробел
iexcl
¡ Восклицательный знак вверх ногами
cent
¢ Цент(ы)
pound
£ Фунт(ы)
curren
¤ Денежная еденица
yen
¥ Иена(ы)
brvbar
¦ Битая вертикальная черта
sect
§ Параграфа знак
uml
¨ Умляут, диезерис
ordf
ª Указатель порядковости, женский
copy
© Знак права собственности, 2022
laquo
« Угловые кавычки, открывающие и указывающие влево
not
¬ Отрицательный знак
shy
Мягенкий перенос на следующую строку
reg
® Элемент зарегестрированого товарного знака
macr
¯ Макрон, надчёркивающий знак
deg
° Градусов знак
plusmn
± Больше либо меньше, +/─
sup2
² Надстрочный 2: возведение в квадрат
sup3
³ Надстрочный 3: возведение в кубик
acute
´ Ударение
micro
µ Микрознак, Мю греческое
para
¶ Абзаца знак
middot
· Точка посередине
cedil
¸ Цедила
sup1
¹ Надстрочный 1: возведение в линию
ordm
º Указатель порядковости, мужской
raquo
» Угловые кавычки, закрывающие и указывающие вправо
frac14
¼ Четверть, 1/4
frac12
½ Половина, 1/2
frac34
¾ Без четверти, 3/4
iquest
¿ Вопросительный знак вверх ногами
times
× Умножения знак
divide
÷ Деления знак

HTML 3.2

Здесь не было добавлено каких-либо новых сущностей.

HTML 4

Символы математические, греческие буквы и другие специальные символы

О греческих буквах для математики и нём же было слышно ещё при разговорах об HTML+. Этот список символов был создан на основе шрифта Adobe Script, широко доступного, и от которого можно бы брать все эти знаки.

Присутствуют примечания. Для тебя они переведены, однако всё-таки они могли устареть.

Замечание: современные браузеры примут только те сущности, которые завершены точкой с запятой. Причиной этого поведения является отказ в поддержке сокращённого письма SGML.

Латинский расширенный-Б

fnof
ƒ Латинская строчная F с крюком. Оно же ─ функция, флорин

Греческий алфавит

Alpha
Α Прописная Альфа
Beta
Β Прописная Бета
Gamma
Γ Прописная Гамма
Delta
Δ Прописная Дельта
Epsilon
Ε Прописной Эпсилон
Zeta
Ζ Прописная Зета
Eta
Η Прописная Эта
Theta
Θ Прописная Дзета
Iota
Ι Прописная Йота
Kappa
Κ Прописная Каппа
Lambda
Λ Прописная Лямбда
Mu
Μ Прописная Мю
Nu
Ν Прописная Ню
Xi
Ξ Прописная Кси
Omicron
Ο Прописной Омикрон
Pi
Π Прописная Пи
Rho
Ρ Прописная Рхо
Sigma
Σ Прописная Сигма
Tau
Τ Прописная Тау
Upsilon
Υ Прописной Апсилон
Phi
Φ Прописная Пхи
Chi
Χ Прописная Кхи
Psi
Ψ Прописной Пси
Omega
Ω Прописная Омега
alpha
α Строчная Альфа
beta
β Строчная Бета
gamma
γ Строчная Гамма
delta
δ Строчная Дельта
epsilon
ε Строчный Эпсилон
zeta
ζ Строчная Зета
eta
η Строчная Эта
theta
θ Строчная Дзета
iota
ι Строчная Йота
kappa
κ Строчная Каппа
lambda
λ Строчная Лямбда
mu
μ Строчная Мю
nu
ν Строчная Ню
xi
ξ Строчная Кси
omicron
ο Строчный Омикрон
pi
π Строчная Пи
rho
ρ Строчная Рхо
sigmaf
ς Строчная финальная Сигма
sigma
σ Строчная Сигма
tau
τ Строчная Тау
upsilon
υ Строчный Апсилон
phi
φ Строчная Пхи
chi
χ Строчная Кхи
psi
ψ Строчный Пси
omega
ω Строчная Омега
thetasym
ϑ Символ строчной Тзеты
upsih
ϒ Строчный Апсилон с крюком
piv
ϖ Символ строчной Пи

Основная пунктуация

bull
• Чёрный маркер списка. Оно же ─ чёрный маленький кружок.
Не является маркером-оператором
hellip
… Многоточие
prime
′ Штрих. Оно же ─ минуты угловые, футы
Prime
″ Двойной штрих. Оно же ─ секунды, дюймы
oline
‾ Надчёркивание. Также вид пробельного материала
frasl
⁄ Косая черта дроби

Похожие на буквы символы

weierp
℘ Писменая прописная Р. Оно же ─ надмножество
image
ℑ Готическая прописная I. Оно же ─ мнимая часть
real
ℜ Готическая заглавная R. Оно же ─ знак реальной части
trade
™ Часть незарегестрированого товарного знака
alefsym
ℵ Символ Алеф. Оно же ─ первый трансконечный кардинал

Стрелы

larr
← Стрела влево
uarr
↑ Стрела вверх
rarr
→ Стрела вправо
darr
↓ Стрела вниз
harr
↔ Стрела влево-вправо
crarr
↵ Стрела влево сверху
lArr
⇐ Стрела двойная влево.
UCS не говорит, что это тоже что и стрела «подразумеваемое», но не предусматревает для этого отдельной стрелы. Поэтому ? эту можно использовать в данной роли
uArr
⇑ Стрела двойная вверх
rArr
⇒ Стрела двойная вправо.
UCS не говорит, что это стрела «подразумет», но не представляет для этого специальной стрелы. Поэтому ? эта стрела может быть использована в этой роли
dArr
⇓ Стрела двойная вниз
hArr
⇔ Стрела двойная влево-вправо

Математические операторы

forall
∀ Для всех
part
∂ Частичное различение
exist
∃ Существует в
empty
∅ Пустое множество. Оно же ─ диаметр
nabla
∇ Гамильтона оператор
isin
∈ Пренадлежит к
notin
∉ Не пренадлежит к
ni
∋ Содержит себя как.
Должно быть здесь более запоминаемое имя чем «ni»?
prod
n-множественный продукт. Оно же ─ знак продукта.
Это не то же что и Греческая Прописная Пи, пусть их начертания и похожи
sum
n-множественная сумма.
Это не то же что и Греческая Прописная Сигма, пусть их начертания и похожи
minus
− Минуса знак
lowast
∗ Звезда оператор
radic
√ Квадратный корень. Оно же ─ знак радикала
prop
∝ Пропорционально к
infin
∞ Бесконечность
ang
∠ Угол
and
∧ Логическое И. Оно же ─ клин
or
∨ Логическое ИЛИ. Оно же ─ V
cap
∩ Пересечение. Оно же ─ шапка
cup
∪ Объединение. Оно же ─ чашка
int
∫ Интеграл
there4
∴ Следовательно
sim
∼ Тильда оператор. Оно же ─ различается в диапазоне, около.
Это не то же что и просто Тильда (U+007E), хотя они по начертанию сильно похожи
cong
≅ Примерно равно
asymp
≈ Почти равно. Оно же ─ асимптомически равно
ne
≠ Не равно
equiv
≡ Одинаково к
le
≤ Меньше или равно
ge
≥ Больше или равно
sub
⊂ Подмножество
sup
⊃ Надмножество.
Заметьте, что «не надмножество» не было включено в шрифт Symbol. Должно оно быть, для симметрий?
nsub
⊄ Не подмножество
sube
⊆ Подмножество или одинаково к
supe
⊇ Надмножество или одинаково к
oplus
⊕ Плюс в круге. Оно же ─ прямая сумма
otimes
⊗ Умножение в круге. Оно же ─ продукт векторов
perp
⊥ Присоединять сверху знак. Оно же ─ ортоганально к, перпендикулярно
sdot
⋅ Точка оператор.
Это не то же что и точка посередине

Дополнительные технические

lceil
⌈ Левое перекрытие. Оно же ─ «apl upstile»
rceil
⌉ Правое перекрытие.
lfloor
⌊ Левый этаж
rfloor
⌋ Правый этаж
lang
⟨ Угловая скобка влево. Оно же ─ «Bra».
Это не то же что и Меньше чем знак или Одиночная угловая Кавычка влево
rang
⟩ Угловая скобка вправо. Оно же ─ «Ket».
Это не то же что и Больше чем знак или одиночная угловая кавычка вправо

Геометрические фигуры

loz
◊ Пастилка

Дополнительные символы

spades
♠ Масть Чёрные Пики
clubs
♣ Масть Чёрные Трефы. Оно же ─ Шамрок
hearts
♥ Масть Чёрные Червы. Оно же ─ Валентин
diams
♦ Масть Чёрные Бубны

Специальные символы

Эти сущности добавлены с целью предоставить различные типографские символы и символы международизаций, такие как символы направления печати. Также здесь добавлены некоторые символы из кодировки 1252 (оконное расширение ISO 8859-1).

Латинский расширенный-А

OElig
Œ Латинская лигатура заглавная ОЕ
oelig
œ Латинская лигатура строчная ОЕ.
Это неправильно называть лигатурой, в некоторых языках это отдельная буква
Scaron
Š Латинская заглавная S с кароном
scaron
š Латинская строчная S с кароном
Yuml
Ÿ Латинскя заглавная Y с диэзерисом

Пробельные модифицирующие знаки

circ
ˆ Модифицирующий знак Акцент Циркумфлекс
tilde
˜ Маленькая Тильда

Основная пунктуация

ensp
  Малый пробельный материал
emsp
  Большой пробельный материал
thinsp
  Очень малый пробельный материал
zwnj
‌ Малейший пробельный материал (ноль йоктаметров)
zwj
‍ Малейшая склеивающая пластина (ноль йоктаметров)
lrm
Слева направо маркер
rlm
Справа налево маркер
ndash
– Короткое тире
mdash
— Тире (длинное)
lsquo
‘ Одиночная Кавычка левая
rsquo
’ Одиночная Кавычка правая
sbquo
‚ Одиночная Кавычка низкая-9
ldquo
“ Двойная Кавычка левая
rdquo
” Двойная Кавычка правая
bdquo
„ Двойная Кавычка нижняя-9
dagger
† Крест
Dagger
‡ Крест × 2
permil
‰ Промилле
lsaquo
‹ Одиночный угловой влево указывающий знак пунктуаций.
Он был предложен, но ISO его всё-ещё не стандартезировала
rsaquo
› Одиночный угловой вправо указывающий знак пунктуаций.
Он был предложен, но ISO его всё-ещё не стандартезировала
euro
€ Евро

HTML5

Спустя столько времени было добавлено очень большое количество сущностей из самых разных частей Unicode. Их так много, что автору впадлу документировать всех их здесь. Однако, ты можешь посмотреть список наборов добавленных символов.

К счастью, больше таких бесполезных сущностей (где HTML5, там и UTF-8, без исключений) больше не будет.

Чтобы просмотреть соответственный список, вставьте в адресную строку браузера базовую строку «//www.w3.org/2003/entities/2007/», затем добавьте название из списка, и закончите его на «.ent».

Источники информаций

Тим БЕРНЕРС-ЛИ, Данил В. КОНОЛЛИ, Запрос комментариев № 1866 «Язык разметки гипертекста ─ 2.0», ноябрь 1995. Также доступен на этом же сайте.

Дейв РЕГГЕТ, «HTML 3.2 справочная спецификация».

Дейв РЕГГЕТ, Арнольд ЛЕ ХОРС, Иан ЙАКОБС, «Спецификация Языка разметки гипертекста 4.01». Собственно сущности.

(Множество людей и машин) Живой HTML.

W3C, ISO, Полный список всех списков сущностей.

Смотрите также Полный перечень всех существующих сущностей в HTML и MathML, на Английском.


Части © Международная организация по стандартизаций, 1986:

Разрешение копировать в любой форме дана для использования с соответствующими SGML системами и приложениями, как определено в ISO 8879, с предоставлением этого уведомления во всех копиях. Оно было расширенно для использования с HTML, чтобы покрывать полный диапазон кодов в десятичном диапазоне 160-255.

Permission to copy in any form is granted for use with conforming SGML systems and applications as defined in ISO 8879, provided this notice is included in all copies. This has been extended for use with HTML to cover the full set of codes in the range 160-255 decimal.