«Сущности» HTML

Сущности в HTML работают прямо как в SGML. Сущность всегда начинается со символа ампресанда «&». После амперсанда идёт имя сущности, которая может состоять из прописных и строчных букв и цифр, и регистр тут имеет значение (Другие знаки пока не были использованы). В конце имя сущности может быть отделено от остального текста знаком точки с запятой. Отделять имя нужно от последующих букв за исключением пробела, запятой, решётки, других не латинских знаков, однако отделение этим знаком рекомендованно при любых алфавитов.

Также есть числовые десятичные сущности, которые имеют начало вида &#. Первые 0─255 знаков соответствуют ISO-8859-1, а последующие ─ по Unicode, который, впрочем, вначале также идёт как и ISO.

Здесь сущности отсортированы в порядке возрастания версий, когда они впервые появились.

Документ также доступен в Unicode.

Содержание:

HTML 2

Базовые символы

В SGML такие символы, как Больше чем и Меньше чем, имеют особое значение ─ они обозначают теги. Также подобную значимость имеет и Лигатура ET, которая позволяет вставлять другие символы вне кодировки. Также, в кавычки должна быть заключена строка параметра атрибута. Но, конечно же, они могут нести смысл и для читателя. Для таких случаев и были добавлены эти сущности.

lt
< «Меньше чем» знак
gt
> «Больше чем» знак
amp
& Лигатура ET (амперсанд)
quot
" Кавычки машинные, для вставки в текст атрибутов

ISO Latin-1

Следующий список сущностей позволяет тебе символически ссылаться на соответственные символы из ISO-8859-1, «Latin-1». Это может быть полезно в случаях, если в документе использована другая кодировка, для вставки в документ символов, отсутствующих в кодировке.

Agrave
À Прописная А с гревисом
Aacute
Á Прописная А с ударением
Acirc
 Прописная А с циркумфлексом
Atilde
à Прописная А с тильдой
Auml
Ä Прописная А с умляутом
Aring
Å Прописная А с кольцом
AElig
Æ Прописная лигатура AE
Ccedil
Ç Прописная С с седилой
Egrave
È Прописная Е с гревисом
Eacute
É Прописная Е с ударением
Ecirc
Ê Прописная Е с циркумфлексом
Euml
Ë Прописная Ё!
Igrave
Ì Прописная I с гревисом
Iacute
Í Прописная I с ударением
Icirc
Î Прописная I с циркумфлексом
Iuml
Ï Прописная I с умляутом
ETH
Ð Прописная Ез Исландская
Ntilde
Ñ Прописная N с тильдой
Ograve
Ò Прописная О с гревисом
Oacute
Ó Прописная О с ударением
Ocirc
Ô Прописная О с циркумфлексом
Otilde
Õ Прописная О с тильдой
Ouml
Ö Прописная О с умляутом
times
× Умножения знак
Oslash
Ø Прописная О зачёркнутая
Ugrave
Ù Прописная U с гревисом
Uacute
Ú Прописная U с ударением
Ucirc
Û Прописная U с циркумфлексом
Uuml
Ü Прописная U с умляутом
Yacute
Ý Прописная Y с ударением
THORN
Þ Прописной ТОРН Исландский
szlig
ß Лигатура З
agrave
à Строчная А с гревисом
aacute
á Строчная А с ударением
acirc
â Строчная А с циркумфлексом
atilde
ã Строчная А с тильдой
auml
ä Строчная А с умляутом
aring
å Строчная А с кольцом
aelig
æ Строчная лигатура АЕ
ccedil
ç Строчная С с седилой
egrave
è Строчная Е с гревисом
eacute
é Строчная Е с ударением
ecirc
ê Строчная Е с циркумфлексом
euml
ë Строчная Е с умляутом
igrave
ì Строчная I с гревисом
iacute
í Строчная I с ударением
icirc
î Строчная I с циркумфлексом
iuml
ï Строчная I с умляутом
eth
ð Строчная Ез Исландская
ntilde
ñ Строчная N с тильдой
ograve
ò Строчная О с гревисом
oacute
ó Строчная О с ударением
ocirc
ô Строчная О с циркумфлексом
otilde
õ Строчная О с тильдой
ouml
ö Строчная О с умляутом
divide
÷ Деления знак
oslash
ø Строчная О зачёркнутая
ugrave
ù Строчная U с гревисом
uacute
ú Строчная U с ударением
ucirc
û Строчная U с циркумфлексом
uuml
ü Строчная U с умляутом
yacute
ý Строчная Y с ударением
thorn
þ Строчный ТОРН Исландский
yuml
ÿ Прописная Y с умляутом

Дополнение к ISO Latin-1

Для того, чтобы можно было ссылаться к всем сущностям Latin-1, в IETF расширили их. Таким образом достигли возможности адресовать все сущности из этой кодировки, например, в USASCII, или из любой другой кодировки, если браузер и среда это позволяют, конечно.

nbsp
  Не разрываемый пробел
iexcl
¡ Восклицательный знак вверх ногами
cent
¢ Цент(ы)
pound
£ Фунт(ы)
curren
¤ ДЕНЕЖНАЯ ЕДЕНИЦА
yen
¥ Иена(ы)
brvbar
¦ Битая вертикальная черта
sect
§ Параграфа знак
uml
¨ Умляут, диезерис
ordf
ª Указатель порядковости, женский
copy
© Знак права собственности, 2022
laquo
« Угловые кавычки, открывающие и указывающие влево
not
¬ Отрицательный знак
shy
Мягенкий перенос на следующую строку
reg
® Элемент зарегестрированого товарного знака
macr
¯ Макрон, надчёркивающий знак
deg
° Градусов знак
plusmn
± Больше либо меньше, +/─
sup2
² Надстрочный 2: возведение в квадрат
sup3
³ Надстрочный 3: возведение в кубик
acute
´ Ударение
micro
µ Микрознак, Мю греческое
para
¶ Абзаца знак
middot
· Точка посередине
cedil
¸ Цедила
sup1
¹ Надстрочный 1: возведение в линию
ordm
º Указатель порядковости, мужской
raquo
» Угловые кавычки, закрывающие и указывающие вправо
frac14
¼ Четверть, 1/4
frac12
½ Половина, 1/2
frac34
¾ Без четверти, 3/4
iquest
¿ Вопросительный знак вверх ногами

HTML 3.2

Здесь не было добавлено каких-либо новых сущностей.

HTML 4

Символы математические, Греческие буквы и другие специальные символы

О Греческих буквах для и математики было слышно ещё при разговорах об HTML+. Этот список символов был основан на основе шрифта Adobe Script, широко доступного, и от которого можно было бы брать все эти знаки.

Присутствуют примечания. Для тебя они переведены.

Замечание: современные браузеры примут только те сущности, которые завершены точкой с запятой. Причиной этого поведения является превышение нормальной дневной дозы браузера Живим HTML.

Латинский расширенный-Б

fnof
ƒ Латинская строчная F с крюком. Оно же ─ функция, флорин

Греческий алфавит

Alpha
Α Прописная Альфа
Beta
Β Прописная Бета
Gamma
Γ Прописная Гамма
Delta
Δ Прописная Дельта
Epsilon
Ε Прописной Эпсилон
Zeta
Ζ Прописная Зета
Eta
Η Прописная Эта
Theta
Θ Прописная Дзета
Iota
Ι Прописная Йота
Kappa
Κ Прописная Каппа
Lambda
Λ Прописная Лямбда
Mu
Μ Прописная Мю
Nu
Ν Прописная Ню
Xi
Ξ Прописная Кси
Omicron
Ο Прописной Омикрон
Pi
Π Прописная Пи
Rho
Ρ Прописная Рхо
Sigma
Σ Прописная Сигма
Tau
Τ Прописная Тау
Upsilon
Υ Прописной Апсилон
Phi
Φ Прописная Пхи
Chi
Χ Прописная Кхи
Psi
Ψ Прописной Пси
Omega
Ω Прописная Омега
alpha
α Строчная Альфа
beta
β Строчная Бета
gamma
γ Строчная Гамма
delta
δ Строчная Дельта
epsilon
ε Строчный Эпсилон
zeta
ζ Строчная Зета
eta
η Строчная Эта
theta
θ Строчная Дзета
iota
ι Строчная Йота
kappa
κ Строчная Каппа
lambda
λ Строчная Лямбда
mu
μ Строчная Мю
nu
ν Строчная Ню
xi
ξ Строчная Кси
omicron
ο Строчный Омикрон
pi
π Строчная Пи
rho
ρ Строчная Рхо
sigmaf
ς Строчная финальная Сигма
sigma
σ Строчная Сигма
tau
τ Строчная Тау
upsilon
υ Строчный Апсилон
phi
φ Строчная Пхи
chi
χ Строчная Кхи
psi
ψ Строчный Пси
omega
ω Строчная Омега
thetasym
ϑ Символ строчной Тзеты
upsih
ϒ Строчный Апсилон с крюком
piv
ϖ Символ строчной Пи

Основная пунктуация

bull
• Чёрный маркер списка. Оно же ─ чёрный маленький кружок.
Не является маркером-оператором
hellip
′ Штрих. Оно же ─ минуты угловые, футы
Prime
″ Двойной штрих. Оно же ─ секунды, дюймы
oline
‾ Надчёркивание. Также вид пробельного материала
frasl
⁄ Дробная косая черта

Похожие на буквы символы

weierp
℘ Писменая прописная Р. Оно же ─ надмножество
image
ℑ Готическая прописная I. Оно же ─ мнимая часть
real
ℜ Готическая заглавная R. Оно же ─ знак реальной части
trade
™ Часть незарегестрированого товарного знака
alefsym
ℵ Символ Алеф. Оно же ─ первый трансконечный кардинал

Стрелы

larr
← Стрела влево
uarr
↑ Стрела вверх
rarr
→ Стрела вправо
darr
↓ Стрела вниз
harr
↔ Стрела влево-вправо
crarr
↵ Стрела влево сверху
lArr
⇐ Стрела двойная влево.
UCS не говорит, что оно не тоже что и стрела «подразумеваемое», но не предусматревает для этого отдельной стрелы. Поэтому ? эту можно использовать в данной роли
uArr
⇑ Стрела двойная вверх
rArr
⇒ Стрела двойная вправо.
UCS не говорит, что это стрела «подразумет», но не представляет для этого специальной стрелы. Поэтому ? эта стрела может быть использована в этой роли
dArr
⇓ Стрела двойная вниз
hArr
⇔ Стрела двойная влево-вправо

Математические операторы

forall
∀ Для всех
part
∂ Частичное различение
exist
∃ Существует в
empty
∅ Пустое множество. Оно же ─ диаметр
nabla
∇ Гамильтона оператор
isin
∈ Пренадлежит к
notin
∉ Не пренадлежит к
ni
∋ Содержит себя как.
Должно быть здесь более запоминаемое имя чем «ni»?
prod
n-множественный продукт. Оно же ─ знак продукта.
Это не то же что и Греческая Прописная Пи, пусть их начертания и похожи
sum
n-множественная сумма.
Это не то же что и Греческая Прописная Сигма, пусть их начертания и похожи
minus
− Минуса знак
lowast
∗ Звезда оператор
radic
√ Квадратный корень. Оно же ─ знак радикала
prop
∝ Пропорционально к
infin
∞ Бесконечность
ang
∠ Угол
and
∧ Логическое И. Оно же ─ клин
or
∨ Логическое ИЛИ. Оно же ─ V
cap
∩ Пересечение. Оно же ─ шапка
cup
∪ Объединение. Оно же ─ чашка
int
∫ Интеграл
there4
∴ Следовательно
sim
∼ Тильда оператор. Оно же ─ различается в диапазоне, около.
Это не то же что и просто Тильда (U+007E), хотя они по начертанию сильно похожи
cong
≅ Примерно равно
asymp
≈ Почти равно. Оно же ─ асимптомически равно
ne
≠ Не равно
equiv
≡ Одинаково к
le
≤ Меньше или равно
ge
≥ Больше или равно
sub
⊂ Подмножество
sup
⊃ Надмножество.
Заметьте, что «не надмножество» не было включено в шрифт Symbol. Должно оно быть, для симметрий?
nsub
⊄ Не подмножество
sube
⊆ Подмножество или одинаково к
supe
⊇ Надмножество или одинаково к
oplus
⊕ Плюс в круге. Оно же ─ прямая сумма
otimes
⊗ Умножение в круге. Оно же ─ продукт векторов
perp
⊥ Присоединять сверху знак. Оно же ─ ортоганально к, перпендикулярно
sdot
⋅ Точка оператор.
Это не то же что и точка посередине

Дополнительные технические

lcedil
ļ Левое перекрытие. Оно же ─ «apl upstile»
rcedil
ŗ Правое перекрытие.
lfloor
⌊ Левый этаж
rfloor
⌋ Правый этаж
lang
⟨ Угловая скобка влево. Оно же ─ «Bra».
Это не то же что и Меньше чем знак или Одиночная угловая Кавычка влево
rang
⟩ Угловая скобка вправо. Оно же ─ «Ket»
Это не то же что и Больше чем знак или одиночная угловая кавычка вправо

Геометрические фигуры

loz
◊ Пастилка

Дополнительные символы

spades
♠ Масть Чёрный Спад
clubs
♣ Масть Чёрный Клуб. Оно же ─ Шамрок
hearts
♥ Масть Чёрное Сердце. Оно же ─ Валентин
diams
♦ Масть Чёрный Алмаз

Специальные символы

Эти сущности добавлены с целью предоставить различные типографские символы и символы международизаций, такие как символы направления печати. Также здесь добавлены некоторые символы из кодировки 1252 (оконное расширение ISO-8859-1).

Латинский расширенный-А

OElig
Œ Латинская лигатура заглавная ОЕ
oelig
œ Латинская лигатура строчная ОЕ
Это неправильно называть лигатурой, в некоторых языках это отдельная буква
Scaron
Š Латинская заглавная S с кароном
scaron
š Латинская строчная S с кароном
Yuml
Ÿ Латинскя заглавная Y с диэзерисом

Пробельные модифицирующие знаки

circ
ˆ Модифицирующий знак Акцент Циркумфлекс
tilde
˜ Маленькая Тильда

Основная пунктуация

ensp
  Малый пробельный материал
emsp
  Большой пробельный материал
thinsp
  Очень малый пробельный материал
zwnj
‌ Малейший пробельный материал (ноль йоктаметров)
zwj
‍ Склеевающая малейшая пластина (ноль йоктаметров)
lrm
Слева направо маркер
rlm
Справа налево маркер
ndash
– Короткое тире
mdash
— Тире (длинное)
lsquo
‘ Одиночная Кавычка левая
rsquo
’ Одиночная Кавычка правая
sbquo
‚ Одиночная Кавычка низкая-9
ldquo
“ Двойная Кавычка левая
rdquo
” Двойная Кавычка правая
bdquo
„ Двойная Кавычка нижняя-9
dagger
† Крест
Dagger
‡ Крест × 2
permil
‰ Промилле
lsaquo
‹ Одиночный угловой влево указывающий знак пунктуаций.
Он был предложен, но ISO его всё-ещё не стандартезировала
rsaquo
› Одиночный угловой вправо указывающий знак пунктуаций.
Он был предложен, но ISO его всё-ещё не стандартезировала
euro
€ Евро

HTML5

Спустя столько времени было добавлено очень большое количество сущностей из самых разных частей Unicode. Их так много, что автору впадлу документировать всех их здесь. Однако, ты можешь посмотреть список наборов добавленных символов.

К счастью, больше таких бесполезных сущностей (где HTML5, там и Unicode) больше не будет.

Чтобы просмотреть соответственный список, вставьте в адресную строку браузера базовую строку «//www.w3.org/2003/entities/2007/», затем добавьте название из списка, и закончите его на «.ent».

Источники информаций

Тим БЕРНЕРС-ЛИ, Данил В. КОНОЛЛИ, Запрос на коментирование № 1866 «Язык разметки гипертекста ─ 2.0».

Дейв РЕГГЕТ, «ЯРГ 3.2 справочная спецификация».

Дейв РЕГГЕТ, Арнольд ЛЕ ХОРС, Иан ЙАКОБС, «Гипертекста язык разметки 4.01 спецификация». Собственно сущности.

(Множество людей и машин) Живой HTML.

W3C, ISO, Полный список всех списков сущностей.

Смотрите также Полный перечень всех существующих сущностей в HTML и MathML, на Английском.


Части © Международная организация по стандартизаций, 1986:

Разрешение копировать в любой форме дана для использования с соответствующими SGML системами и приложениями, как определено в ISO 8879, с предоставлением этого уведомления во всех копиях. Оно было расширенно для использования с HTML [ISO-Latin-1], чтобы покрывать полный диапазон кодов в диапазоне 160-255, десятично.

Permission to copy in any form is granted for use with conforming SGML systems and applications as defined in ISO 8879, provided this notice is included in all copies. This has been extended for use with HTML to cover the full set of codes in the range 160-255 decimal.