«Сущности» HTML
В HTML используются сущности SGML, представляющие собой: знак
амперсанда (&), после которого идёт имя сущности, чувствительное
к регистру, в котором могут быть прописные и строчные латинские
буквы, точки и дефисы, после которого можно поставить разделительную
точку с запятой. Ставить точку с запятой нужно, если иначе
последующий поток текста может быть воспринят как часть имени
сущности. Консорциум Всемирной паутины рекомендует ставить этот
разделитель всегда.
Также, в SGML ─ а соответственно и в HTML ─ существуют символические
ссылки, где вместо ииени идёт знак решётки (#) и либо десятичный
порядковый номер символа из предопределённого набора символов
документа (в HTML до версий 4 это был ISO Latin-1, а далее ─ Unicode,
ISO 10646), либо некоторое слово. Мне известны следующие слова:
- SPACE
- Пробел обыкновенный
- RE
- Новая строка
Но вот браузерам ни один из них не известен.
Здесь сущности отсортированы в порядке возрастания версий HTML, когда
их впервые добавили.
Документ также доступен в Unicode.
Содержание:
В SGML такие символы, как Больше чем и Меньше чем, имеют особое
значение ─ они обозначают теги. Также подобную значимость имеет и
амперсанд, которая и обозначает сущность или символическую ссылку.
Если после знака < или & не идёт буква, или не идёт она после
последовательностей </ или &#, то их можно записать как есть,
однако в гипертексте делать это нельзя.
- lt
- < «Меньше чем» знак
- gt
- > «Больше чем» знак
- amp
- & Лигатура ET (амперсанд)
- quot
- " Кавычки машинные, для вставки в текст
атрибутов
Следующий список сущностей позволяет тебе ссылаться на
соответственные символы из ISO 8859-1, «Latin-1». Это
может быть полезно, если в документе использована другая кодировка, в
котором нужного знака нет.
- Agrave
- À Прописная А с гревисом
- Aacute
- Á Прописная А с ударением
- Acirc
- Â Прописная А с циркумфлексом
- Atilde
- Ã Прописная А с тильдой
- Auml
- Ä Прописная А с умляутом
- Aring
- Å Прописная А с кольцом
- AElig
- Æ Прописная лигатура AE
- Ccedil
- Ç Прописная С с седилой
- Egrave
- È Прописная Е с гревисом
- Eacute
- É Прописная Е с ударением
- Ecirc
- Ê Прописная Е с циркумфлексом
- Euml
- Ë Прописная Ё!
- Igrave
- Ì Прописная I с гревисом
- Iacute
- Í Прописная I с ударением
- Icirc
- Î Прописная I с циркумфлексом
- Iuml
- Ï Прописная I с умляутом
- ETH
- Ð Прописная Ез Исландская
- Ntilde
- Ñ Прописная N с тильдой
- Ograve
- Ò Прописная О с гревисом
- Oacute
- Ó Прописная О с ударением
- Ocirc
- Ô Прописная О с циркумфлексом
- Otilde
- Õ Прописная О с тильдой
- Ouml
- Ö Прописная О с умляутом
- times
- × Умножения знак
- Oslash
- Ø Прописная О зачёркнутая
- Ugrave
- Ù Прописная U с гревисом
- Uacute
- Ú Прописная U с ударением
- Ucirc
- Û Прописная U с циркумфлексом
- Uuml
- Ü Прописная U с умляутом
- Yacute
- Ý Прописная Y с ударением
- THORN
- Þ Прописной ТОРН Исландский
- szlig
- ß Лигатура З
- agrave
- à Строчная А с гревисом
- aacute
- á Строчная А с ударением
- acirc
- â Строчная А с циркумфлексом
- atilde
- ã Строчная А с тильдой
- auml
- ä Строчная А с умляутом
- aring
- å Строчная А с кольцом
- aelig
- æ Строчная лигатура АЕ
- ccedil
- ç Строчная С с седилой
- egrave
- è Строчная Е с гревисом
- eacute
- é Строчная Е с ударением
- ecirc
- ê Строчная Е с циркумфлексом
- euml
- ë Строчная Е с умляутом
- igrave
- ì Строчная I с гревисом
- iacute
- í Строчная I с ударением
- icirc
- î Строчная I с циркумфлексом
- iuml
- ï Строчная I с умляутом
- eth
- ð Строчная Ез Исландская
- ntilde
- ñ Строчная N с тильдой
- ograve
- ò Строчная О с гревисом
- oacute
- ó Строчная О с ударением
- ocirc
- ô Строчная О с циркумфлексом
- otilde
- õ Строчная О с тильдой
- ouml
- ö Строчная О с умляутом
- divide
- ÷ Деления знак
- oslash
- ø Строчная О зачёркнутая
- ugrave
- ù Строчная U с гревисом
- uacute
- ú Строчная U с ударением
- ucirc
- û Строчная U с циркумфлексом
- uuml
- ü Строчная U с умляутом
- yacute
- ý Строчная Y с ударением
- thorn
- þ Строчный ТОРН Исландский
- yuml
- ÿ Прописная Y с умляутом
Для того, чтобы можно было ссылаться ко всем символам Latin-1, было
предложено добавить ещё сущностей. Так стало возможным символически
использовать все символы Latin-1 в документе с кодировкой, скажем,
US-ASCII.
- nbsp
- Не разрываемый пробел
- iexcl
- ¡ Восклицательный знак вверх ногами
- cent
- ¢ Цент(ы)
- pound
- £ Фунт(ы)
- curren
- ¤ ДЕНЕЖНАЯ ЕДЕНИЦА
- yen
- ¥ Иена(ы)
- brvbar
- ¦ Битая вертикальная черта
- sect
- § Параграфа знак
- uml
- ¨ Умляут, диезерис
- ordf
- ª Указатель порядковости, женский
- copy
- © Знак права собственности, 2022
- laquo
- « Угловые кавычки, открывающие и указывающие
влево
- not
- ¬ Отрицательный знак
- shy
- Мягенкий перенос на следующую строку
- reg
- ® Элемент зарегестрированого товарного
знака
- macr
- ¯ Макрон, надчёркивающий знак
- deg
- ° Градусов знак
- plusmn
- ± Больше либо меньше, +/─
- sup2
- ² Надстрочный 2: возведение в квадрат
- sup3
- ³ Надстрочный 3: возведение в кубик
- acute
- ´ Ударение
- micro
- µ Микрознак, Мю греческое
- para
- ¶ Абзаца знак
- middot
- · Точка посередине
- cedil
- ¸ Цедила
- sup1
- ¹ Надстрочный 1: возведение в линию
- ordm
- º Указатель порядковости, мужской
- raquo
- » Угловые кавычки, закрывающие и указывающие
вправо
- frac14
- ¼ Четверть, 1/4
- frac12
- ½ Половина, 1/2
- frac34
- ¾ Без четверти, 3/4
- iquest
- ¿ Вопросительный знак вверх ногами
Здесь не было добавлено каких-либо новых сущностей.
О Греческих буквах для математики и нём же было слышно ещё при
разговорах об HTML+. Этот список символов был создан на основе шрифта
Adobe Script, широко доступного, и от которого можно бы
брать все эти знаки.
Присутствуют примечания. Для тебя они переведены, однако всё-таки они
могли устареть.
Замечание: современные браузеры примут только те
сущности, которые завершены точкой с запятой. Причиной этого
поведения является отказ в поддержке сокращённого письма SGML.
- fnof
- ƒ Латинская строчная F с крюком. Оно же ─
функция, флорин
- Alpha
- Α Прописная Альфа
- Beta
- Β Прописная Бета
- Gamma
- Γ Прописная Гамма
- Delta
- Δ Прописная Дельта
- Epsilon
- Ε Прописной Эпсилон
- Zeta
- Ζ Прописная Зета
- Eta
- Η Прописная Эта
- Theta
- Θ Прописная Дзета
- Iota
- Ι Прописная Йота
- Kappa
- Κ Прописная Каппа
- Lambda
- Λ Прописная Лямбда
- Mu
- Μ Прописная Мю
- Nu
- Ν Прописная Ню
- Xi
- Ξ Прописная Кси
- Omicron
- Ο Прописной Омикрон
- Pi
- Π Прописная Пи
- Rho
- Ρ Прописная Рхо
- Sigma
- Σ Прописная Сигма
- Tau
- Τ Прописная Тау
- Upsilon
- Υ Прописной Апсилон
- Phi
- Φ Прописная Пхи
- Chi
- Χ Прописная Кхи
- Psi
- Ψ Прописной Пси
- Omega
- Ω Прописная Омега
- alpha
- α Строчная Альфа
- beta
- β Строчная Бета
- gamma
- γ Строчная Гамма
- delta
- δ Строчная Дельта
- epsilon
- ε Строчный Эпсилон
- zeta
- ζ Строчная Зета
- eta
- η Строчная Эта
- theta
- θ Строчная Дзета
- iota
- ι Строчная Йота
- kappa
- κ Строчная Каппа
- lambda
- λ Строчная Лямбда
- mu
- μ Строчная Мю
- nu
- ν Строчная Ню
- xi
- ξ Строчная Кси
- omicron
- ο Строчный Омикрон
- pi
- π Строчная Пи
- rho
- ρ Строчная Рхо
- sigmaf
- ς Строчная финальная Сигма
- sigma
- σ Строчная Сигма
- tau
- τ Строчная Тау
- upsilon
- υ Строчный Апсилон
- phi
- φ Строчная Пхи
- chi
- χ Строчная Кхи
- psi
- ψ Строчный Пси
- omega
- ω Строчная Омега
- thetasym
- ϑ Символ строчной Тзеты
- upsih
- ϒ Строчный Апсилон с крюком
- piv
- ϖ Символ строчной Пи
- bull
- • Чёрный маркер списка. Оно же ─ чёрный
маленький кружок.
Не является маркером-оператором
- hellip
- … Многоточие
- prime
- ′ Штрих. Оно же ─ минуты угловые, футы
- Prime
- ″ Двойной штрих. Оно же ─ секунды, дюймы
- oline
- ‾ Надчёркивание. Также вид пробельного
материала
- frasl
- ⁄ Дробная косая черта
- weierp
- ℘ Писменая прописная Р. Оно же ─
надмножество
- image
- ℑ Готическая прописная I. Оно же ─ мнимая
часть
- real
- ℜ Готическая заглавная R. Оно же ─ знак
реальной части
- trade
- ™ Часть незарегестрированого товарного
знака
- alefsym
- ℵ Символ Алеф. Оно же ─ первый
трансконечный кардинал
- larr
- ← Стрела влево
- uarr
- ↑ Стрела вверх
- rarr
- → Стрела вправо
- darr
- ↓ Стрела вниз
- harr
- ↔ Стрела влево-вправо
- crarr
- ↵ Стрела влево сверху
- lArr
- ⇐ Стрела двойная влево.
UCS не говорит, что это тоже что и
стрела «подразумеваемое», но
не предусматревает для этого отдельной
стрелы. Поэтому ? эту можно
использовать в данной роли
- uArr
- ⇑ Стрела двойная вверх
- rArr
- ⇒ Стрела двойная вправо.
UCS не говорит, что это стрела
«подразумет», но не
представляет для этого специальной
стрелы. Поэтому ? эта
стрела может быть использована в этой
роли
- dArr
- ⇓ Стрела двойная вниз
- hArr
- ⇔ Стрела двойная влево-вправо
- forall
- ∀ Для всех
- part
- ∂ Частичное различение
- exist
- ∃ Существует в
- empty
- ∅ Пустое множество. Оно же ─ диаметр
- nabla
- ∇ Гамильтона оператор
- isin
- ∈ Пренадлежит к
- notin
- ∉ Не пренадлежит к
- ni
- ∋ Содержит себя как.
Должно быть здесь более запоминаемое имя
чем «ni»?
- prod
- ∏ n-множественный продукт. Оно
же ─ знак продукта.
Это не то же что и Греческая Прописная
Пи, пусть их начертания и похожи
- sum
- ∑ n-множественная сумма.
Это не то же что и Греческая Прописная
Сигма, пусть их начертания и похожи
- minus
- − Минуса знак
- lowast
- ∗ Звезда оператор
- radic
- √ Квадратный корень. Оно же ─ знак
радикала
- prop
- ∝ Пропорционально к
- infin
- ∞ Бесконечность
- ang
- ∠ Угол
- and
- ∧ Логическое И. Оно же ─ клин
- or
- ∨ Логическое ИЛИ. Оно же ─ V
- cap
- ∩ Пересечение. Оно же ─ шапка
- cup
- ∪ Объединение. Оно же ─ чашка
- int
- ∫ Интеграл
- there4
- ∴ Следовательно
- sim
- ∼ Тильда оператор. Оно же ─ различается в
диапазоне, около.
Это не то же что и просто Тильда
(U+007E), хотя они по начертанию сильно
похожи
- cong
- ≅ Примерно равно
- asymp
- ≈ Почти равно. Оно же ─ асимптомически
равно
- ne
- ≠ Не равно
- equiv
- ≡ Одинаково к
- le
- ≤ Меньше или равно
- ge
- ≥ Больше или равно
- sub
- ⊂ Подмножество
- sup
- ⊃ Надмножество.
Заметьте, что «не
надмножество» не было включено в
шрифт Symbol. Должно оно быть, для
симметрий?
- nsub
- ⊄ Не подмножество
- sube
- ⊆ Подмножество или одинаково к
- supe
- ⊇ Надмножество или одинаково к
- oplus
- ⊕ Плюс в круге. Оно же ─ прямая сумма
- otimes
- ⊗ Умножение в круге. Оно же ─ продукт
векторов
- perp
- ⊥ Присоединять сверху знак. Оно же ─
ортоганально к, перпендикулярно
- sdot
- ⋅ Точка оператор.
Это не то же что и точка посередине
- lceil
- ⌈ Левое перекрытие. Оно же ─
«apl upstile»
- rceil
- ⌉ Правое перекрытие.
- lfloor
- ⌊ Левый этаж
- rfloor
- ⌋ Правый этаж
- lang
- 〈 Угловая скобка влево. Оно же ─
«Bra».
Это не то же что и Меньше чем знак или
Одиночная угловая Кавычка влево
- rang
- 〉 Угловая скобка вправо. Оно же ─
«Ket»
Это не то же что и Больше чем знак или
одиночная угловая кавычка вправо
- loz
- ◊ Пастилка
- spades
- ♠ Масть Чёрные Пики
- clubs
- ♣ Масть Чёрные Трефы. Оно же ─ Шамрок
- hearts
- ♥ Масть Чёрные Червы. Оно же ─ Валентин
- diams
- ♦ Масть Чёрные Бубны
Эти сущности добавлены с целью предоставить различные типографские
символы и символы международизаций, такие как символы направления
печати. Также здесь добавлены некоторые символы из кодировки 1252
(оконное расширение ISO 8859-1).
- OElig
- Œ Латинская лигатура заглавная ОЕ
- oelig
- œ Латинская лигатура строчная ОЕ
Это неправильно называть лигатурой, в
некоторых языках это отдельная буква
- Scaron
- Š Латинская заглавная S с кароном
- scaron
- š Латинская строчная S с кароном
- Yuml
- Ÿ Латинскя заглавная Y с диэзерисом
- circ
- ˆ Модифицирующий знак Акцент Циркумфлекс
- tilde
- ˜ Маленькая Тильда
- ensp
- Малый пробельный материал
- emsp
- Большой пробельный материал
- thinsp
- Очень малый пробельный материал
- zwnj
- Малейший пробельный материал (ноль
йоктаметров)
- zwj
- Малейшая склеивающая пластина (ноль
йоктаметров)
- lrm
- Слева направо маркер
- rlm
- Справа налево маркер
- ndash
- – Короткое тире
- mdash
- — Тире (длинное)
- lsquo
- ‘ Одиночная Кавычка левая
- rsquo
- ’ Одиночная Кавычка правая
- sbquo
- ‚ Одиночная Кавычка низкая-9
- ldquo
- “ Двойная Кавычка левая
- rdquo
- ” Двойная Кавычка правая
- bdquo
- „ Двойная Кавычка нижняя-9
- dagger
- † Крест
- Dagger
- ‡ Крест × 2
- permil
- ‰ Промилле
- lsaquo
- ‹ Одиночный угловой влево указывающий знак
пунктуаций.
Он был предложен, но ISO его всё-ещё не
стандартезировала
- rsaquo
- › Одиночный угловой вправо указывающий знак
пунктуаций.
Он был предложен, но ISO его всё-ещё не
стандартезировала
- euro
- € Евро
Спустя столько времени было добавлено очень большое количество
сущностей из самых разных частей Unicode. Их так много, что автору
впадлу документировать всех их здесь. Однако, ты можешь посмотреть
список наборов добавленных символов.
- html5-uppercase ─ Самые часто используемые символы (базовые
сущности и товарные и правовые знаки) в верхнем регистре
- predefined ─ Базовые символы с дополнительным Апострофом
- isobox ─ Коробки и символы рисования рамок
- isocyr1 ─ Русская Кириллица
- isocyr2 ─ Нерусская Кириллица
- isodia ─ Диакритические знаки
- isolat2 ─ Сущности Latin-2
- isonum ─ Математические и специальные знаки
- isopub ─ символы для публикаций
- isoamsX ─ Математические знаки, X:
- a ─ Стрелочные связи
- b ─ Бинарные операторы
- c ─ Разделители
- n ─ Отрицающие связи
- o ─ Одиналы
- r ─ Связи
- isomfrk ─ Математические алфавиты: Фрактура
- isomopf ─ Математические алфавиты: Открытое лицо
- isomscr ─ Математические алфавиты: Рукописный
- isotech ─ Основные технические
- mmlextra ─ Дополнительные символы MathML
- mmlalias ─ Сущности-синонимы в MathML
К счастью, больше таких бесполезных сущностей (где HTML5, там и
UTF-8, безусловно) больше не будет.
Чтобы просмотреть соответственный список, вставьте в адресную строку
браузера базовую строку
«//www.w3.org/2003/entities/2007/», затем добавьте
название из списка, и закончите его на «.ent».
Тим БЕРНЕРС-ЛИ, Данил В. КОНОЛЛИ,
Запрос
комментариев № 1866 «Язык разметки гипертекста ─
2.0», ноябрь 1995. Также доступен на этом же сайте.
Дейв РЕГГЕТ, «HTML 3.2 справочная
спецификация».
Дейв РЕГГЕТ, Арнольд ЛЕ ХОРС, Иан ЙАКОБС,
«Спецификация Языка разметки гипертекста 4.01». Собственно сущности.
(Множество людей и машин) Живой HTML.
W3C, ISO, Полный список всех
списков сущностей.
Смотрите также Полный перечень
всех существующих сущностей в HTML и MathML, на Английском.
Части © Международная организация по стандартизаций, 1986:
Разрешение копировать в любой форме дана для использования с
соответствующими SGML системами и приложениями, как определено в
ISO 8879, с предоставлением этого уведомления во всех копиях. Оно
было расширенно для использования с HTML [ISO-Latin-1], чтобы
покрывать полный диапазон кодов в диапазоне 160-255, десятично.
Permission to copy in any form is granted for use with conforming
SGML systems and applications as defined in ISO 8879, provided this
notice is included in all copies. This has been extended for use with
HTML to cover the full set of codes in the range 160-255 decimal.