Дополнительно
Почему я не должен использовать символы Юникода для имитации типографические стили (такие, как капители или скрипт)?
Юникод содержит различные символы, которые выглядят как типографским способом стилизованных вариантов символов латинского алфавита и которые позволяют писать тексты в соответствующем типографические стили, не прибегая к продаже или аналогичные. Например, можно смоделировать:
- Капители:
ʙᴇʜᴏʟᴅ ᴛʜɪꜱ ꜰᴀɴᴄɪʟy ᴇɴᴄᴏᴅᴇᴅ ᴛᴇxᴛ.
- Скрипт:
𝓑𝓮𝓱𝓸𝓵𝓭 𝓽𝓱𝓲𝓼 𝓯𝓪𝓷𝓬𝓲𝓵𝔂 𝓮𝓷𝓬𝓸𝓭𝓮𝓭 𝓽𝓮𝔁𝓽.
- Старопечатный:
𝕭𝖊𝖍𝖔𝖑𝖉 𝖙𝖍𝖎𝖘 𝖋𝖆𝖓𝖈𝖎𝖑𝖞 𝖊𝖓𝖈𝖔𝖉𝖊𝖉 𝖙𝖊𝖝𝖙.
Это встретило интерес на обмен стека (например, здесь, здесь, и здесь) и критика таких методов был сделан. Но что может пойти не так, когда я могу их использовать?
128
4
Общие
Эти символы не предназначены для регулярного латинского алфавита текст, но для фонетики, кириллица-алфавит текстом, для использования в качестве математических символов (представляющие переменные), или похожие. Только в Unicode-совместимых способ кодирования текста в базовом латинском алфавите является использование символов в основном используется для этой цели (т. е., с латинского блок Unicode). Как и во многих других стандартов, вы должны думать дважды о нарушении Юникод. Кроме того, Юникод включает в себя так много систем письменности, примеры, и прочее, что только существует для обратной совместимости с другими стандартами на<SUP-серфинг>1</суп> что полностью понимая все его мотивы-это наука своего собственного. Короче говоря, если вы действительно знаете, что вы делаете, весьма вероятно, что что-то сломается, что вы не даже отдаленно мысли.
Конкретные примеры
Доступность
Закодированный текст не только существовать, которые должны быть оказаны в некоторых шрифтов. Он также может быть интерпретировано, например, для чтения с экрана. И программы чтения с экрана не нужно угадать, будет ли
найдено при поиске 𝒲 в точный режим – для тех, кто хочет искать, где соответствующая переменная упоминается в математической документ³;
не найден при поиске 𝓌, Ш И Ш в точном режиме на счет взлома поиск аналогичные вышеуказанным.
Однако, если вы использовать этот персонаж, чтобы имитировать обычный текст, то он должен быть найден при поиске Ш или 𝒲 в точный режим, который вступает в противоречие с вышесказанным. Как второй пример считают, что кириллические символы не должны быть найдены при поиске латинскими буквами, и наоборот, так как они совершенно разные вещи. Однако если использовать кириллические символы для моделирования Латинской капители, вам нужно, чтобы это произошло, если вы не хотите, возможности поиска, чтобы быть сломанным. Это позволит людям найти множество бесполезных вещей, если они ищут редкое латинского алфавита слово, что просто так, случается, соответствуют искусственного капители некоторых популярных кириллица-алфавит Слово (и наоборот). Точную опцию поиска не может решить эту проблему, так как это зарезервировано для других целей в этих алфавитов. Вообще, невозможно построить (без безумного количества вариантов), которая не нарушается с помощью специальных символов для имитации стиле латинский текст.
<суп>1</суп> вы знаете, что XKCD о неизбежном провале унификации стандартов? Ну, Юникод удалось. <суп>2</суп> или на любой пустой оператор в соответствующей конвенции <суп>3</с SUP> Я осознаю, что очень мало математических текстов в настоящее время поддержка этой кодировки или что-то совместимое, но дело в том, что когда-нибудь они, надеюсь, сделают. Юникод-текст злоупотреблении они могут быть рядом и читала тогда. <суп>4</суп> если вы не локализации на Македонский или Сербский, в которой вы получите разные но все же нежелательный результат.
Что может пойти не так? Ну, я вижу это:
в Firefox 50.1.0 на Windows 7.
Проблема глифов, в этом случае на мобильном устройстве, дополнительно иллюстрируется в качестве изображения, данные пользователя Крис Кент В а comment, что у меня обрезано от оригинал:
И пользователей oals пожалуйста contributed другой пример:
Я'м, имеющим проблемы XY с этим.
Здесь мы видим, что y и X меньше, чем остальной текст. При определенном масштабе они кажутся одинакового размера, но это, кажется, выявили проблемы с эти символы определенного шрифта.
Используя нелатинские символы это своего рода выглядит как латинских, вы окажетесь в компании спамеров, pornmongers, и кто-знает-что-они'повторно в лицемеры, которые хотят, чтобы их текст непостижимы, unindexable, и repudiatable. ("Я никогда не говорил, что это было безопасно!! Я сказал, что это Сигма-Альфа-Интеграл-знак-epislon!!! Может'т судить меня!!!&и")
Если вы'вновь уютно в этом клубе, затем пойти на это.