These are public posts tagged with #unicode. You can interact with them if you have an account anywhere in the fediverse.
Understand UTF-8 and the others (16, 32) https://tonsky.me/blog/unicode/ #computer #reference #unicode
Modern extension to classic 2003 article by Joel Spolsky
tonsky.meWe’ve got mail #4
—
An introduction to the Lovers Communication System by Yukio Ōta, designed by Loïc Marlaix a.k.a. @MoritzBrouhaha
—
And the newest edition of #Unicode à Gogo! A fanzine designed and published by him.
Как досадить редактору: мастер-класс от юникодоведа для юникодоводов
Хочешь утончённо свести с ума редактора? Не нужно банальностей: не пиши капсом, не вставляй Comic Sans, не сыпь ошибками. Это всё слишком топорно. Включи изящную пакость: добавь после каждой буквы невидимый, непробельный, нерушимый символ — U+2060! А лучше несколько.
В чём суть?
Его не видно даже в режиме показа непечатных символов.
Все буквы разделены, так что проверка орфографии предательски молчит.
Внешне слово выглядит нормально, но ломает поиск.
Курсор тупо застревает в тексте, что-то исправить нереально.
Статистика не считает этот символ пробелом, так что число символов покажет такое, что Толстой позавидует.
Пример:
Привет, редактор! Как настроение?
(между буквами — рандомное количество U+2060
).
Что получаем?
На экране — нормальный текст.
Внутри — козьи какашки («ощущение наступления на дерьмо» ©).
Поиск по слову — не находит.
Проверка орфографии — молчит.
Подозрения — смутные.
Редактор — в ярости.
Предупреждение:
Работа в любом приложении не гарантируется! Word и Notepad ведутся, Notepad++ отображает квадратики, LibreOffice подсвечивает сереньким предыдущую букву.
Проверка орфографии всё же дуреет от такой прикормки (в зависимости от количества добавленных символов).
Если срать юникодом не после каждой буквы, а в конце слова, то орфография даст добро, при этом бонусы по объему текста и глючному курсору — сохраняются.
What sets apart the Cascii web-based ASCII diagram editor from similar tools is it manipulates whole shapes, not just individual characters, and can save them for further modification. Plus it's shokingly easy to self-host and run locally.
A web-based ASCII and Unicode diagram builder written…
GitHub@ale @pongo
#Unicode #Markdown #kb
Что это за странный символ на „я“?
Это zero-width non-joiner. В некоторых языках он используется, чтобы написать части слова раздельно. Но ещё он помогает отправлять текстовые смайлики в мессенджерах, которые их заменяют на эмоджи :-)
Интересное... По ходу joiner/non-joiner'ов нулевой ширины у нас как минимум четыре:
#Tags
U+2060 ⁠
Предотвращает разрывы строк, не влияя на лигатуры или сегментацию текста
#Tags
U+200B ​
Обозначает возможные точки разрыва строки, используется в языках без пробелов
#Tags
U+200C ‌
Предотвращает соединение символов в скриптах с соединением, например, арабском
#Tags U+200D ‍
Заставляет символы соединяться, используется для лигатур и составных эмодзи
@pongo@mastodon.ml Подумал я что-то: а почему бы не…
Mastodon 豐富文本,貧乏文本
➤ 探討數位時代文字呈現的本質與挑戰
✤ https://laemeur.sdf.org/words/D29.html
本文作者Adam Moore探討了文字呈現格式(如粗體、斜體等)在數位世界中的地位。作者認為,這些格式如同標點符號一樣,是語言表達的重要組成部分,不應被視為純粹的「裝飾」。然而,目前主流的文字編碼方式,如ASCII和Unicode,都未能有效地納入這些呈現格式的資訊,導致格式資訊需要混雜在文字數據中,造成污染。作者呼籲應將呈現格式納入文字編碼標準,並建議採用更寬廣的編碼方案來實現。
+ 這篇文章讓我重新思考了我們每天使用的文字格式,原來它們背後有如此深層的技術和哲學問題。
+ 我贊同作者的觀點,目前的文字編碼方式確實存在缺陷,希望能有更好的解決方案出現。
#科技評論 #文字編碼 #Unicode
#Unicode #Emoji: #Math #Geekiness
<U+1F605> <U+1F4A7> <U+1F604>
I set my name on LinkedIn to end with a 0-width right-to-left unicode character, so everything after it is flipped, and it's *still* paying dividends
Unicode pictograms to mark progressively rising values:
https://www.draketo.de/anderes/unicode-icon-progressions
For Ace Maths I searched for unicode icons to mark progression: show that you’re getting better. Since I found a lot of different options (from simple sparklines to a huge list of animals), I’m collecting them in this article.
Includes a tip for somewhat better, automatic #unicode "image" suppport #LaTeX with plain #pdflatex / #pdftex
Vous avez un peu d'expérience avec les IDN (Internationalized Domain Names), soit des noms de domaine contenant d'autres caractères que ceux ASCII ?
Je m'interroge surtout quant à leur compatibilité par rapport aux outils et aux logiciels. Les navigateurs, OK, ils les supportent tous, je n'ai pas à m'en faire.
Pour les API et autres outils, par contre...
Which is your favourite #Unicode telephone?
Ticket numéro 18455 ouvert sur le Jira d'Unicode à propos des noms des jours de la semaine en Kabyle.
Faux gras, caractères fantaisistes, abus d’émojis : le détournement des caractères Unicode, fléau pour l’#accessibilité du #Web
On observe actuellement une mode de rédaction de messages publiés sur les réseaux sociaux donnant l'impression que le texte bénéficie d'une mise en forme particulière (gras, italique, souligné, script, etc.) grâce à certains caractères #Unicode.
Une véritable plaie pour les personnes utilisant des lecteurs d'écran !
par @lalutineduweb
https://www.lalutineduweb.fr/detournement-unicode-emojis-accessibilite/