Unicode: Зад завесата

Консорциумът Unicode отпразнува своя 25 -годишнина миналата година. Истината е, че въпреки цялата работа, която Unicode върши, за да осигури текст от езици по света на работата – повечето от нас знаят Unicode като групата, която одобрява новите емоджи.
Това, което може да не е толкова ясно, е защо се изисква голям консорциум или скритата сложност на Unicode. Или как емоджиите на повръщане, показани в карикатурата на XCKD по -горе, вече се считат за „валидни (но не се препоръчва)“.

Марк Дейвис, съосновател и президент на настоящия ден на Unicode, се стреми да изясни как Emoji се вписва в Unicode в този преглед на високо ниво, който разглежда какво е Unicode и как подкомитетът на Emoji на Unicode („Emoji SC“) се вписва в подкомитета на Unicode Emoji („Emoji SC“) влязъл в подкомитета на Emoji („Emoji SC“)) се вписва („Emoji SC“)) то.
Дейвис отбелязва, че емоджиите съставляват само част от общия брой знаци в стандарта Unicode. Едва можете да ги направите в тази диаграма:

Само героите не разказват половината история. Редица глифи трябва да се комбинират, когато се показват в определени поръчки или комбинации.

Комбинация, която ще бъде позната на мнозина, е как се прилагат тоновете на кожната кожа на емоджи.
Те работят чрез откриване, когато символът на модификатора се показва след човешки емоджи, като момиче. Те се комбинират на поддържани платформи, за да покажат един -единствен емоджи:

По -сложното изпълнение включва обединяването на две или повече емоджи заедно в това, което се нарича емоджи ZWJ последователност.
Те се използват за създаване на професии като 👩‍⚖ 👩‍⚖ жена съдия. Това емоджи е създадено с помощта на емоджита на 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 👩 ⚖ ⚖ ⚖ ⚖ ⚖ ⚖.
Характерът „ZWJ“ (нулева ширина) стои между тези две емоджи и е невидимо лепило, което се присъединява към множество емоджи в едно (където се поддържа).

Други видове ZWJ последователности изброяват съществуващи емоджи като 🕵 детектив със символ на пола ♀ женски знак, добавен след него.
Този тип ZWJ последователност обикновено се използва, ако вече съществува емоджи. Например: бегач, сърфист или много от жестовете.

И да, можете да комбинирате модификатори и ZWJ, за да създадете по -дълга последователност.

Unicode не контролира ZWJ последователностите по същия начин като новите емоджи, които изискват собствена кодова точка.
Препоръчителни последователности на Unicode, които трябва да се поддържат за междуплатформена консистенция. Въпреки това доставчиците са свободни да комбинират всякакви емоджи с всеки друг, както сметне за добре.
Microsoft има шест котки Ninja, налични в Windows, които не са част от препоръчания списък на Unicode. 🐱 Cat Face и 🚀 Rocket се комбинират на Windows 10, за да покажат емоджи за 🐱‍🚀 astro cat.
Astro Cat е валиден (тъй като използва правилна структура на последователността), но не се препоръчва като други професии и полове.

XKCD предположи, че повръщането трябва да бъде модификатор, за да направи „повръщащ се каубой“.
Дейвис изтъква, че 🤠 Лицето на каубойската шапка вече може да се комбинира с 🤮 повръщане на лице, за да се създаде валидна последователност на ZWJ:

Други типове последователности съществуват за емоджи, включително последователности на знамето, последователности на маркери и последователности на KeyCap. Трябва да разгледате целия набор от слайдове, за да ги видите по -подробно.
И накрая, поглед върху времевата линия (Current, 2017) за това как се ражда нов емоджи:

🚨 Актуализиране на април 2020 г .: Текущият график за това как се създава нов емоджи, е значително повлиян от пандемията Covid-19. Можете да прочетете повече за преработения график за 2020 г. и след това.
Разбира се, Unicode все още има какво да прави извън поддръжката на емоджи:

„Има приблизително 7000 живи човешки езици, с различни нива на жизненост. По-малко от 100 от тези езици са добре подкрепени на компютри, мобилни телефони и други устройства, докато всички останали рискуват цифрово в неравностойно положение“

Unicode има програма за приемане на характер. Средствата, събрани от осиновяването, насочват към изследване, за да подкрепят тези цифрово неравностойни езици.
Повече ▼:

Unicode емоджи от Марк Дейвис
Unicode приеме герой
Нови емоджи за 2017 г.
Забавни емоджи хакове

Search Emojis: