Unicode: A függöny mögött

Az Unicode Consortium tavaly ünnepelte 25. évfordulóját. Az igazság az, hogy annak ellenére, hogy az Unicode minden munkája a világ minden tájáról származó nyelvek szöveget biztosítja – többségünk ismeri az Unicode -t, mint az új hangulatjeleket jóváhagyó csoportot.
Nem lehet egyértelmű, hogy miért van szükség nagy konzorciumra, vagy az Unicode rejtett komplexitása. Vagy hogy a fenti XCKD rajzfilmben bemutatott hányás hangulatjelek már „érvényes (de nem ajánlott)”.

Mark Davis, az Unicode társalapítója és mai elnöke megpróbálta tisztázni, hogy az Emoji hogyan illeszkedik az Unicode-ba ebben a magas szintű áttekintésben, amely megvizsgálja, hogy mi az Unicode, és hogyan illeszkedik az Unicode Emoji albizottság („Emoji SC”). azt.
Davis megjegyzi, hogy a hangulatjelek csak az Unicode Standard karakterének teljes számának töredékét teszik ki. Alig tudod kitalálni őket ebben a táblázatban:

A karakterek önmagukban nem mondják el a történetet. Számos karakterjelnek kombinálnia kell, ha bizonyos megrendelésekben vagy kombinációkban megjelenítik.

Az a kombináció, amely sokak számára ismeri, az az, hogy miként valósítják meg az Emoji bőr tónusokat.
Ezek úgy működnek, hogy felismerik, mikor jelenik meg egy módosító karakter az emberi hangulatjelek után, például 👧 Girl. Ezek a támogatott platformon kombinálják, hogy egyetlen hangulatjelet mutassák be:

A bonyolultabb megvalósítás magában foglalja a két vagy több hangulatjel összekapcsolását az úgynevezett zwj hangulatjelekbe.
Ezeket olyan szakmák létrehozására használják, mint a 👩‍⚖️ nőbíró. Ezt a hangulatjelet a 👩 nő és a ⚖️ egyensúlyi hangulatjelek felhasználásával hozzák létre.
A „ZWJ” (nulla szélességű csatlakozó) karakter a két hangulatjel között áll, és egy láthatatlan ragasztó, amely több hangulatjelhez csatlakozik egybe (ahol támogatva).

Más típusú ZWJ -szekvenciák felsorolnak egy meglévő hangulatjeleket, például 🕵️ Detektív nemi szimbólummal ♀️ A női jel hozzáadása után.
Az ilyen típusú ZWJ -szekvenciát általában akkor használják, ha hangulatjelek már léteznek. Például: futó, szörfös vagy sok gesztus.

És igen, kombinálhatja a módosítókat és a ZWJ -ket, hogy hosszabb sorozatot hozzon létre.

Az Unicode nem ellenőrzi a ZWJ szekvenciákat ugyanúgy, mint az új hangulatjelek, amelyek megkövetelik a saját kódpontjukat.
Unicode ajánlott szekvenciák, amelyeket támogatni kell a platformok közötti konzisztencia szempontjából. A gyártók azonban szabadon kombinálhatják a hangulatjeleket bármilyen mással, ahogyan azt megfelelőnek látják.
A Microsoftnak hat Ninja macskája érhető el a Windows -ban, amelyek nem tartoznak az Unicode ajánlott listájába. 🐱 A macska arcát és a 🚀 rakétát a Windows 10 -en kombinálják, hogy mutasson egy hangulatjelet az Astro Cat számára.
Az Astro Cat érvényes (mivel helyes szekvencia -struktúrát használ), de nem olyan ajánlott, mint más szakmák és nemek.

Az XKCD azt javasolta, hogy a hányás módosító karakter legyen, hogy „hányás cowboyt” készítsen.
Davis rámutat arra, hogy a cowboy kalap arca már kombinálható 🤮 arc hányással, hogy érvényes ZWJ -szekvenciát hozzon létre:

Más szekvenciatípusok léteznek az emoji esetében, beleértve a zászlót, a TAG szekvenciákat és a KeyCap szekvenciákat. Nézze meg a teljes diákkészletet, hogy ezeket részletesebben lássa.
Végül egy pillantás a (Current, 2017) ütemtervnek az új hangulatjelek születésének módjára:

🚨 Frissítés 2020 április: Az új hangulatjelek létrehozásának jelenlegi idővonalát jelentősen befolyásolta a COVID-19 járvány. További információ a 2020 -as és azon túli felülvizsgált ütemtervről.
Természetesen az Unicode -nak még sok tennivalója van a hangulatjelek támogatásán kívül:

„Körülbelül 7000 élő emberi nyelv létezik, eltérő életerővel. Ezeknek a nyelveknek kevesebb mint 100-at támogatnak a számítógépeken, a mobiltelefonokon és más eszközökön, míg a többi kockázatot digitálisan hátrányos helyzetűek.”

Az Unicode -nak egy karakterprogramja van. Az örökbefogadásokból összegyűjtött pénzeszközök a kutatás felé fordulnak, hogy támogassák ezeket a digitálisan hátrányos helyzetű nyelveket.
Több:

Unicode Emoji Mark Davis készítette
Az Unicode alkalmaz egy karaktert
Új hangulatjelek 2017 -re
Szórakoztató hangulatjelek csapkodnak

Hangulatjelek keresése: