Cyrylica i głagolica w Unicode

W słowiańskich alfabetów cyrylicy i głagolicy są podzielone na pięć bloków w Unicode , pierwsze dwa z nich zawierają znaki potrzebne do pisania języków słowiańskich i non-słowiańskich (w tym niektórych postaci historycznych), a drugi trzy bloki znaków dla reprodukcja historycznych tekstów cyrylicy lub głagolicy.

Aby porównać Unicode i najpopularniejsze 8-bitowe kodowanie, zobacz kodowanie znaków cyrylicy # .

Zakodowane znaki

Głównym blokiem cyrylicy jest blok cyrylicy Unicode , który można podzielić na kilka części: Pierwsza część jest zgodna z kodowaniem ISO 8859-5, a zatem zawiera znaki niezbędne do pisania języków słowiańskich. Następnie znajdują się litery używane w językach tureckich , a następnie w języku abchaskim .

Pozostałe bloki zawierają rzadkie lub historyczne znaki: Dodatek cyrylicy koduje znak Komi z ISO 10754 i litery kurdyjskie , dwa bloki cyrylicy rozszerzone-A i cyrylica rozszerzone-B były używane głównie litery w języku staro -cerkiewno-słowiańskim .

Litery głagolicy są zakodowane w bloku Unicode głagolicy , nie ma rozróżnienia między okrągłymi i kanciastymi kształtami liter.

puchnąć

  • Julie D. Allen i wsp .: The Unicode Standard. Wersja 6.2 - Specyfikacja podstawowa. Konsorcjum Unicode, Mountain View, CA, 2012. ISBN 978-1-936213-07-8 . Rozdział 7.4: Cyrylica, Rozdział 7.5: Głagolica. ( online , PDF)