Cyrylica i głagolica w Unicode
W słowiańskich alfabetów cyrylicy i głagolicy są podzielone na pięć bloków w Unicode , pierwsze dwa z nich zawierają znaki potrzebne do pisania języków słowiańskich i non-słowiańskich (w tym niektórych postaci historycznych), a drugi trzy bloki znaków dla reprodukcja historycznych tekstów cyrylicy lub głagolicy.
Aby porównać Unicode i najpopularniejsze 8-bitowe kodowanie, zobacz kodowanie znaków cyrylicy # .
Zakodowane znaki
Głównym blokiem cyrylicy jest blok cyrylicy Unicode , który można podzielić na kilka części: Pierwsza część jest zgodna z kodowaniem ISO 8859-5, a zatem zawiera znaki niezbędne do pisania języków słowiańskich. Następnie znajdują się litery używane w językach tureckich , a następnie w języku abchaskim .
Pozostałe bloki zawierają rzadkie lub historyczne znaki: Dodatek cyrylicy koduje znak Komi z ISO 10754 i litery kurdyjskie , dwa bloki cyrylicy rozszerzone-A i cyrylica rozszerzone-B były używane głównie litery w języku staro -cerkiewno-słowiańskim .
Litery głagolicy są zakodowane w bloku Unicode głagolicy , nie ma rozróżnienia między okrągłymi i kanciastymi kształtami liter.
puchnąć
- Julie D. Allen i wsp .: The Unicode Standard. Wersja 6.2 - Specyfikacja podstawowa. Konsorcjum Unicode, Mountain View, CA, 2012. ISBN 978-1-936213-07-8 . Rozdział 7.4: Cyrylica, Rozdział 7.5: Głagolica. ( online , PDF)