KOI8-U
KOI8-U z KOI8 rodziny jest zestaw znaków , który jest używany do kodowania znaków w tym cyrylicy dla języka ukraińskiego w systemach komputerowych i zastosowań tylko jeden bajt do kodowania.
KOI8-U jest nadzbiorem ASCII i dlatego zawiera również 26 liter alfabetu łacińskiego . KOI8-U ma wiele wspólnych cech z KOI8-R dla języka rosyjskiego . Międzynarodowy zestaw znaków standard Unicode całkowicie zastępuje KOI8-U.
KOI-U jest opisane w RFC 2319 i jest zarejestrowane w IANA i zatwierdzone do MIME .
stół
… 0 | … 1 | … 2 | … 3 | … 4 | … 5 | … 6 | … 7 | … 8th | … 9 | … A. | ... B | ... C | … D | … E. | ... F. | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0… | nie używany | |||||||||||||||
1… | ||||||||||||||||
2… | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3… | 0 | 1 | 2 | 3 | 4 | 5 | 6th | 7th | 8th | 9 | : | ; | < | = | > | ? |
4… | @ | ZA. | B. | DO. | RE. | MI. | FA. | sol | H. | JA. | jot | K. | L. | M. | N | O |
5… | P. | Q | R. | S. | T | U | V | W. | X | Y | Z | [ | \ | ] | ^ | _ |
6… | ` | za | b | do | re | mi | fa | sol | H. | ja | jot | k | l | m | n | O |
7 ... | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8… | ─ | │ | ┌ | ┐ | └ | ┘ | ├ | ┤ | ┬ | ┴ | ┼ | ▀ | ▄ | █ | ▌ | ▐ |
9 ... | Ø | ▒ | ▓ | ⌠ | ■ | ∙ | √ | ≈ | ≤ | ≥ | NBSP | ⌡ | ° | ² | · | ÷ |
A ... | ═ | ║ | ╒ | ё | є | ╔ | і | ї | ╗ | ╘ | ╙ | ╚ | ╛ | ґ | ╝ | ╞ |
B ... | ╟ | ╠ | ╡ | Ё | Є | ╣ | І | Ї | ╦ | ╧ | ╨ | ╩ | ╪ | Ґ | ╬ | © |
C ... | ю | а | б | ц | д | е | ф | г | х | и | й | к | л | м | н | о |
D ... | п | я | р | с | т | у | ж | в | ь | ы | з | ш | э | щ | ч | ъ |
E ... | Ю | А | Б | Ц | Д | Е | Ф | Г | Х | И | Й | К | Л | М | Н | О |
F ... | П | Я | Р | С | Т | У | Ж | В | Ь | Ы | З | Ш | Э | Щ | Ч | Ъ |
Różnice w KOI8-R są w pozycji A4 sześciokątnych A6 sześciokątnych , A7 sześciokątnych AD sześciokątnych i B4 sześciokątnych B6 sześciokątnych , B7 sześciokątnych BD hex (zaznaczone kolorem w tabeli powyżej), przy czym cztery dodatkowe liter wymagane są kodowane.
Chociaż RFC 2319 mówi, że 95 hex Unicode powinno być U + 2219 (∙), często jest konwertowane na U + 2022 (•) w celu zapewnienia zgodności ze stroną kodową 1251 . Niektóre odwołania zawierają literówkę i niepoprawnie przypisują B4 w zapisie szesnastkowym U + 0403 zamiast prawidłowego U + 0404. Ta literówka znajduje się również w załączniku A do RFC 2319 , ale tabela w tekście głównym jest poprawna.