Unicode je standard počítač vyvinutý konsorciem Unicode , která si klade za cíl poskytnout každý znak každého systému psaní z jazyka jedinečný číselný identifikátor a jednotně, nezávisle na platformě počítače nebo softwaru .
Unicode a norma ISO / IEC 10646 dávají každému znaku oficiální název v rámci společného jednotného repertoáru mezi všemi jazyky a všemi způsoby použití. Jakmile je společný repertoár schválen, jsou znaky seskupeny do bloků podle jejich použití a přijatých skriptů a je jim dána jedinečná číselná identifikace, která se nazývá kódový bod , obvykle označovaná jako „U + ....“ (kde „... . "představuje šestnáctkové číslo o 4 až 6 číslicích mezi U + 0000 a U + 10FFFF). Definovaný rozsah umožňuje přiřadit až 1 114 112 kódových bodů.
Celkový kódovací prostor je rozdělen do 17 letadel, z nichž každé obsahuje 65 536 kódových bodů. V každém ze 17 letadel jsou poslední dva body kódu přiděleny a vyhrazeny pro interní speciální funkce, nikoli pro znaky, a neměly by být použity pro kódování textu.
Každý plán je rozdělen do bloků. Bloky seskupují znaky podle kritérií logického členství ve skupině znaků, a proto nemají pevnou velikost. Jejich velikost se může pohybovat od několika kódových bodů po několik tisíc. V rámci bloku nemusí být nutně přiděleny všechny dostupné body kódu.
V následující tabulce je uveden seznam 7 plánů kódových bodů přidělených ve standardech ISO / IEC 10646 a Unicode .
Poznámka: Aby byla omezena velikost stránky a usnadněna navigace, má každá stránka rozsah 4096 kódových bodů. navigační paletu v horní části každé stránky můžete použít k přechodu z jednoho rozsahu 4096 kódových bodů do jiného nebo z jednoho plánu do druhého nebo k zobrazení mapy přidělení každého plánu k vyhledání různých zápisů. Kliknutím na název bloku zobrazíte podrobnější informace o bloku obsahující odkazy odkazující na jiné bloky obsahující podobné znaky.Některé z těchto tabulek se mohou na obrazovce zobrazovat špatně, pokud tato písma v počítači nepoužíváte. V tomto případě je možné nahlédnout do těchto tabulek v PDF (například) pomocí odkazů navržených v záhlaví každé ze zobrazených tabulek.
Kódové body U + 0000 až U + FFFF.
Základní vícejazyčný obrys (první, číslovaný 0) je nejpoužívanější, protože obsahuje většinu znaků používaných nejběžnějšími moderními jazyky na světě.
Kódové body U + 10 000 až U + 1FFFF.
Tato doplňková rovina (číslo 1) se používá pro staré znaky skriptu a sady symbolů.
Kódové body U + 20000 až U + 2FFFF.
Tento doplňkový plán (číslo 2) se používá k nezbytnému rozšíření méně obvyklých sinogramů ideografického písma v čínštině, japonštině a korejštině (CJC) a k vietnamskému sinografickému psaní Chữ Nôm .
Kódové body U + 30000 až U + 3FFFF.
Tento doplňkový plán (číslo 3) se používá pro novější rozšíření nezbytná pro méně běžné sinogramy ideografického písma v čínštině, japonštině a korejštině (CJC) a pro vietnamský sinografický nápis Chữ Nôm .
Kódové body U + 40000 až U + DFFFF.
Těchto deset doplňkových plánů (čísla 4 až 13) se dosud nepoužívá.
Kódové body U + E0000 až U + EFFFF.
Tento málo používaný doplňkový plán (číslo 14) obsahuje speciální řídicí znaky.
Tyto dva doplňkové plány (čísla 15 a 16) jsou zcela přiřazeny k soukromému použití podle uvážení uživatele (texty obsahující tyto kódové body jsou platné, ale bez předchozího vzájemného soukromého souhlasu nejsou interoperabilní) a rozšiřují soukromé kódové body základního vícejazyčného plánu .
Další zóna A pro soukromé použitíKódové body U + F0000 až U + FFFFF.
Další zóna B pro soukromé použitíKódové body U + 100 000 až U + 10FFFF.