Tabulka znaků Unicode

Tabulky Unicode (plán 0) Klíčové údaje

0000 - 0FFF	8000 - 8FFF
1000 - 1FFF	9000 - 9FFF
2000 - 2FFF	A000 - AFFF
3000 - 3FFF	B000 - BFFF
4000 - 4FFF	C000 - CFFF
5 000 - 5FFF	D000 - DFFF
6000 - 6FFF	E000 - EFFF
7000 - 7FFF	F000 - FFFF

Další plány Unicode

0000 - FFFF	plán 0 (PMB / BMP )
10 000 - 1FFFF	plán 1 (PMC / SMP )
20 000 - 2FFFF	plán 2 (PSC / SIP )
30 000 - 3FFFF	plán 3 (PST / TIP )
40 000 - DFFFF	záběry 4–13 (vyhrazeno)
E0000 - EFFFF	plán 14 (PCS / SSP )
F0000 - FFFFF	plán 15 (soukromý A)
100 000 - 10FFFF	plán 16 (soukromý B)

Unicode je standard počítač vyvinutý konsorciem Unicode , která si klade za cíl poskytnout každý znak každého systému psaní z jazyka jedinečný číselný identifikátor a jednotně, nezávisle na platformě počítače nebo softwaru .

Unicode a norma ISO / IEC 10646 dávají každému znaku oficiální název v rámci společného jednotného repertoáru mezi všemi jazyky a všemi způsoby použití. Jakmile je společný repertoár schválen, jsou znaky seskupeny do bloků podle jejich použití a přijatých skriptů a je jim dána jedinečná číselná identifikace, která se nazývá kódový bod , obvykle označovaná jako „U + ....“ (kde „... . "představuje šestnáctkové číslo o 4 až 6 číslicích mezi U + 0000 a U + 10FFFF). Definovaný rozsah umožňuje přiřadit až 1 114 112 kódových bodů.

Lokalizace znaků rovinou a blokem

Celkový kódovací prostor je rozdělen do 17 letadel, z nichž každé obsahuje 65 536 kódových bodů. V každém ze 17 letadel jsou poslední dva body kódu přiděleny a vyhrazeny pro interní speciální funkce, nikoli pro znaky, a neměly by být použity pro kódování textu.

Každý plán je rozdělen do bloků. Bloky seskupují znaky podle kritérií logického členství ve skupině znaků, a proto nemají pevnou velikost. Jejich velikost se může pohybovat od několika kódových bodů po několik tisíc. V rámci bloku nemusí být nutně přiděleny všechny dostupné body kódu.

Tabulky rovinných bodů kódu Unicode

V následující tabulce je uveden seznam 7 plánů kódových bodů přidělených ve standardech ISO / IEC 10646 a Unicode .

Poznámka: Aby byla omezena velikost stránky a usnadněna navigace, má každá stránka rozsah 4096 kódových bodů. navigační paletu v horní části každé stránky můžete použít k přechodu z jednoho rozsahu 4096 kódových bodů do jiného nebo z jednoho plánu do druhého nebo k zobrazení mapy přidělení každého plánu k vyhledání různých zápisů. Kliknutím na název bloku zobrazíte podrobnější informace o bloku obsahující odkazy odkazující na jiné bloky obsahující podobné znaky.

Některé z těchto tabulek se mohou na obrazovce zobrazovat špatně, pokud tato písma v počítači nepoužíváte. V tomto případě je možné nahlédnout do těchto tabulek v PDF (například) pomocí odkazů navržených v záhlaví každé ze zobrazených tabulek.

Základní vícejazyčný plán (PMB / BMP )

Kódové body U + 0000 až U + FFFF.

Základní vícejazyčný obrys (první, číslovaný 0) je nejpoužívanější, protože obsahuje většinu znaků používaných nejběžnějšími moderními jazyky na světě.

Doplňkový vícejazyčný plán (PMC / SMP )

Kódové body U + 10 000 až U + 1FFFF.

Tato doplňková rovina (číslo 1) se používá pro staré znaky skriptu a sady symbolů.

Doplňkový sinografický plán (PSC / SIP )

Kódové body U + 20000 až U + 2FFFF.

Tento doplňkový plán (číslo 2) se používá k nezbytnému rozšíření méně obvyklých sinogramů ideografického písma v čínštině, japonštině a korejštině (CJC) a k vietnamskému sinografickému psaní Chữ Nôm .

Ternární sinografický plán (PST / TIP )

Kódové body U + 30000 až U + 3FFFF.

Tento doplňkový plán (číslo 3) se používá pro novější rozšíření nezbytná pro méně běžné sinogramy ideografického písma v čínštině, japonštině a korejštině (CJC) a pro vietnamský sinografický nápis Chữ Nôm .

Další plány vyhrazeny

Kódové body U + 40000 až U + DFFFF.

Těchto deset doplňkových plánů (čísla 4 až 13) se dosud nepoužívá.

Specializovaný doplňkový plán (PCS / SSP )

Kódové body U + E0000 až U + EFFFF.

Tento málo používaný doplňkový plán (číslo 14) obsahuje speciální řídicí znaky.

Další plány pro soukromé použití

Tyto dva doplňkové plány (čísla 15 a 16) jsou zcela přiřazeny k soukromému použití podle uvážení uživatele (texty obsahující tyto kódové body jsou platné, ale bez předchozího vzájemného soukromého souhlasu nejsou interoperabilní) a rozšiřují soukromé kódové body základního vícejazyčného plánu .

Další zóna A pro soukromé použití

Kódové body U + F0000 až U + FFFFF.

Další zóna B pro soukromé použití

Kódové body U + 100 000 až U + 10FFFF.

Podívejte se také

Související články

Unicode , ISO / IEC 10646
Řídicí znaky Unicode
UTF-8 , UTF-16 , UTF-32
Nápověda: Speciální znaky
Nápověda: Unicode
Wikipedia: Unicode / Test

externí odkazy

Na oficiálním webu Unicode:
- (en) Tabulky znaků Unicode psaním (nejnovější standardizovaná verze 5.0).
- (en) Tabulky znakových kódů Unicode podle skriptů (nejnovější standardizovaná verze 6.0).
- (en) Unicode 6.1 BETA Charts (veřejná beta verze ).
- (en) Plány k Unicode (podporované zápisy nebo v procesu standardizace).
(fr) Unicode a ISO / IEC 10646 .
Standardy volně ke stažení z webu ISO (standards.iso.org) - vyžaduje předchozí souhlas s navrhovanou licencí:
- (fr) ISO / CEI 10646: 2003 (francouzská verze ve formátu zip obsahující HTML a textové soubory)
- (en) ISO / IEC 10646: 2003 (anglická verze ve formátu zip obsahující HTML a textové soubory)