Úniková sekvence

Termín úniková sekvence (anglická úniková sekvence ) je sekvence několika bajtů nebo znaků přítomných v toku textu a hraje tam, kde je přítomna, určitou roli. Je zaveden kódem poskytnutým pro tento účel, obvykle ovládacím kódem 0x1B ESC (pro únik ).

Dějiny

Pojem únikový kód byl zaveden v Baudotově kódu . Anekdoticky, pokud vezmeme v úvahu, že -jsou 1 s a +0 s, je úniková sekvence Baudotova kódu již hodnotou 0x1B.

8bitový kód DoD obsahoval speciální funkci ve stejných ustanoveních již v roce 1961.

aplikace

Tato technologie se používá v různých kontextech; zejména :

Existuje nejméně 157 různých kódování znaků přístupných únikovou sekvencí.

V jazyce C a C ++ jsou únikové sekvence ASCII :

Tyto sekvence jsou užitečné pro soubor a manipulaci s textem v konzoli ze systému Windows , Linux ,  atd.

Omezení standardu POSIX

POSIX nedefinuje žádný standardní způsob doslovného označování znaků jejich číselným kódem ve znakových sadách delších než 8 bitů (např. Unicode). Mnoho implementací POSIX kompatibilních s Unicode nebo ISO / IEC 10646 také přijímá sekvence (kde NNNN označuje 4 hexadecimální číslice kódového bodu Unicode znaku v základním vícejazyčném plánu) nebo (kde NNNNNNNN označuje 8 číslic šestnáctkovou číslici Unicode pro libovolný znak v sadě). \uNNNN\UNNNNNNNN

Standard také neurčuje, zda znaky určené hexadecimálním kódem označují znaky ve zdrojovém souboru, nebo zda jejich kód vyplývá z překódování vstupní kódované znakové sady do společné sady (například Unicode). Jako interní kódování se téměř vždy používá Unicode nebo základní sada ASCII, ale u systémů kódujících EBCDIC na základě regulárních výrazů POSIX to neplatí vždy .

8bitové znakové sady se navíc mohou značně lišit, zejména v horní zóně (jiné než ASCII) a interpretaci řídicích znaků (v závislosti na použitém systému). Jedná se o problém interoperability, který se nejčastěji řeší použitím, v nástrojích pro zpracování textu, jedné společné interní znakové sady založené na Unicode a překódování vstupní znakové sady do tohoto společného interního kódování.: S tímto systémem mohou regulární výrazy osamostatní se od kódovaných znakových sad použitých v různých dokumentech.

Poznámky a odkazy

  1. 1963 ASCII Standard, §A.8.1 Struktura podmnožiny řízení.
  2. http://alis.isoc.org/codage/registre_ISO.htm
  3. http://fr.cppreference.com/w/cpp/language/escape

Dodatky

Související články

Bibliografie