Normální forma Greibacha

V teoretické informatice , a zejména v teorii formálního jazyka , je algebraická gramatika v Greibachově normální formě (v angličtině, Greibachově normální formě nebo GNF ), pokud správní členové jejích pravidel začínají symbolem terminálu , případně následovaným a nebo více proměnné . Varianta umožňuje dalšímu pravidlu vygenerovat prázdné slovo, pokud je součástí jazyka. Tato normální forma je pojmenována po Sheile Greibachové, která ji představila a prokázala svou existenci.

Existují i jiné normální formy gramatiky, jako je Chomského normální forma , nebo gramatiky bez levé rekurze . Normální forma Greibacha je nejkomplikovanější z těchto normálních forem a byla dále vylepšena.

Popis

Algebraická gramatika je v Greibachově normální formě, pokud jsou všechna její pravidla ve tvaru:

{\ displaystyle A \ až aA_ {1} A_ {2} \ cdots A_ {n}}

nebo

{\ displaystyle S \ to \ varepsilon}

kde je proměnná , je písmeno a je možná prázdná sekvence proměnných; je axiom a ε je prázdné slovo . $NA$ $na$ ${\ displaystyle A_ {1} A_ {2} \ ldots A_ {n}}$ $S$

Gramatika v normální Greibachově podobě je pozoruhodně bez levé rekurze . Hlavní vlastností je, že jakoukoli algebraickou gramatiku lze transformovat do ekvivalentní gramatiky v normální formě Greibacha, teorém založený v roce 1965 Sheilou Greibachovou.

Existuje několik konstrukcí. Pokud neexistuje žádné pravidlo epsilon , je algoritmus jednodušší; v obecném případě dochází k časovým transformacím složitosti a v případě, že gramatika nemá pravidlo jednotky (ve formě proměnné ). ${\ displaystyle S \ to \ varepsilon}$ $O (n ^ 4)$ $O (n ^ {3})$ ${\ displaystyle A \ až B}$ $B$

V normální Greibachově formě derivace generuje v každém kroku derivace písmeno daného jazykového slova: délka derivace se proto rovná délce slova. Normální formu lze použít ekvivalentním způsobem k vytvoření tlačítkového automatu, který přijímá slova jazyka v reálném čase, to znamená čte písmeno vstupního slova v každém kroku výpočtu.

Konstrukce

Konstrukce gramatiky v normální formě Greibacha z algebraické gramatiky dané částí předmětů zpracovaných v mnoha teoretických počítačových učebnicích formálních jazyků, automatů a jejich složitosti. Jedna ze staveb je v několika fázích:

Předběžná fáze: odstranění pravidel epsilon

Můžeme předpokládat, že axiom gramatiky se neobjevuje u pravého člena pravidla.

Pravidlo , kde axiom není, je odstraněno; vezmeme v úvahu každé pravidlo, kde se objeví , a přidáme pro každý výskyt pravidlo do gramatiky, pokud nevytvoříme pravidlo epsilon. Například pokud ${\ displaystyle A \ to \ varepsilon}$ $NA$ ${\ displaystyle B \ až \ alfa}$ $NA$ $\ alfa$ ${\ displaystyle \ alpha = \ beta A \ gamma}$ ${\ displaystyle B \ až \ beta \ gama}$

{\ displaystyle B \ na aAbAc}

přidáme tři pravidla

{\ displaystyle B \ to abAc, B \ to aAbc, B \ to abc}

Pravidlo, jehož pravý člen obsahuje proměnné, které jsou všechny odvozeny od prázdného slova, se tak může vzdát nových pravidel. $ne$ $2 ^ {n}$

Druhá fáze: odstranění pravidel jednoty

Pravidlo jednotka je pravidlo formy , kde je proměnná. Abychom tento typ pravidla vyloučili, nahradíme takové pravidlo pravidlem $A \ až B$ $B$

{\ displaystyle A \ až \ alfa}

pro každé pravidlo

{\ displaystyle B \ až \ alfa}

(pokud se nejedná o dříve odstraněné pravidlo jednotky). Tato technika je dokončena v případě cyklů (například existence tří pravidel ) identifikací proměnných cyklu: všechny jsou nahrazeny jednou z nich. ${\ displaystyle A \ až B, B \ až C, C \ až A}$

Formátování normální

Předpokládáme gramatiku bez pravidel ε a bez pravidel jednotek. Předpokládáme číslované proměnné ; definujeme posloupnost gramatik, kde je počáteční gramatika, s tou vlastností, že se proměnné neobjeví v čele správných členů pravidla. Předpokládáme, že gramatika je konstruována, a postupujeme ve dvou fázích ${\ displaystyle A_ {1}, A_ {2}, \ tečky, A_ {m}}$ ${\ displaystyle G_ {0}, G_ {1}, \ tečky, G_ {n}}$ ${\ displaystyle G_ {0}}$ $G_ {i}$ ${\ displaystyle A_ {1}, \ ldots, A_ {i}}$ ${\ displaystyle G_ {i-1}}$

1. Odstranění levé rekurze pro $Mít}$ : odstraníme záhlaví pravidel z : pravidel $Mít}$ $Mít}$

{\ displaystyle A_ {i} \ rightarrow A_ {i} \ alpha _ {1} \ mid \ ldots \ mid A_ {i} \ alpha _ {n} \ mid \ beta _ {1} \ mid \ ldots \ mid \ beta _ {m}}

kde jsou nezačínají nahrazeny $\ beta _ {j}$ $NA$

{\ displaystyle A_ {i} \ rightarrow \ beta _ {1} A '_ {i} \ mid \ ldots \ mid \ beta _ {m} A' _ {i} \ mid \ beta _ {1} \ mid \ ldots \ mid \ beta _ {m}}

{\ displaystyle A '_ {i} \ rightarrow \ alpha _ {1} A' _ {i} \ mid \ ldots \ mid \ alpha _ {n} A '_ {i} \ mid \ alpha _ {1} \ mid \ ldots \ mid \ alpha _ {n}}

2. Odstranění hlavičkových $Mít}$ výskytů: výskyty proměnných, které se objevují nebo se mohou objevit v hlavičce v pravých členech pravidel, jsou nahrazeny sadou pravidel pro tyto proměnné. ${\ displaystyle A_ {j} (1 \ leq j \ leq i)}$

Pokud na konci zůstanou v pravých členech pravidel jiná než v záhlaví koncová písmena, budou nahrazena další proměnnou , jednou pro každé písmeno , s pravidlem . $Vaše}$ $na$ ${\ displaystyle T_ {a} \ to a}$

Příklad

Zde je příklad z knihy Oliviera Cartona (píšeme místo ): $ABC$ ${\ displaystyle A_ {1}, A_ {2}, A_ {3}}$

Gramatika G 0 :

{\ displaystyle A \ až AB \ mid a}

{\ displaystyle B \ až BC \ střední b}

{\ displaystyle C \ až CA \ mid c}

Obě pravidla jsou nahrazena $NA$

{\ displaystyle A \ do aA '\ mid a, \ quad A' \ do BA '\ mid B}

Získáváme:

Gramatika G 1 :

{\ displaystyle A \ až aA '\ střední a}

{\ displaystyle A '\ do BA' \ střední B}

{\ displaystyle B \ až BC \ střední b}

{\ displaystyle C \ až CA \ mid c}

Obě pravidla jsou nahrazena $B$

{\ Displaystyle B \ až bB '\ mid b, \ quad B' \ až CB '\ mid C}

a výskyty v horní části

B

jsou nahrazena těmito dvěma pravidly. Získáváme:

Gramatika G 2 :

{\ displaystyle A \ až aA '\ střední a}

{\ displaystyle A '\ to bB'A' \ mid bA '\ mid bB' \ mid b}

{\ displaystyle B \ až bB '\ střední b}

{\ displaystyle B '\ do CB' \ střední C}

{\ displaystyle C \ až CA \ mid c}

Podobně jsou dvě pravidla nahrazena, v prvním kroku, $VS$

{\ displaystyle C \ to cC '\ mid c, \ quad C' \ to AC '\ mid A}

ale přední proměnná je nahrazena jejími pravidly, stejně jako přední proměnná . Dostaneme gramatiku: $NA$ $VS$

Gramatika G 3

{\ displaystyle A \ až aA '\ střední a}

{\ displaystyle A '\ to bB'A' \ mid bA '\ mid bB' \ mid b}

{\ displaystyle B \ až bB '\ střední b}

{\ displaystyle B '\ až cC'B' \ střední cB '\ střední cC' \ střední c}

{\ displaystyle C \ až cC '\ střední c}

{\ displaystyle C '\ do aA'C' \ střední aC '\ střední aA' \ střední a}

Jiné běžné formy

Kvadratická normální forma

Gramatika je v Greibachově kvadratické normální formě, pokud jsou všechna její pravidla v podobě

{\ displaystyle A \ až aV}

kde se skládá z nejvýše dvou proměnných, takže pokud navíc mají správní členové pravidel délku nejvýše 3. Výše uvedená gramatika a gramatika: $PROTI$

{\ Displaystyle S \ ASS | b}

jazyk Lukasiewicz jsou v kvadratické formě, gramatiky

{\ displaystyle S \ k aSSS | b}

není. Lze jej transformovat do kvadratické gramatiky seskupením po sobě jdoucích výskytů; zde představíme novou proměnnou a gramatiku nahradíme: $T$

{\ displaystyle S \ k AST | b, \ quad T \ k SS}

Gramatika již není v normální Greibachově formě, ale stejně jako dříve nahradíme přední proměnnou v pravidle pro , což dává , tedy $T$ ${\ displaystyle T \ k aSSSS \ mid bS}$

{\ displaystyle S \ k AST | b, \ quad T \ k aTT \ mid bS}

Bilaterální normální forma

Gramatika je v normální formě oboustranného nebo normální formě duálního z Greibachové-li spustit všechna její pravidla a konec s koncovou dopisem formálně pokud pravidla členů práv ve kterém a je abeceda terminál a non-terminál gramatiky. Gramatika je v bilaterální kvadratické normální formě, pokud jsou v ní praví členové pravidel , takže pokud jsou navíc praví členové pravidel v délce menší nebo rovné 4. Tuto konstrukci představil Günter Hotz. ${\ displaystyle \ Sigma \ cup \ Sigma V ^ {*} \ Sigma}$ $\ Sigma$ $PROTI$ ${\ displaystyle \ Sigma \ cup \ Sigma (\ varepsilon \ cup V \ cup V ^ {2}) \ Sigma}$

Ostatní stavby

Jinou algebraickou konstrukci navrhl Daniel J. Rosenkrantz. Je založen na řešení soustavy rovnic v algebře částí na volném monoidu. Tato metoda vede přímo k kvadratické gramatice, pokud vycházíme z gramatiky v Chomského normální formě . Další konstrukce a zevšeobecnění byly dány různými autory.

Poznámky a odkazy

Hopcroft a Ullman 1979 , str. 95.
(in) Sheila A. Greibach , „ The New Normal-Form Theorem for Context-Free Grammars Sentence Structure “ , Journal of ACM , vol. 12, n o 1,Leden 1965, str. 42–52 ( DOI 10.1145 / 321250.321254 ).
(in) Norbert Blum a Robert Koch , „ Greibach Normal Form Transformation Revisited “ , Information & Computation , sv. 150, n o 1, 1999, str. 112–118 ( DOI 10.1006 / inco.1998.2772 , číst online ).
Představujeme, co se týče konstrukce Chomského normální formy , novou proměnnou, která se stává axiomem, a jediné další pravidlo , kde je starý axiom. $S_0$ ${\ displaystyle S_ {0} \ to S}$ $S$
Hopcroft, Motwani a Ullman 2007 , s. 268.
Carton 2008 .
Günter Hotz, „ Normální tvarové transformace bezkontextových gramatik “, Acta Cybernetica , roč. 4, n o 1, 1978, str. 65-84.
(in) Joost Engelfriet , „ Elementární důkaz dvojí normální formy Greibacha “ , Information Processing Letters , sv. 44, n O 6, 1992, str. 291–293 ( DOI 10.1016 / 0020-0190 (92) 90101-Z ).
Daniel J. Rosenkrantz, „ Maticové rovnice a normální tvary pro bezkontextové gramatiky “, Journal of ACM , sv. 14, N O 3, července 1967, str. 501–507.
(in) Ryo Yoshinaka , „ Elementární důkaz zobecnění pravidelné dvojité Greibachovy formy “ , Information Processing Letters , sv. 109, n o 10,2009, str. 490–492 ( DOI 10.1016 / j.ipl.2009.01.015 ).

Bibliografie

Manuály

Olivier Carton, Formální jazyky, vyčíslitelnost a složitost: bakalářský a magisterský titul z matematiky nebo informatiky, výpočetní technika možnost agregace matematiky , Paříž, Vuibert,2008, 237 s. ( ISBN 978-2-7117-2077-4 , číst online ) - Oddíl 2.5 Normální forma Greibach.
John E. Hopcroft a Jeffrey D. Ullman , Úvod do teorie automatů, jazyky a výpočty , Addison-Wesley,1979
(en) John E. Hopcroft , Rajeev Motwani a Jeffrey D. Ullman , Úvod do teorie automatů, jazyků a výpočtů , Addison-Wesley ,2007, 3 e ed. ( ISBN 978-0-32146225-1 )
(en) John E. Hopcroft, Rajeev Motwani a Jeffrey D. Ullman, Úvod do teorie automatů, jazyků a výpočtů , Pearson Addison Wesley,2007, 3 e ed. , xvii + 535 str. ( ISBN 978-0-321-45536-9 a 0-321-45536-3 ) - strana 277.
(en) Peter Linz, Úvod do formálních jazyků a automatů , Jones & Bartlett Learning,2001, 410 str. ( ISBN 978-0-7637-1422-2 a 0763714224 , číst online ).
(de) Katrin Erk a Lutz Priese, Theoretische Informatik: eine umfassende Einführung , Berlin, Springer,2008, 485 s. ( ISBN 978-3-540-76319-2 , OCLC 244015158 ) - 6.8.1 6.3 Chomsky- und Greibach-Normalform str. 121 .
(en) Michael A. Harrison, Úvod do teorie formálního jazyka , čtení, mše sv. ua, Addison-Wesley,1978, 594 s. ( ISBN 0-201-02955-3 , OCLC 266962302 ) - Oddíl 4.6 Greibachova normální forma, s. 111-120 .

Třídy

Arthur Milchior, " Normální forma Greibacha " , Kurzy psaní ENS (Olivier Carton) ,19. prosince 2008.
Jacques Désarménien, „ Kapitola 4.4 Normální forma Greibacha “ , Cours automatizuje , Université Paris-Est Marne-la-Vallée .
Sandrine Julia, „ Course 7 - Grammaires out of context (pokračování) “ , Automates & Langages , University of Nice - Sophia Antipolis .

Podívejte se také