Přirozený jazyk

Přirozený jazyk , nebo obyčejný jazyk , je „normální“ jazyk mluvený lidské bytosti. Je proti formálnímu jazyku , jako je počítačový jazyk , a také proti kreativnímu jazyku Z konstruovaných jazyků .

Dějiny

Pojmem přirozený jazyk označujeme jazyk, kterým mluví lidé a který se objevil mezi 200 000 a 50 000 lety před naším letopočtem. Je to podrobně popsáno v historii jazyků . Po 2 milionech let těhotenství Homo erectus , který převzal od Homo habilis , se moderní člověk, zvaný Homo sapiens , objevil spojením mnoha faktorů:

Existují dva scénáře vzhledu Homo sapiens :  scénář „  Mimo Afriku “ a scénář pluri-dostředivý (polygeneze). Nedávný výzkum v paleo-lingvistice identifikoval na počátku XXI .  Století základnu 27 slov, běžných v kořenech všech psaných pozemských jazyků, což prosazuje upřednostňování scénáře „  Out of Africa  “ (monogeneze). Několik zdrojů by ve skutečnosti nemělo důvod k přijetí stejného výchozího jazyka.

Následně se Homo sapiens vnutil do lidského druhu, buď kvůli produktivistické hypotéze, nebo kvůli sociologické hypotéze.

Po přibližně 7000 let získal tento jazyk písemnou formu v mnoha jazycích, které se poté prosadily jako dominantní. Hlavně kvůli tomu dnes hrozí vyhynutí 6000 jazyků.

Počítačové jazyky

V informatice je přirozený jazyk na rozdíl od počítačového jazyka  :

Výzvou pro vydavatele vyhledávačů je schopnost poskytnout relevantní výsledky dotazu formulovanému v přirozeném jazyce.

Alan Turing , britský matematik první poloviny XX th  století se také domníval, že umělá inteligence mohl tak dobře působí dojmem „mluvení“, že by bylo obtížné rozeznat člověka. Testy umělé inteligence, které mají schopnost napodobovat lidskou konverzaci, se nazývají Turingovy testy.

Konzistence přirozeného jazyka

Pokud je konzistence textu vlastností textu, který nevyžaduje dedukci k přechodu z jednoho dokumentárního prvku na další, použijeme příklad Floriana Wolfa et al. pro ilustraci této vlastnosti:

Závěr, který je třeba učinit, aby bylo možné porozumět textu, je zde triviální, respektující zásadu relevance při přenosu informací. Jsou progresivní. Vypuštění rakety vyžaduje dobré počasí a odpalovací zařízení Ariane může vypustit dva satelity. Stále musíme charakterizovat tyto závěry: „počasí bylo dobré, a proto“ první závěr je výslovný, a „spouštěč Ariane [...] umístil na oběžnou dráhu dva satelity“ druhý závěr výslovně uvádí. Není známo, zda může odpalovací program vypustit čtyři satelity, ale o to nejde. Musíme si uvědomit potřebu všech slov v tomto textu.

Kromě toho je respektován postup: mluvíme o počasí, pak o odpálení rakety a nakonec o tom, co je vypuštěno.

Odstraňte z tohoto textu přídavné jméno mezery připojené ke středu podstatného jména a my už nevíme, jak ospravedlnit jeho konzistenci. Potom musíme učinit méně explicitní závěr: centrum Kourou je prostorové centrum. Abychom to mohli udělat, musíme se podívat na teorii pragmatiky, abychom mohli posoudit cenu této inference. Je třeba poznamenat, že zásada relevance se silně vyvíjí, ať už jsme v psaném jazyce, kde je předem stanovený slabý, nebo v jazyce ústním, kde je předem stanovený důležitý, protože autor zná část znalostí svého posluchače.

Je třeba si uvědomit, že mnoho textů tuto vlastnost nesplňuje: proto Michel Charolles věnuje mnoho dokumentů soupisu těchto nejednoznačných situací v textech:

Tyto příklady zdůrazňují pojem hloubky implicitního zacházení, který tyto texty vyžadují, aby bylo dosaženo konzistence.

Lexikální aspekty

Typografická shoda bude definována jako vlastnost textů respektovat pravopis a typografii písemně. Pokud je přijatelné se domnívat, že „Lift-Gate“ představuje pojmenovanou entitu a že „lift-gate“ je běžný název, doslovný překlad slova „Lift-Gate“ do pojmenované entity přináší zbytečný šum v sémantickém zpracování ... Je žádoucí filtrovat tyto projevy v morfologické léčbě.

Lexikální konformita spočívá ve výběru správného výrazu pro koncept: „Tailgate“ je tedy výslovné složené slovo, přičemž „ocasní brána“ je ve francouzštině přeložena „ocasními dveřmi“, i když ve francouzštině je tento výraz nadbytečný, protože dost.

Použití slovníku je uspokojivé, pokud člověk nehledá pouze slova, se kterými se setkal, ale i ty části slov (lexémy), která pravděpodobně tvoří slova.

Proto byla v prvních dvou dokumentech korpusu uložena volba nahradit „decklid“ výrazem „boot boot“, což znamená „víko kufru“. Tento typ chyby označíme lexikální chybou vzniklou z analýzy složených slov.

Kromě toho se musíme obrátit k řešení nejasností výrazů. Neměli bychom se zastavit u kořenových lemmat složených slov.

Obecné aspekty

Stylistické vlastnosti, které přispívají k lepší soudržnosti. Generické dokumenty těží z toho, že jsou psány v současné generice tím, že co nejvíce standardizují negativní formy. Požadavek tedy přijímá aktivní formu a je psán v současné generice a pro uspokojení potřeby postačuje transformace pasivních forem na aktivní formy. Může být také užitečné použít transformaci ke zpracování negativních textů.

Diskurzivní aspekty

Vlastnosti dokumentů jsou kvalifikovány zejména s ohledem na složky jádra koherence:

Poznámky a odkazy

Poznámky

  1. Viz o tomto tématu výzkum genetiků v Institutu Maxe Plancka . V červenci 2006 Ústav a 454 věd o životě oznámily, že provádějí sekvenování genomu neandertálců. Neandertálský genom, který se skládá ze tří miliard párů bází, má velikost lidského genomu a pravděpodobně má mnoho identických genů. Předpokládá se, že srovnání genomu neandertálců a lidského genomu poskytne pohled na tento vyhynulý druh, stejně jako na vývoj člověka a lidského mozku. Max-Planckův institut pro evoluční antropologii .
  2. Tyto oblasti byly identifikovány na konci XIX th  století a nebyly předloženy žádné důkazy o aktivaci těchto oblastí je uveden na jiné druhy Homo , že Homo sapiens
  3. http://www.tlfq.ulaval.ca/axl/monde/ origin- langues.htm
  4. Posílení koherence specifikačních dokumentů z automobilového průmyslu, Jean Noël Martin 2012, Braga Portugal slate 2012 - červen 2012 http://drops.dagstuhl.de/portals/oasics/index.php?semnr=12004

Reference

  1. Cécile Lestienne, Ghislain Dehanne, Laurent Sagart, Pascal Picq, Nejkrásnější historie jazyka , Seuil, 2008.
  2. (in) Alec MacAndrew, FOXP2 a vývoj jazyka .
  3. Jean-Pierre Changeux, The Neuronal Man , Fayard, Paříž, 1983.
  4. Jean-Pierre Changeux, Vlastnost neurálních množin v Teorie jazyka a teorie učení , Édition du threshold, Paříž, 1979.
  5. Joseph Donato, Lingvistická variace v lingvistice pod vedením Fréderic François, PUF, 1980.
  6. Fabien Wolf a Edward Gibson, Koherence v přirozeném jazyce , Massachusetts Institute of Technology , 2006.
  7. Michel Charolles, Koherence, relevance a koncepční integrace , University of Paris III, 2002.

Bibliografie

Odkazy jsou mimo jiné z knihy Aux Origines des Langues et du Langue, vydané Jean-Marie Hombert, Fayard , 2005

  1. Jean-Jacques Hubelin, Jazyk prvních mužů .
  2. Philippe Vernier, Vývoj mozku a vznik jazyka .
  3. Christophe Coupé, Hledání stop do artikulovaného jazyka .
  4. Christophe Coupé, Nemožné pátrání po mateřském jazyce .
  5. Bernard Victorri, Tajemství vzniku jazyka .

Podívejte se také

Související články