Automatický překlad

Automatický překlad vztahuje k překladu brutální textu vyrobené výhradně jedním nebo více počítačových programů . V případě překladu zvukové konverzace, živé nebo zaznamenané, mluvíme o automatickém přepisu . Lidský překladatel nezasahuje do opravy chyb textu během překladu, ale pouze před a / nebo po. Liší se od počítačově podporovaného překladu, kde je překlad částečně manuální, případně interaktivně se strojem.

Přes své slabosti může poskytovat služby v oblastech, jako je mezinárodní sledování (včetně sledování technologií ), kde umožňuje povrchní, ale rychlou znalost velkého množství textů.

Od přelomu století zaznamenal strojový překlad na webu značný růst a několik online systémů dokázalo automaticky překládat stále delší webové stránky nebo texty během několika sekund. Je to velmi oceňovaná pomoc široké veřejnosti, protože umožňuje hrubým způsobem rozluštit téma webové stránky ve zcela neznámém jazyce a hlavní fakta či informace, které obsahuje. Pro zjednodušení navigace několik vyhledávačů, jako je Google , Altavista nebo Yahoo! umožnit jeho systematické používání.

Historie a vývoj

Konec Října 2005, tisk ohlašuje významná vylepšení. Mezinárodní centrum pro pokročilé komunikační technologie, které společně provozují Carnegie-Mellon University v Pittsburghu a University of Karlsruhe v Německu, představuje počítačový systém pro okamžitý překlad. Čínský student, vyzdobený jedenácti elektrodami na obličeji a krku, přednese projev ve svém vlastním jazyce, který je současně přeložen do angličtiny a španělštiny. Vědci dospěli k závěru, že „výsledky nejsou dokonalé“ a že „někdy mohou být potíže“. Žádný článek ve skutečnosti nenaznačuje, že by němečtí a američtí novináři mohli se studentem diskutovat. Novináři obecně opomínají upřesnit, že když doktor Waibel oznámí, že se bude ptát německých a amerických novinářů, počítač uslyší něco jako: „Takže my glykogen střídáme otázky mezi Německem a Amerikou. Tento typ okamžitého překladu stále postrádá softwarová vylepšení týkající se rozpoznávání řeči , zejména zakódovaná okolním hlukem a špatnou výslovností.

V roce 2018 se počítačovému nástroji založenému na umělé inteligenci podařilo přeložit za dvanáct hodin knihu s 800 stránkami textu , grafiky a matematických vzorců napsanou v LaTeXu . Tento nástroj vyvinutý společností Quantmetry, mladou poradenskou firmou pro umělou inteligenci pro podniky, spojenou se čtyřmi francouzskými vědci specializujícími se na hluboké učení a z ENSAI , INRIA a University of Caen , je založen na strojové překladové službě DeepL .

Metoda Deep Learning a postup strojového překladu inspirovaný způsobem, jakým funguje lidský mozek, je založen na neurálním strojovém překladu, běžně nazývaném NMT v angličtině „ Neural Machine Translation “.

V roce 2019 je jednou z předních služeb v doméně DeepL od Linguee, ale tuto službu by mohly předjet další pokroky od Google.

V roce 2010 se společnost Pangeanic stala první společností na světě, která použila statistický překladač Mojžíše v komerčním prostředí, a to ve spolupráci s Instituto Técnico de Informática de Valencia (ITI) a výzkumnou platformou pro vývoj samoučícího se, čištění a recyklace korpusu. skupina Uznávání forem a technologií lidského jazyka Politècnica de València. Zakládající člen Taus, Pangeanic získal největší zakázku na infrastrukturu strojového překladu pro Evropskou komisi s IADAATPA projektem v roce 2017. Od roku 2019, Pangeanic byl vedoucí NTEU.eu , CEF projekt Evropské komise. NTEU je největší farmou pro strojové překlady založené na neuronových sítích pro evropské veřejné správy.

Od roku 2020 Google zpřístupňuje automatický překlad řeči nebo ústní konverzace z mobilních telefonů.


Strojový překlad a strojový přepis

Strojový překlad se liší od strojového přepisu v tom, že strojový překlad je překlad - z písemného na písemný - zatímco přepis se aplikuje na řeč a lze jej nabídnout písemně.

Například Překladatelské středisko pro orgány EU nabízí svým uživatelům oba typy služeb, které jim umožní rychle a levně získat text, který lze použít, aniž by byl přesně správný.

První indický distributor filmů - původně VHS - s několika stovkami milionů registrovaných uživatelů, který je známý svými filmovými trháky, má ve svém katalogu všech 12 000 produktů s podtitulem - automaticky přepsaných - službou Google, aby byly dostupné v arabštině. Tento automatický přepis snižuje náklady o 25% a zpoždění o dva dny. Vede také k chybám, které vyžadují opravu, když jsou detekovány nebo identifikovány.

Proces překladu

Proces překladu (v lidském smyslu) lze rozdělit do tří po sobě následujících fází:

  1. porozumění: asimilace významu sdělovaného textem, významu autora ...;
  2. deverbalizace: zapomínání slov a zachování významu; „Operace, při níž subjekt stává vědomi o významu části zprávy tím, že ztratí vědomí slov a vět, které mu dali tělo“;
  3. re-výraz: přeformulování významu v cílovém jazyce.

Z výpočetního hlediska se porozumění stává analýzou , deverbalizace přenosem a reexprese generací . Tyto fáze procesu jsou modelovány Vauquoisovým trojúhelníkem. Tento model je užitečný, protože k přechodu od zdroje k cíli existuje několik možných cest, které tvoří různé dosud zvažované přístupy. Čím vyšší je stupeň konceptualizace, tím kratší je cesta přenosu. Existují čtyři hlavní možnosti:

V současné době jsou překladače založeny hlavně na pravidlech nebo statistikách. Objevuje se takzvaná hybridní cesta. Systran , Google Translate , Reverso a Microsoft Translation používají hybridní přístupy.

Předpoklady

Nezbytné předpoklady závisí na předpokládaném přístupu: překlad založený na pravidlech (doslovně, přenos, pivot), překlad příkladem, statistický překlad.

Strojový překlad podle pravidel vyžaduje:

Překlad podle příkladu a statistický překlad vyžadují:

Kromě toho můžeme potřebovat nástroje jazykové analýzy, jako například:

Přístupy

Pro strojový překlad lze zvážit několik přístupů.

  1. doslovný překlad zdrojového textu do cílového textu
  2. přeformulování přeloženého slovosledu v cílovém textu
  3. doslovný překlad textu z fotografie
  1. konstrukce mezijazykové reprezentace zdrojového textu
  2. konstrukce cílového textu reprezentací
  1. lexikální a syntaktická analýza zdrojového textu
  2. přenos přeložených lemmat a struktur do cílového jazyka
  1. Automatická korekce zdrojového textu
  2. Léčba idiomů
    1. Detekce idiomů zdrojového jazyka ve zdrojovém textu
    2. Tlumočení cílového jazyka
    3. Překlad slovo za slovem ve zdrojovém jazyce
    4. Nahrazení ve zdrojovém textu
  3. Detekce pro tlumočení (zdrojový jazyk → cílový jazyk a překlad doslovně → zdrojový jazyk) a nahrazení pouze vlastních jmen ve zdrojovém textu
  4. Syntaktická reorganizace ve zdrojovém textu
  5. Překlad zdrojového textu od slova do slova

Proslulost

Používání strojového překladu se stalo běžným pro určité burzy a v určitých odborných kruzích.

Například přes rizika a při absenci kompetentních odborníků by se nemocnice a kliniky ve Spojených státech mohly uchýlit k strojovému překladu.

90% textů přeložených Generálním ředitelstvím pro překlady (DG TRAD) je předem přeloženo strojovým překladem.

Kvalita překladu

Strojový překlad, hrubý, není dokonalý a ve výsledku lze najít některé chyby, například použití jednoho slova místo druhého. Je proto nutné jej přepracovat, aby se vyloučily chyby.

Příklad chyby, kdy je slovo úsudek přeloženo slovem dekret:

„  S odkazem na dekret vydaný v tomto případě dne 31. ledna 2019, kterým byla prohlášena slavnostně slavnostně uzavřená svatba 1. července 2013. ( „ S odkazem na dekret v tomto případě 31. ledna 2019, kterým bylo rozhodnuto, že manželství bude slaven 1. července 2013 „  v angličtině )“

- Právní překlad versus strojový překlad

Když kvantita a cena mají přednost před kvalitou, je strojový překlad privilegován a profesionální překladatel je nucen ospravedlnit svou přidanou hodnotu.

Měření kvality

Metriky měření kvality se používají k tomu, aby bylo možné automatizovat měření kvality strojového překladu. Některé známé metriky jsou MODRÁ , ČERVENÁ, NIST a METEOR.

Hodnocení člověka

Strojový překlad může také podléhat lidské klasifikaci:

Rizika

Tento typ služby může představovat rizika v oblasti soukromí a rizika vyvolání rasistických nebo sexistických předsudků.

Zneužití může vést k dalším rizikům v závislosti na použití, takže podle Daily Telegraph byl polský zaměstnanec vážně zraněn po dodržení bezpečnostních pokynů, které Google na žádost zaměstnavatele poskytl nesprávný nebo chybný překlad - Parker's Nurseries -

Víš jak

Znalost používání strojového překladu s potřebným odstupem času se nazývá „Machine Translation Literacy“.

Aplikace

Aktuální překladová zařízení jsou užitečná pro omezené situace, jako je rezervace pokoje v hotelu. „Pokud půjdu do Pekingu, mohu bez problémů zůstat v Hiltonu,“ řekl Stephan Vogel, výzkumník Carnegie Mellon.

online služby

Vzhled online služeb se snadno používá: spočívá v otevření služby, automatickém kopírování textu, který má být přeložen, výběru původního jazyka a cílového jazyka a poté v žádosti o překlad.

Zdarma online překladatelé  :

Umožňují překládat slova nebo texty omezené velikosti. Jedná se například o:


Svobodný software  :

Vývojová prostředí  :

Budoucí

Různé projekty se snaží zlepšit výkon a rychlost překladačů (včetně Googlu ) a doufají, že jednoho dne budou schopny překonat „jazykovou bariéru“ a překládat v reálném čase (jak si představovalo mnoho autorů vědy - fikce ) a cizí jazyk, nebo dokonce schopnost „komunikovat“ s určitými zvířaty pomocí softwaru pro zpracování hlasu.

Poznámky a odkazy

  1. Laurence Danlos. Profesor počítačové lingvistiky na univerzitě v Paříži 7 píše v počítačové lingvistice, automatický překlad  : „Často vytvářejí chybné překlady, které však lze alespoň použít k určení toho, o co v textu jde (což je důležité například v technologických hodinkách) .). "
  2. „  Nové překladové systémy k překonání jazykové bariéry  “ , na www.rtflash.fr ,18. října 2018(zpřístupněno 14. října 2018 )
  3. Ange-Gabriel C., „  Stroj na simultánní překlad  “ , na generation-nt.com ,31. října 2005(zpřístupněno 14. října 2018 )
  4. Laure Beaudonnet, „  „ Hluboké učení “: Člověk pořizuje svůj první velký výprask strojem z hlediska překladu  “ , na www.20minutes.fr ,10. října 2018(zpřístupněno 14. října 2018 )
  5. „  Automatický překlad vyžaduje obrovské kroky  “ , na lesechos.fr (přístup 4. března 2019 )
  6. https://www.letemps.ch/economie/traduction-deepl-meilleur-google-innovera-bientot
  7. https://www.science-et-vie.com/science-et-culture/traduction-automatique-la-barriere-de-la-langue-est-en-train-de-tomber-58230
  8. https://www.cdt.europa.eu/fr/news/nouveaux-services-partir-de-janvier-2021-transcription-automatique-traduction-automatique-paste
  9. Cheeni Kum , Šťastný Bhag Jayegi , Manmarziyaan , Bajirao Mastani , Tanu Weds Manu vrací , Goliyon ki raasleela Ram-Leela , Rockstar , Shubh Mangal Savdhan , Vicky dárce , Mukkabaaz , Munna Michael , Ki a Ka , anglicky Vinglish , Sellag Virat, Zind Hain, Maine Pyaar Kiya a Padosan
  10. https://www.moneycontrol.com/news/trends/entertainment/changing-script-ai-not-humans-to-write-subtitles-for-movies-soaps-6632641.html
  11. Překlad: návod k použití, Analytický glosář , J. DEMANUELLI & C. DEMANUELLI, strana 51
  12. V návaznosti na práci Vauquoise a Boiteta (Bernard Vauquois, Christian Boitet: Automatizovaný překlad na univerzitě v Grenoblu. Computational Linguistics 11 (1): 28-36 (1985))
  13. Philipp Koehn: Statistický strojový překlad. Cambridge University Press, 2010.
  14. (in) Eugene Seo Il-Sun Song, Su-Kyung Kim a Jin-Ho Choi. 2009. Syntaktický a sémantický anglicko-korejský strojový překlad pomocí ontologie. In Proceedings of the 11th international conference on Advanced Communication Technology - Volume 3 (ICACT'09), Vol. 3. IEEE Press, Piscataway, NJ, USA, 2129-2132.
  15. Roland Raoul KOUASSI, University of Cocody, Problematika strojového překladu ,17. listopadu 2009, 30  str. ( číst online )
  16. M. Constant, Kurz strojového překladu , University of Paris-Est Marne-la-Vallée,5. října 2009, 32  s.
  17. Právní překlad versus strojový překlad
  18. https://www.presse-citron.net/google-traduction-est-toujours-un-risque-pour-la-medecine/
  19. Výroční zpráva o činnosti za rok 2015, GŘ pro překlady, D (2016) 3325
  20. https://www.erudit.org/fr/revues/meta/2018-v63-n3-meta04634/1060173ar/
  21. https://www.erudit.org/fr/revues/meta/2018-v63-n3-meta04634/1060173ar/
  22. https://www.erudit.org/fr/revues/meta/2018-v63-n3-meta04634/1060173ar/
  23. https://www.noslangues-ourlanguages.gc.ca/fr/blogue-blog/traduction-automatique-machine-translation-fra
  24. Daily Telegraph, únor 2013
  25. https://www.noslangues-ourlanguages.gc.ca/fr/blogue-blog/traduction-automatique-machine-translation-fra
  26. popis eseje na C&C iEXPO 09 , článek akihabaranews .

Podívejte se také

Související články

Bibliografie

externí odkazy