Automatický překlad vztahuje k překladu brutální textu vyrobené výhradně jedním nebo více počítačových programů . V případě překladu zvukové konverzace, živé nebo zaznamenané, mluvíme o automatickém přepisu . Lidský překladatel nezasahuje do opravy chyb textu během překladu, ale pouze před a / nebo po. Liší se od počítačově podporovaného překladu, kde je překlad částečně manuální, případně interaktivně se strojem.
Přes své slabosti může poskytovat služby v oblastech, jako je mezinárodní sledování (včetně sledování technologií ), kde umožňuje povrchní, ale rychlou znalost velkého množství textů.
Od přelomu století zaznamenal strojový překlad na webu značný růst a několik online systémů dokázalo automaticky překládat stále delší webové stránky nebo texty během několika sekund. Je to velmi oceňovaná pomoc široké veřejnosti, protože umožňuje hrubým způsobem rozluštit téma webové stránky ve zcela neznámém jazyce a hlavní fakta či informace, které obsahuje. Pro zjednodušení navigace několik vyhledávačů, jako je Google , Altavista nebo Yahoo! umožnit jeho systematické používání.
Konec Října 2005, tisk ohlašuje významná vylepšení. Mezinárodní centrum pro pokročilé komunikační technologie, které společně provozují Carnegie-Mellon University v Pittsburghu a University of Karlsruhe v Německu, představuje počítačový systém pro okamžitý překlad. Čínský student, vyzdobený jedenácti elektrodami na obličeji a krku, přednese projev ve svém vlastním jazyce, který je současně přeložen do angličtiny a španělštiny. Vědci dospěli k závěru, že „výsledky nejsou dokonalé“ a že „někdy mohou být potíže“. Žádný článek ve skutečnosti nenaznačuje, že by němečtí a američtí novináři mohli se studentem diskutovat. Novináři obecně opomínají upřesnit, že když doktor Waibel oznámí, že se bude ptát německých a amerických novinářů, počítač uslyší něco jako: „Takže my glykogen střídáme otázky mezi Německem a Amerikou. Tento typ okamžitého překladu stále postrádá softwarová vylepšení týkající se rozpoznávání řeči , zejména zakódovaná okolním hlukem a špatnou výslovností.
V roce 2018 se počítačovému nástroji založenému na umělé inteligenci podařilo přeložit za dvanáct hodin knihu s 800 stránkami textu , grafiky a matematických vzorců napsanou v LaTeXu . Tento nástroj vyvinutý společností Quantmetry, mladou poradenskou firmou pro umělou inteligenci pro podniky, spojenou se čtyřmi francouzskými vědci specializujícími se na hluboké učení a z ENSAI , INRIA a University of Caen , je založen na strojové překladové službě DeepL .
Metoda Deep Learning a postup strojového překladu inspirovaný způsobem, jakým funguje lidský mozek, je založen na neurálním strojovém překladu, běžně nazývaném NMT v angličtině „ Neural Machine Translation “.
V roce 2019 je jednou z předních služeb v doméně DeepL od Linguee, ale tuto službu by mohly předjet další pokroky od Google.
V roce 2010 se společnost Pangeanic stala první společností na světě, která použila statistický překladač Mojžíše v komerčním prostředí, a to ve spolupráci s Instituto Técnico de Informática de Valencia (ITI) a výzkumnou platformou pro vývoj samoučícího se, čištění a recyklace korpusu. skupina Uznávání forem a technologií lidského jazyka Politècnica de València. Zakládající člen Taus, Pangeanic získal největší zakázku na infrastrukturu strojového překladu pro Evropskou komisi s IADAATPA projektem v roce 2017. Od roku 2019, Pangeanic byl vedoucí NTEU.eu , CEF projekt Evropské komise. NTEU je největší farmou pro strojové překlady založené na neuronových sítích pro evropské veřejné správy.
Od roku 2020 Google zpřístupňuje automatický překlad řeči nebo ústní konverzace z mobilních telefonů.
Strojový překlad se liší od strojového přepisu v tom, že strojový překlad je překlad - z písemného na písemný - zatímco přepis se aplikuje na řeč a lze jej nabídnout písemně.
Například Překladatelské středisko pro orgány EU nabízí svým uživatelům oba typy služeb, které jim umožní rychle a levně získat text, který lze použít, aniž by byl přesně správný.
První indický distributor filmů - původně VHS - s několika stovkami milionů registrovaných uživatelů, který je známý svými filmovými trháky, má ve svém katalogu všech 12 000 produktů s podtitulem - automaticky přepsaných - službou Google, aby byly dostupné v arabštině. Tento automatický přepis snižuje náklady o 25% a zpoždění o dva dny. Vede také k chybám, které vyžadují opravu, když jsou detekovány nebo identifikovány.
Proces překladu (v lidském smyslu) lze rozdělit do tří po sobě následujících fází:
Z výpočetního hlediska se porozumění stává analýzou , deverbalizace přenosem a reexprese generací . Tyto fáze procesu jsou modelovány Vauquoisovým trojúhelníkem. Tento model je užitečný, protože k přechodu od zdroje k cíli existuje několik možných cest, které tvoří různé dosud zvažované přístupy. Čím vyšší je stupeň konceptualizace, tím kratší je cesta přenosu. Existují čtyři hlavní možnosti:
V současné době jsou překladače založeny hlavně na pravidlech nebo statistikách. Objevuje se takzvaná hybridní cesta. Systran , Google Translate , Reverso a Microsoft Translation používají hybridní přístupy.
Nezbytné předpoklady závisí na předpokládaném přístupu: překlad založený na pravidlech (doslovně, přenos, pivot), překlad příkladem, statistický překlad.
Strojový překlad podle pravidel vyžaduje:
Překlad podle příkladu a statistický překlad vyžadují:
Kromě toho můžeme potřebovat nástroje jazykové analýzy, jako například:
Pro strojový překlad lze zvážit několik přístupů.
Používání strojového překladu se stalo běžným pro určité burzy a v určitých odborných kruzích.
Například přes rizika a při absenci kompetentních odborníků by se nemocnice a kliniky ve Spojených státech mohly uchýlit k strojovému překladu.
90% textů přeložených Generálním ředitelstvím pro překlady (DG TRAD) je předem přeloženo strojovým překladem.
Strojový překlad, hrubý, není dokonalý a ve výsledku lze najít některé chyby, například použití jednoho slova místo druhého. Je proto nutné jej přepracovat, aby se vyloučily chyby.
Příklad chyby, kdy je slovo úsudek přeloženo slovem dekret:
„ S odkazem na dekret vydaný v tomto případě dne 31. ledna 2019, kterým byla prohlášena slavnostně slavnostně uzavřená svatba 1. července 2013. ( „ S odkazem na dekret v tomto případě 31. ledna 2019, kterým bylo rozhodnuto, že manželství bude slaven 1. července 2013 „ v angličtině )“
- Právní překlad versus strojový překlad
Když kvantita a cena mají přednost před kvalitou, je strojový překlad privilegován a profesionální překladatel je nucen ospravedlnit svou přidanou hodnotu.
Metriky měření kvality se používají k tomu, aby bylo možné automatizovat měření kvality strojového překladu. Některé známé metriky jsou MODRÁ , ČERVENÁ, NIST a METEOR.
Strojový překlad může také podléhat lidské klasifikaci:
Tento typ služby může představovat rizika v oblasti soukromí a rizika vyvolání rasistických nebo sexistických předsudků.
Zneužití může vést k dalším rizikům v závislosti na použití, takže podle Daily Telegraph byl polský zaměstnanec vážně zraněn po dodržení bezpečnostních pokynů, které Google na žádost zaměstnavatele poskytl nesprávný nebo chybný překlad - Parker's Nurseries -
Znalost používání strojového překladu s potřebným odstupem času se nazývá „Machine Translation Literacy“.
Aktuální překladová zařízení jsou užitečná pro omezené situace, jako je rezervace pokoje v hotelu. „Pokud půjdu do Pekingu, mohu bez problémů zůstat v Hiltonu,“ řekl Stephan Vogel, výzkumník Carnegie Mellon.
Vzhled online služeb se snadno používá: spočívá v otevření služby, automatickém kopírování textu, který má být přeložen, výběru původního jazyka a cílového jazyka a poté v žádosti o překlad.
Zdarma online překladatelé :
Umožňují překládat slova nebo texty omezené velikosti. Jedná se například o:
Svobodný software :
Vývojová prostředí :
Různé projekty se snaží zlepšit výkon a rychlost překladačů (včetně Googlu ) a doufají, že jednoho dne budou schopny překonat „jazykovou bariéru“ a překládat v reálném čase (jak si představovalo mnoho autorů vědy - fikce ) a cizí jazyk, nebo dokonce schopnost „komunikovat“ s určitými zvířaty pomocí softwaru pro zpracování hlasu.