Turingův test je navrženo umělá inteligence Test založený na schopnosti stroje napodobit lidskou konverzaci . Popsal Alan Turing ve své publikaci Computing Machinery and Intelligence v roce 1950 , tento test zahrnuje uvedení člověka do slepé slovní konfrontace s počítačem a jiným člověkem.
Pokud osoba, která zahajuje konverzaci, nedokáže zjistit, který z účastníků je počítač, lze považovat počítačový software za vyhovující. To znamená, že počítač a člověk se pokusí mít sémantický lidský vzhled .
Z důvodu zachování jednoduchosti a univerzálnosti testu je konverzace omezena na textové zprávy mezi protagonisty.
Test obsahuje imitaci hry, ve které muž a žena chodí do samostatných místností a hosté se snaží povídat si s oběma protagonisty tak, že si zapisují otázky a čtou odpovědi, které jim byly zaslány. V této hře se muž a žena snaží přesvědčit hosty, že jsou obě ženy.
Alan Turing původně vymyslel tento test, aby odpověděl na jeho existenciální otázku: „Dokáže stroj myslet?“ », Poskytující konkrétnější výklad jeho otázky.
Zajímavou myšlenkou jeho návrhu testu je, že odpovědi musí být poskytnuty ve stanovených časových intervalech. Představuje si to jako nezbytné, aby pozorovatel nemohl vyvodit závěr na základě skutečnosti, že počítač dokáže odpovědět rychleji než člověk, zejména na matematické otázky.
V Turingově publikaci se termín „imitace hry“ používá k označení jeho návrhu zkoušky. Zdá se, že „Turingův test“ poprvé formuloval v roce 1968 britský romanopisec Arthur C. Clarke ve svých sci-fi povídkách, z nichž vycházel film Vesmírná odysea z roku 2001 .
Alan Turing předpovídal, že počítače jednoho dne zvládnou test. Odhadoval, že v roce 2000 budou stroje se 128 MB paměti schopny oklamat přibližně 30% lidských soudců během 5minutového testu. Předpovídal, že lidé v té době nebudou vnímat pojem „inteligentní stroj“ jako rozporuplný. On také předpovídal, že akvizice učení počítačů by bylo také důležité pro vytváření vysoce výkonných počítačů, metodu, která je skutečně používán dnes současných výzkumníků v oblasti umělé inteligence prostřednictvím strojového učení , například.
Některé chatovací programy jednoduché, jak Elizy mají zmást člověka věřícího mluví s jinými lidmi, s neformální výrazy, jako dialogueur OELiza. Ale takový „úspěch“ nepředstavuje absolvování Turingova testu. Osoba většinou nemá důvod se domnívat, že nemluví s člověkem, zatímco v případě Turingova testu se soudce aktivně snaží určit povahu subjektu, s nímž hovoří. Zmíněné případy se týkají zejména IRC , kde je běžný akt marného a nesmyslného rozhovoru. Mnoho účastníků IRC navíc konverzuje v jiném jazyce, než je jejich rodný jazyk, nejčastěji v angličtině, což ještě více usnadňuje, když je robot podvede, aby si myslel, že nerozumí všemu nebo znovu, protože není dostatečně informován o samotné existenci roboti.
Loebnerova cena je každoroční soutěž o programu považován nejblíže k absolvování testu Turing. ALICE získala toto ocenění několikrát. Žádný z předložených programů však ještě neprošel Turingovým testem.
v září 2011v indickém Guwahati se programu Cleverbot podařilo přesvědčit většinu účastníků a pozorovatelů o testu jeho lidskosti. Konverzace trvala vždy 4 minuty. Patnáct účastníků si povídalo s Cleverbotem a patnáct dalších s lidmi. Veřejnost mohla sledovat konverzace a poté hlasovat s účastníky. Tam bylo 1334 hlasů. Cleverbot byl považován za 59% lidských a 63% lidských partnerů.
The 7. června 2014, anglická univerzita v Readingu tvrdí, že Turingův test vyhrál produkt ruského týmu počítačových vědců, který dokázal přesvědčit 33% soudců (nad 30% limit stanovený Turingem), že za strojem byl člověk. Toto tvrzení je okamžitě zpochybněno, i když je obecně uznáván skutečný pokrok. Kritika namířená proti počítačovému programu spočívá v tom, že se jedná o simulaci člověka s inteligencí třináctiletého chlapce, který mluví špatně anglicky, což snižuje kvalitu nezbytnou k tomu, aby program přesvědčil soudce, a že je neprůhledný zkušební protokol.
Alan Turing sám navrhl mnoho námitek, které lze proti testu vznést, a odpověděl na ně ve svém původním příspěvku:
V článku z roku 1980 filozof John Searle zpochybňuje sílu Turingova testu a dovolává se meze syntaxe počítačů . Podle autora se sémantika , charakteristická pro lidské myšlení, nemohla omezit na manipulaci se symboly podle stanovených syntaktických pravidel, což se jeví jako charakteristické pro stroj.
Pro ilustraci představuje myšlenkový experiment čínské místnosti : Předpokládejme, že jste uvnitř místnosti obsahující čínské symboly a návod k použití s pravidly typu „otázka a odpověď“. Když vám čínský mluvčí mimo místnost pošle zprávu na papíře, můžete díky příručce poskytnout adekvátní odpověď a dát druhému dojem, že umí mluvit jeho jazykem, aniž by byl schopen mluvit jeho jazykem je nutné, abyste tomu porozuměli.
Turingův test je založen na předpokladu, že lidské bytosti mohou posoudit inteligenci stroje porovnáním jeho chování s lidským chováním. Každý prvek tohoto předpokladu byl zpochybněn: úsudek člověka, hodnota srovnání, která má pouze srovnávat chování a hodnota srovnání s člověkem. Z těchto a dalších důvodů někteří vědci z oblasti umělé inteligence zpochybnili užitečnost procesu.
Lidská inteligence versus inteligence obecněTento test přímo neurčuje, zda se počítač chová inteligentně, pouze testuje, zda se počítač chová jako člověk. Protože inteligentní chování a lidské chování nejsou úplně to samé, test neměří přesně inteligenci dvěma způsoby:
Tuto posledně uvedenou námitku vznesl The Economist v článku s názvem „ Artificial Stupidity (en) “, publikovaném krátce po první Loebnerově soutěži v roce 1992. V článku bylo uvedeno, že vítězství vítěze první Loebnerovy soutěže bylo způsobeno méně částečně na jeho schopnost „napodobovat lidské překlepy“. Sám Turing navrhl, aby programy přidávaly chyby ve svých výstupech, aby byly lepšími „hráči“ ve hře.
Skutečná inteligence versus simulovaná inteligenceTestuje pouze způsob, jakým subjekt působí - na vnější chování stroje. V tomto ohledu předpokládá behavioristický nebo funkcionalistický pohled na inteligenci. Příklad společnosti ELIZA naznačoval, že stroj, který projde testem, může být schopen simulovat lidské konverzační chování podle jednoduchého (ale rozsáhlého) seznamu mechanických pravidel, aniž by automaticky přemýšlel .
John Searle tvrdil, že vnější chování nelze použít k určení, zda stroj „skutečně“ myslí, nebo jednoduše „simuluje akt myšlení“.
Turing očekával tyto kritiky ve svém původním článku, kde napsal:
"Nechci vzbudit dojem, že si myslím, že o vědomí není žádná záhada." S jakýmkoli pokusem o jeho nalezení je spojen například jakýsi paradox. Ale nemyslím si, že tato tajemství musí být nutně vyřešena, než budeme moci odpovědět na otázku, která nás v tomto článku zajímá. "
- Alan Turing ( Turing 1950 ).
Naivita vyšetřovatelů a antropomorfní klamTuringův test předpokládá, že vyšetřovatel je dostatečně sofistikovaný, aby určil rozdíl mezi chováním stroje a chováním člověka, ačkoli kritici tvrdí, že to není dovednost, kterou má většina lidí. Přesné dovednosti a znalosti požadované vyšetřovatelem Turing ve svém popisu eseje neurčuje, ale použil výraz „průměrný vyšetřovatel“: „Průměrný vyšetřovatel by nebyl starší 70 let. identifikace po pěti minutách výslechu “. Shah a Warwick (2009C) ukazují, že experti se nechali oklamat a že strategie vyšetřovatele, „síla“ nebo „solidarita“, ovlivňuje správnou identifikaci (druhá je účinnější).
Dialog spisovatel jako Elizy opakovaně oklamat naivní lidi do podezření, že se v komunikaci s lidmi. V těchto případech „vyšetřovatel“ ani neví o možnosti interakce s počítačem. Aby byl stroj úspěšný v tom, aby vypadal jako člověk, nemusí mít všechny informace a je zapotřebí pouze povrchní podobnosti lidského chování. Většina lidí souhlasí s tím, že nejde o „skutečný“ Turingův test, který byl proveden v „neinformovaných“ případech, jako je tento.
V raných verzích Loebnerovy ceny se používaly „nenáročné“ vyšetřovatele a stroje je snadno oklamaly. Od roku 2004 organizátoři Loebnerovy ceny nasadili mezi vyšetřovatele filozofy, počítačové vědce a novináře. Některé z nich byly oklamány stroji.
Michael Shermer poukazuje na to, že lidské bytosti se systematicky rozhodují považovat jiné než lidské objekty za lidské, kdykoli mají šanci, omyl nazývaný také antropomorfní klam: mluví svým autem, připisují vůli a úmysly přírodním silám (například „přírodě“) abhors a vakuum “) a uctívat slunce jako lidskou bytost nebo jako bytost obdařenou inteligencí. Pokud je Turingův test aplikován na náboženské předměty, Shermer tvrdí, že neživé sochy, skály a místa vždy v historii prošly testem, do jisté míry. Tato lidská tendence k antropomorfismu snižuje laťku Turingova testu, pokud vyšetřovatelé nejsou speciálně vyškoleni, aby se mu vyhnuli.
Nereálnost a zbytečnost: Turingův test a výzkum AIVědci v oblasti umělé inteligence tvrdí, že pokus o složení Turingova testu je prostě rozptýlení, místo aby se soustředil na plodný výzkum. Turingův test skutečně není aktivním zaměřením akademického ani komerčního úsilí; jak píše Stuart Russell a Peter Norvig : „Výzkumníci umělé inteligence věnovali zkoušce Turingova malou pozornost.“ Existuje několik důvodů:
Nejprve existují jednodušší způsoby, jak otestovat jejich programy. Velká část současného výzkumu v oborech souvisejících s umělou inteligencí je zaměřena na malé, ale konkrétní cíle, jako je automatické plánování , rozpoznávání objektů nebo logistika . Za účelem testování inteligence programů, které řeší problémy, jim vědci z oblasti umělé inteligence dávají za úkol vykonávat je přímo, a ne procházet objížďkou kladení otázek v chatu naplněném počítači a lidmi.
Zadruhé, tvorba simulací lidí jako je život je sama o sobě obtížným problémem, který pro dosažení základních cílů výzkumu AI není nutné řešit. Důvěryhodné umělé lidské postavy mohou být zajímavé v uměleckém díle, videohře nebo fantastickém uživatelském rozhraní , ale to není součástí vědy o vytváření inteligentních strojů, což je věda o strojích, které řeší problémy související s inteligencí. Russell a Norvig navrhují analogii s historií letectví : letadla jsou testována podle jejich letu, nikoli podle jejich srovnání s ptáky. Testování letectví nedefinuje účel jejich pole jako závodu o vynalézání strojů, které létají tak holubičím způsobem, že by se holubi sami mýlili.
Turing nikdy nezamýšlel použít svůj test jako metodu pro měření inteligence programů AI; chtěl dát jasný a srozumitelný příklad přispět k diskusi o filosofii z umělé inteligence . Není tedy divu, že Turingův test měl tak malý vliv na výzkum v oblasti umělé inteligence. Filozofie AI , napsal John McCarthy , „je nepravděpodobné, že by měla větší dopad na praxi výzkumu AI, než má filozofie vědy obecně na praxi vědy.“
Výraz „Gratulujeme! Právě jste selhali v Turingově testu ... “ je urážka školáka ve světě IT. Tento výraz se říká, když člověk právě řekl něco zvlášť hloupého, a nezdá se, že by měl úroveň inteligence stroje.