https://frosthead.com

Turingův test měří něco, ale nejde o „inteligenci“

Alan Turing, jeden z otců počítačového věku, byl mimořádně chytrý muž. Ve skutečnosti byl tak chytrý, že pochopil, že pojem strojová inteligence je téměř bezvýznamný. Podle jeho názoru je lepší mluvit o tom, co může stroj ve skutečnosti udělat: Může to mluvit? Může to podržet konverzaci? Alespoň to je něco, co se můžeme pokusit studovat. Turing nakonec navrhl, co se stalo známým jako „Turingův test“: Pokud soudce nemůže říct, která ze dvou skrytých entit je člověk a který je umělý, stroj „test“ prošel - což je přesně to, co se říká, že se to stalo minulou sobotu v Londýně.

Související obsah

  • Silicon Valley vděčí za svůj úspěch této technice Genius, kterou jste nikdy neslyšeli
  • 60letá předpověď Alana Turinga o vzorcích v přírodě prokázaná pravda

"Jsme ... hrdí na to, že můžeme prohlásit, že test Alan Turing byl poprvé absolvován, " uvedl jeden z organizátorů Kevin Warwick z University of Reading, když byly výsledky oznámeny. Vítězný chatbot se jmenuje „Eugene Goostman“, což je počítačový program, který emuluje osobnost třináctiletého ukrajinského chlapce. „Eugene“ se podařilo přesvědčit 33 procent soudců, že v sobotní akci, která se konala v kancelářích Royal Society v Londýně u příležitosti 60. výročí Turingovy smrti, to bylo lidské. (Turing, homosexuál, byl v roce 1952 usvědčen z hrubé nemilosti a bylo mu nařízeno podstoupit hormonální „léčbu“ v rámci dohody o prosbě. O dva roky později zemřel na otravu kyanidem zjevnou sebevraždou.)

Ale slovo opatrnosti je v pořádku. „Inteligence“ byla vždy kluzkým tématem a zejména Turingův test byl dlouho plný kontroverzí. Turing popsal, jak by to fungovalo v dokumentu z roku 1950 nazvaném „Výpočetní technika a inteligence.“ Vzal myšlenku z tradiční viktoriánské společenské hry, kde se pokusíte přijít na to, zda je osoba skrytá za oponou muž nebo žena, jen kladením otázek. (Odpovědi na otázky musely být zapsány, protože hlas by byl prozraditelný.) Turingova verze by fungovala: Měli byste soudce, který by seděl před dvěma závěsy, aniž byste věděli, co je za nimi . Za jednou oponou je člověk; za druhým je počítač. Soudce může klást otázky kterékoli ze dvou skrytých entit. Na základě odpovědí se soudce snaží zjistit, zda je skrytou entitou člověk nebo stroj. (Turing si představil, že konverzace je zprostředkována teletypovými stroji; dnes můžeme použít jakýkoli druh elektronického, textového rozhraní, jako je typ používaný v internetových chatovacích místnostech nebo instant messaging.)

Turing spekuloval, že do roku 2000 „průměrný vyšetřovatel nebude mít více než 70 procent šanci na správnou identifikaci“ - to znamená, že počítačové programy by styly soudců 30 procent času - po pěti minutách dotazování. „Pět minut“ je důležité. Turing nemluvil o časovém limitu jako o neodmyslitelné součásti testu, a dalo by se tvrdit, že aby stroj opravdu složil zkoušku, měl by být schopen zvládnout jakékoli množství otázek. Pravděpodobně byla pětiminutová kritéria libovolným, ale nezbytným limitem. Rok 2000 přišel a odešel, s chatboty se jen zastavil pokrok. (Ve střízlivějším okamžiku odpověděl na otázku tazatele BBC v roce 1952, Turing řekl, že to bude 100 let, než stroj projde testem.)

V roce 2012 jsem byl rozhodčím v „Turingově zkušebním maratonu“, v dosud největší soupravě Turingových testů; konalo se v anglickém Bletchley Parku, v místě Turingovy životně důležité práce na rozbití kódu během posledních let druhé světové války. (Byl organizován stejným týmem, který provozoval sobotní akci, a v té době také zvítězil starší verze Eugene.) Nastavení pro sobotní akci bylo stejné jako v roce 2012: Soudci zadali své otázky do počítače, pak počkal, až se odpovědi objeví na jejich obrazovkách; Chatboti spolu se „skrytými lidmi“ byli v jiné místnosti, mimo dohled.

První věc, kterou jsem si uvědomil, je, že když jste soudcem v Turingově testu, pět minut uběhne celkem rychle. A čím kratší je rozhovor, tím větší je výhoda počítače; čím delší je dotaz, tím vyšší je pravděpodobnost, že se počítač vzdá. Ráda bych tomu říkala manekýnský efekt: Už jste někdy omluvili manekýn obchodního domu za předpokladu, že jste právě narazili na živou lidskou bytost? Pokud střetnutí trvá jen zlomek vteřiny a budete čelit opačným směrem, můžete si představit, že jste se právě oprášili proti člověku. Čím déle se setkáváte, tím jasnější je manekýn figuríny.

Je to stejné s chatboty. Výměna hellos neodhalí nic - ale čím více se do toho dostanete, tím více problémů vyvstává. Zjistil jsem, že chatbots jsou náchylní ke změně tématu bez důvodu. Často nedokážou odpovědět na jednoduché otázky. Na riziko, že znějí vágně, prostě nezní lidsky . V jedné z mých rozhovorů v roce 2012 jsem napsal jednoduchý vtip - a entita, se kterou jsem mluvil, okamžitě změnil předmět na hamburgery. (Počítačový vědec Scott Aaronson nedávno zažil podobný zážitek, když si povídal s Eugenem prostřednictvím webu robota. Aaronson se zeptal Eugena, kolik nohou má velbloud; odpověděl: „Něco mezi 2 a 4. Možná, tři? :-)))“ “ Později, když se Aaronson zeptal, kolik nohou má mravenec, Eugene vykašlal přesně stejnou odpověď, trojitý smích a všechny.)

Všimněte si také, že Eugene nenapodobuje dospělého-anglicky mluvícího dospělého; předstírá, že je mladým a poněkud mizerným ukrajinským dospívajícím, konverzuje v přiměřeně dobré (ale zdaleka dokonalé) angličtině. Jak Vladimir Veselov, jeden z vývojářů programu, řekl společnosti Mashable.com : „Strávili jsme spoustu času vývojem postavy s uvěřitelnou osobností.“ Přestože Eugene zapojí kohokoli na jakékoli téma, jeho věk „je naprosto rozumné, že se mu nedaří "Nevím všechno." Eugene nevyšel hned a neoznámil svůj věk a národnost; ale na požádání to odhalí - a konečný výsledek může být ze strany soudců určitou mírou shovívavosti, zejména pokud jde o anglickou gramatiku a použití slov. (Předpokládám, že většina soudců v sobotu byli rodilí mluvčí angličtiny, i když to určitě nevím.) Stoly by se pravděpodobně otočily, kdyby se Eugene někdy setkal s rodilým ukrajinským mluvčím jako soudcem.

Boj o vybudování mluvícího stroje zdůrazňuje, jak složitý je jazyk. Není to jen otázka mluvení - musíte mluvit o něčem, a to, co říkáte, musí dávat smysl - a musí to dávat smysl v kontextu toho, co právě řekla druhá osoba . Pro nás je to snadné; pro počítače, ne tolik. A tak se chatboti spoléhají na řadu triků: Zapamatování megabajtů konzervovaných odpovědí nebo vyhledávání internetu na dialog, který by mohl přiblížit konverzaci, v níž právě probíhají. Jinými slovy, co stroji chybí inteligence, může být schopen vyrovnat se v surovém výpočetním výkonu. Proto se nám může Google nebo Siri (osobní asistent iPhone) zdát tak chytrý: Siri nemusí mít „mysl“, ale má přístup k tak rozsáhlé databázi informací, může se chovat, jako by tomu tak bylo. Byl to stejný druh přístupu brutální síly, který společnosti IBM „Watson“ umožnil vyhrát na Jeopardy! v roce 2011.

To vše vyvolává zásadní otázku: Co přesně přesně Turingův test měří? Někteří kritici navrhli, že to je odměna za podvod, spíše než za inteligenci. NYU psycholog Gary Marcus, psaní na NewYorker.com, říká, že Eugene uspěje „provedením řady„ ploysů “, které mají maskovat omezení programu.“ Steven Harnad, psycholog a počítačový vědec na Quebecké univerzitě v Montrealu, byl ještě více skeptický, říkat Guardianovi, že je „úplný nesmysl“ tvrdit, že Eugene prošel Turingovým testem. (Na jeho zásluhu si byl Turing dobře vědom tohoto problému; nazval svou myšlenku „napodobovací hrou“ a mluvil inteligencí jen střídmě.) Ještě trapněji je počítač na rozdíl od člověka nucen podvádět. "Turingův test je opravdu testem toho, že jsem úspěšným lhářem, " řekl mi Pat Hayes, počítačový vědec Ústavu pro lidské a strojové poznávání v Pensacole na Floridě, po maratonu Turingových testů v roce 2012. "Kdybyste měli něco, co by opravdu mohlo projít Turingovu imitační hru, bylo by to velmi úspěšné" lidské napodobování. ""

A „člověk“ je dalším klíčovým bodem: Je možné, že ve světě existují i ​​jiné druhy inteligence, než jaké jsou u našich druhů? Opravdu inteligentní stroj by měl bezpočet praktických aplikací, ale proč se zaměřit na vytváření více „lidí“? Koneckonců, už máme spoustu lidí. Jak zdůraznil lingvista Noam Chomsky, když se snažíme postavit stroj, který se pohybuje pod vodou, nevyžadujeme, aby „plaval“ - a ponorka není o nic méně úspěchem pro jeho neschopnost udělat úder.

Ano, Eugene je působivý, přinejmenším v malých dávkách. A přesto se i ti nejlepší chatboti potýkají s otázkami, které by dítě poloviny Eugenina předstíraného věku dokázalo zvládnout. Možná není divu, že většina výzkumníků AI tráví málo času posedlostí Turingovým testem. Strojová inteligence se ve skutečnosti pohybuje vpřed a poměrně rychle. Softwarový překladatelský software, který byl před několika lety poměrně ubohý, se rychle zlepšuje, stejně jako programy jazykových překladů. Amazon má často docela dobrou představu o tom, co chcete koupit ještě předtím, než to uděláte. A samohybné auto společnosti Google by bylo před deseti lety pouhou fantazií. Ale konverzace, jak neustále objevujeme, je opravdu těžká a není pravděpodobné, že to bude hranice, ve které AI září nejjasněji. Prozatím, pokud hledáte někoho, s kým si můžete povídat, doporučuji skutečného člověka.

Dan Falk je vědecký novinář se sídlem v Torontu.

Turingův test měří něco, ale nejde o „inteligenci“