GOOGLE JE NOVÝ AI JE MISTREM HER, ALE JAK TO VE SROVNÁNÍ S LIDSKOU MYSLÍ? | INOVACE | KOVÁŘ - ČLÁNKY, INOVACE, TECHNOLOGIE, VĚDA

U lidí může trvat šachy celý život. Nový program umělé inteligence Google DeepMind, AlphaZero, se však může naučit dobývat desku během několika hodin.

Na základě svých minulých úspěchů se sadou AlphaGo - řadou počítačových programů určených k hraní čínské deskové hry Go - se Google chlubí, že její nový AlphaZero dosahuje úrovně „nadlidského výkonu“ nejen v jedné stolní hře, ale ve třech: Go, šachy a shogi (v podstatě japonské šachy). Tým počítačových vědců a inženýrů vedený Davidem Silverem Google nedávno zveřejnil svá zjištění v časopise Science .

„Předtím, pomocí strojového učení, byste mohli dostat stroj, který bude dělat přesně to, co chcete - ale jen to, “ říká Ayanna Howard, odbornice na interaktivní výpočetní techniku a umělou inteligenci na Gruzínském technologickém institutu, která se nezúčastnila výzkum. "Ale AlphaZero ukazuje, že můžete mít algoritmus, který není tak [specifický], a že se může učit v rámci určitých parametrů."

Inteligentní programování AlphaZero jistě zvýší ante na hraní pro člověka i stroj, ale Google už dlouho zaměřuje své pozornosti na něco většího: inženýrskou inteligenci.

Vědci jsou opatrní, aby netvrdili, že AlphaZero je na pokraji světové nadvlády (jiní byli o něco rychlejší, aby skočili ze zbraně). Přesto Silver a zbytek skupiny DeepMind již doufají, že jednoho dne uvidí podobný systém aplikovaný na design léčiv nebo na vědu o materiálech.

Co dělá AlphaZero tak působivým?

Hra se ve výzkumu umělé inteligence dlouho ctí jako zlatý standard. Strukturované interaktivní hry jsou zjednodušením scénářů skutečného světa: musí být učiněna obtížná rozhodnutí; výhry a ztráty vyhrávají sázky; a predikce, kritické myšlení a strategie jsou klíčové.

Kódování tohoto druhu dovedností je složité. Starší hry na hraní her - včetně prvních prototypů původního AlphaGo - byly tradičně čerpány plné kódů a dat, aby napodobily zážitek, který se obvykle získává během let přirozené lidské hry (v podstatě pasivní, znalostní skládka odvozená od programátorů). S AlphaGo Zero (nejnovější verze AlphaGo) a nyní AlphaZero, vědci dali programu jen jeden vstup: pravidla dané hry. Poté se systém zhroutil a aktivně se naučil triky samotného obchodu.

AlphaZero je založeno na AlphaGo Zero, součásti sady AlphaGo určené k hraní čínské stolní hry Go, na obrázku výše. Časné iterace původního programu byly krmeny daty z her mezi lidmi a lidmi; pozdější verze zabývající se samoučením, kde software hrál hry proti sobě, aby se naučil své vlastní strategii. (Chad Miller / Flickr / CC BY-SA 2.0)

Tato strategie, nazývaná posilování učení se samou hrou, je do značné míry přesně taková, jak to vypadá: Chcete-li trénovat na velké ligy, hra AlphaZero se po iteraci hrála v iteraci a své dovednosti honila pokusem a omylem. A přístup brutální síly se vyplatil. Na rozdíl od AlphaGo Zero, AlphaZero nehraje jen Go: To může porazit nejlepší AI v oboru i na šachy a shogi. Výukový proces je také působivě účinný a vyžaduje pouze dvě, čtyři nebo 30 hodin sebeobsluhy, aby překonal programy speciálně přizpůsobené mistrovským šógim, šachům a Go. Autoři studie zejména nezaznamenali žádné případy, kdy by AlphaZero šlo přímo ke skutečnému člověku, říká Howard. (Vědci mohli předpokládat, že vzhledem k tomu, že tyto programy soustavně oklamávají své lidské protějšky, bylo by takové srovnání zbytečné.)

AlphaZero také dokázal překonat Stockfish (nyní neporažený šachový mistr AI) a Elmo (bývalý expert na AI shogi), přestože během hry vyhodnotil méně možných dalších tahů na každém tahu. Ale protože tyto algoritmy jsou inherentně odlišné a mohou spotřebovávat různá množství energie, je obtížné přímo srovnávat AlphaZero s jinými, staršími programy, upozorňuje Joanna Brysonová, která studuje umělou inteligenci na University of Bath ve Velké Británii a udělala nepřispívat k AlphaZero.

Google udržuje mámu o spoustě jemného tisku na svém softwaru a AlphaZero není výjimkou. I když nevíme vše o spotřebě energie v programu, je jasné, že: AlphaZero musí mít nějaké vážné počítačové náboje. V těch skromných hodinách tréninku se program udržoval velmi zaneprázdněný, zapojil se do desítek nebo stovek tisíc tréninkových kol, aby si vylepšil strategii deskové hry až po šňupání - mnohem víc, než by lidský hráč potřeboval (nebo ve většině případů mohl dokonce dosáhnout) ve snaze o odbornost.

Tento intenzivní režim také používal 5 000 proprietárních procesorových jednotek Google pro strojové učení neboli TPU, které podle některých odhadů spotřebují kolem 200 wattů na čip. Bez ohledu na to, jak to nakrájíte, AlphaZero vyžaduje mnohem více energie než lidský mozek, který běží na asi 20 wattech.

Je třeba vzít v úvahu absolutní spotřebu energie AlphaZero, dodává Bin Yu, který pracuje na rozhraní statistik, strojového učení a umělé inteligence na University of California v Berkeley. AlphaZero je mocný, ale nemusí být dobrým třeskem za babku - zejména při sčítání osobohodin, které šly na jeho vytvoření a provedení.

Energeticky drahé nebo ne, AlphaZero dělá úvod: Většina AI je hyper-specializovaná na jediný úkol, díky čemuž je tento nový program - s jeho trojnásobnou hrozbou hry - pozoruhodně flexibilní. "Je působivé, že AlphaZero dokázalo použít stejnou architekturu pro tři různé hry, " říká Yu.

Takže ano. Nová AI společnosti Google nastavuje novou značku několika způsoby. Je to rychlé. Je to mocné. Ale dělá to inteligentním?

To je místo, kde definice začínají být kalné. "AlphaZero se dokázal naučit, od nuly, bez jakéhokoli lidského poznání, hrát každou z těchto her na nadlidskou úroveň, " řekl DeepMind's Silver v prohlášení pro tisk.

I když zkušenosti s deskovými hrami vyžadují duševní ostrost, všechny proxy servery pro skutečný svět mají své limity. Ve své současné iteraci maximalizuje AlphaZero tím, že vyhraje hry navržené člověkem - což nemusí zaručovat potenciálně alarmující štítek „nadlidského“. Navíc, pokud bude překvapen novou sadou pravidel uprostřed hry, může se AlphaZero flummoxovat. Na druhou stranu skutečný lidský mozek může do svého repertoáru uložit mnohem více než tři deskové hry.

Navíc, srovnání základní linie AlphaZero s tabula rasa (prázdná břidlice) - jako vědci -, je úsek, říká Bryson. Programátoři to stále živí jedním zásadním seskupením lidských znalostí: pravidly hry, kterou se chystá hrát. "Musí toho mnohem méně, než cokoli předtím, " dodává Bryson, "ale nejzákladnější věcí je, že stále platí pravidla." To jsou explicitní. “

A ta otravná pravidla by mohla představovat významnou berlu. "Přestože se tyto programy učí, jak provádět, potřebují pravidla silnice, " říká Howard. "Svět je plný úkolů, které tato pravidla nemají."

Když dojde na tlak, AlphaZero je upgradem již tak výkonného programu - AlphaGo Zero, vysvětluje JoAnn Paul, který studuje umělou inteligenci a výpočetní sny na Virginia Polytechnic Institute a State University a nebyl zapojen do nového výzkumu. AlphaZero používá mnoho stejných stavebních bloků a algoritmů jako AlphaGo Zero a stále představuje pouze podmnožinu skutečných inteligentních počítačů. "Myslela jsem si, že tento nový vývoj je více evoluční než revoluční, " dodává. "Žádný z těchto algoritmů nemůže vytvořit ." Zpravodajství je také o vyprávění příběhů. Představuje si věci, které tam ještě nejsou. V počítačích nemyslíme v těchto termínech. “

Součástí problému je, že stále neexistuje shoda ohledně skutečné definice „inteligence“, říká Yu - a to nejen v oblasti technologie. "Stále není jasné, jak trénujeme kriticky uvažující bytosti nebo jak využíváme mozek v bezvědomí, " dodává.

K tomuto bodu je mnoho vědců přesvědčeno, že existuje pravděpodobně více druhů inteligence. A klepnutím na jeden daleko od zaručuje ingredience pro jiného. Například někteří z nejchytřejších lidí jsou v šachu hrozní.

S těmito omezeními Yuova vize budoucnosti umělé inteligence spojuje lidi a stroje v jakémsi koevoluci. Stroje budou jistě i nadále vynikat v určitých úkolech, vysvětluje, ale k tomu, aby kompenzovaly neutomované, může být vždy zapotřebí lidský vstup a dohled.

Samozřejmě se nedá říci, jak se v AI aréně otřásají věci. Mezitím musíme přemýšlet. „Tyto počítače jsou výkonné a dokážou dělat určité věci lépe než člověk, “ říká Paul. "Ale to stále nedosahuje tajemství inteligence."

Tento článek byl původně publikován na NOVA.