https://frosthead.com

Bude AI někdy chytřejší než čtyřletý?

Všichni slyšeli o nových pokrokech v umělé inteligenci a zejména o strojovém učení. Také jste slyšeli utopické nebo apokalyptické předpovědi o tom, co tyto zálohy znamenají. Byli přijati, aby předstírali nesmrtelnost nebo konec světa a o obou těchto možnostech bylo napsáno mnoho. Ale ty sofistikovanější umělé inteligence ještě zdaleka nejsou schopny řešit problémy, s nimiž se lidští čtyři roky stávají snadno. Navzdory působivému jménu umělá inteligence do velké míry sestává z technik detekce statistických vzorců ve velkých souborech dat. Učení člověka je mnohem více.

Jak můžeme vědět tolik o světě kolem nás? Učíme se obrovské množství, i když jsme malé děti; čtyřleté už vědí o rostlinách, zvířatech a strojích; touhy, přesvědčení a emoce; dokonce i dinosaury a kosmické lodě.

Věda rozšířila naše znalosti o světě na nepředstavitelně velký a nekonečně malý, na okraj vesmíru a na začátek času. A tyto znalosti využíváme k vytváření nových klasifikací a předpovědí, k představování nových možností a k vytváření nových věcí ve světě. Ale vše, co zasáhne kohokoli z nás ze světa, je proud fotonů, který zasahuje naše sítnice a poruchy vzduchu u našich ušních bubínků. Jak se toho tolik naučíme o světě, když máme tak omezené důkazy? A jak to všechno uděláme s několika kilogramy šedého goo, které sedí za našimi očima?

Nejlepší odpověď doposud je, že naše mozky provádějí výpočty na konkrétních, zejména chaotických datech přicházejících na naše smysly, a tyto výpočty poskytují přesné reprezentace světa. Reprezentace se zdají být strukturované, abstraktní a hierarchické; zahrnují vnímání trojrozměrných objektů, gramatiky, které jsou základem jazyka, a mentální kapacity, jako je „teorie mysli“, což nám umožňuje porozumět tomu, co si ostatní myslí. Tyto reprezentace nám umožňují vytvářet širokou škálu nových předpovědí a představovat si mnoho nových možností v nápadně kreativním lidským způsobem.

Tento druh učení není jediný druh inteligence, ale je to obzvláště důležité pro lidské bytosti. A je to druh inteligence, který je zvláštností malých dětí. Přestože jsou děti zásadně špatné při plánování a rozhodování, jsou nejlepšími studenty ve vesmíru. Hodně z procesu přeměny dat na teorie se děje dříve, než budeme pět.

Od Aristotela a Platóna existují dva základní způsoby řešení problému, jak víme, co víme, a stále jsou to hlavní přístupy ve strojovém učení. Aristoteles přistoupil k problému zdola nahoru: Začněte smysly - proudem fotonů a vzduchových vibrací (nebo pixelů nebo zvukových vzorků digitálního obrazu nebo záznamu) - a podívejte se, zda z nich můžete extrahovat vzory. Tento přístup nesli další klasičtí asociacionisté jako filozofové David Hume a JS Mill a později behaviorální psychologové jako Pavlov a BF Skinner. Z tohoto pohledu je abstraktnost a hierarchická struktura reprezentací něčím iluzí, nebo alespoň epifenomenonem. Veškerou práci lze provést detekcí asociace a vzoru - zejména pokud je k dispozici dostatek dat.

Preview thumbnail for video 'Possible Minds: 25 Ways of Looking at AI

Možné mysli: 25 způsobů pohledu na AI

Světový vědecký svět John Brockman shromažďuje dvacet pět nejdůležitějších vědeckých myslí, lidí, kteří přemýšleli o poli umělé inteligence po většinu své kariéry, za bezkonkurenční kulatý stůl o mysli, myšlení, inteligenci a co to znamená být člověk.

Koupit

Postupem času se mezi tímto přístupem zdola nahoru k tajemství učení a Platónovým alternativním, shora dolů objevuje houpačka. Možná získáme abstraktní znalosti z konkrétních dat, protože už toho hodně víme, a to zejména proto, že díky evoluci již máme řadu základních abstraktních konceptů. Stejně jako vědci, můžeme tyto pojmy použít k formulaci hypotéz o světě. Poté, místo pokusu extrahovat vzory ze surových dat, můžeme udělat předpovědi o tom, jak by data měla vypadat, pokud jsou tyto hypotézy správné. Spolu s Platónem se k tomu přistupovali také „racionální“ filozofové a psychologové jako Descartes a Noam Chomsky.

Zde je každodenní příklad, který ilustruje rozdíl mezi těmito dvěma metodami: vyřešení moru spamu. Data sestávají z dlouhého, netříděného seznamu zpráv ve vaší doručené poště. Skutečností je, že některé z těchto zpráv jsou pravé a některé jsou spamem. Jak můžete data použít k jejich rozlišení?

Nejprve zvažte techniku ​​zdola nahoru. Všimněte si, že spamové zprávy mají sklon mít zvláštní rysy: dlouhý seznam adresátů, původ v Nigérii, odkazy na ceny v milionech dolarů nebo Viagra. Potíž je v tom, že tyto funkce mohou mít i dokonale užitečné zprávy. Pokud jste se podívali na dostatek příkladů nevyžádaných a nevyžádaných e-mailů, můžete vidět nejen to, že nevyžádané e-maily mají tendenci tyto funkce mít, ale že tyto funkce mají tendenci se spojovat konkrétními způsoby (Nigérie plus milion dolarů způsobuje potíže). Ve skutečnosti mohou existovat nějaké jemné korelace na vyšší úrovni, které odlišují spam od užitečných zpráv - například určitý vzor pravopisných chyb a IP adres. Pokud tyto vzory zjistíte, můžete filtrovat spam.

Techniky strojového učení zdola nahoru to dělají. Žák dostane miliony příkladů, každý s nějakou sadou funkcí a každý označený jako spam (nebo nějaká jiná kategorie) či nikoli. Počítač může extrahovat vzorec funkcí, který tyto dva odlišuje, i když je to celkem jemné.

A co přístup shora dolů? Dostávám e-mail od editora časopisu Journal of Clinical Biology . Týká se to jednoho z mých článků a říká, že by chtěli publikovat článek ode mě. Žádná Nigérie, žádná Viagra, žádné miliony dolarů; e-mail nemá žádnou funkci nevyžádané pošty. Ale pomocí toho, co již vím, a abstraktním přemýšlením o procesu, který vytváří spam, mohu zjistit, že tento e-mail je podezřelý:

1. Vím, že spammery se snaží získat peníze od lidí přitažlivou k lidské chamtivosti.

2. Vím také, že legitimní časopisy „s otevřeným přístupem“ začaly pokrývat své náklady účtováním autorů namísto předplatitelů a že necvičím nic, jako je klinická biologie.

Celkově to vše dohromady a mohu vytvořit dobrou novou hypotézu o tom, odkud tento e-mail pochází. Je navržen tak, aby akademikům přinutil platit za „publikování“ článku v falešném časopise. E-mail byl výsledkem stejného pochybného procesu jako ostatní nevyžádané e-maily, přestože nevypadal jako oni. Tento závěr mohu vyvodit pouze z jednoho příkladu a mohu dále otestovat svou hypotézu, nad rámec čehokoli v samotném e-mailu, googlingem „editora“.

Z počítačového hlediska jsem začal s „generativním modelem“, který zahrnuje abstraktní pojmy jako chamtivost a podvod a popisuje proces, který vytváří podvody s e-maily. To mi umožňuje rozpoznat klasický nigerijský e-mailový spam, ale také mi umožňuje představit si mnoho různých druhů možných spamů. Když dostanu e-mailový deník, mohu pracovat pozpátku: „Zdá se, že jde jen o druh pošty, která by vycházela z procesu generování spamu.“

Nové nadšení z AI přichází, protože vědci z AI nedávno vytvořili výkonné a efektivní verze obou těchto metod učení. O samotných metodách však není nic nového.

Hluboké učení zdola nahoru

V 80. letech 20. století počítačoví vědci vymysleli důmyslný způsob, jak přimět počítače k ​​detekci vzorců v datech: connectistická nebo neuronová síť, architektura („neurální“ část byla a stále je metaforická). Tento přístup spadl do doldrů v 90. letech 20. století, ale nedávno byl oživen pomocí výkonných metod „hlubokého učení“, jako je Google DeepMind.

Například můžete programu pro hluboké učení dát spoustu internetových obrázků označených jako „kočka“, jiné označené jako „dům“ atd. Program může detekovat vzory rozlišující dvě sady obrázků a tyto informace použít k označení nových obrázků správně. Některé druhy strojového učení, nazývané učení bez dozoru, mohou detekovat vzorce v datech bez štítků; jednoduše hledají shluky funkcí - to, co vědci nazývají faktorovou analýzou. V hlubokých strojích se tyto procesy opakují na různých úrovních. Některé programy mohou dokonce objevovat relevantní funkce z prvotních dat pixelů nebo zvuků; počítač by mohl začít detekováním vzorů v surovém obrazu, které odpovídají hranám a čarám, a poté najít vzory v těch vzorech, které odpovídají obličejům atd.

Další technikou zdola nahoru s dlouhou historií je posilování učení. V padesátých letech minulého století BF Skinner, stavějící na práci Johna Watsona, skvěle naprogramovali holuby, aby prováděli komplikovaná opatření - dokonce naváděli rakety vypouštěné ke svým cílům (rušivá ozvěna nedávné umělé inteligence) tím, že jim dávali zvláštní plán odměn a trestů . Základní myšlenkou bylo, že akce, které byly odměněny, budou opakovány a ty, které byly potrestány, ne, dokud nebude dosaženo požadovaného chování. Dokonce i v Skinnerově dni může tento jednoduchý proces, opakovaný znovu a znovu, vést ke složitému chování. Počítače jsou navrženy k provádění jednoduchých operací znovu a znovu v měřítku, které zakrývá lidskou fantazii, a výpočetní systémy se tímto způsobem mohou naučit pozoruhodně složité dovednosti.

Například vědci společnosti Google DeepMind použili kombinaci hlubokého učení a posílení učení, aby naučili počítač hrát videohry Atari. Počítač nevěděl nic o tom, jak hry fungují. Začalo to náhodným jednáním a získalo informace pouze o tom, jak vypadala obrazovka v každém okamžiku a jak dobře to skóroval. Hluboké učení pomohlo interpretovat funkce na obrazovce a učení posílené odměnilo systém za vyšší skóre. Počítač byl velmi dobrý při hraní několika her, ale také zcela bombardoval ostatní, kteří byli pro člověka stejně snadné zvládnout.

Podobná kombinace hlubokého učení a posílení učení umožnila úspěch AlphaZero společnosti AlphaZero, programu, který dokázal porazit lidské hráče jak u šachů, tak u Go, vybavený pouze základními znalostmi pravidel hry a některými plánovacími schopnostmi. AlphaZero má další zajímavou vlastnost: Funguje tak, že proti sobě hraje stovky milionů her. Přitom prořezává chyby, které vedly ke ztrátám, a opakuje a rozpracovává strategie, které vedly k vítězství. Takové systémy a další, které se týkají technik nazývaných generativní protivníkovské sítě, generují data a také pozorují data.

Pokud máte výpočetní schopnost tyto techniky aplikovat na velmi velké soubory dat nebo miliony e-mailových zpráv, obrázků Instagramu nebo hlasových záznamů, můžete vyřešit problémy, které se dříve zdály velmi obtížné. To je zdroj velké části vzrušení v informatice. Je však třeba si uvědomit, že tyto problémy - jako rozpoznání, že obraz je kočka nebo mluvené slovo je Siri - jsou pro lidské batole triviální. Jedním z nejzajímavějších objevů počítačové vědy je to, že problémy, které jsou pro nás snadné (například identifikace koček), jsou pro počítače obtížné - mnohem těžší než hraní šachů nebo Go. Počítače potřebují miliony příkladů pro kategorizaci objektů, které můžeme kategorizovat pomocí několika. Tyto systémy zdola nahoru mohou zobecnit na nové příklady; mohou označit nový obrázek jako kočku docela přesně ve všem. Dělají to však způsobem, který se zcela liší od toho, jak lidé zobecňují. Některé obrázky, téměř identické s obrázkem kočky, nebudeme vůbec identifikovány jako kočky. Ostatní, kteří vypadají jako náhodné rozostření, budou.

Bayesiánské modely shora dolů

Přístup shora dolů hrál velkou roli v časných umělých inteligenci a ve dvacátých letech také zažil oživení ve formě pravděpodobnostních nebo bayesovských generativních modelů.

První pokusy využít tento přístup čelily dvěma druhům problémů. Za prvé, většina vzorů důkazů by mohla být v zásadě vysvětlena mnoha různými hypotézami: Je možné, že moje e-mailová zpráva v deníku je pravá, prostě se nezdá pravděpodobná. Za druhé, odkud pocházejí především pojmy, které používají generativní modely? Platón a Chomsky řekli, že jste se s nimi narodili. Jak ale můžeme vysvětlit, jak se učíme nejnovějším pojmům vědy? Nebo jak i malé děti rozumějí dinosaurům a raketovým lodím?

Bayesovské modely kombinují generativní modely a testování hypotéz s teorií pravděpodobnosti a řeší tyto dva problémy. Bayesovský model vám umožňuje vypočítat, jak je pravděpodobné, že konkrétní hypotéza je pravdivá, s ohledem na data. A díky malým, ale systematickým vylepšením modelů, které již máme, a jejich testováním na základě dat můžeme někdy vytvořit nové koncepty a modely ze starých. Ale tyto výhody jsou kompenzovány dalšími problémy. Bayesovské techniky vám mohou pomoci vybrat, která ze dvou hypotéz je pravděpodobnější, ale existuje téměř vždy obrovské množství možných hypotéz a žádný systém je nemůže všechny účinně zvážit. Jak se rozhodujete, které hypotézy stojí v první řadě za testování?

Brenden Lake na NYU a jeho kolegové použili tyto metody shora dolů k vyřešení dalšího problému, který je pro lidi jednoduchý, ale pro počítače extrémně obtížný: rozpoznávání neznámých ručně psaných znaků. Podívejte se na postavu na japonském svitku. I když jste to ještě nikdy neviděli, můžete pravděpodobně zjistit, zda je to podobné nebo odlišné od postavy na jiném japonském svitku. Pravděpodobně to můžete nakreslit a dokonce navrhnout falešnou japonskou postavu na základě toho, které vidíte - takové, které bude vypadat docela jinak než korejská nebo ruská postava.

Metoda zdola nahoru pro rozpoznávání ručně psaných znaků je poskytnout počítači tisíce příkladů každého z nich a nechat jej vytáhnout hlavní rysy. Místo toho Lake et al. dal programu obecný model, jak nakreslíte postavu: Tah jde buď doprava, nebo doleva; po dokončení jednoho začnete další; a tak dále. Když program viděl konkrétní postavu, mohl by odvodit posloupnost tahů, které k tomu s největší pravděpodobností vedly - stejně jako jsem usoudil, že spamový proces vedl k mému pochybnému e-mailu. Pak mohl posoudit, zda z této sekvence nebo z jiné může vyplynout nová postava a zda by mohla sama vyvolat podobnou sadu tahů. Program fungoval mnohem lépe než program pro hluboké učení aplikovaný na přesně stejná data a úzce odrážel výkon lidí.

Tyto dva přístupy ke strojovému učení mají komplementární silné a slabé stránky. V přístupu zdola nahoru nepotřebuje program mnoho znalostí, ale potřebuje velké množství dat a může zobecnit pouze omezeným způsobem. V přístupu shora dolů se program může poučit z několika příkladů a vytvořit mnohem širší a rozmanitější zobecnění, ale musíte do něj mnohem více zabudovat, abyste mohli začít. Řada vyšetřovatelů se v současné době snaží tyto dva přístupy kombinovat pomocí hlubokého učení k implementaci Bayesovské inference.

Nedávný úspěch umělé inteligence je částečně výsledkem rozšíření těchto starých myšlenek. Má ale více společného s tím, že díky internetu máme mnohem více dat a díky Mooreovu zákonu máme mnohem větší výpočetní sílu, abychom se na tato data mohli aplikovat. Kromě toho je neocenitelným faktem to, že data, která máme, již byla lidmi tříděna a zpracována. Obrázky koček zveřejněné na webu jsou kanonické obrázky koček - obrázky, které si lidé již vybrali jako „dobré“ obrázky. Google Translate funguje, protože využívá miliony lidských překladů a zobecňuje je do nového textu, než aby skutečně věděl samotné věty.

Opravdu pozoruhodnou věcí na lidských dětech je to, že nějakým způsobem kombinují nejlepší vlastnosti každého přístupu a pak jdou daleko za nimi. Během posledních patnácti let vývojáři zkoumali způsob, jakým se děti učí strukturu z dat. Čtyřleté děti se mohou učit tím, že vezmou jen jeden nebo dva příklady dat, jak to dělá systém shora dolů, a zobecňují se na velmi odlišné koncepty. Stejně jako u systému zdola nahoru se ale mohou naučit nové koncepty a modely ze samotných dat.

Například v naší laboratoři dáváme malým dětem „detektor bliket“ - nový stroj, který přijde na to, který nikdy předtím neviděl. Je to box, který se rozsvítí a přehrává hudbu, když na něj dáte určité předměty, ale ne jiné. Dáváme dětem jen jeden nebo dva příklady toho, jak stroj funguje, a ukážeme jim, že, řekněme, dva červené bloky, aby to šlo, zatímco zeleno-žlutá kombinace ne. Dokonce i osmnáctiměsíční staří okamžitě přijdou na obecný princip, že dva objekty musí být stejné, aby to fungovalo, a zobecňují tento princip na nové příklady: Například si vyberou dva objekty, které mají stejný tvar, aby se vytvořily strojní práce. V jiných experimentech jsme ukázali, že děti mohou dokonce zjistit, že skrytá neviditelná vlastnost způsobuje, že stroj jde, nebo že stroj pracuje na nějakém abstraktní logickém principu.

Můžete to ukázat také v každodenním učení dětí. Malé děti se rychle učí abstraktní intuitivní teorie biologie, fyziky a psychologie, podobně jako dospělí vědci, a to i s relativně malými údaji.

Pozoruhodné úspěchy strojového učení posledních systémů AI, jak zdola, tak shora dolů, se odehrávají v úzkém a dobře definovaném prostoru hypotéz a konceptů - v přesném souboru herních pohybů a pohybů, předem stanovené sadě obrazů. . Naproti tomu děti i vědci někdy mění své koncepty radikálním způsobem a provádějí posuny paradigmatu spíše než jednoduše vyladit koncepty, které již mají.

Čtyři-rok-olds mohou okamžitě rozpoznat kočky a rozumět slovům, ale oni mohou také dělat kreativní a překvapivé nové závěry, které jdou daleko za jejich zážitky. Můj vlastní vnuk například nedávno vysvětlil, že pokud se dospělý chce znovu stát dítětem, měl by se pokusit nejíst žádnou zdravou zeleninu, protože zdravá zelenina způsobí, že se dítě stane dospělým. Tato hypotéza, věrohodná, kterou žádný dospělý nikdy nebude bavit, je charakteristická pro malé děti. Ve skutečnosti jsme se svými kolegy systematicky ukázali, že předškoláci jsou lepší, když přicházejí s nepravděpodobnými hypotézami, než starší děti a dospělí. Nemáme téměř tušení, jak je tento druh kreativního učení a inovací možný.

Při pohledu na to, co děti dělají, však mohou programátoři poskytnout užitečné rady ohledně pokynů pro počítačové učení. Obzvláště nápadné jsou dvě rysy učení dětí. Děti jsou aktivní žáci; nejen pasivně nasákají data jako AI. Stejně jako vědci experimentují, jsou děti přirozeně motivovány k tomu, aby získaly informace ze světa kolem sebe prostřednictvím jejich nekonečné hry a zkoumání. Nedávné studie ukazují, že tento průzkum je systematičtější, než vypadá a je dobře přizpůsoben k nalezení přesvědčivých důkazů na podporu tvorby hypotéz a volby teorie. Budování zvědavosti do strojů a umožnění jim aktivně interagovat se světem může být cestou k realističtějšímu a rozsáhlejšímu učení.

Za druhé, děti, na rozdíl od stávajících AI, jsou sociální a kulturní studenti. Lidé se neučí izolovaně, ale využívají nahromaděné moudrosti minulých generací. Nedávné studie ukazují, že i předškoláci se učí napodobováním a nasloucháním svědectví druhých. Ale jednoduše pasivně neposlouchají své učitele. Místo toho přijímají informace od ostatních pozoruhodně jemným a citlivým způsobem, vytvářejí složité závěry o tom, odkud informace pocházejí a jak důvěryhodná je, a systematicky integrují své vlastní zkušenosti s tím, co slyší.

„Umělá inteligence“ a „strojové učení“ zní strašidelně. A v některých ohledech jsou. Tyto systémy se například používají k ovládání zbraní, a my bychom se tím opravdu měli bát. Přirozená hloupost může přesto způsobit mnohem více chaosu než umělá inteligence; my lidé budeme muset být mnohem chytřejší, než jsme byli v minulosti, abychom správně regulovali nové technologie. Není však mnoho základů ani pro apokalyptickou, ani utopickou vizi AI nahrazujících lidi. Dokud nevyřešíme základní paradox učení, nejlepší umělá inteligence nebude schopna konkurovat průměrnému čtyřletému člověku.

Z nadcházející kolekce MOŽNÉ MINUTY: 25 způsobů pohledu na AI, editoval John Brockman. Publikováno na základě dohody s Penguin Press, členem Penguin Random House LLC. Copyright © 2019 John Brockman.

Bude AI někdy chytřejší než čtyřletý?