https://frosthead.com

Tato pokerová hra AI ví, kdy držet 'Em a kdy skládat' Em

Počítačový program s názvem Pluribus získal nejlepší pokerové profesionály v řadě šesti hráčských her bez omezení Texas Hold'em a dosáhl milníku ve výzkumu umělé inteligence. Je to první bot, který porazil lidi v komplexní multiplayerové soutěži.

Jak vědci z laboratoře AI na Facebooku a Carnegie Mellon University referují v časopise Science, Pluribus se stal vítězem v zápasech s dominancí člověka i algoritmu. Merrit Kennedy původně píše pro NPR, pět verzí botu, které stojí před jedním profesionálním pokerovým hráčem; v dalším kole experimentů hrál jeden robot proti pěti lidem. Za příspěvek na blogu na Facebooku získala AI průměrně kolem 5 $ za handu nebo 1 000 $ za hodinu, když hrála proti pěti lidským protivníkům. Tato míra je mezi pokerovými profesionály považována za „rozhodující hranici vítězství“.

Čtyřnásobný šampion World Poker Tour Darren Elias, který hovořil s Kennedym, vysvětluje, že pomohl trénovat Pluribuse tím, že konkuroval čtyřem stolům protivníků a upozorňoval vědce, když se AI pomýlí. Brzy se bota „zlepšovala velmi rychle, z průměrného hráče na v podstatě světového pokerového hráče během několika dní a týdnů.“ Elias říká, že zážitek byl „docela děsivý“.

Podle Jamese Vincenta z Verge, Pluribus - překvapivě levná AI trénovaná s prostředky cloud computingu v hodnotě méně než 150 USD - dále zvládla pokerovou strategii tím, že hrála proti kopii sebe sama a učila se pomocí pokusů a omylů. Jak Jennifer Ouellette upozorňuje na Ars Technicu, bot si rychle uvědomila, že nejlepší postup je kombinací hratelnosti a nepředvídatelných tahů.

Většina lidských profesionálů se vyhýbá „donk sázení“, které najde hráče, který jedno kolo ukončí dorovnáváním a další začíná sázkou, ale Pluribus snadno přijal nepopulární strategii. Ve zprávě Ouellette zároveň AI nabídla neobvyklé velikosti sázek a vykazovala lepší náhodnost než soupeři.

"Jeho hlavní silnou stránkou je schopnost používat smíšené strategie, " uvedl Elias podle prohlášení CMU. "To je to samé, co se lidé snaží udělat." Je to poprava pro lidi - dělat to naprosto náhodně a důsledně. Většina lidí prostě nemůže. “

Pluribus není první AI hrající poker, který porazil lidské profesionály. V roce 2017 vyvinuli tvůrci bot Noam Brown a Tuomas Sandholm časnější iteraci programu s názvem Libratus. Tato AI rozhodně porazila čtyři pokerové profesionály na 120 000 handech dvou hráčů Texas Hold'em, ale jak vysvětluje blogový příspěvek na Facebooku, byla omezena skutečností, že čelila pouze jednomu soupeři najednou.

Podle Will Knight z MIT Technology Review představuje poker výzvu pro AI, protože zahrnuje více hráčů a množství skrytých informací. Ve srovnání s tím hry jako šachy a go zahrnují pouze dva účastníky a pozice hráčů jsou viditelné pro všechny.

K překonání těchto překážek vytvořili Brown a Sandholm algoritmus navržený tak, aby předpovídal další dva nebo tři tahy soupeře, než aby měřil jejich kroky na konci hry. I když se zdá, že tato strategie upřednostňuje krátkodobý zisk před dlouhodobými výhrami, Vergeův Vincent píše, že „krátkodobá rezistence je opravdu vše, co potřebujete“.

Pokud jde o postup vpřed, mohly by být použity programy pro více hráčů, jako je Pluribus, k navrhování léků schopných bojovat proti bakteriím rezistentním na antibiotika a ke zlepšení kybernetické bezpečnosti a vojenských robotických systémů. Tak jako V poznámkách společnosti Ars Technica k Ouellette patří mezi další potenciální aplikace dohled nad jednáními více stran, stanovení cen produktů a brainstormingové strategie dražeb.

Prozatím Brown říká Knightovi, že algoritmus zůstane z velké části pod záštitou - hlavně kvůli ochraně odvětví online poker před vznikem devastujících finančních ztrát.

Výzkumník uzavírá: „Pro pokerovou komunitu by to mohlo být velmi nebezpečné.“

Tato pokerová hra AI ví, kdy držet 'Em a kdy skládat' Em