https://frosthead.com

Studie umělé inteligence lidského genomu najde neznámého lidského předka

Dokáže nás stroje naučit něco nového o tom, co to znamená být člověkem? Pokud jde o složitý příběh komplexního původu a vývoje našeho druhu, zdá se, že mohou.

Nedávná studie použila technologii strojového učení k analýze osmi předních modelů lidského původu a evoluce a program identifikoval důkazy v lidském genomu „duchové populace“ lidských předků. Analýza naznačuje, že dříve neznámá a dlouho zaniklá skupina homininů se křížila s Homo sapiens v Asii a Oceánii někde podél dlouhé klikaté cesty lidské evoluční historie, která v moderní lidské DNA zanechávala pouze fragmentované stopy.

Studie, publikovaná v Nature Communications, je jedním z prvních příkladů toho, jak strojové učení může pomoci odhalit stopy našeho vlastního původu. Vědci mohou proniknout skrz obrovské množství genomických dat, která zůstala ve zkamenělých kostech, a porovnat je s DNA u moderních lidí, a mohou tak zaplnit některé mezery evoluční historie našeho druhu.

V tomto případě se zdá, že výsledky odpovídají paleoantropologickým teoriím, které byly vyvinuty ze studia fosilií lidských předků nalezených v zemi. Nová data naznačují, že záhadný hominin pravděpodobně pocházel ze směsi neandrtálců a Denisovanů (kteří byli v lidském rodokmenu v roce 2010 identifikováni pouze jako jedinečný druh). Takový druh v naší evoluční minulosti by vypadal hodně jako fosilie 90 000 leté dospívající dívky z Sibiřské Denisovy jeskyně. Její pozůstatky byly popsány loni v létě jako jediný známý příklad hybridů první generace mezi dvěma druhy, s neandrtálskou matkou a Denisovanovým otcem.

"Je to přesně ten druh člověka, kterého očekáváme, že najdeme původ této populace, nemělo by to však být pouze jednotlivci, ale celá populace, " říká spoluautor studie Jaume Bertranpetit, evoluční biolog na barcelonské univerzitě Pompeu Fabra.

Šíření rodu Homo Schopnost raných lidí přizpůsobit se měnícím se podmínkám nakonec umožnila nejčasnějším druhům Homo měnit, přežít a začít se šířit z Afriky do Eurasie před 1, 85 miliony let. (Obrázek se svolením Antón, Potts and Aiello (2014), Science 345 (6192))

Předchozí studie lidského genomu odhalily, že poté, co moderní lidé opustili Afriku, asi před 180 000 lety, se následně křížili s druhy jako Neandertálci a Denisovanové, kteří koexistovali s ranými moderními lidmi dříve, než vyhynuli. Ale překreslení našeho rodokmenu tak, aby obsahoval tyto divergentní větve, bylo obtížné. Důkazy o „duchových“ druzích mohou být řídké a existuje mnoho konkurenčních teorií, které vysvětlují, kdy, kde a jak často se Homo sapiens mohli křížit s jinými druhy.

Stopy těchto starodávných mezidruhových spojení, nazývaných introgrese, lze identifikovat jako místa divergence v lidském genomu. Vědci pozorují větší oddělení dvou chromozomů, než byste očekávali, pokud oba chromozomy pocházejí ze stejného lidského druhu. Když vědci v roce 2010 sekvenovali neandrtálský genom, uvědomili si, že některé z těchto divergencí představují zlomky našeho genomu, které pocházejí od neandertálců. Studie také odhalily, že někteří žijící lidé mohou vystopovat až 5 procent svého původu k Denisovanům.

"Mysleli jsme si, že se pokusíme najít tato místa s vysokou divergencí v genomu, zjistit, která jsou neandrtálská a která jsou Denisovan, a pak zjistit, zda tato vysvětlují celý obraz, " říká Bertranpetit. "Jak se to stane, pokud odečtete části neandrtálců a Denisovanů, v genomu je stále něco, co je velmi odlišné."

Identifikace a analýza mnoha divergentních míst v celém genomu a výpočet nespočetných genetických kombinací, které by je mohly produkovat, je pro lidi příliš velkou úlohou, aby se s nimi vypořádaly samy - ale je to úkol, který může být vytvořen pro algoritmy hlubokého učení.

Hluboké učení je druh umělé inteligence, ve kterém jsou algoritmy navrženy tak, aby fungovaly jako umělá neuronová síť nebo program, který dokáže zpracovávat informace stejným způsobem jako mozek savců. Tyto systémy strojového učení mohou detekovat vzorce a odpovídat za předchozí informace, které se „naučí“, což jim umožňuje provádět nové úkoly nebo hledat nové informace po analýze obrovského množství dat. (Běžným příkladem je AlphaZero společnosti Google DeepMind, které se může naučit ovládat deskové hry.)

"Hluboké učení se přizpůsobuje složitějšímu tvaru množině bodů ve větším prostoru, " říká Joshua Schraiber, odborník na evoluční genomiku na Temple University. "Namísto toho, abys osadil čáru mezi Y a X, sesadíš nějakou šikovnou věc k souboru bodů v mnohem větším, tisícimenzionálním prostoru." Hluboké učení říká: „Nevím, jak by se k těmto bodům maličko přizpůsobit, ale uvidíme, co se stane.“ “

V tomto případě byly stroje nastaveny tak, aby analyzovaly lidský genom a předpovídaly lidskou demografii simulací toho, jak by se naše DNA mohla vyvinout v mnoha tisících možných scénářích starověké evoluce. Program odpovídal za strukturu a vývoj DNA, stejně jako modely lidské migrace a křížení, aby se pokusil spojit některé kousky do neuvěřitelně složité hádanky.

Vědci vyškolili počítač, aby analyzoval osm různých modelů nejpravděpodobnějších teorií rané lidské evoluce v celé Eurasii. Modely pocházely z předchozích studií, které se pokusily přijít s scénářem, který by vyústil v současný obraz lidského genomu, včetně jeho známých neandertálských a Denisovanových složek.

"Samozřejmě by mohly existovat i jiné modely, ale tyto modely jsou ty, které navrhli jiní lidé ve vědecké literatuře, " říká Bertranpetit. Každý model začíná akceptovanou událostí mimo Afriku a poté obsahuje odlišnou sadu nejpravděpodobnějších rozdělení mezi lidskými liniemi, včetně různých křížení se známými druhy a možnými druhy duchů.

Lidský rodokmen Lidé, nebo Homo sapiens, pocházejí ze složitého stromu předních pěšáků, včetně druhů z rodů Ardipithecus, Australopithecus a Paranthropus . (Smithsonianův program Human Origins Program)

"U každého z těchto osmi modelů počítáme v průběhu týdnů výpočtů, jak dobře jsou schopni dosáhnout skutečné současné genetické skladby lidí, " říká Bertranpetit. "Pokaždé, když provádíme simulaci, je to simulace možné cesty lidského vývoje a tyto simulace jsme provedli tisíckrát a algoritmy hlubokého učení jsou schopny rozpoznat, který z modelů nejlépe vyhovuje datům."

Závěr stroje? V naší linii je přítomen druh předků, který musíme ještě identifikovat. "Zdaleka, jediné modely, které jsme testovali a které jsou skutečně podloženy údaji, jsou ty, které mají tuto introgresi populace duchů, " říká Bertranpetit.

Zajímavá studie a další, které se jí líbí, mohou pomoci překreslit mapu toho, jak se lidé stěhovali a vyvíjeli, ačkoli to vypadá, že je stále komplikovanější starověký svět v Eurasii a Oceánii.

"Je to jistě zajímavé a konzistentní se vznikajícím obrazem komplexní síťované fylogeneze v evoluci člověka, " říká Iain Mathieson, populační genetik University of Pennsylvania, e-mailem. „Nejsem si jistý, zda má smysl mluvit o„ introgresních událostech “, když se to zdá být normou.“ Ve skutečnosti, protože bylo testováno pouze osm modelů a mnoho dalších bylo možné, Mathieson dodává, že nová zjištění jsou „ jistě věrohodný scénář, ale realita je pravděpodobně ještě složitější. “

Protože se v této oblasti objevují nové fosilní objevy, lze pomocí těchto typů programů nyní testovat aktualizované modely proti lidskému genomu. Schraiber říká, že síla hlubokého učení pro studium lidského původu spočívá právě v jeho schopnosti analyzovat složité modely.

"Pokud chcete udělat extrémně podrobný model, protože jste antropolog, a chcete vědět, zda k této introgrese došlo před 80 000 lety nebo 40 000 lety, je to moc takového přístupu k hlubokému učení."

Interbreedings starověké Eurasie, jak jsou dnes, jsou stále jen jednou částí našeho lidského příběhu. Bertranpetit věří, že budoucí pokroky v hlubokém učení mohou pomoci odhalit další nové kapitoly.

"Tento způsob analýzy bude mít všechny nové výsledky, " říká. "Jsem si jist, že lidé pracující v Africe najdou vyhynulé skupiny, které dosud nebyly uznány." Afrika nám v budoucnu bezpochyby ukáže překvapivé věci. “

Studie umělé inteligence lidského genomu najde neznámého lidského předka