Jsme v éře Big Data, kde někteří vědci procházejí absolutně ohromující množství informací, aby odhalili světová tajemství. Vezměte si například výpočetní biolog Yaniv Erlich. Erlich a jeho kolegové pomocí dat z webu genealogie staví obrovské rodokmeny. Jeden strom, který říkají, spojuje tečky mezi 13 miliony různých lidí, odkaz, který sahá více než 500 let.
Celkově říká Erlich na svém webu projekt genetického stromu FamiLinx, který shromáždil informace 43 milionů lidí. Po spojení mezi lidmi, Erlich a Geni.com byli schopni sledovat kousek historie věku zkoumání.
Výchozím bodem FamiLinxu byly veřejné informace na Geni.com, genealogické sociální síti provozované společností MyHeritage. Geni.com umožňuje genealogickým pracovníkům zadávat jejich rodokmeny na webové stránky a vytvářet profily rodinných příslušníků se základními demografickými informacemi, jako jsou pohlaví, datum narození, rodinný stav a umístění. Genealógové rozhodují, zda chtějí, aby profily v jejich stromech byly veřejné nebo soukromé. Nové nebo upravené profily rodokmenu jsou neustále porovnávány se všemi existujícími profily a pokud existuje vysoká podobnost s existujícími, nabízí web uživatelům možnost sloučení profilů a propojení stromů.
Erlich otevírá dveře potenciálně do budoucnosti výzkumu lidské genetiky tím, že škrábe data, říká Nature .
Struktura samotných stromů by mohla poskytnout zajímavé informace o lidské demografii a populačním rozšíření, říká Nancy Cox, genetik člověka na University of Chicago v Illinois, který se studie nezúčastnil. Zajímavější však je, že taková data mohou být jednoho dne spojena s lékařskými informacemi nebo s DNA sekvenčními daty, protože více lidí má své genomy sekvencované a tyto informace ukládají do veřejných databází.
Více z Smithsonian.com:
Nejnovější člen lidského rodokmenu