Jedním ze základů vědecké metody je reprodukovatelnost výsledků. V laboratoři kdekoli na světě by měl být výzkumný pracovník schopen studovat stejný předmět jako jiný vědec a reprodukovat stejná data nebo analyzovat stejná data a všimnout si stejných vzorců.
To je důvod, proč nálezy studie zveřejněné dnes v současné biologii jsou tak znepokojivé. Když se skupina vědců pokusila poslat e-mail autorům 516 biologických studií publikovaných v letech 1991 až 2011 a požádat o nezpracovaná data, byla zděšena, když zjistila, že více než 90 procent nejstarších dat (z příspěvků napsaných před více než 20 lety) bylo nepřístupný. Celkově, i když zahrnovali příspěvky publikované teprve v roce 2011, byli schopni sledovat data pouze 23 procent.
"Každý ví, že pokud požádáte výzkumníka o data ze starých studií, budou lemovat a sbíhat, protože nevědí, kde to je, " říká Timothy Vines, zoolog na Britské Kolumbii, který vedl úsilí. "Ve skutečnosti však nikdy neexistovaly systematické odhady toho, jak rychle údaje vlastněné autory skutečně zmizí."
Pro svůj odhad si jeho skupina vybrala typ dat, která byla v průběhu času relativně konzistentní - anatomická měření rostlin a zvířat - a vykopala mezi 25 a 40 papíry za každý lichý rok v období, které použilo tento druh dat, aby viděla kdyby dokázali lovit surová čísla.
Překvapivé množství jejich dotazů bylo zastaveno v prvním kroku: u 25 procent studií nebylo možné nalézt aktivní e-mailové adresy, přičemž zaniklé adresy jsou uvedeny na samotném papíru a vyhledávání na internetu nezvyšovala žádné současné. U dalších 38 procent studií vedly jejich dotazy k žádné odezvě. Dalších 7 procent souborů dat bylo ztraceno nebo nepřístupné.
"Někdy to bylo například uloženo na disketách o velikosti tři a půl palce, takže k nim nikdo neměl přístup, protože už neměli správné jednotky, " říká Vines. Protože základní myšlenka uchovávání dat je taková, že je mohou v budoucím výzkumu používat i jiní, tato zastaralost v podstatě činí data zbytečnými.
Mohou se zdát jako obyčejné překážky, ale vědci jsou stejně jako my ostatní - mění e-mailové adresy, získávají nové počítače s různými jednotkami, ztratí zálohy souborů - takže tyto trendy odrážejí vážné systémové problémy ve vědě.
A uchovávání dat je tak důležité, stojí za to si pamatovat, protože je nemožné předvídat, kterým směrem se bude výzkum v budoucnu pohybovat. Například Vines provádí svůj vlastní výzkum na druhu ropuchy původem z východní Evropy, která se zdá být v procesu hybridizace. V 80. letech 20. století se na stejném tématu zabýval samostatný tým vědců a narazil na starý dokument, který dokumentoval distribuci těchto ropuch ve 30. letech. Věděli, že jejich distribuce se během uplynulých desetiletí změnila relativně málo, což vědcům umožnilo provádět nejrůznější výpočty, které by jinak nebyly možné. „Tato původní data, která byla k dispozici, z velmi malé staré studie napsané v polštině, byla pro vědce neuvěřitelně užitečná, která se objevila až o 70 let později, “ říká.
Existuje také skutečnost, že tolik z tohoto výzkumu je hrazeno z veřejných prostředků, z velké části jde o granty, které stanoví, že výsledné údaje budou volně zpřístupněny veřejnosti. Kromě toho jsou data v terénu ovlivněna okolnostmi prostředí, ve kterém jsou shromažďována - není tedy možné dokonale replikovat později, když se podmínky změnily.
Jaké je řešení? Některé časopisy - včetně Molecular Ecology, jejichž Vines je vedoucím editorem - přijaly zásady, které vyžadují, aby autoři spolu se svými papíry předkládali nezpracovaná data, což časopisu umožňuje, aby data trvale archivovala. Přestože časopisy, stejně jako lidé, podléhají změnám e-mailových adres a technologickému zastarávání, lze tyto problémy mnohem snadněji řešit v institucionálním měřítku.