Před deseti lety mezinárodní výzkumný tým dokončil ambiciózní snahu číst 3 miliardy písmen genetické informace nalezené v každé lidské buňce. Program, známý jako Projekt lidského genomu, poskytoval plán lidského života, úspěch, který byl porovnán s přistáním člověka na Měsíc.
Eric D. Green byl zapojen od samého začátku a zdokonaloval některé klíčové technologie použité v projektu. V té době působil jako postdoktorand a bydlel v patologii na Washingtonské univerzitě v St. Louis. Vyřezal svůj 5 procent genomu a zaměřil se na mapování DNA chromozomu 7. Green je dnes ředitelem Národního výzkumného ústavu pro lidský genom, který prostřednictvím genomického výzkumu podporuje porozumění lidskému genomu.
Vraťme se do poloviny osmdesátých let, kdy byl poprvé vytvořen nápad na projekt Human Genome Project. Jaká byla motivace v té době?
Záleží na tom, koho se zeptáte. Různí lidé měli různé motivace. Mějte na paměti, že v 70. a na začátku 80. let byla éra revoluce molekulární biologie. V metodách, které nám umožnily izolovat a studovat DNA v laboratoři, došlo k významnému pokroku.
Například v USA se ministerstvo energetiky velmi zajímalo o představu o studiu genomu kvůli zájmu o mutaci a proces mutace spojený s některými formami energie, jako je jaderná energie.
Pokud jdete na místa, jako jsou Národní ústavy zdraví, nebo se podíváte na biomedicínské výzkumníky a výzkumníky související se zdravím, měli velký zájem na tom, aby byli schopni objasnit genetický základ nemoci. Mezi mnoho genetických chorob, které byly zvažovány, byla samozřejmě rakovina.
Mnoho dalších lidí v biomedicínském výzkumném spektru - dokonce i ti, kteří pracují na modelových organismech, jako jsou mouchy, červi a kvasinky - uznali, že pokud bychom mohli přijít na to, jak komplexně nahlédnout do komplexních genomů, počínaje mouchami a červy a kvasinkami, ale pak pracujeme Naše cesta k lidem by poskytla základní informace pro pochopení toho, jak genom fungoval.
Došlo ke sloučení mnoha různých myšlenek, které se na pozadí postupných, ale důležitých technologických pokroků zdály, že i když je to skličující, je možné vyřešit problém sekvenování lidského genomu a stanovení pořadí 3 miliard písmen.
Odkud pochází materiál pro genomový projekt? Čí to byl genom?
Když byl genomový projekt zahájen, byl pořád docela kusový. Různí lidé dělali různé sbírky a fragmenty DNA nazývané knihovny, které jsou jen kousky DNA klonované. Udělali by to od kohokoli: Někdy by to byla laboratorní hlava, jindy to byl postdoktorand nebo student. Kdyby to ve skutečnosti nemělo žádné důsledky, chytili by DNA zpátky.
Ale pak, když konečně přišel čas, aby se knihovny, které se měly použít pro sekvenování lidského genomu v rámci projektu Human Genome Project, člověk, který byl nejlepší pro výrobu těchto knihoven, stal vědcem, který pracoval v Roswell Park Cancer Institute v Buffalu v New Yorku. [Tým] získal informovaný souhlas od přibližně 10 nebo 20 anonymních dárců krve a poté náhodně vybral jednoho z nich, a to byla ta osoba. Asi 60 procent sekvence lidského genomu generované Projektem lidského genomu pocházelo od jednoho dárce krve v Buffalu v New Yorku.
Ale víš co, na tom nezáleží. Pokud projdete sekvenci lidského genomu generovanou Projektem lidského genomu, je to jako mozaika. Můžete jít na sto tisíc dopisů a může to být jedna osoba z Buffala. Mohlo by to skončit tím, že půjdeš dalších sto tisíc a bude to někdo jiný. A dalších sto tisíc, někdo jiný. Všechno, co sloužilo jako reference. A protože všichni lidé jsou na úrovni sekvence identičtí na 99, 9 procenta, první sekvence nemusí být skutečná osoba. Může to být jen hypotetický odkaz na osobu.
Ze všech těchto informací, proč jste se rozhodli zaměřit na chromozom 7 [lidský genom má 23 chromozomů]?
Bylo to trochu svévolné. Chtěli jsme vybrat chromozom, který nebyl příliš velký. Nechtěli jsme si vybrat ten, který byl příliš malý. Věděli jsme, že bude hodně práce, a tak jsme vybrali chromozom střední velikosti.
Nechtěli jsme si vybrat ten, na kterém už hodně lidí pracuje. V té době byl nejznámějším genem na chromozomu 7 gen pro cystickou fibrózu, který byl objeven v roce 1989. A my jsme vlastně izolovali některé z této oblasti a studovali jsme pilotně.
Pravda je, že jsme to vybrali, protože to nebylo příliš velké, nebylo příliš malé a nebylo příliš přeplněné. To byl libovolný způsob, jak začít; v době, kdy projekt genomu skončil, byla většina studií prováděna v celé genomu.
Jak se práce změnila v průběhu celého projektu?
Celý příběh genomiky je vývoj technologií. Pokud zjistíte, kde došlo k obrovským pokrokům, každá z nich byla spojena s technologickými vlnami. Na začátku projektu genomu došlo k nárůstu v tom, že jsme měli lepší způsoby izolace velkých kusů DNA.
Když jsme sekvenovali menší genomy organismů - jako například mušky ovoce Drosophila - v podstatě jsme industrializovali proces sekvencování, čímž jsme ho stále více automatizovali.
Když byl genomový projekt zahájen, byla myšlenka: „Pojďme sekvenci genomů mouch a červů a kvasinek, všech těchto menších organismů pomocí metody dne“, což byla tato metoda vyvinutá Fredem Sangerem v roce 1977. nebude tlačit na urychlovač, aby zahájil sekvenování lidského genomu, dokud nebude k dispozici nová revoluční metoda sekvenování. Takže bylo vynaloženo velké úsilí na vývoj nových bláznivých způsobů sekvenování DNA.
Když přišel čas, kolem roku 1997 nebo 1998, aby skutečně přemýšleli o tom, jak začít sekvenovat lidský genom, všichni řekli: „Možná nemusíme čekat na revoluční metodu, možná jsme postupně vylepšili staromódní metodu dobře natolik, že může být použit, “a to je skutečně to, o čem bylo rozhodnuto.
Od genomového projektu však byla změněna tvář genomiky revoluční nové sekvenční technologie, které na scénu konečně přišly zhruba v roce 2005.
Jak tato vylepšení změnila cenu a čas potřebný pro řazení?
Projekt Human Genome Trvalo šest až osm let aktivního sekvencování a pokud jde o aktivní sekvenování, utratili asi miliardu dolarů na výrobu první sekvence lidského genomu. V den, kdy projekt genomu skončil, jsme se zeptali našich sekvenačních skupin: „Dobrá, pokud půjdeš sekvenci druhého lidského genomu, hypoteticky, jak dlouho to bude trvat a kolik to bude stát?“ Se zadní stranou obálky výpočet, řekli: „Páni, kdybyste nám dali dalších 10 až 50 milionů dolarů, pravděpodobně bychom to mohli udělat za tři až čtyři měsíce.“
Ale teď, pokud jdete na místo, kde jsme dnes, můžete sekvenci lidského genomu přibližně za den nebo dva. Do konce tohoto roku to bude asi den. A bude to stát jen asi 3 000 až 5 000 dolarů.
Jaké byly hlavní nálezy z prvního genomu a ty, které následovaly?
Každý den přicházejí nová zjištění. V prvních 10 letech, kdy jsme před sebou měli lidskou genomovou sekvenci, si myslím, že každý den shromažďujeme stále více informací o tom, jak lidský genom funguje. Měli bychom si však uvědomit, že i po 10 letech jsme teprve v počátečních stádiích interpretace této sekvence. Desetiletí od nynějška budeme stále tlumočit a znovu interpretovat.
Například některé z prvních věcí, které jsme se naučili: Máme mnohem méně genů, než někteří lidé předpovídali. Když genom začal, mnoho lidí předpovídalo, že lidé pravděpodobně měli 100 000 genů a měli by podstatně více genů než jiné organismy, zejména jednodušší organismy. Ukazuje se, že to není pravda. Ukázalo se, že jsme mnohem nižší počet genů. Ve skutečnosti jsme pravděpodobně více než 20 000 genů. A to je jen o několik tisíc více než mouchy a červi. Naše složitost tedy není v našem počtu genů. Naše složitost je jinde.
Další překvapení přišlo, když jsme začali sekvenovat další savce - zejména myší genom, krysí genom, psí genom atd., A nyní jsme sekvenovali 50, 60, 70 takových genomů. Vyrovnejte tyto genomové sekvence v počítači a podíváte se, kde jsou sekvence, které jsou velmi konzervované, jinými slovy napříč desítky milionů let evolučního času, kde se sekvence vůbec nezměnily. Vysoce, vysoce evoluční konzervované sekvence téměř jistě ukazují na funkční sekvence. To jsou věci, které život nechce měnit, a tak je udržují stejné, protože vykonávají nějakou zásadní základní funkci nezbytnou pro biologii. Když jsme šli do projektu genomu, mysleli jsme si, že většina těch nejvíce konzervovaných oblastí, které byly funkčně důležité, bude v genech - části genomu, které přímo kódují proteiny. Ukázalo se, že většina nejvíce konzervovaných a nevyhnutelně funkčních sekvencí není v oblastech kódujících protein; jsou mimo geny.
Co tedy dělají? Neznáme všechny. Ale víme, že mnoho z nich jsou v zásadě obvodové spínače, jako jsou spínače pro stmívání světla, které určují, kde a kdy a jak moc se gen zapne. U lidí je mnohem složitější než u nižších organismů, jako jsou mouchy a červi. Takže naše biologická složitost není ani tak v našem počtu genů. Je to v komplexních spínačích, jako jsou dimmerové spínače, které regulují, kde, kdy a kolik genů se zapne.
Co jsme nechali přijít na to?
Když přemýšlíte o tom, jak genom funguje, přemýšlíte o tom, jak to funguje běžně pro nás všechny. Ale další velký důraz v genomice - zejména v posledních 10 letech - je pochopit, jak se naše genomy liší. Zde můžete zdůraznit 0, 1 procenta našich genomů, které jsou ve srovnání navzájem odlišné a jak tyto rozdíly vedou k různým biologickým procesům. Takže, pochopení variace je velmi, velmi důležité, a pak korelace této variace s různými důsledky, jejichž nemoc je jejich hlavní částí.
Tam byly pozoruhodné, jen opravdu pozoruhodné pokroky. Nyní známe genomický základ pro téměř 5 000 vzácných genetických chorob. Když byl genomový projekt zahájen, existovalo jen několik desítek nemocí, u nichž jsme pochopili, co mutace způsobuje tuto nemoc. To je obrovský rozdíl. Nyní víme mnoho, stovky a stovky oblastí lidského genomu, které obsahují varianty - zatím nevíme, které varianty - které představují riziko pro komplikovanější genetická onemocnění, jako je hypertenze a cukrovka a astma, kardiovaskulární onemocnění atd. .
Přecházeli jsme od úplného nedostatku znalostí o tom, kde hledat genom pro tyto varianty, až po nyní velmi diskrétní regiony, které je třeba hledat. Toto je nyní velký důraz v genomice, snaží se pochopit, které varianty jsou relevantní pro nemoc a co s nimi dělat.