Chinesische, afrikanische Genome sequenziert

Ein männlicher Yoruba aus Nigeria und ein Han-Chinese schlossen sich am Mittwoch den Genetik-Koryphäen James Watson und Craig Venter als einzige Personen an, deren Genome sequenziert und öffentlich zugänglich gemacht wurden. Die beiden anonymen Genome dienen als Beweis dafür, dass neue Sequenziertechnologien, die um Größenordnungen billiger sind als Standardmethoden, in der Lage sind, die Sequenz eines vollständigen menschlichen Genoms genau zu lesen. Das bedeutet, dass Wissenschaftler Tausende von Menschen sequenzieren können, von denen sie hoffen, dass sie endlich ein kohärentes Verständnis der genomischen Grundlagen von Krankheiten ermöglichen.





DNA lesen: Das dichte Packen von DNA-Fragmenten auf diesen kreditkartengroßen Chip von Illumina, eine sogenannte Flusszelle, ermöglicht eine Hochdurchsatz-Sequenzierung. Etwa 50 Millionen DNA-Cluster, von denen jeder etwa 1.000 Kopien desselben Fragments enthält, passen auf eine Fließzelle. Derzeit werden etwa 40 Fließzellen benötigt, um ein menschliches Genom genau zu sequenzieren.

Dies verlängert die Zeit, die für die Sequenzierung eines menschlichen Genoms benötigt wird, von Jahren auf Monate, sagt Samuel Levy , Direktor für Humangenetik am Craig Venter Institute in Rockville, MD, der nicht an der Forschung beteiligt war. Das ist ein riesiger technologischer Fortschritt. Es gibt uns die Möglichkeit, die Arten von Studien durchzuführen, die wir durchführen möchten, um genetische Variationen mit menschlichen Merkmalen in Verbindung zu bringen.

In den letzten zehn Jahren sind die Kosten für die Sequenzierung drastisch gesunken. Während die Referenzsequenz, die während des Humangenomprojekts generiert wurde, 300 Millionen US-Dollar kostete, wurde Watsons Genom letztes Jahr veröffentlicht und mit einer von entwickelten Technologie sequenziert 454 Biowissenschaften , in Branford, CT, kostete etwa 1 bis 2 Millionen US-Dollar. Das Yoruba-Genom kostete schätzungsweise 250.000 US-Dollar und die Fertigstellung dauerte nur zwei Monate, unter Verwendung der Technologie von Erleuchten , ein Gentechnologieunternehmen mit Hauptsitz in San Diego.



Neue Sequenzierungstechnologien steigern die Geschwindigkeit und senken die Kosten, indem sie gleichzeitig Hunderttausende von DNA-Stücken sequenzieren. Aus technischen Gründen reduziert diese massive Parallelität die Anzahl der Basenpaare – der DNA-Buchstaben –, die von jedem Stück gelesen werden können. Standard-Sequenzierungsmethoden können 400 bis 800 Basenpaare lesen, aber die Technologie von Illumina kann nur 35 bis 50 lesen. Das macht es schwieriger, eine vollständige Sequenz zusammenzustellen, was ein rechnerisches Zusammennähen der überlappenden Teile erfordert.

Aufgrund dieser kurzen Leselängen war unklar, wie genau die Technologie von Illumina und anderen Unternehmen ein menschliches Genom sequenzieren könnte. In den neuen Studien, die heute in . veröffentlicht wurden Natur , zeigen Forscher von Illumina und vom Beijing Genomics Institute in China, dass sie durch die jeweils etwa 40-malige Sequenzierung des Genoms ihrer Probanden 99,9 Prozent der Sequenz im Referenzgenom lesen konnten. Die größere Anzahl von Sequenzierungsdurchgängen – die Standardsequenzierung erfordert nur etwa 6 bis 10 Durchgänge – ist notwendig, um kürzere Leselängen auszugleichen. Aber auch mit den zusätzlichen Pässen ist die neue Technik deutlich günstiger.

Die Genauigkeit ihrer Sequenzen konnten die Wissenschaftler durch den Vergleich mit früheren genetischen Analysen derselben Genome überprüfen. Die von David Bentley und seinen Kollegen bei Illumina sequenzierte Yoruba-DNA war in früheren Studien verwendet worden, die nach Single-Nukleotid-Polymorphismen (SNPs) oder genetischen Variationen eines einzelnen Buchstabens suchten, die sich über das gesamte Genom verteilen. Jun Wang und Kollegen vom Beijing Genomics Institute, die das chinesische Genom sequenziert haben, verglichen ihre Ergebnisse mit denen eines Mikroarrays, der Tausende von gängigen SNPs erkennen soll.



Die beiden neuen Sequenzen offenbaren keine genomischen Überraschungen. Forscher fanden etwa vier Millionen SNPs im Yoruba-Genom, von denen etwa 26 Prozent zuvor nicht identifiziert worden waren. Das Yoruba-Genom zeigte eine höhere genetische Vielfalt als zuvor sequenzierte Einzelgenome, aber frühere Analysen afrikanischer DNA hatten dies vorhergesagt. Das chinesische Genom hingegen wies etwa 13,6 Prozent zuvor nicht identifizierte SNPs auf.

Wissenschaftler hoffen, dass die Fähigkeit, neuartige SNPs zu identifizieren, ein Segen bei der Suche nach der genomischen Grundlage von Krankheiten sein wird. Die meisten großen Genomstudien haben sich bisher auf häufige genetische Variationen konzentriert – solche mit einer Häufigkeit von mindestens 5 Prozent –, weil sie am einfachsten zu finden waren. Die Forschung legt jedoch nahe, dass diese Variationen nur einen Bruchteil des genetischen Beitrags zu Volkskrankheiten ausmachen. Die Möglichkeit, viele menschliche Genome zu sequenzieren, wird es Wissenschaftlern ermöglichen, seltenere Varianten zu finden und ihre potenziell große Rolle für die menschliche Gesundheit zu charakterisieren.

Solche Studien laufen bereits. Das Yoruba-Genom ist Teil einer internationalen Zusammenarbeit, die als 1.000-Genome-Projekt bekannt ist und als technologische Testumgebung für die großvolumige menschliche Sequenzierung dienen wird. Man könnte mit alten Technologien keine 1.000 Genome erstellen, aber die neuen Technologien machen es möglich, sagt Lisa Brooks , Direktor des genetischen Variationsprogramms am National Human Genome Research Institute in Bethesda, MD. Die an dem Projekt beteiligten Wissenschaftler wollen alle menschlichen Variationen katalogisieren, die mit einer Häufigkeit von etwa 0,1 Prozent auftreten.



Illumina ist nicht allein in seinem Bestreben, menschliche Genome kostengünstig zu sequenzieren. Applied Biosystems, das Unternehmen, das viele der Sequenziermaschinen für das Human Genome Project lieferte, hat auch das Yoruba-Genom sequenziert und wird seine Ergebnisse wahrscheinlich bald veröffentlichen. Zwei Start-ups, Pacific Biosciences und Complete Genomics, sind ebenfalls auf der Spur. Complete Genomics verspricht beispielsweise ein Genom von 5.000 US-Dollar bis zum nächsten Jahr. Die Wissenschaftler des Unternehmens haben ihre Ergebnisse jedoch noch nicht in begutachteten Zeitschriften veröffentlicht, sodass die Vollständigkeit und Genauigkeit ihrer Methode noch unabhängig validiert werden muss. Mit diesen und anderen Daten aus dem 1.000-Genome-Projekt werden wir in einer guten Position sein, um diese verschiedenen Technologien richtig zu kalibrieren, sagt Richard Gibbs , Direktor des Human Genome Sequencing Center am Baylor College of Medicine in Houston, TX.

Die beiden neuen Genome sind auch die ersten nicht-kaukasischen Genome, die in die öffentliche Datenbank aufgenommen werden. Sie seien ein Sprungbrett zum Verständnis genetischer Unterschiede zwischen Ethnien, sagt Levy, der einen Kommentar zur Veröffentlichung der beiden Papiere verfasste.

In derselben Ausgabe von Natur , Wissenschaftler der Washington University School of Medicine in St. Louis beschreiben die Verwendung der Technologie von Illumina zur Sequenzierung des ersten vollständigen Krebsgenoms. Sie fanden acht bisher nicht identifizierte Mutationen, die Aufschluss über die Krankheit geben könnten.



Beim Sequenzierungsansatz von Illumina wird DNA in kleine Stücke fragmentiert und molekular an einen speziell entwickelten Objektträger, bekannt als Durchflusszelle, gebunden. Etwa 50 Millionen Fragmente passen auf eine einzelne Zelle. Jedes Fragment wird 1.000 Mal kopiert, während es noch an der Fließzelle haftet. Fluoreszierend markierte Basen, die die vier Buchstaben darstellen, aus denen die DNA besteht und rot, grün, blau und gelb gefärbt sind, werden dann der Zelle hinzugefügt. Die Base, die dem Buchstaben an der ersten Position in einem DNA-Fragment entspricht, wird an dieses Fragment angehängt. Eine Kamera macht dann an jeder der 50 Millionen Stellen der Durchflusszelle ein Bild der fluoreszierenden Basen. Die Base wird dann abgeschnitten und der Zyklus wird für jeden Buchstaben des DNA-Fragments wiederholt. Die resultierenden Bilder werden rechnerisch zusammengefügt, um eine Sequenz zu erzeugen.

verbergen