Forscher von der University of Washington und der HudsonAlpha Institut für Biotechnologie haben eine neue Methode für die Organisation und Priorisierung genetischer Daten entwickelt. Die Kombinierte Annotation Abhängige Depletion oder CADD , Methode werden die Wissenschaftler bei der Suche nach krankheitsverursachenden Mutation Ereignisse in der menschlichen Genome unterstützen.
Das neue Verfahren ist der Gegenstand einer Veröffentlichung mit dem Titel " A allgemeinen Rahmen zur Schätzung der relativen Pathogenität von menschlichen genetischen Varianten", veröffentlicht in Nature Genetics .
Aktuelle Methoden der Organisierung der menschlichen genetischen Variation Blick auf nur ein oder ein paar Faktoren, und verwenden Sie nur eine kleine Teilmenge der verfügbaren Informationen . Zum Beispiel der Encyclopedia of DNA Elements oder ENCODE , Kataloge unterschiedliche Funktionselemente in der menschlichen Genome , während die Sequenzkonservierung sieht für ähnliche oder identische Sequenzen, die in den verschiedenen Arten durch Hunderte von Millionen von Jahren der Evolution überlebt haben. CADD bringt all diese Daten zusammen , und mehr, in eine Kerbe , um eine Rangliste , die Forscher erkennen, welche Varianten können Erkrankungen in Verbindung gebracht werden und welche möglicherweise nicht unterstützt werden.
" CADD im Wesentlichen unsere Fähigkeit, krankheits kausalen Mutationen zu identifizieren zu verbessern, wird auch weiterhin besser als genomische Datenbanken wachsen, um zu bekommen, und ist eine wichtige analytische Voraus notwendig, um den Informationsgehalt der Vollgenomsequenzenin beiden klinischen und wissenschaftlichen Einstellungen besser zu nutzen " sagte Gregory M. Cooper , Ph.D., Fakultät Ermittler bei HudsonAlpha und einer der Mitarbeiter auf CADD .
Das Ziel bei der Entwicklung des neuen Konzepts war es, die überwältigende Menge an Daten zu nehmen und es destillieren sich in eine einzige Punktzahl , die leichter von einem Forscher oder Arzt ausgewertet werden können. Um dies zu erreichen , verglichen und gegen die Eigenschaften von 15 Millionen Genvarianten trennt den Menschen vom Schimpansen, die mit 15 Millionen simulierten Varianten CADD . Bei Menschen beobachtet Varianten haben natürliche Selektion , die schädliche , krankheitserregende Varianten zu entfernen neigt überlebt , während simulierten Varianten nicht zu Auswahl ausgesetzt . So kann durch den Vergleich beobachteten simulierten Varianten ist CADD der Lage, diese Eigenschaften, die eine Variante schädlichen oder krankheitsverursachende machen zu identifizieren. C Scores wurden für alle 8,6 Milliarden möglichen Einzel-Nukleotid- Varianten voraus berechnet und sind für die Forscher frei verfügbar.
" Wir wussten nicht, was zu erwarten ist ", sagte Cooper , "aber wir waren angenehm überrascht , dass CADD konnte nicht nur auf Mutationen zu sein, überall im Genom , aber in der Tat eine wesentlich bessere Arbeit in fast allen Tests , die wir durchgeführt als andere Kennzahlen . "
Das CADD Verfahren ist einzigartig von anderen Algorithmen , daß sie ordnet Partituren Mutationen irgendwo im menschlichen Genom , und nicht nur die weniger als zwei Prozent , die Proteine kodieren (die " Exoms "). Diese einzigartige Eigenschaft wird entscheidend sein , wie Ganzkörper- Genom-Sequenzierung zur Routine in beiden klinischen und Forschungseinstellungen.