Bioinformatik - Genetische Schaltzentralen leichter erkennen
"Um die Steuerung der Genexpression besser zu verstehen, müssen wir untersuchen, wie und wann Regulationsfaktoren binden" sagt der LMU-Informatiker Johannes Söding, der nun mit seinem Team ein neues computerbasiertes Verfahren dafür entwickelt hat. Die meisten modernen Methoden zur Untersuchung der Genregulierung liefern als Ergebnis eine Liste von Sequenzen, die durch einen oder mehrere spezifisch bindende Faktoren kontrolliert werden. Die jeweiligen Bindungspräferenzen der Faktoren können dabei mithilfe sogenannter Positionsspezifischer Gewichtsmatritzen (PWMs) beschrieben werden.
Muster im Sequenzrauschen
Allerdings sind PWMs für die computergestützte Entdeckung unbekannter Bindepräferenzen in Sequenzdaten problematisch, weil es unendlich viele von ihnen gibt, und weil die Berechnung ihrer statistischen Signifikanz sehr zeitaufwändig ist. Södings Gruppe ist es gelungen, diese Limitierung zu überwinden und eine Methode zu entwickeln, mit der die statistische Signifikanz der PWMs direkt optimiert werden kann. Dieser Ansatz zahlt sich aus: "Unsere Methode zeigt im Vergleich zu herkömmlichen Verfahren eine deutlich größere Sensitivität, um auch schwache Muster zu erkennen. Zudem sind die errechneten PWMs genauer", erklärt Söding.
Die Wissenschaftler untersuchten mit ihrer Methode sogenannte humane Core-Promotor-Sequenzen, also kurze DNA-Abschnitte, an denen die Abschrift der DNA in Boten-RNA beginnt. Tatsächlich gelang es ihnen, eine Reihe von bislang unbekannten Motiven zu identifizieren, die vermutlich wichtige regulatorische Eigenschaften beinhalten. "Wir hoffen, mit unserer Methode das Verständnis der Genregulation durch spezifische DNA- und RNA-Bindungsfaktoren entscheidend voranzubringen", sagt Söding. (Genome Research, September 2012)