Genome Function Topology

Das Projekt Genome Function Topology zielt darauf ab, neue Prinzipien der räumlichen und funktionellen Organisation des menschlichen Genoms zu entdecken, indem es die globale dreidimensionale Organisation des Genoms und groß angelegte Wissensgraphen berücksichtigt.

Der aktuelle Stand der Technik zur Verknüpfung von Genomstrukturwissen mit Funktionswissen ist die Berücksichtigung des lokalen "Genomkontextes". Das heißt, die Sequenz und Topologie des Genoms wird berücksichtigt, aber nur im Hinblick auf die Annotation einzelner Gene oder Gen-Krankheits-Assoziationen in eng definierten funktionellen Zusammenhängen.

In den letzten Jahren sind die Grenzen dieses Ansatzes deutlich geworden. Fortschritte in der Hochdurchsatz-Chromatin-Interaktionsanalyse haben demonstriert, dass die räumliche Organisation von Chromatin im Kern eine starke Verbindung zur Funktion hat. Es ist beispielsweise auch bekannt, dass regulatorische Regionen (wie Promotoren und Enhancer) eines Gens ganz weit vom kodierenden Teil entfernt sein können, da sich das Chromosom während der Transkription biegt und schleifenförmig bewegt. Solche Wechselwirkungen können weit getrennt voneinander auftreten. Andererseits ist weniger über interchromosomale Wechselwirkungen bekannt. Darüber hinaus weiß man, dass die "Verklumpung" von Chromatin in verschiedene Gebieten, von denen einige bevorzugt in der Nähe des Kerns und andere in der Nähe der Kernhülle liegen, eine regulatorische Wirkung hat. Dementsprechend wird jeder Ansatz, der sich nur auf den lokalen Kontext konzentriert, notwendigerweise signifikante Verbindungen zwischen der räumlichen und funktionalen Organisation des Genoms übersehen.

Wir verfolgen daher einen grundlegend anderen Ansatz: die vollständige Genom-Topologie durch Hinzufügen eines globalen funktionalen Kontextes über datengesteuerte Annotationen und wissensbasierte Modellierung in BEL zu berücksichtigen. Aus Volltextartikeln abgeleitete Wissensgrafen werden mit einer Darstellung der dreidimensionalen Genomstruktur im menschlichen Genom verankert. Zum Beispiel können wir die funktionelle topologische Enrichment-Analyse betrachten: Finde für ein gegebenes Gen alle Gene, deren Enhancer "nahe" am Enhancer des Zielgens liegt, und identifiziere die Wirkungspfade, an denen diese Gene beteiligt sind. Wir können die Bedeutung dieser Enrichment-Analyse anhand einer vordefinierten Benchmark-Analyse untersuchen. Sobald diese Methodik etabliert ist, können wir andere genetische Objekte identifizieren, die für das funktionelle Enrichment von Interesse sind, und die Methodik auf diese Objekte ausdehnen. Wir können auch die Verteilung von Genen über das Genom untersuchen, die an einem Wirkungspfad beteiligt sind.

Projektlaufzeit: 11/2018 - 10/2021