Weiß, Elena (2024): Identifying differential read density in functional genomics data. Dissertation, LMU München: Fakultät für Mathematik, Informatik und Statistik |
Vorschau |
PDF
Weiss_Elena.pdf 33MB |
Abstract
The introduction of high-throughput next-generation sequencing (NGS) methods now allows genome-wide investigations into gene regulation at unprecedented detail and scale. Yet, this also increased complexity of analyses and has introduced new challenges for bioinformatics. One major challenge that has hardly been addressed so far is the identification of differences in read distributions on individual genomic regions, e.g., genes or promoters. In this thesis, we developed novel methods to identify genomic regions exhibiting significant changes in read distributions. This was motivated by analyses of changes in promoterproximal pausing of polymerase II (Pol II) and chromatin accessibility in lytic Herpes virus type 1 (HSV-1) infection. Existing methods for analyzing changes in Pol II pausing focus only on ratios of read counts within specific windows and cannot distinguish between simple increases or decreases in pausing or more complex changes in Pol II distribution. To address this limitation, we first developed an approach based on clustering Pol II occupancy profiles around promoters. This revealed a prevalent delay of Pol II pausing to more downstream sites for most host genes in HSV-1 infection. Since this first method was still incapable of detecting changes in read distributions at single-gene level, we developed RegCFinder to determine subregions of genomic windows that exhibit differences in read distributions between two conditions. RegCFinder allows to focus on any regions of interest for any type of sequencing assay. We applied RegCFinder to investigate changes of chromatin accessibility and nucleosome positioning in promoter regions during HSV-1 infection. This uncovered a major change in chromatin architecture upon HSV-1 infection for the majority of host genes. Here, relaxation of +1 nucleosome positions led to a broadening of accessible chromatin regions at the transcription start site (TSS) into downstream regions depending on transcription levels in uninfected cells. In summary, this thesis presents novel contributions toward identifying changes in read density at gene level for any type of sequencing data. Furthermore, application of these methods provided new insights into infection with a common human pathogen.
Abstract
Die Einführung von Hochdurchsatz-Sequenzierungsmethoden der nächsten Generation (NGS) ermöglicht nun genomweite Untersuchungen zur Genregulation in bisher nicht gekanntem Detailgrad und Maßstab. Dies hat jedoch auch die Komplexität der Analysen erhöht und zu neuen Herausforderungen für die Bioinformatik geführt. Darunter wurde die Identifizierung von Unterschieden in der Verteilung von Reads in einzelnen genomischen Regionen, zum Beispiel in Genen oder Promotoren, bisher nur wenig adressiert. In dieser Arbeit haben wir neuartige Methoden entwickelt, um genomische Regionen mit signifikanten Veränderungen in der Verteilung von Reads zu identifizieren. Dies wurde motiviert durch Analysen von Veränderungen im promoter-proximalen Pausieren der Polymerase II (Pol II) und der Chromatin-Zugänglichkeit bei einer lytischen Infektion mit dem Herpesvirus Typ 1 (HSV-1). Bestehende Methoden zur Analyse von Veränderungen im Pausieren von Pol II konzentrieren sich ausschließlich auf Verhältnisse von Read-Zahlen innerhalb bestimmter Fenster und können nicht zwischen einfachen Zu- oder Abnahmen des Pausierens oder komplexeren Veränderungen in der Pol II-Verteilung unterscheiden. Um diese Einschränkung zu überwinden, haben wir zuerst einen Ansatz entwickelt, der auf dem Clustern von Pol II Profilen um Promotoren basiert. Dabei zeigte sich, dass Pol II bei den meisten Wirtsgenen bei einer HSV-1-Infektion häufiger an stromabwärts gelegenen Stellen pausiert. Da diese erste Methode immer noch nicht in der Lage war, Veränderungen in der Verteilung von Reads auf Einzelgen-Ebene zu erkennen, haben wir RegCFinder entwickelt, um Unterregionen von genomischen Fenstern zu bestimmen, die Unterschiede in der Verteilung von Reads zwischen zwei Bedingungen aufweisen. RegCFinder ermöglicht es, sich auf beliebige gewünschte Regionen für jede Art von Sequenzierungsdaten zu konzentrieren. Wir haben RegCFinder angewendet, um Veränderungen der Chromatin-Zugänglichkeit und der Positionierung der Nukleosomen in Promotorregionen während einer HSV-1-Infektion zu untersuchen. Dies enthüllte eine wesentliche Veränderung der Chromatin-Architektur bei einer HSV-1-Infektion für die Mehrheit der Wirtsgene. Hier führte die Relaxation von +1-Nukleosomen zu einer Verbreiterung der zugänglichen Chromatin-Regionen an der Transkriptions-Startstelle (TSS) in Abhängigkeit vom Transkriptionsniveau in nicht infizierten Zellen. Zusammenfassend liefert diese Arbeit neue Beiträge zur Identifizierung von Änderungen in der Read-Dichte auf Gen-Ebene für jede Art von Sequenzierungsdaten. Die Anwendung dieser Methoden lieferte darüber hinaus neue Erkenntnisse über die Infektion mit einem weitverbreiteten menschlichen Krankheitserreger.
Dokumententyp: | Dissertationen (Dissertation, LMU München) |
---|---|
Keywords: | Functional genomics, RegCFinder, RNAPII pausing, Chromatin accessibility, Nucleosome positions |
Themengebiete: | 000 Allgemeines, Informatik, Informationswissenschaft
000 Allgemeines, Informatik, Informationswissenschaft > 004 Informatik |
Fakultäten: | Fakultät für Mathematik, Informatik und Statistik |
Sprache der Hochschulschrift: | Englisch |
Datum der mündlichen Prüfung: | 12. Dezember 2024 |
1. Berichterstatter:in: | Friedel, Caroline |
MD5 Prüfsumme der PDF-Datei: | d1eb5d18cc18b86e076020ee297c60fa |
Signatur der gedruckten Ausgabe: | 0001/UMC 30919 |
ID Code: | 34634 |
Eingestellt am: | 19. Dec. 2024 13:09 |
Letzte Änderungen: | 19. Dec. 2024 13:10 |