Denkena, Johanna (2024): Computational approaches for the quantification of transgenerational and somatic epimutations. Dissertation, LMU München: Medizinische Fakultät |
Vorschau |
PDF
Denkena_Johanna.pdf 1MB |
Abstract
In plants, DNA methylation is maintained through specialized DNA methylation maintenance pathways. In spite of this, the methylation status of cytosines is not always faithfully maintained across meiotic and mitotic cell divisions. Epimutations, defined as stochastic gains and losses of methylation, may be inherited transgenerationally as well as somatically. The rates at which single cytosines (CG context) gain and lose methylation over generations have been previously studied in different mutation accumulation (MA) lines in A. thaliana, showing that epimutation rates are 5 magnitudes higher than genetic mutation rates (gain rate = 1.4 · 10 −4 , loss rate = 5.7 · 10 −4 per generation per haploid methylome, genetic mutation rate = 7 · 10 −9 ). But since functionally relevant effects linked to phenotypic variation and transcriptional activity have generally been associated with methylation changes in larger genomic regions rather than single cytosines, we have sought to estimate such regions-level epimutation rates for A. thaliana. In order to study functionally meaningful epimutation rates for clusters of cytosines that would also be comparable across different MA lines, we segmented the A. thaliana methylome into methylation units on the basis of the A. thaliana reference genome, rather than methylation data. Based on the observation that the correlation of methylation levels between two cytosines scales with the distance (measured in basepairs) between these cytosines, regions were constructed by aggregating close cytosines. Starting from the lowest distance, cytosines were iteratively concatenated with their neighboring cytosines (or already concatenated clusters of cytosines) until the size of these clusters reached a threshold of 185 bp. Using these regions, we were able to show that region-wise epimutation rates were of the same magnitude as cytosine-level epimutation rates, albeit slightly lower (gain rate = 1.2 · 10 −4 , loss rate = 4.6 · 10 −4 ). These epimutation rates were only marginally dependent of size and density of cytosine regions, but depended heavily on genomic features. More concretely, epimutations accumulated rapidly in genes bodies, while transposable elements showed comparatively faithful maintenance. Moreover, chromosome arms showed higher epimutation accumulation than centromeric regions and this trend held true even when genes and transposable elements were investigated separately for epimutations specific to chromosomal location. In addition to the regions in CG context, we found evidence that cytosine regions with non-CG context also accumulate epimutations at the genome-wide scale. This accumulation, however, occurs at much slower rates than in CG context. To complement the transgenerational epimutations rates, we also aimed to explore somatic epigenetic and genetic mutations, which accumulate during a plant’s life cycle. Especially in long-lived perennial trees, investigating the scope of somatic (epi-)mutations is important for our understanding of trees capacity for local adaption. In this work a novel reference genome for wild type Populus trichocarpa was generated from a tree with two main stems. The ages of different tree branching events were determined through coring, and leafs were sampled from the ends of the main branches. From the leaf samples, genomic, epigenomic and transcriptomic sequencing data was obtained and used to quantify somatic mutations and epimutations between the branches and to estimate how quickly they accumulated per year as well as per generation. We observed that CG epimutations accumulated at rates in the magnitude of 10 −6 per year (gain rate = 1.8 · 10 −6 , loss rate = 5.8 · 10 −6 ), which (assuming an average generation time of 15-150 years in poplar) amounts to per-generation CG epimutation rates between 10 −5 and 10 −4 . This was - as already seen over generations in A. thaliana - multiple orders of magnitudes higher than the genetic mutation rate at 1.33 · 10 −10 per year and 1.99 · 10 −9 per seed-to-seed generation. Furthermore, we established Differentially Methylated Regions (DMRs) present between branches and partitioned the remaining genomic space into regions that resembled the size distribution of the DMRs. Methylation levels were aggregated for all regions and used to estimate region-level epimutation rates. The P. trichocarpa region-level CG epimutation rates, at 2.1 · 10 −6 (gain rate) and 6.1 · 10 −6 (loss rate), were also very similar to the single CG epimutation rates, but were slightly higher, as had been observed in A. thaliana. These observations did not only indicate that epimutations and the speed at which they accumulate in both plant species are decoupled from genetic mutations on an evolutionary scale, but also that these epimutations might have a functional impact on the organism by emerging in the context of regions. In the case of the somatic epimutations in P. trichocarpa, we were able to identify DMRs that correlated with differential expression of a nearby gene, even though globally a significant association between transcription and methylation could not be found. Another conclusion that can be drawn from the similarity of epimutation rates in A. thaliana and P. trichocarpa is that the rate and spectrum of epimutations is not determined by transgenerational cell division processes but rather during somatic cell division. This is further underpinned by the epimutation rates calculated for different genomic features, which were also similarly ordered between A. thaliana and P. trichocarpa with the genes accumulating epimutations the fastest while transposable elements are maintained the most faithfully, possibly reflecting the distinct pathways maintaining these different features during mitotis. Additionally, we showed how we could predict the total age of the tree that we analysed by using the steadily accumulating genome-wide methylation changes as an epigenetic clock. Through fitting the model of epimutation accumulation with different total tree ages we found that the age of the tree was ∼ 330 years, which was in accordance with the hypothesized age window of 250 to 350 years. This suggests that genome-wide random CG epimutations that occur at a steady rate can be used to track aging over time.
Abstract
In Pflanzen wird die DNA-Methylierung durch spezialisierte Mechanismen aufrechterhalten. Trotzdem wird der Methylierungsstatus von Cytosinen nicht immer zuverlässig über meiotische und mitotische Zellteilungen hinweg beibehalten. Solche stochastischen Methylierungsgewinne und -verluste, die als "spontane Epimutationen" bezeichnet werden, können sowohl transgenerational als auch somatisch vererbt werden. Dies führt im Laufe der Zeit zu einer Akkumulation im Pflanzengenom. Die Raten, mit denen einzelne Cytosine (im CG-Kontext) über Generationen hinweg Methylierung gewinnen und verlieren, wurden zuvor in verschiedenen Mutationsakkumulationslinien in A. thaliana untersucht, wobei sich zeigte, dass die Epimutationsraten um 5 Größenordnungen höher sind als die genetischen Mutationsraten (Gewinnrate = 1, 4 · 10 −4 pro Generation pro haploidem Methylom, Verlustrate = 5, 7 · 10 −4 , genetische Mutationsrate = 7 · 10 −9). Da jedoch funktionell relevante Effekte wie phänotypische Variation und Transkriptionsaktivität im Allgemeinen mit Methylierungsänderungen in größeren Genomregionen und nicht in einzelnen Cytosinen in Verbindung gebracht werden, haben wir versucht, solche Epimuationsraten auf Regionsebene für A. thaliana zu berechnen. Um funktionell aussagekräftige Epimutationsraten für Cytosin-Cluster zu untersuchen, die auch über verschiedene MA-Linien hinweg vergleichbar sind, haben wir das A. thaliana-Methylom in Methylierungseinheiten auf Grundlage des A. thaliana-Referenzgenoms und nicht auf Grundlage von Methylierungsdaten segmentiert. Ausgehend von der Beobachtung, dass die Korrelation der Methylierungsniveaus zwischen zwei Cytosinen mit dem Abstand (gemessen in Basenpaaren) zwischen diesen Cytosinen skaliert, wurden Regionen durch Zusammenfassen von nahe beieinander liegenden Cytosinen konstruiert. Ausgehend vom geringsten Abstand wurden die Cytosine iterativ mit ihren benachbarten Cytosinen (oder bereits verketteten Clustern von Cytosinen) verkettet, bis die Größe dieser Cluster bzw. der Abstand zwischen ihnen einen Schwellenwert von 185 Basenpaaren erreichte. So konnten wir zeigen, dass die Epimutationsraten in der Region in der gleichen Größenordnung lagen wie die Epimutationsraten auf Cytosin-Ebene, wenn auch etwas niedriger (Gewinnrate = 1, 2 · 10 −4 , Verlustrate = 4, 6 · 10 −4 ). Diese Epimutationsraten waren nur geringfügig von der Größe und Dichte der Cytosinregionen abhängig, aber stark von den genomischen Eigenschaften. Konkret akkumulierten sich Epimutationen schnell in Genkörpern, während Transposons vergleichsweise wenig Methylierungs-unterschiede zeigten. Darüber hinaus wiesen Chromosomenarme eine höhere Epimutationsakkumulation auf als zentromerische Regionen, und dieser Trend blieb auch dann bestehen, wenn Gene und Transposons je nach chromosomaler Herkunft getrennt auf Epimutationen untersucht wurden. Zusätzlich zu den Regionen im CG-Kontext fanden wir Hinweise darauf, dass auch Regionen mit Cytosinen im Nicht-CG-Kontext auf genomweiter Ebene Epimutationen akkumulieren. Diese Anhäufung erfolgt jedoch wesentlich langsamer als im CG-Kontext. Ergänzend zu den transgenerationalen Epimutationsraten wollten wir auch somatische epigenetische und genetische Mutationen untersuchen, die sich im Laufe des Lebenszyklus einer Pflanze ansammeln. Insbesondere bei langlebigen mehrjährigen Bäumen ist die Untersuchung des Umfangs somatischer (Epi-)Mutationen wichtig für das Verständnis wie sich Bäume lokal anpassen. Hier wurde ein neues Referenzgenom für den Wildtyp von Populus trichocarpa aus einem Baum mit zwei Hauptstämmen generiert. Das Alter der verschiedenen Verzweigungspunkte des Baums wurde durch Entnahme von Bohrkernen bestimmt, und an den Enden der Hauptäste wurden Blattproben entnommen. Aus den Blattproben wurden genomische, epigenomische und transkriptomische Sequenzierungsdaten gewonnen und zur Quantifizierung von somatischen Mutationen und Epimutationen zwischen den Zweigen sowie zur Abschätzung der Geschwindigkeit ihrer Akkumulation pro Jahr und pro Generation verwendet. Wir beobachteten, dass CG-Epimutationen mit Raten in der Größenordnung von 10 −6 pro Jahr akkumulierten (Gewinnrate = 1, 8 · 10 −6 , Verlustrate = 5, 8 · 10 −6 ), was bei einer durchschnittlichen Generationsdauer von 15-150 Jahren bei Pappeln auf CG-Epimutationsraten zwischen 10 −5 und 10 −4 pro Generation schließen lässt. Dies war - wie bereits anhand von A.thaliana gesehen - um ein Vielfaches höher als die genetische Mutationsrate mit 1, 33·10 −10 pro Jahr und 1, 99·10 −9 pro Generation von Saatgut zu Saatgut. Darüber hinaus ermittelten wir zwischen den Zweigen vorhandene differenziell methylierte Regionen (DMRs) und unterteilten den verbleibenden genomischen Raum in Regionen, die der Größenverteilung der DMRs entsprachen. Die Methylierungsgrade wurden für alle Regionen aggregiert und zur Schätzung der Epimutationsraten auf Regionsebene verwendet. Wie bei A. thaliana waren auch bei P. trichocarpa die regionsweisen CG-Epimutationsraten mit 2, 1 · 10 −6 (Gewinnrate) und 6, 1 · 10 −6 (Verlustrate) den einzelnen CG-Epimutationsraten sehr ähnlich, lagen aber etwas höher. Diese Beobachtungen könnten nicht nur darauf hinweisen, dass Epimutationen und die Geschwindigkeit, mit der diese sich in beiden Pflanzenarten ansammeln, auf evolutionärer Ebene von genetischen Mutationen entkoppelt sind, sondern auch darauf, dass diese Epimutationen eine funktionelle Auswirkung auf den Organismus haben könnten, wenn sich ganze Regionen ändern. Im Fall der somatischen Epimutationen in P. trichocarpa konnten wir DMRs identifizieren, die mit der unterschiedlichen Expression eines nahegelegenen Gens korrelierten, auch wenn insgesamt kein signifikanter Zusammenhang zwischen Transkription und Methylierung gefunden werden konnte. Eine weitere Schlussfolgerung, die aus der Ähnlichkeit der Epimutationsraten bei A. thaliana und P. trichocarpa gezogen werden kann, ist, dass die Rate und das Spektrum der Epimutationen nicht durch transgenerationale Zellteilungsprozesse, sondern eher während der somatischen Zellteilung bestimmt werden. Dies wird auch durch die für verschiedene genomische Annotationen berechneten Epimutationsraten untermauert, die bei A. thaliana und P. trichocarpa ähnlich angeordnet waren, wobei die Gene am schnellsten Epimutationen anhäufen, während Transposons am zuverlässigsten erhalten werden, was möglicherweise die unterschiedlichen Mechanismen widerspiegelt, durch die die Methylierung an diesen verschiedenen Genomstrukturen während der Mitose erhalten werden. Darüber hinaus haben wir gezeigt, wie wir das Gesamtalter des von uns analysierten Baums vorhersagen können, indem wir die sich stetig akkumulierenden genomweiten Methylierungsänderungen als epigenetische Uhr verwenden. Durch die Anpassung des Modells der Epimutationsakkumulation mit verschiedenen Gesamtbaumaltern fanden wir heraus, dass das Alter des Baums ∼ 330 Jahre betrug, was mit dem angenommenen Altersfenster von 250 bis 350 Jahren übereinstimmte. Dies deutet darauf hin, dass genomweite zufällige CG-Epimutationen, die mit einer konstanten Rate auftreten, dazu verwendet werden können, Alterung zu verfolgen.
Dokumententyp: | Dissertationen (Dissertation, LMU München) |
---|---|
Keywords: | CpG methylation, epimutations, plant populations |
Themengebiete: | 600 Technik, Medizin, angewandte Wissenschaften
600 Technik, Medizin, angewandte Wissenschaften > 610 Medizin und Gesundheit |
Fakultäten: | Medizinische Fakultät |
Sprache der Hochschulschrift: | Englisch |
Datum der mündlichen Prüfung: | 16. Oktober 2024 |
1. Berichterstatter:in: | Colomé-Tatché, Maria |
MD5 Prüfsumme der PDF-Datei: | d8d4fd1e29ceccc2df2b7eb9a197b81d |
Signatur der gedruckten Ausgabe: | 0700/UMD 22075 |
ID Code: | 34320 |
Eingestellt am: | 20. Dec. 2024 10:12 |
Letzte Änderungen: | 20. Dec. 2024 10:12 |