Logo Logo
Help
Contact
Switch language to German
Sequence self-selection by the network dynamics of random ligating oligomer pools
Sequence self-selection by the network dynamics of random ligating oligomer pools
One problem on the research on the Origin of Life is the step from short oligomers with random sequence of bases to longer, active complexes like ribozymes. Chemistry and non-equilibrium physics have found pathways for the formation of short strands, mediated by activated nucleotides or activation agents. It has also been shown, that medium length autocatalytically active complexes can form reaction networks necessary for downstream reactions and the emergence of more sophisticated systems. The intermediate step is difficult though: Short random sequences need to be extended, while introducing a reduction of sequence entropy, that does not inhibit double-stranded complex formation. This pre-selection step is necessary due to the vast sequence space of oligomer strands and must conform to an Origin-of-Life-like environment. The ancient reactions only depended on the inherent parameters of the oligomer strands such as the hybridization to double-stranded complexes and basic physical mechanisms such as temperature changes. Although short strands likely emerged by a non-templated polymerization-like extension mechanism, passing sequence information from one strand to another is assumed essential in longer strands. Chemical ligation is probable in the context of the Origin of Life, but the yield and specificity is known to be low. As a model for said mechanism, this study utilizes an evolved DNA ligase to facilitate the ligation reaction of the model-oligomer (DNA) without introducing a sequence bias. After 1000 temperature cycles, necessary for the dissociation and rehybridization of elongated strands, the resulting reaction products showed several distinct features of selection. Compared to random strands of the same length, the set of emerging reaction products have a significantly reduced sequence entropy. The emerging strands can be categorized in two groups: A-type and T-type strands with a ratio about 70:30 % of each base. As strands can only act as a template or substrate in the templated ligation reaction when they are in the single-stranded conformation, this selection inhibits the formation of self-folding oligomer products. At the same time the formation of double-stranded complexes is not reduced, as the A-type and T-type groups are predominantly sets of reverse complement sequences. Selecting only the most common subsequences from each group as a new starting pool shows a greater fitness of the selected pool for the emergence of new ligation products compared to a pool of random strands. While the analysis of the complex types and the exact dynamics is limited in the experimental system, all parameters can be accessed and analyzed in detail in a closely related theoretical simulation. This simulation found a distinct relation of the major reaction rates in the system: the hybridization on-rate, the ligation-rate and the hybridization-off rate. With those parameters the emergence of a local minimum-maximum feature in the concentration-over-strand-length analysis could be identified and the feature's appearance predicted in the experiment. The understanding of the dynamical regimes of the reaction also led to the understanding of length-dependent dominant growth modes of the product strands. Analyzing the emerging 24mers with a simple simulation based on these growth modes produced the same common ligation site sequence pattern ATAT. A small bias towards the self-complementary AT sequence motif at the 3'-end of strands in the original random sequence 12mer pool was identified as the likely cause. This study found,that longer product strands in this simple model system had a reduced entropy while retaining the important hybridization properties of the oligomer strands. The dynamics of the elongation are dependent on the microscopic rates of complex formation, ligation and dissociation, while the temperature cycling frequency imposes a rate-limit for the entire system and substantially changes the reaction dynamic., Ein Problem bei der Erforschung des Ursprungs des Lebens ist der Schritt von kurzen Oligomeren mit zufälliger Basenfolge zu längeren aktiven Komplexen wie Ribozymen. Chemie und physikalische Nichtgleichgewichtsysteme haben mögliche Wege für die Synthese von kurzen Strängen durch aktivierte Nukleotide oder sogenannte "activation agents" gefunden. Es wurde auch gezeigt, dass mittellange, autokatalytisch aktive Komplexe Reaktionsnetzwerke bilden können, die für darauffolgende Reaktionen und die Entstehung anspruchsvollerer Systeme notwendig sind. Der Zwischenschritt ist schwieriger: Kurze Stränge mit zufälliger Sequenz müssen länger werden, wobei gleichzeitig eine Verringerung der Sequenzentropie auftreten muss, die die Bildung von doppelsträngigen Komplexen nicht beeinträchtigt. Dieser Vorselektionsschritt ist aufgrund des riesigen Sequenzraums der Oligomerstränge notwendig und muss zusätzlich den physikalischen Rahmenbedingungen einer Umgebung ähnlich der frühen Erde entsprechen. Die ursprünglichen Reaktionen hingen vermutlich lediglich von den inhärenten Parametern der Oligomerstränge wie der Hybridisierung zu Doppelstrangkomplexen und grundlegenden physikalischen Mechanismen, wie etwa Temperaturänderungen ab. Obwohl kurze Stränge wahrscheinlich durch einen nicht-templierten polymerisations-ähnlichen Verlängerungsmechanismus entstanden sind, wird bei längeren Strängen die Weitergabe von Sequenzinformationen von einem Strang zum anderen als essentiell angesehen. Chemische Ligation ist im Zusammenhang mit dem Ursprung des Lebens wahrscheinlich, aber die Ausbeute und Spezifität ist bekanntermaßen gering. Als Modell für diesen Mechanismus wird in dieser Studie daher eine moderne DNA-Ligase biologischen Ursprungs verwendet, um die Ligationsreaktion des Modell-Oligomers (DNA) ohne einen möglichen Sequenz-Bias zu ermöglichen. Nach 1000 Temperaturzyklen, die für die Dissoziation und Rehybridisierung der verlängerten Doppelstränge notwendig sind, zeigen die resultierenden Reaktionsprodukte mehrere deutliche Selektionsmerkmale. Im Vergleich zu zufälligen Strängen gleicher Länge weisen die entstandenen Reaktionsprodukte eine deutlich reduzierte Sequenzentropie auf. Diese Stränge können in zwei Gruppen kategorisiert werden: A-Typ- und T-Typ-Stränge mit einem Verhältnis von etwa 70:30 % der jeweiligen Base. Da die Stränge nur dann als Templat oder Substrat in der templierten Ligation reagieren können, wenn sie sich in der einzelsträngigen Konformation befinden, hemmt diese Selektion die Bildung von selbstfaltenden Oligomerprodukten. Gleichzeitig wird die Bildung von doppelsträngigen Komplexen nicht reduziert, da es sich bei den A- und T-Typ-Gruppen überwiegend um Ensembles von Komplementsequenzen handelt. Eine Auswahl der häufigsten Teilsequenzen aus jeder Gruppe als neuer Startpool zeigt eine höhere Liagtionsaktivität des Pools im Vergleich zu einem Pool aus zufälligen Strängen. Während die Analyse der Doppelstrang-Typen und der genauen Dynamik im experimentellen System begrenzt ist, können alle Parameter in einer eng verwandten theoretischen Simulation detailliert analysiert werden. Diese Simulation zeigt einen eindeutigen Zusammenhang der wichtigsten Reaktionsraten im System: die Hybridisierungs-On-Rate, die Ligations-Rate und die Hybridisierungs-Off-Rate. Mit diesen Parametern konnte das Auftreten einer lokalen Minimum-Maximum-Eigenschaft in der Konzentration-über-Stranglänge-Analyse identifiziert und das Auftreten des Merkmals im Experiment vorhergesagt werden. Das Ergebnis längenabhängiger dynamischer Regime führte auch zum Verständnis der längenabhängigen dominanten Wachstumsmodi der Produktstränge. Die Analyse der entstehenden 24mer mit einer einfachen Simulation, die auf diesen Wachstumsmodi basiert, zeigt ein häufiges Sequenzmuster an Ligationsstellen: ATAT. Ein kleiner Bias in Richtung des selbstkomplementären AT-Sequenzmotivs am 3'-Ende der Stränge im ursprünglichen 12mer-Pool kann als wahrscheinliche Ursache identifiziert werden. Diese Studie zeigt, wie längere, neu ligierte Produktstränge in einem einfachen Modellsystem eine reduzierte Entropie aufweisen, während die wichtigen Hybridisierungseigenschaften der Oligomerstränge erhalten bleiben. Die Dynamik der Elongation hängt von den mikroskopischen Raten der Komplexbildung, Ligation und Dissoziation ab, während die Frequenz der Temperaturzyklen ein Ratenlimit für das gesamte System bildet und die Reaktionsdynamik wesentlich verändert.
Biophysics, Origin of Life, Selection, DNA Sequencing
Kudella, Patrick
2021
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Kudella, Patrick (2021): Sequence self-selection by the network dynamics of random ligating oligomer pools. Dissertation, LMU München: Faculty of Physics
[img]
Preview
PDF
Kudella_Patrick.pdf

28MB

Abstract

One problem on the research on the Origin of Life is the step from short oligomers with random sequence of bases to longer, active complexes like ribozymes. Chemistry and non-equilibrium physics have found pathways for the formation of short strands, mediated by activated nucleotides or activation agents. It has also been shown, that medium length autocatalytically active complexes can form reaction networks necessary for downstream reactions and the emergence of more sophisticated systems. The intermediate step is difficult though: Short random sequences need to be extended, while introducing a reduction of sequence entropy, that does not inhibit double-stranded complex formation. This pre-selection step is necessary due to the vast sequence space of oligomer strands and must conform to an Origin-of-Life-like environment. The ancient reactions only depended on the inherent parameters of the oligomer strands such as the hybridization to double-stranded complexes and basic physical mechanisms such as temperature changes. Although short strands likely emerged by a non-templated polymerization-like extension mechanism, passing sequence information from one strand to another is assumed essential in longer strands. Chemical ligation is probable in the context of the Origin of Life, but the yield and specificity is known to be low. As a model for said mechanism, this study utilizes an evolved DNA ligase to facilitate the ligation reaction of the model-oligomer (DNA) without introducing a sequence bias. After 1000 temperature cycles, necessary for the dissociation and rehybridization of elongated strands, the resulting reaction products showed several distinct features of selection. Compared to random strands of the same length, the set of emerging reaction products have a significantly reduced sequence entropy. The emerging strands can be categorized in two groups: A-type and T-type strands with a ratio about 70:30 % of each base. As strands can only act as a template or substrate in the templated ligation reaction when they are in the single-stranded conformation, this selection inhibits the formation of self-folding oligomer products. At the same time the formation of double-stranded complexes is not reduced, as the A-type and T-type groups are predominantly sets of reverse complement sequences. Selecting only the most common subsequences from each group as a new starting pool shows a greater fitness of the selected pool for the emergence of new ligation products compared to a pool of random strands. While the analysis of the complex types and the exact dynamics is limited in the experimental system, all parameters can be accessed and analyzed in detail in a closely related theoretical simulation. This simulation found a distinct relation of the major reaction rates in the system: the hybridization on-rate, the ligation-rate and the hybridization-off rate. With those parameters the emergence of a local minimum-maximum feature in the concentration-over-strand-length analysis could be identified and the feature's appearance predicted in the experiment. The understanding of the dynamical regimes of the reaction also led to the understanding of length-dependent dominant growth modes of the product strands. Analyzing the emerging 24mers with a simple simulation based on these growth modes produced the same common ligation site sequence pattern ATAT. A small bias towards the self-complementary AT sequence motif at the 3'-end of strands in the original random sequence 12mer pool was identified as the likely cause. This study found,that longer product strands in this simple model system had a reduced entropy while retaining the important hybridization properties of the oligomer strands. The dynamics of the elongation are dependent on the microscopic rates of complex formation, ligation and dissociation, while the temperature cycling frequency imposes a rate-limit for the entire system and substantially changes the reaction dynamic.

Abstract

Ein Problem bei der Erforschung des Ursprungs des Lebens ist der Schritt von kurzen Oligomeren mit zufälliger Basenfolge zu längeren aktiven Komplexen wie Ribozymen. Chemie und physikalische Nichtgleichgewichtsysteme haben mögliche Wege für die Synthese von kurzen Strängen durch aktivierte Nukleotide oder sogenannte "activation agents" gefunden. Es wurde auch gezeigt, dass mittellange, autokatalytisch aktive Komplexe Reaktionsnetzwerke bilden können, die für darauffolgende Reaktionen und die Entstehung anspruchsvollerer Systeme notwendig sind. Der Zwischenschritt ist schwieriger: Kurze Stränge mit zufälliger Sequenz müssen länger werden, wobei gleichzeitig eine Verringerung der Sequenzentropie auftreten muss, die die Bildung von doppelsträngigen Komplexen nicht beeinträchtigt. Dieser Vorselektionsschritt ist aufgrund des riesigen Sequenzraums der Oligomerstränge notwendig und muss zusätzlich den physikalischen Rahmenbedingungen einer Umgebung ähnlich der frühen Erde entsprechen. Die ursprünglichen Reaktionen hingen vermutlich lediglich von den inhärenten Parametern der Oligomerstränge wie der Hybridisierung zu Doppelstrangkomplexen und grundlegenden physikalischen Mechanismen, wie etwa Temperaturänderungen ab. Obwohl kurze Stränge wahrscheinlich durch einen nicht-templierten polymerisations-ähnlichen Verlängerungsmechanismus entstanden sind, wird bei längeren Strängen die Weitergabe von Sequenzinformationen von einem Strang zum anderen als essentiell angesehen. Chemische Ligation ist im Zusammenhang mit dem Ursprung des Lebens wahrscheinlich, aber die Ausbeute und Spezifität ist bekanntermaßen gering. Als Modell für diesen Mechanismus wird in dieser Studie daher eine moderne DNA-Ligase biologischen Ursprungs verwendet, um die Ligationsreaktion des Modell-Oligomers (DNA) ohne einen möglichen Sequenz-Bias zu ermöglichen. Nach 1000 Temperaturzyklen, die für die Dissoziation und Rehybridisierung der verlängerten Doppelstränge notwendig sind, zeigen die resultierenden Reaktionsprodukte mehrere deutliche Selektionsmerkmale. Im Vergleich zu zufälligen Strängen gleicher Länge weisen die entstandenen Reaktionsprodukte eine deutlich reduzierte Sequenzentropie auf. Diese Stränge können in zwei Gruppen kategorisiert werden: A-Typ- und T-Typ-Stränge mit einem Verhältnis von etwa 70:30 % der jeweiligen Base. Da die Stränge nur dann als Templat oder Substrat in der templierten Ligation reagieren können, wenn sie sich in der einzelsträngigen Konformation befinden, hemmt diese Selektion die Bildung von selbstfaltenden Oligomerprodukten. Gleichzeitig wird die Bildung von doppelsträngigen Komplexen nicht reduziert, da es sich bei den A- und T-Typ-Gruppen überwiegend um Ensembles von Komplementsequenzen handelt. Eine Auswahl der häufigsten Teilsequenzen aus jeder Gruppe als neuer Startpool zeigt eine höhere Liagtionsaktivität des Pools im Vergleich zu einem Pool aus zufälligen Strängen. Während die Analyse der Doppelstrang-Typen und der genauen Dynamik im experimentellen System begrenzt ist, können alle Parameter in einer eng verwandten theoretischen Simulation detailliert analysiert werden. Diese Simulation zeigt einen eindeutigen Zusammenhang der wichtigsten Reaktionsraten im System: die Hybridisierungs-On-Rate, die Ligations-Rate und die Hybridisierungs-Off-Rate. Mit diesen Parametern konnte das Auftreten einer lokalen Minimum-Maximum-Eigenschaft in der Konzentration-über-Stranglänge-Analyse identifiziert und das Auftreten des Merkmals im Experiment vorhergesagt werden. Das Ergebnis längenabhängiger dynamischer Regime führte auch zum Verständnis der längenabhängigen dominanten Wachstumsmodi der Produktstränge. Die Analyse der entstehenden 24mer mit einer einfachen Simulation, die auf diesen Wachstumsmodi basiert, zeigt ein häufiges Sequenzmuster an Ligationsstellen: ATAT. Ein kleiner Bias in Richtung des selbstkomplementären AT-Sequenzmotivs am 3'-Ende der Stränge im ursprünglichen 12mer-Pool kann als wahrscheinliche Ursache identifiziert werden. Diese Studie zeigt, wie längere, neu ligierte Produktstränge in einem einfachen Modellsystem eine reduzierte Entropie aufweisen, während die wichtigen Hybridisierungseigenschaften der Oligomerstränge erhalten bleiben. Die Dynamik der Elongation hängt von den mikroskopischen Raten der Komplexbildung, Ligation und Dissoziation ab, während die Frequenz der Temperaturzyklen ein Ratenlimit für das gesamte System bildet und die Reaktionsdynamik wesentlich verändert.