Logo Logo
Hilfe
Kontakt
Switch language to English
Sequence diversity and functional conformity. a comparative molecular characterization of TALE-like proteins
Sequence diversity and functional conformity. a comparative molecular characterization of TALE-like proteins
At least four phylogenetically distinct groups of bacteria encode repeat proteins with the common ability to bind specific DNA sequences with a unique but conserved code. Each repeat binds a single DNA base, and specificity is determined by the amino acid residue at position 13 of each repeat. Repeats are typically 33-35 amino acids long. Comparing repeat sequences across all groups reveals that only three positions are hyper-conserved. Repeats are in most cases functionally compatible such that they can be assembled together into a single chimeric array. This functional conformity and inter-compatibility is a result of structural conservation. Repeat arrays of these proteins have been demonstrated or predicted to form almost identical tertiary structures: a right-handed super helix that wraps around the DNA double strand with the base specifying residue of each repeat positioned in the major groove next to its cognate target base. The mechanism of DNA binding is conserved. The first discovered group, providing the name for the rest, are the Transcription Activator Like Effectors (TALEs) of plant-pathogenic Xanthomonas bacteria. The eukaryotic transactivation domain, which lends this group their name, allows them to activate specifically targeted host genes for the benefit of the bacterial invader. The other groups, discovered after the TALEs, are the RipTALs of Ralstonia solanacearum, the Bats of Burkholderia rhizoxinica, and MOrTL1 and MOrTL2 of unknown marine bacteria. Together they are designated TALE-likes. Each designation contains some allusion to the TALEs. The term RipTAL stands for Ralstonia injected proteins TALE-like, the Bats are Burkholderia TALE likes, and the MOrTLs Marine Organism TALE-likes. This unity of terminology belies disunity in the lifestyles of these different bacteria, and the biological roles fulfilled by these proteins. The TALEs have already been researched extensively. The code that describes the relationship between the base specifying residues and their cognate bases is often referred to as the TALE code. This code was deciphered by two groups independently and published in 2009, a year before I began my doctoral work. Since then research into TALEs has not slowed and a great deal has been learnt both about the native biology and biotechnological uses of TALEs. My work has been focused on the other TALE-like groups, none of which had been previously characterized in terms of DNA recognition properties, before I began my work. RipTALs are effector proteins delivered during bacterial wilt disease caused by R. solanacearum strains. This devastating disease affects numerous crop species worldwide. Characterizing the molecular properties of the RipTALs provides a first step towards uncovering their role in the disease. The Bats and MOrTLs are primarily of interest as comparison groups to the TALEs and RipTALs and as sources of sequence diversity for future efforts into TALE repeat engineering. In the introduction of this dissertation, which explores TALE biology, a particular focus will be placed on the DNA binding properties of TALEs and how this can be put to use in TALE technology. After this the RipTALs, Bats and MOrTLs are each introduced, explaining what is known about their provenance and sequence features. The aims of my doctoral work are then listed and expounded in turn. The proximal goal of my doctoral work was to carry out a comparative molecular characterization of each group of non-TALE TALE-likes. In doing so we hoped to gain insights into the principles of TALE-like DNA-binding properties, evolutionary history of the different groups and their potential uses in biotechnology. In the case of the RipTALs this work should begin to unravel the role these proteins play in bacterial wilt disease, as a means to fight this devastating pathogen. The articles I have worked on covering the molecular characterizations of RipTALs, Bats and MOrTLs are then presented in turn. Working together with others I was able to show that repeats from each group of TALE-likes mediate sequence specific DNA binding, revealing a conserved code in each case. This code links position 13 of any TALE-like repeat to a specific DNA base preference in a reliable fashion. I will argue that the TALE-likes represent a fascinating case of conserved structure and function in a diverse sequence space. In addition the TALEs and RipTALs may simply represent one face of the TALE-likes, a protein family mediating as yet unknown biological roles as bacterial DNA binding proteins., Gene die ähnlichen repeat-enthaltende Proteine kodieren finden sich in den Genomen von mindestens vier phylogenetischen Gruppen von Bakterien. Alle diese verschiedene Proteine nutzen den gleichen, einzigartigen Code um bestimmte DNS Basen zu binden. Repeats bestehen in der Regel aus 33-35 Aminosäuren und jeder Repeat bindet eine einzige Base, wobei die Spezifität durch die Aminosäure an Position 13 im Repeat bestimmt wird. Ein Vergleich der Repeatsequenzen aus den verschiedenen Proteinen zeigt nur drei hyperkonservierte Aminosäuren, aber chimäre Repeat-domänen sind meistens dennoch Funktionsfähig. Funktionseinigkeit und Kompatibilität sind Folge struktureller Konservation. Es wurde schon gezeigt oder vorhergesagt dass die Repeat-Domäne dieser Proteine fast identische Strukturen bilden: Eine rechtsgängige Superhelix die sich um die DNS wickelt, wobei die basenbestimmenden Aminosäuren in der großen Furche neben der verwandte Base positioniert werden. Dieser Bindungsmechanismus ist innerhalb dieser Gruppe von Proteinen konserviert. Die erste beschriebene Gruppe sind die Transcription Activator Like Effectors (TALEs) aus pflanzenkrankheitserregenden Xanthomonas Bakterien, und ist namensgebend für diese Klasse von Proteinen. Der Name stammt von der eukaryotischen Aktivierungsdomäne durch die ermöglicht wird, dass die TALEs spezifische Wirtsgene aktivieren zum Vorteil der Bakterien. Die anderen Gruppen sind RipTALs aus Ralstonia solanacearum, Bats aus Burkholderia rhizoxinica, und MOrTL1 und MOrTL2 aus bis jetzt unbekannten Meeresbakterien. Kollektivbegriff dafür ist TALE-likes. Der Name jeder Gruppe deutet darauf hin, dass diese Proteine TALEs ähnlich sind. RipTAL bedeutet Ralstonia injected proteins TALE-like; Bats sind Burkholderia TALE likes; und die MOrTLs Marine Organism TALE-likes. Diese Namenseinigkeit verbirgt die unterschiedliche Lebensweisen dieser Bakterien und die verschiedenen natürliche Rollen dass die TALE-likes annehmen könnten. TALEs werden schon seit langem erforscht. Der TALE-Code beschreibt die Beziehung zwischen bestimmten Resten und passenden Basen. Er wurde in 2009 entschlüsselt und von zwei unabhängigen Forschungsgruppen veröffentlicht. Das war ein Jahr bevor ich mit meiner Doktorarbeit anfing. Seitdem hat die TALE-Forschung stark weiterentwickelt und vieles wurde über die natürliche Biologie und biotechnische Applikation dieser Proteine gelernt. Meine Arbeit fokussiert sich auf die anderen TALE-likes, von denen zuvor kein einziges charakterisiert war. RipTALs sind Effektor-Proteine, die von R. solanacearum im Laufe der Entwicklung der bakterieller Schleimkrankheit sekretiert werden. Diese Krankheit betrifft weltweit viele wichtige Nutz- und Kulturpflanzen. Eine Charakterisierung der molekularen Eigenschaften der RipTALs ist der erste Schritt um die Rolle dieser Proteine in der Pathogenese zu verstehen. Die Bats und MOrTls sind als Vergleichsgruppe zu den TALEs und RipTALs relevant. Ausserdem könnten die Polymorphismen die einen leichten Einfluss auf DNS-Bindung als eine Ressource genutzt werden um TALE-Technologie zu verstärke. Die Einleitung dieser Dissertation erklärt das Wesentliche über TALE Biologie mit Schwerpunkt auf DNA-Bindung und wie diese zur TALE-Technologie entwickelt wurde. Anschließend werden die RipTALs, Bats und MOrTLs der Reihe nach vorgestellt, und das Wissen über Herkunft und Sequenzmerkmale präsentiert. Die Ziele meiner Doktorarbeit werden dann ausgeführt. Das Hauptziel meiner Arbeit war ein Vergleich der molekularen Eigenschaften der einzelnen TALE-like Gruppen anzustellen. Davon erhofften wir neue Einblicke in die Interaktion zwischen TALE-likes und DNS, die Evolution der TALE-likes sowie eventuelle Biotechnologische Anwendungen zu gewinnen. Im Falle der RipTALs ist dieses Wissen direkt einsetzbar um die bakterielle Schleimkrankheit zu bekämpfen. Artikel zur Charakterisierung von RipTALs, Bats und MOrTls sind Resultate meiner Doktorarbeit und kommen als Ergebnisteil der Dissertation vor. Zusammen mit Kollegen konnte ich zeigen dass die Repeats aus jeder TALE-like Gruppe Basen-spezifisch DNS-Binden. Der TALE Code, aus dem hervorgeht welche Aminosäurereste an Position 13 Bindung an welche Base vermitteln, ist in allen Gruppen konserviert. Ich beschreibe auch wie ich die TALE-likes als faszinierender Fall von struktureller Konservation in einem vielfaltigem Sequenzraum verstehe. Überdies könnte es sein dass die TALE-likes, trotz dem akzeptierten Bild als eukaryotische Transkriptionsfaktoren, eine viel diversere Gruppe sind mit Exemplaren die bis jetzt unerklärte Rollen erfüllen.
Phytopathology, Transcription, DNA-binding
Lange, Orlando de
2015
Englisch
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Lange, Orlando de (2015): Sequence diversity and functional conformity: a comparative molecular characterization of TALE-like proteins. Dissertation, LMU München: Fakultät für Biologie
[thumbnail of Lange_Orlando_de.pdf]
Vorschau
PDF
Lange_Orlando_de.pdf

36MB

Abstract

At least four phylogenetically distinct groups of bacteria encode repeat proteins with the common ability to bind specific DNA sequences with a unique but conserved code. Each repeat binds a single DNA base, and specificity is determined by the amino acid residue at position 13 of each repeat. Repeats are typically 33-35 amino acids long. Comparing repeat sequences across all groups reveals that only three positions are hyper-conserved. Repeats are in most cases functionally compatible such that they can be assembled together into a single chimeric array. This functional conformity and inter-compatibility is a result of structural conservation. Repeat arrays of these proteins have been demonstrated or predicted to form almost identical tertiary structures: a right-handed super helix that wraps around the DNA double strand with the base specifying residue of each repeat positioned in the major groove next to its cognate target base. The mechanism of DNA binding is conserved. The first discovered group, providing the name for the rest, are the Transcription Activator Like Effectors (TALEs) of plant-pathogenic Xanthomonas bacteria. The eukaryotic transactivation domain, which lends this group their name, allows them to activate specifically targeted host genes for the benefit of the bacterial invader. The other groups, discovered after the TALEs, are the RipTALs of Ralstonia solanacearum, the Bats of Burkholderia rhizoxinica, and MOrTL1 and MOrTL2 of unknown marine bacteria. Together they are designated TALE-likes. Each designation contains some allusion to the TALEs. The term RipTAL stands for Ralstonia injected proteins TALE-like, the Bats are Burkholderia TALE likes, and the MOrTLs Marine Organism TALE-likes. This unity of terminology belies disunity in the lifestyles of these different bacteria, and the biological roles fulfilled by these proteins. The TALEs have already been researched extensively. The code that describes the relationship between the base specifying residues and their cognate bases is often referred to as the TALE code. This code was deciphered by two groups independently and published in 2009, a year before I began my doctoral work. Since then research into TALEs has not slowed and a great deal has been learnt both about the native biology and biotechnological uses of TALEs. My work has been focused on the other TALE-like groups, none of which had been previously characterized in terms of DNA recognition properties, before I began my work. RipTALs are effector proteins delivered during bacterial wilt disease caused by R. solanacearum strains. This devastating disease affects numerous crop species worldwide. Characterizing the molecular properties of the RipTALs provides a first step towards uncovering their role in the disease. The Bats and MOrTLs are primarily of interest as comparison groups to the TALEs and RipTALs and as sources of sequence diversity for future efforts into TALE repeat engineering. In the introduction of this dissertation, which explores TALE biology, a particular focus will be placed on the DNA binding properties of TALEs and how this can be put to use in TALE technology. After this the RipTALs, Bats and MOrTLs are each introduced, explaining what is known about their provenance and sequence features. The aims of my doctoral work are then listed and expounded in turn. The proximal goal of my doctoral work was to carry out a comparative molecular characterization of each group of non-TALE TALE-likes. In doing so we hoped to gain insights into the principles of TALE-like DNA-binding properties, evolutionary history of the different groups and their potential uses in biotechnology. In the case of the RipTALs this work should begin to unravel the role these proteins play in bacterial wilt disease, as a means to fight this devastating pathogen. The articles I have worked on covering the molecular characterizations of RipTALs, Bats and MOrTLs are then presented in turn. Working together with others I was able to show that repeats from each group of TALE-likes mediate sequence specific DNA binding, revealing a conserved code in each case. This code links position 13 of any TALE-like repeat to a specific DNA base preference in a reliable fashion. I will argue that the TALE-likes represent a fascinating case of conserved structure and function in a diverse sequence space. In addition the TALEs and RipTALs may simply represent one face of the TALE-likes, a protein family mediating as yet unknown biological roles as bacterial DNA binding proteins.

Abstract

Gene die ähnlichen repeat-enthaltende Proteine kodieren finden sich in den Genomen von mindestens vier phylogenetischen Gruppen von Bakterien. Alle diese verschiedene Proteine nutzen den gleichen, einzigartigen Code um bestimmte DNS Basen zu binden. Repeats bestehen in der Regel aus 33-35 Aminosäuren und jeder Repeat bindet eine einzige Base, wobei die Spezifität durch die Aminosäure an Position 13 im Repeat bestimmt wird. Ein Vergleich der Repeatsequenzen aus den verschiedenen Proteinen zeigt nur drei hyperkonservierte Aminosäuren, aber chimäre Repeat-domänen sind meistens dennoch Funktionsfähig. Funktionseinigkeit und Kompatibilität sind Folge struktureller Konservation. Es wurde schon gezeigt oder vorhergesagt dass die Repeat-Domäne dieser Proteine fast identische Strukturen bilden: Eine rechtsgängige Superhelix die sich um die DNS wickelt, wobei die basenbestimmenden Aminosäuren in der großen Furche neben der verwandte Base positioniert werden. Dieser Bindungsmechanismus ist innerhalb dieser Gruppe von Proteinen konserviert. Die erste beschriebene Gruppe sind die Transcription Activator Like Effectors (TALEs) aus pflanzenkrankheitserregenden Xanthomonas Bakterien, und ist namensgebend für diese Klasse von Proteinen. Der Name stammt von der eukaryotischen Aktivierungsdomäne durch die ermöglicht wird, dass die TALEs spezifische Wirtsgene aktivieren zum Vorteil der Bakterien. Die anderen Gruppen sind RipTALs aus Ralstonia solanacearum, Bats aus Burkholderia rhizoxinica, und MOrTL1 und MOrTL2 aus bis jetzt unbekannten Meeresbakterien. Kollektivbegriff dafür ist TALE-likes. Der Name jeder Gruppe deutet darauf hin, dass diese Proteine TALEs ähnlich sind. RipTAL bedeutet Ralstonia injected proteins TALE-like; Bats sind Burkholderia TALE likes; und die MOrTLs Marine Organism TALE-likes. Diese Namenseinigkeit verbirgt die unterschiedliche Lebensweisen dieser Bakterien und die verschiedenen natürliche Rollen dass die TALE-likes annehmen könnten. TALEs werden schon seit langem erforscht. Der TALE-Code beschreibt die Beziehung zwischen bestimmten Resten und passenden Basen. Er wurde in 2009 entschlüsselt und von zwei unabhängigen Forschungsgruppen veröffentlicht. Das war ein Jahr bevor ich mit meiner Doktorarbeit anfing. Seitdem hat die TALE-Forschung stark weiterentwickelt und vieles wurde über die natürliche Biologie und biotechnische Applikation dieser Proteine gelernt. Meine Arbeit fokussiert sich auf die anderen TALE-likes, von denen zuvor kein einziges charakterisiert war. RipTALs sind Effektor-Proteine, die von R. solanacearum im Laufe der Entwicklung der bakterieller Schleimkrankheit sekretiert werden. Diese Krankheit betrifft weltweit viele wichtige Nutz- und Kulturpflanzen. Eine Charakterisierung der molekularen Eigenschaften der RipTALs ist der erste Schritt um die Rolle dieser Proteine in der Pathogenese zu verstehen. Die Bats und MOrTls sind als Vergleichsgruppe zu den TALEs und RipTALs relevant. Ausserdem könnten die Polymorphismen die einen leichten Einfluss auf DNS-Bindung als eine Ressource genutzt werden um TALE-Technologie zu verstärke. Die Einleitung dieser Dissertation erklärt das Wesentliche über TALE Biologie mit Schwerpunkt auf DNA-Bindung und wie diese zur TALE-Technologie entwickelt wurde. Anschließend werden die RipTALs, Bats und MOrTLs der Reihe nach vorgestellt, und das Wissen über Herkunft und Sequenzmerkmale präsentiert. Die Ziele meiner Doktorarbeit werden dann ausgeführt. Das Hauptziel meiner Arbeit war ein Vergleich der molekularen Eigenschaften der einzelnen TALE-like Gruppen anzustellen. Davon erhofften wir neue Einblicke in die Interaktion zwischen TALE-likes und DNS, die Evolution der TALE-likes sowie eventuelle Biotechnologische Anwendungen zu gewinnen. Im Falle der RipTALs ist dieses Wissen direkt einsetzbar um die bakterielle Schleimkrankheit zu bekämpfen. Artikel zur Charakterisierung von RipTALs, Bats und MOrTls sind Resultate meiner Doktorarbeit und kommen als Ergebnisteil der Dissertation vor. Zusammen mit Kollegen konnte ich zeigen dass die Repeats aus jeder TALE-like Gruppe Basen-spezifisch DNS-Binden. Der TALE Code, aus dem hervorgeht welche Aminosäurereste an Position 13 Bindung an welche Base vermitteln, ist in allen Gruppen konserviert. Ich beschreibe auch wie ich die TALE-likes als faszinierender Fall von struktureller Konservation in einem vielfaltigem Sequenzraum verstehe. Überdies könnte es sein dass die TALE-likes, trotz dem akzeptierten Bild als eukaryotische Transkriptionsfaktoren, eine viel diversere Gruppe sind mit Exemplaren die bis jetzt unerklärte Rollen erfüllen.