Biokatalytische Diversität der Terpenbildung

in Pflanzen und Bakterien

Dissertation zur Erlangung des Grades eines Doktors der Naturwissenschaften

der Fakultät für Chemie und Biochemie

an der Graduate School for Chemistry and Biochemistry

der Ruhr-Universität Bochum

angefertigt in der

Nachwuchsgruppe für Mikrobielle Biotechnologie

vorgelegt von

Octavia Natascha Kracht

aus Unna

Bochum

Juli 2017

Erstgutachter: Prof. Dr. Robert Kourist

Zweitgutachter: Jun.-Prof. Dr. Simon Ebbinghaus

Diese Arbeit wurde in der Zeit von Mai 2014 bis Juli 2017 unter der Leitung von Jun.- Prof. Dr. Robert Kourist in der Nachwuchsgruppe für Mikrobielle Biotechnologie an der Ruhr-Universität Bochum durchgeführt.

2

Danksagung

An dieser Stelle möchte ich mich bei den Personen bedanken, die mich während der Anfertigung dieser Arbeit immer unterstützt und damit einen Großteil zum Gelingen dieses Projektes beigetragen haben.

Mein größter Dank gilt meinem Doktorvater Prof. Dr. Robert Kourist für die interessante Themenstellung und die Möglichkeit der Anfertigung dieser Dissertation in seiner Arbeitsgruppe. Vielen Dank für das Vertrauen, dass du mir entgegengebracht hast und deine sowohl fachliche als auch persönliche Unterstützung während meiner gesamten Promotion. Auch auf langen Durststrecken hast du immer an unser Projekt geglaubt und mich stets motiviert. Vielen Dank für deine ständige Gesprächsbereitschaft, die konstruktiven Beiträge und vor allem die Ermöglichung meines Auslandsaufenthaltes in Kanada. Ich werde meine Zeit in deiner Gruppe immer in guter Erinnerung behalten.

Ich möchte mich außerdem ganz herzlich bei Jun.-Prof. Dr. Simon Ebbinghaus für die freundliche Übernahme des Koreferates bedanken.

Einen ganz großen Dank möchte ich unseren Gärtnern Andreas Aufermann und Martin Pullack (LS Pflanzenphysiologie, RUB) ausprechen. Ohne euch wäre die Anfertigung dieser Arbeit gar nicht erst möglich gewesen! Egal ob Weiße Fliege, Läuse oder Behandlung mit Methanol, ihr habt nie aufgegeben und euch immer etwas Neues einfallen lassen, um unsere Pflanzen zu erhalten. Euer Einsatz bei der Kultivierung der Spezies war beeindruckend.

Ein weiterer Dank gilt unseren Kooperationspartnern des OMCBP-Projektes. Hierbei möchte ich vor allem PD Dr. Markus Piotrowski (RUB), Prof. Dr. Thomas Brück (TUM) und Dr. Michael Hofer (Fraunhofer IGB) für die fachliche Unterstützung während der gesamten Projektlaufzeit danken. Die fachlichen Diskussionen während der OMCBP-Meetings haben zu einem Mehrwert dieser Arbeit beigetragen.

Ein ganz besonderer Dank gilt ebenfalls unseren kanadischen Kooperationspartnern: Many thanks to Prof. Russell Kerr, Brad Haltli and Dr. Fabrice Berrué for your support on my project and the nice research stay in your lab.

Desweiteren möchte ich mich ganz herzlich bei Prof. Dr. Julia Bandow und Christoph Senges für die angenehme Kooperationsarbeit bezüglich des Streptomyceten-Projektes bedanken.

Einen ganz besonderen Dank möchte ich ebenfalls meinen Studenten Julia Stockmann, Dennis Sander und Pia Fiegenbaum ausprechen: Eure Leistungsbereitschaft und Motivation war beeindruckend und ich hoffe, dass ihr nie eure Freude an der Wissenschaft verlieren werdet. Ich bin glücklich, euch in meinem „Team Eremophila“ gehabt zu haben und danke

3

euch für eure Unterstützung! Vor allem Julia Stockmann sei gedankt für die Unterstützung bei der Anfertigung der unzähligen Stämmbäume während und sogar nach ihrer Masterarbeit.

Vielen Dank an Ann-Christin Ammann und Nicole Schmelzer für die Hilfe bei der RNA- Extraktion und die Unterstüzung bei den zahlreichen RACE-PCRs.

Für die schöne Zeit auf der zweiten Etage möchte ich mich ganz herzlich bei der Arbeitsgruppe von Prof. Dr. Ute Krämer bedanken. Ein ganz großer Dank gilt hierbei Klaus Hagemann, der mich regelmäßig über drei Jahre lang mit Trinkwasser versorgte. Vielen Dank auch an Petra Düchting für die Unterstützung mit dem GC/MS.

Desweiteren danke ich PD Dr. Minou Nowrousian und ihrem gesamten Team für das freundliche Miteinander auf der sechsten Etage sowie die Unterstützung bei der Gerätebenutzung.

Der gesamten Nachwuchsgruppe für Mikrobielle Biotechnologie möchte ich für das freundliche, stets positive Arbeitsklima danken, sowie für viele lustige Momente, beim Wasserski, Lasertag und nicht zuletzt natürlich auch im Labor. Ich freue mich über die tollen Freundschaften, die sich auch über die Arbeit hinaus entwickelt haben.

Zuletzt danke ich meiner Familie für die Unterstützung während meiner gesamten Promotion.

4

Inhaltsverzeichnis

1. Zusammenfassung 11

1. Abstract 14

2. Einleitung 17

2.1 Die Bedeutung der Biotechnologie 17

2.1.1. Bereitstellung von Enzymen in der Biotechnologie 18

2.2 Bedeutung und Biosynthese von Terpenen 19

2.2.1. Die Naturstoffgruppe der Terpene 19

2.2.2. Die Bedeutung von Terpenen in der Industrie 23

2.2.3. Entstehung und Generierung von Terpendiversität 25

2.2.4. Entstehung von Terpendiversität in Bakterien 50

2.3. Zielsetzung 53

3. Material und Methoden 54

3.1. Material 54

3.2. Methoden 63

3.2.1. Molekularbiologische Methoden 63

3.2.2. Proteinbiochemische Methoden 72

3.2.3. Analytische Methoden 73

4. Ergebnisse 78

4.1. Identifizierung und Charakterisierung neuer TPS aus der australischen 78

Wüstenpflanze E. serrulata

4.1.1. Naturstoffextraktion 78

4.1.2. Etablierung einer Methode zur Isolierung von Nukleinsäuren 82

aus den Blättern der Pflanze E. serrulata

4.1.3. Transkriptomdaten 88

4.1.4. Bestimmung potentieller TPS aus E. serrulata 90

5

4.1.5. Resquenzierung der NGS Daten und Entdeckung 96

potentieller Isoenzyme

4.1.6. RACE-PCR zur Generierung von Volllängen-Genen 103

4.1.7. Phylogenetische Einordnung der E. serrulata 104

4.1.8. Heterologe Genexpression potentieller TPS in E. coli 106

4.1.9. Aktivitätsmessungen mit isotopenmarkierten Substraten 108

4.1.10. Produktbestimmung der potentiellen TPS 109

4.1.11. Enzym-Charakterisierung von OK 4a und OK 1a 118

4.2. Entdeckung und Identifzierung neuer TPS aus S. chartreusis 122

4.2.1. Generierung der genomischen DNA und NGS 122

4.2.2. Bestimmung potentieller TPS 123

4.2.3. Phylogenetische Einordnung der TPS 125

4.2.4. Heterologe Expression der potentiellen TPS in E. coli 126

4.2.5. Produktbestimmung der TPS 129

4.3. Mutagenesestudien einer pflanzlichen TPS 135

4.3.1. Modellierung von TPS4 135

4.3.2. Generierung der TPS4 Mutanten 136

4.3.3. Heterologe Expression von TPS4 und seinen Varianten 139

4.3.4. Produktbestimmung von TPS4 140

4.3.5. Mutanten mit einem veränderten Produktspektrum 147

5. Diskussion 152

5.1. Entdeckung neuer TPS aus der australischen Wüstenpflanze 152

E. serrulata

5.1.1. Naturstoffextraktion und Induktion der E. serrulata 152

5.1.2. Betrachtung der NGS Daten und der 160 Transkriptomzusammensetzung

6

5.1.3. Generierung von Volllängen-Genen mittels RACE-PCR 164

5.1.4. Heterologe Genexpression pflanzlicher TPS in E. coli 164

5.1.5. Produktbestimmung der TPS 166

5.2. Entdeckung und Identifzierung neuer TPS aus S. chartreusis 169

5.2.1. Bakterien als alternative Terpenproduzenten 169

5.2.2. Heterologe Genexpression und Aktivität der bakteriellen 171

TPS

5.2.3. Identifzierung der potentiellen TPS 171

5.3. Mutagenesestudien zur pflanzlichen Sesquiterpensynthase TPS4 174

5.3.1. Strukturbestimmung und Analyse potentieller 175

plastizierbarer Reste

5.3.2. Auswirkung der Mutagenese auf das Produktspektrum 176

6. Fazit 178

7. Literatur 181

8. Anhang 199

Lebenslauf 203

Eidesstattliche Erklärung 206

7

Abkürzungsverzeichnis

Abkürzungsverzeichnis

Amp Ampicillin

antiSMASH and Secondary Metabolite Analysis SHell Software

AS Aminosäure

cDNA copy-Desoxyribonukleinsäure

Cm Chloramphenicol

FD Fast digest

DMAPP Dimethylallylpyrophosphat

DMSO Dimethylsulfoxid

DNA Desoxyribonukleinsäure

dNTP Desoxyribonukleosidtriphosphat

ds-DNA double-stranded-DNA

E. coli Escherichia coli

E. serrulata Eremphila serrulata (A. DC.) Druce

et al. et alii

FPP Farnesylpyrophosphat

GC/FID Gaschromatographie mit Flammenionisations-Detektor

GC/MS Gaschromatographie mit Massenspektrometrie-Detektor

gDNA Genomische DNA

GPP Geranylpyrophosphat

GGPP Geranylgeranylpyrophosphat

Hep n-Heptan

IPP Isopentylpyrophosphat

8

Abkürzungsverzeichnis

IPTG Isopropyl-β-D-thiogalactopyranosid

ITS Internal transcribed spacer

Kan Kanamycin

LB Lysogeny broth

LC Flüssigchromatographie

MeJa Methyljasmonat

MEP Methylerythritolphosphat

MEV Mevalonat mRNA messenger RNA

MRSA Methicillin-resistenter Staphylococcus aureus n.b. nicht bestimmt

NGS Next generation sequencing

Ni-NTA Nickel-Nitrilotriessigsäure

OPP Diphosphat

ORF open reading frame

PacBio Pacific Biosciences

PDB Protein Datenbank

PCR Polymerase-Kettenreaktion

RACE Rapid amplification of cDNA ends

RI Retentionsindex

RNA Ribonukleinsäure rRNA Ribosomale RNA

S. chartreusis Streptomyces chartreusis

SDS-PAGE Natriumdodecylsulfat-Polyacrylamidgelelektrophorese ss-DNA single-stranded-DNA

Std Stunde tBME tert-Butylmethylether

TCEP Tris(2-Carboxyethyl)-Phosphin

9

Abkürzungsverzeichnis

TIRF-Mikroskopie Interne Totalreflexionsfluoreszenz-Mikroskopie

TPS Terpensynthase tRNA transfer-RNA

TXS Taxadien-Synthase

UHPLC/MS Ultra high performance liquid chromatography mit Massenspektrometrie

VRE Vancomycin-resistente Enterokokken

10

Zusammenfassung

1. Zusammenfassung

Mit über 50.000 Vertretern gehören die Terpenoide zu der bedeutendsten Klasse der Naturstoffe. Aufgrund ihrer diversen Bioaktivitäten und ihrer einzigartigen Gerüche finden sie bereits breite Anwendung in der Pharma- und Kosmetikindustrie. Zahlreiche Terpenoide können derzeit nur durch die klassische Naturstoffextraktion unter Verwendung großer Lösemittelmengen gewonnen werden, sodass die Entwicklung biotechnologischer Verfahren zunehmend an Bedeutung gewinnt. Diese Arbeit befasst sich daher mit der biokatalytischen Bildung von Terpendiversität. Dazu wurde die enzymatische Terpendiversität beispielhaft anhand der Pflanze Eremophila serrulata (A. DC.) Druce sowie des Bakteriums Streptomyces chartreusis NRRL 3882 untersucht. Bislang galten vor allem Pflanzen als Terpenproduzenten. Neuere Studien zeigten jedoch die Bildung von Terpenen durch Endophyten, weshalb ebenfalls ein Streptomycet vergleichend zur Untersuchung der Terpenbiosynthese herangezogen wurde.

Außerdem wurde die pflanzliche Sesquiterpensynthase TPS4 für Mutagenese Experimente verwendet, um über Rationales Protein Design neue Terpendiversität zu generieren und das Verständnis der Struktur-Funktionsbeziehungen von Terpensynthasen zu erhöhen.

Da die australische Wüstenpflanze Eremophila serrulata (A. DC.) Druce ein bekannter Produzent bioaktiver serrulataner Diterpenoide ist, wurde diese zur Untersuchung der katalytischen Bildung der Terpendiversität ausgewählt. Hierzu wurde zunächt ein next- generation-sequencing des Transkriptoms unter Verwendung der de novo Illumina MiSeq Sequenzierung durchgeführt. Die generierten offenen Leseraster wurden anschließend mit den Proteinsequenzen publizierter Terpensynthasen verglichen und hinsichtlich ihrer Länge überprüft. Aufgrund der kurzen reads und der Schwierigkeit der de novo Assemblierung des next-generation-sequencing Datensatzes konnten nicht alle Transkripte in ihrer vollen Länge erzeugt werden. Insgesamt ergaben sich aus 7.084.170 gepaarten reads 103.404 Isotigs und 23 potentielle Terpensynthase Gene, wobei es sich bei sechs Genen um Volllängen-Gene zu handeln schien. Um die Richtigkeit der Assemblierung der vermeintlichen Volllängen-Gene zu überprüfen, wurden die Gensequenzen basierend auf der cDNA mit Hilfe der Sanger Sequenzierung resequenziert. Hierbei konnten zwei der sechs Gensequenzen nicht wiedergefunden werden. Auf der anderen Seite wurden Sequenzen zweier mit regelmäßigen Mutationen gefunden, was auf eine isoenzymatische Aktivität hindeutete. Um die übrigen Genfragmente potentieller Terpensynthasen zu vervollständigen, wurden RACE- PCR-Experimente durchgeführt. Insgesamt konnte mit Hilfe dieser Methode ein Gen, jk 7, sowohl am 5`-, als auch am 3`-Ende vervollständigt werden. Somit ergaben sich insgesamt sieben Enzyme (OK 1a, OK 1b, OK 3, OK 4a, OK 4b, OK 6 und JK 7), welche im Rahmen

11

Zusammenfassung dieser Studie analysiert wurden, wobei es sich bei zwei dieser Enzyme (OK 1b und OK 4b) um vermeintliche Isoenzyme von OK 1a bzw. OK 4a zu handeln schien.

Alle potentiellen Volllängen-Gene konnten kloniert und über heterologe Expression als lösliches Protein generiert werden. Dieses wurde in Experimente mit Tritium-markiertem Substrat eingesetzt. Diese Experimente dienten aufgrund ihrer hohen Sensitivät zur Bestimmung der allgemeinen Aktivität der Enzyme. Anschließend erfolgte die Produktbestimmung über GC/MS-Messungen mit nicht-markierten Substraten.

Von den insgesamt sieben neuen potentiellen Terpensynthasen konnten vier Enzyme identifiziert werden. Die Monoterpensynthasen OK 4a und OK 4b wiesen eine isoenzymatische Funktion auf und bildeten jeweils Myrcen und Z-(β)-Ocimen in nahezu gleichem Verhältnis. Die Sesquiterpensynthase OK 6 bildete insgesamt sechs Produkte mit Farnesyldiphosphat, wobei Sesquisabinen B das Hauptprodukt darstellte. Die Nebenprodukte konnten als (E)- Nerolidol, γ-Bisabolen, Geranylacetat sowie (3Z, 6E)-α-Farnesen und (E, E)-α-Farnesen identifiziert werden. Darüber hinaus zeigte OK 6 Monoterpensynthase-Aktivität, allerdings konnte das gebildete Produkt nicht identifiziert werden. Die Produkte der Monoterpensynthase OK 1b konnten als α- und β-Pinen identifiziert werden.

Diese Studie zeigt die ersten Transkriptomdaten sowie die ersten Terpensynthasen der Gattung der Eremophila.

In einem zweiten Teilprojekt wurde in einem komplementären Ansatz die bakterielle Terpendiversität am Beispiel des Streptomyceten Streptomyces chartreusis NRRL 3882 analysiert. Bislang galten vor allem Pflanzen und Pilze als Terpenproduzenten. Neuere Studien zeigten jedoch das große Potential von Bakterien als eine leichter zugängliche Alternative zur Entdeckung neuer biosynthetischer Gene der Terpendiversität. Da das Bakterium Streptomyces chartreusis bereits für die Bildung einzigartiger Naturstoffe, wie dem Antibiotikum Chartreusin, bekannt ist und bislang noch nicht hinsichtlich der Terpenbildung untersucht wurde, schien es ein geeigneter Kandidat für die Analyse bakterieller Terpensynthasen zu sein.

Über Genomsequenzierung und anschließende Alignments der offenen Leseraster der Gensequenzen mit bereits bekannten Terpensynthasen wurden fünf potentielle Klasse I Enzyme entdeckt. Drei der fünf potentiellen Sesquiterpensynthasen konnten hinsichtlich ihrer Produktbildung über GC/MS-Messungen identifiziert werden. Das Enzym Strep_01776 zeigte drei Produkte, wobei das Hauptprodukt als Germacradien-11-ol und eines der Nebenprodukte als Geosmin identifiziert werden konnten. Diese Produkte sind in Streptomyceten weit verbreitet. Andersherum konnte ebenfalls eine 7-epi-α-Eudesmol-Synthase, genannt Strep_07544, entdeckt werden. Diese Sesquiterpensynthase zeigte ebenfalls die Bildung

12

Zusammenfassung zweier Nebenprodukte, welche als 10-epi-γ-Eudesmol sowie Elemol identifiziert werden konnten. 10-epi-γ-Eudesmol zeigt hohes Potential als Insektizid und bislang ist nur eine weitere 7-epi-α-Eudesmol-Synthase aus dem Streptomyceten Streptomyces viridochromogenes bekannt. Die einzig bislang bekannte pflanzliche Eudesmol-Synthase stammt aus Zingiber zerumbet und zeigt die Bildung des Isomers β-Eudesmol.

Außerdem konnte eine dritte Sesquiterpensynthase entdeckt werden: Das Enzym Strep_07041 zeigte die Bildung von α-Amorphen und vier weiteren Produkten, wobei es sich vermutlich um γ-Muurolen und δ-Amorphen sowie zwei unbekannte Produkte handelte. Es ist die bislang zweite entdeckte α-Amorphen-Synthase, wobei die erste ebenfalls aus Streptomyces viridochromogenes stammte.

Das dritte Teilprojekt befasst sich mit der Veränderung der Terpendiversität durch Rationales Protein Design. Hierbei wurde die pflanzliche Sesquiterpensynthase TPS4 aus Santalum spicatum verwendet, welche sechs Produkte mit Farnesyldiphosphat und ebenfalls sechs Produkte mit Geranyldiphosphat bildet. Über ein Alignment mit einer pflanzlichen γ-Humulen- Synthase, welche durch Mutagenese der plastizierbaren Reste ein verändertes Produktspektrum aufwies, wurden vier vermeintliche plastizierbare Reste für TPS4 detektiert. Diese wurden über Rationales Protein Design mutiert und dabei hinsichtlich ihrer Hydrophobizität oder sterischen Gegebenheiten verändert. Insgesamt wurden zwölf Mutanten hinsichtlich ihrer Produktbildung mit beiden Substraten getestet. Alle Mutanten zeigten eine verringerte oder aber gar keine Produktbildung. Interessanterweise zeigte eine Mutante (TPS4_Y288F) die Bildung eines neuen Produktes mit Geranylpyrophosphat, welches jedoch aufgrund der geringen Produktmenge nicht identifiziert werden konnte. Mit Farnesyldiphosphat hingegen zeigte diese Mutante keine Aktivität.

13

Abstract

1. Abstract

With more than 50,000 members, terpenoids are one of the most important class of natural products. Due to their diverse bioactivity and their unique odors, they already find wide application in the pharma and cosmetic industry. Numerous terpenoids are still obtained by traditional natural product extraction which includes the usage of high solvent amounts indicating the importance of the development of alternative biotechnological processes.

This work focuses on the biocatalytic formation of terpene diversity. Therefore, the biosynthetic terpene formation of the Eremophila serrulata (A. DC.) Druce as well as the bacterium Streptomyces chartreusis NRRL 3882 was studied. Even though to this date, were considered to be the main terpene producers, recent studies indicated the formation of terpenes also by endophytes. Due to that, the terpene of a Streptomyces strain was also investigated in this study.

Furthermore, a plant-derived sesquiterpene synthase, named TPS4, was modified by rational protein design for the generation of novel terpene diversity and also to increase the understanding of the structure-function-relationship of terpene synthases.

Since the Australian desert plant Eremophila serrulata (A. DC.) Druce is known to produce bioactive serrulatane diterpenoids, it seemed to be an interesting candidate for investigations on the catalytic terpene formation. Next generation sequencing of the plant transcriptome was performed using the de novo Illumina MiSeq method. Afterwards, the generated open reading frames were compared to already published terpene synthase sequences and checked for its completeness. Due to the short reads and the difficulties of the de novo assembly, not all of the transcripts could be generated in its full length. In total, 7,084,170 paired reads led to 103,404 isotigs which resulted in 23 potential terpene synthase genes. Out of these candidates, 6 of them seemed to be full-length genes. To check the accuracy of the assembly of the potential full-length genes, the cDNA was resequenced by Sanger-sequencing. Two of the 6 genes could not be detected by Sanger-sequencing. Furthermore, sequences of two showed regular mutations which indicate isoenzymatic activity. To complete the remaining gene fragments of potential terpene synthases, RACE-RCR experiments were performed. In total, one gene, named jk 7, could be completed at its 5`- and 3`-end. In total, seven enzymes were discovered (OK 1a, OK 1b, OK 3, OK 4a, OK 4b, OK 6 and JK 7) and analyzed in this study. Two of these enzymes (OK 1b and OK 4b) seemed to be isoenzymes of OK 1a and OK 4a, respectively.

All potential full-length genes were cloned and expressed heterologously. For all genes, soluble protein could be obtained which was used in experiments with tritium-labled substrate. These experiments were used due to its high sensetivity in order to check the general activity

14

Abstract of the enzymes. Afterwards, product elucidation was done by GC/MS measurements with non- labled substrates.

Out of the seven novel potential terpene synthases, four enzymes could be identified concerning its product formation. The monoterpene synthases OK 4a and OK 4b showed isoenzymatic activity and formed myrcene and Z-(β)-ocimene in nearly the same ratio. The sesquiterpene synthase OK 6 formed six products with farnesyl diphosphate, showing sesquisabinene B as the major product. The byproducts could be identified as (E)-nerolidol, γ- bisabolene, geranylacetate as well as (3Z, 6E)-α-farnesene and (E, E)-α-farnesene. Furthermore, OK 6 showed monoterpene synthase activity but the generated product could not be identified. The monoterpene synthase OK 1b showed product formation of α- and β- pinene. This study shows the first transcriptome data and the first terpene synthases from the Eremophila genus.

In a second project, bacterial terpene diversity was studied in a complementary approach using the Streptomyces chartreusis NRRL 3882 strain. Until now, mainly plants and fungi were supposed to be terpene producers. However, recent studies indicated the high potential of bacteria as a more accessible alternative for the discovery of biosynthetic genes for the terpene formation. Since the bacterium Streptomyces chartreusis is already known to produce unique natural products such as the chartreusin and there is until now nothing known about its terpene formation, it seemed to be an interesting candidate for the analysis of bacterial terpene synthases.

By genome sequencing and following alignments of the open reading frames with already published terpene synthases, five potential class I terpene synthases were detected. The product formation of three out of five potential sesquiterpene synthases could be identified by GC/MS. The enzyme Strep_01776 showed three products but only germacradiene-11-ol being the major product and geosmine being a byproduct could be identified. These products are widely known in Streptomyces strains. Furthermore, a 7-epi-α-eudesmol synthase, called Strep_07544, was discovered. This sesquiterpene synthase also showed the formation of two byproducts which could be identified as 10-epi-γ-eudesmol and elemol. The 10-epi-γ- eudesmol is known for its high potential as anti-repellent. Until now, there is only one other 7- epi-α-eudesmol synthase known, which derived from the bacteria Streptomyces viridochromogenes. The only known eudesmol synthase from plants derived from Zingiber zerumbet and shows the formation of the isomer β-eudesmol.

Additionally, a third sesquiterpene synthase was discovered: the enzyme Strep_07041 showed the formation of α-amorphene and four side products, whereby two of them were suspected to be γ-muurolene and δ-amorphene. So far, the other two products could not be identified. This

15

Abstract enzyme is the second known α-amorphene synthase. The first enzyme also derived from the bacteria Streptomyces viridochromogenes.

The third project dealt with the alteration of terpene diversity by rational protein design. In this project, the plant-derived sesquiterpene synthase TPS4 from Santalum spicatum was mutated. The enzyme is known to produce six products with farnesyl diphosphate and another six products with geranly diphosphate. By an alignment with a plant-derived γ-humulene synthase where a mutagenesis of the plasticity residues resulted in an altered product formation, four potential plasticity residues were detected for TPS4. These residues were mutated by rational protein design concerning their hydrophobicity or steric properties. In total, twelve mutants were tested with both substrates for their product formation. All mutants showed a decreased activity or were completely deactivated. Interestingly, the mutant TPS4_Y288F showed the formation of a novel product with geranyl pyrophosphate which could not be identified due to low product yields. With farnesyl diphosphate no activity was observed for this mutant.

16

Einleitung

2. Einleitung 2.1. Die Bedeutung der Biotechnologie

Die Biotechnologie (griechisch bios: Leben) ist eine interdisziplinäre Wissenschaft, die sich mit der Verwendung von Enzymen, Zellen oder ganzen Organismen als Biokatalysatoren für die Anwendung in industriellen Prozessen befasst (Wink 2004). Bereits seit Jahrtausenden spielt die Biotechnologie, wenn auch unbewusst, eine große Rolle in der Bereitstellung von Nahrungsmitteln oder Bekleidung. So dienten bereits in der Antike insgeheim Mikroorganismen zur Herstellung von Wein, Brot und Bier. Erst durch die Entdeckung der Mikroorganismen im 17. Jahrhundert, basierend auf den Arbeiten von Robert Hooke (1635- 1702) und Antoni van Leeuwenhoek (1632-1723), begann überhaupt erst das Verständnis der Beteiligung von Mikroorganismen in verschiedenen Prozessen (Soyez 1990).

Weitere Fortschritte in der Mikrobiologie im 19. Jahrhundert, herangetrieben durch die Arbeiten von Louis Pasteur (1822–1895) und Robert Koch (1843–1910), erhöhten das Verständnis der Auswirkungen von Mikroorganismen auf Nahrungsmittel (Soyez 1990; Pilz 2010). Die im Jahr 1962 mit dem Nobelpreis für Medizin ausgezeichneten Forscher James D. Watson (1928), Francis H. C. Crick (1916-2004) und Maurice H. C. Wilkins (1916-2004) haben mit der Entdeckung der Desoxyribonukleinsäure (DNA) den Meilenstein für die biotechnologische Forschung gelegt (Watson u. Crick 1953). Nur durch die Erkenntnisse zum Erbgut waren die heutzutage modernen biotechnologischen Arbeiten überhaupt erst möglich (Schmid u. Hammelehle 2016).

Insgesamt kann die Biotechnologie in drei Hauptbereiche eingeteilt werden: die rote, die grüne und die weiße Biotechnologie (Kircher 2006). Während sich die „rote Biotechnologie“ mit den biotechnologischen Entwicklungen im pharmazeutischen Bereich befasst, werden unter dem Begriff „grüne Biotechnologie“ Prozesse und Techniken zusammengefasst, die für die Landwirtschaft eine entscheidende Rolle spielen (Braun et al. 2006; Wenzel 2006). Unter der „weißen Biotechnologie“ versteht man allgemein die biotechnologischen Prozesse der herstellenden Industrie (Braun et al. 2006). Von großer Bedeutung sind hierbei die Produktion von Waschmitteln, Feinchemikalien, Vitaminpräparaten oder Medikamenten (Wink 2004). Wirtschaftlich betrachtet spielt die „rote Biotechnologie“ in Deutschland die größte Rolle, gefolgt von der „weißen Biotechnologie“ (Braun et al. 2006). Im Gegensatz dazu sind nur 4 % der Biotechnologieunternehmen in Deutschland im Bereich der „grünen Biotechnologie“ tätig1, da diese Sparte oftmals stark von aktuellen politischen Situationen und neuen Richtlinien abhängig ist.

1 http://www.biotechnikum.eu/inhalte/biotechnologie-in-deutschland/ (03.05.2017) 17

Einleitung

Aufgrund der klimatischen Veränderungen, der wachsenden Weltbevölkerung sowie der Limitierung fossiler Rohstoffe werden biotechnologische Prozesse zunehmend bedeutender, besonders im Hinblick auf die Bereitstellung von Kraftstoffen, Chemikalien oder Medikamenten (Clark et al. 2012). Die Verwendung von Enzymen oder Mikroorganismen für industrielle Prozesse stellt meist eine umweltfreundliche Alternative zu den traditionellen chemischen Prozessen dar, welche häufig umwelt- und gesundheitsschädigende Lösemittel verwenden (Erbeldinger et al. 2000).

Aus diesem Grund finden bereits zahlreiche Enzyme Anwendung in industriellen Prozessen - eines der wohl bekanntesten Beispiele ist die Verwendung von Lipasen in Waschmitteln (Fariha et al. 2010). Der Einsatz dieser Enzymen in Waschmitteln ermöglichte eine Senkung der Waschtemperatur bei gleichbleibenden Waschergebnissen, wodurch eine Halbierung des Energieaufwandes pro Waschladung erreicht werden konnte (Olsen u. Falholt 1998).

2.1.1. Bereitstellung von Enzymen in der Biotechnologie

Ein weiterer wichtiger Punkt im Bereich der Biotechnologie ist die Tatsache, dass Enzyme eine sehr hohe Regio- und Stereospezifität aufweisen (Schmid et al. 2001). Während alternative Prozesse hierbei häufig auf die Verwendung von Schutzgruppenchemie zurückgreifen müssen, können diese Reaktionen von Enzymen unter milden Reaktionsbedingungen durchgeführt werden (Patel 2016). Häufig bieten sie daher eine umweltfreundliche oder gar die einzige Alternative für die Herstellung einer Substanz.

Generell können Biokatalysatoren je nach Bedarf verschieden bereitgestellt werden. So gibt es die Möglichkeit von Ganzzell-Katalysatoren, isolierten, immobilisierten, lyophilisierten Proteinen, oder aber von Zelllysaten Gebrauch zu machen (Schmid et al. 2001). Jeder der einzelnen Prozesse hat Vor- und Nachteile, sodass für die jeweilige Anwendung abgewogen werden muss, welche biotechnologische Methode sich am besten eignet und welche Vorteile diese gegenüber alternativen Methoden bietet.

Ein herausfordernder Aspekt in der Biotechnologie ist aber selbstverständlich immer die Bereitstellung des Biokatalysators. Bis heute ist eines der größten Probleme der Biotechnologie die Limitierung an Enzymen für katalytische Prozesse (Laemmle et al. 2007). Diese Erkenntnis zeigt aber auch die Wichtigkeit der Erforschung neuer Enzyme zur Erweiterung der industriellen Möglichkeiten.

18

Einleitung

2.2. Bedeutung und Biosynthese von Terpenen 2.2.1. Die Naturstoffgruppe der Terpene

Terpene bzw. Terpenoide sind mit über 50.000 Strukturen eine sehr bedeutende Klasse der Naturstoffe, welche eine enorme Diversität aufweist (Rabe u. Dickschat 2013). Sie sind aus

Isopreneinheiten (C5H8) aufgebaut und lassen sich gemäß der Anzahl dieser Einheiten unterteilen: Monoterpene (C10-Körper) bestehen aus zwei Isopreneinheiten, Sesquiterpene

(C15-Körper) weisen drei Isopreneinheiten auf und Diterpene (C20-Körper) sind aus vier Isopreneinheiten aufgebaut (Bohlmann et al. 1998). Die noch größeren Vertreter werden

Sesterterpene (C25-Körper), Triterpene (C30-Körper) oder Carotinoide (C40-Körper) genannt (Kayser u. Averesch 2015; Bohlmann u. Keeling 2008). Terpene, welche mehr als 40 Kohlenstoffe besitzen, werden als Polyterpene bezeichnet (Kayser u. Averesch 2015). Die Triterpene sind Grundbaustein für die Steroidbiosynthese, wie z.B. die Sterole. Wichtige Vertreter der Sterole sind unter anderem das Cholesterol oder das Ergosterol, welche essentielle Bestandteile der Zellmembranen sind.

Die Namensgebung der Terpene basiert auf den Arbeiten des Chemikers Friedrich A. Kekulé, welcher diese Naturstoffgruppe gemäß des Baumharzes der Kiefer Pinus sylvestris benennen wollte, aus welcher durch Destillation das Terpentinöl gewonnen werden konnte (Kayser u. Averesch 2015). Terpene können azyklisch oder zyklisch aufgebaut sein und ebenfalls funktionalisiert vorliegen (Bohlmann u. Keeling 2008). Diese funktionalisierten Terpene werden dann als Terpenoide bezeichnet. Die Funktionalisierung erfolgt häufig durch P450-Enzyme (Janocha et al. 2015; Dudareva et al. 2004; Bohlmann u. Keeling 2008). Allgemein liegen Terpenoide zumeist hydroxyliert, expoxidiert, acetyliert oder glykosyliert vor.

In der Natur kommen die Terpene als Teil des Primärmetabolismus vor, hauptsächlich sind sie aber Sekundärmetaboliten von Pflanzen und Pilzen (Chen et al. 2011; Bohlmann u. Keeling 2008). Ein Beispiel für das Vorhandensein von Terpenen im Primärmetabolismus eines Organismus ist die Bildung von Squalen, welches durch die Kopf-an-Kopf Kondensation von zwei Molekülen Farnesylpyrophosphat (FPP), unter Verlust der Phosphatgruppen, entsteht (Chen et al. 2011). Dieses Triterpen ist der Vorläufer der Sterole, welche für die Pflanzen überlebensnotwendig sind. Gerade weil aber die meisten Terpenoide ein Bestandteil des Sekundärmetabolismus sind, weisen sie eine enorme Diversität auf. Zwar wurden Terpene bereits auch in anderen Organismen wie z.B. Bakterien gefunden, dennoch wurde der Großteil der Terpenoide aus Pflanze oder Pilzen, extrahiert (Yamada et al. 2012; Andersen-Ranberg et al. 2016; Lubertozzi u. Keasling 2008, 2008).

Insgesamt gibt es zwei natürliche Biosynthesewege zur Herstellung von Terpenen, den Mevalonat-Pfadweg (MEV) und den Methylerythritolphosphat-Pfadweg (MEP) (Martin et al. 2002; Kayser u. Averesch 2015; Singh u. Sharma 2015; Galata et al. 2014). Beide Wege

19

Einleitung generieren Isopentylpyrophosphat (IPP) sowie das Isomer Dimethylallylpyrophosphat (DMAPP), welche aufgrund der IPP- im Gleichgewicht stehen (Abb. 1). Der MEV- Pfadweg, welcher im Cytosol agiert, basiert auf der Verwendung von drei aus der Glykolyse stammenden Molekülen Acetyl-CoA, welche über mehrere Schritte den C6-Körper Mevalonsäure bilden (Kayser u. Averesch 2015; Galata et al. 2014). Die Mevalonsäure wird dann in zwei Schritten mit Hilfe von Kinasen zu Mevalonatdiphosphat umgewandelt. Dieses wird anschließend decarboxyliert, wodurch sich der C5-Körper IPP bildet, welcher über eine Isomerase zu DMAPP umgebaut werden kann. Im Gegensatz zum MEV-Pfadweg wurde der MEP-Pfadweg erst Ende der 1970er-Jahre entdeckt und erforscht. Dieser MEP-Weg läuft in den Plastiden ab und beginnt mit den beiden aus der Glykolyse stammenden C3-Körpern Pyruvat und Glycerinaldehyd-3-Phosphat. Diese bilden durch Decarboxylierung das Desoxyxylulose-5-Phosphat, welches anschließend unter Verwendung von NADPH zu MEP reduziert wird (Kayser u. Averesch 2015). Über mehrere Schritte wird der C5-Körper anschließend in das IPP umgewandelt, welches erneut über die IPP-Isomerase mit dem DMAPP im Gleichgewicht steht.

Aus diesen beiden Molekülen kann mit Hilfe einer Prenyltransferase das Geranylpyrophosphat

(GPP), das einen C10-Körper aufzeigt, gebildet werden. Das FPP weist 15 Kohlenstoffatome auf und wird aus zwei Molekülen IPP und einem Molekül DMAPP aufgebaut (Tholl 2006). Das sogenannte Geranylgeranylpyrophosphat (GGPP) setzt sich aus drei IPP Molekülen und einem DMAPP Molekül zusammen und bildet einen C20-Körper.

Die natürliche Funktion pflanzlicher terpenoid-basierter Sekundärmetabolite umfasst das Anlocken von Bestäubern, die Abwehr von Mikroorganismen und schädlichen Insekten sowie den Schutz der Pflanze gegen photooxidativen Stress (Singh u. Sharma 2015; Pichersky u. Gershenzon 2002). Auch können flüchtige Terpene die Samenreifung benachbarter Pflanzen inhibieren, wodurch die Pflanze sich vor Überwuchs durch andere Pflanzen schützt (Kayser u. Averesch 2015). Vor allem Diterpene, wie z.B. die Gibberelline, spielen als Phytohormone eine große Rolle. So können sie unter anderem die Zellteilung und das pflanzliche Wachstum regulieren. In Pilzen dienen die Terpenoide meistens als Virulenzfaktoren und Mykotoxine (Braese et al. 2009). In Bakterien hingegen sind sie hauptsächlich in die Abwehr von Mikroben und anderen Organismen involviert (Ogura et al. 2000).

20

Einleitung

a.) MEV b.) MEP

Abb. 1: Schematische Darstellung der beiden Biosynthesewege für die Bildung von Terpenen. Während im MEV-Pfadweg (a) das IPP bzw. DMAPP ausgehend von 2 Molekülen Acetyl-CoA synthetisiert wird, werden diese Verbindungen im MEP-Weg (b) aus Pyruvat und Glycerinaldehyd-3-Phosphat gebildet.

21

Einleitung

Allgemein findet die Biosynthese pflanzlicher Terpenoide häufig in spezialisierten Geweben statt, wo diese auch benötigt werden (McGarvey u. Croteau 1995). Ein Beispiel dafür ist die Bildung des Monoterpen-Alkohols Linalool, welches Bestäuber anlocken soll. Die Blume Clarika breweri bildet diese Verbindung in den Kronblättern ihrer Blüte, wo sie letztendlich auch benötigt wird. Auf der anderen Seite konnten in Arabidopsis Spezies keine Mono- und Sesquiterpene in den Kronblättern nachgewiesen werden (Tholl 2006). Es wird daher angenommen, dass die von Arabidopsis gebildeten Mono- und Sesquiterpene eher der Abwehr von pathogenen Mikroorganismen dienen, statt dem Anlocken von Bestäubern. Diese Beobachtung zeigt auch, wie schwierig die Vorhersage der jeweiligen Terpenfunktion in der Pflanze ist. Interessanterweise wurde das Gen der 1,8-Cineol-Synthase (AtTPS-Chin), auf das im weiteren Verlauf näher eingegangen wird (Abb. 3), in den Wurzeln der Arabidopsis Spezies gefunden. Die Monoterpenoide werden hierbei vermutlich in die Rhizosphäre emittiert, um die Pflanze vor pathogenen Mikroorganismen zu schützen (Chen et al. 2004). Auf der anderen Seite konnte eine 1,8-Cineol-Synthase beispielsweise ebenfalls in den Blättern der Pflanze Salvia officinalis entdeckt werden (Croteau et al. 1994), wobei auch hier eine Abwehrfunktion der Verbindung zu vermuten ist. Diese Beobachtung verdeutlicht ebenfalls, dass Terpensynthasen (TPS) mit der selben Produktbildung nicht kategorisch in den selben Geweben vorzufinden sind, sondern die terpen-bildenden Gewebe je nach Pflanze variieren. Auch aus Früchten konnten bereits TPS identifiziert werden (Sharon-Asa et al. 2003; Pechous u. Whitaker 2004). Ein Beispiel hierfür ist die Bildung von Valencen durch eine Sesquiterpensynthase, welche in der Schale von Orangen gefunden wurde (Sharon-Asa et al. 2003).

Allgemein befinden sich in Angiospermen die biosynthetischen Maschinerien für die Terpenproduktion meistens in spezialisierten grandularen Strukturen (McGarvey u. Croteau 1995). Häufig werden die Terpene in den grandularen Trichomen der Blätter gebildet. Die Trichome sind Epidermiszellen und liegen als haarähnliche Strukturen auf der Oberfläche der Blätter. Sie verfügen über eine hohe Anzahl an sekretorischen Zellen und sind von einer Wachsschicht, der Cuticula, umgeben. Ein anderes sehr spezialisiertes seketorisches System, welches in Angiospermen vorkommt, sind die Milchsaftröhren. Der Milchsaft ist ein terpenoid- haltiges Gemisch, welches in den Milchsaftröhren gebildet und transportiert wird. Diese Milchsaftröhren befinden sich häufig im Pflanzenkörper.

Allgemein kommen Terpene und Terpenoide in Pflanzen häufig in Form von ätherischen Ölen vor, welche je nach Pflanze völlig unterschiedlich zusammen gesetzt sein können und sich daher auch stark im Geruch unterscheiden können (Kayser u. Averesch 2015). Fast alle ätherischen Öle setzen sich aus zahlreichen Verbindungen zusammen, so können bis zu 5.000 Stoffe in einem ätherischen Öl vorhanden sein. Als Speicherort für diese ätherischen Öle dienen in den Angiospermen ebenfalls meistens die Trichome der Blätter. 22

Einleitung

Da die meisten Terpene eine wichtige Rolle im Sekundärmetabolismus des Organismus spielen, werden die zugehörigen Gene auch nur unter bestimmten Bedingungen, wie zum Beispiel in „Stress-Situationen”, aktiviert (Keeling u. Bohlmann 2006; Martin et al. 2002; Singh u. Sharma 2015). Die Regulation der TPS Gene in Pflanzen kann außerdem je nach Gewebe und nach Entwicklungsstadium variieren (Tholl 2006). So kann zum Beispiel die Expression gewisser TPS Gene während der Blütephase einer Pflanze höher reguliert sein, wohingegen andere TPS Gene eher während der Reifung aktiv sind. Weiterhin können gewisse „Stress- Situationen” die Expression der TPS Gene aktivieren (Zhao et al. 2011). Da Terpene als Teil des Sekundärmetabolismus häufig zum Anlocken von Insekten zur Bestäubung oder aber zur Abwehr von Schädlingen dienen, wird davon ausgegangen, dass ihre Bildung von den jeweiligen Umweltsitutationen abhängig ist. Es gibt daher verschiedene Möglichkeiten, um künstlich eine „Stress-Situation” in den Pflanzen hervorzurufen. So kann die Expression der TPS Gene unter anderem mechanisch (mit einem Messer) oder aber chemisch, z.B. durch die Verwendung eines Phytohormons [wie Methyljasmonat (MeJa)] oder eines Phytotoxins (wie Coronatin), induziert werden (Boland et al. 1995; Zhao et al. 2011).

2.2.2. Bedeutung von Terpenen in der Industrie

Terpene spielen bereits eine wichtige Rolle in der Industrie. Aufgrund ihrer duftenden Eigenschaften finden sie eine besonders große Anwendung in der Kosmetik-, Aroma- und Duftstoffindustrie (Kayser u. Averesch 2015; Leavell et al. 2016; Bohlmann u. Keeling 2008). So werden mit den terpen-basierten Duftstoffen weltweit bereits mehr als 11 Mrd. Euro Umsatz gemacht, wobei rund 75 Prozent der Aroma- und Duftstoffe heutzutage synthetisch hergestellt werden und nur rund 25 Prozent über die Naturstoffextraktion gewonnen werden (Kayser u. Averesch 2015). Die meisten industrierelevanten Terpene stammen aus Pflanzen, allerdings gibt es auch Ausnahmen: Unter den Duftstoffen sind auch „tierische Düfte”, wie z.B. Moschus aus dem Moschustier oder Ambra aus dem Pottwal, sehr beliebt. Das tierische Ambra wird heutzutage in Parfums durch synthetische Ambroxide ersetzt, welche ausgehend von dem Diterpenoid Sclareol synthetisiert werden können (Leavell et al. 2016). Der erste Schritt der Synthese, die Bildung des Sclareols, erfolgt dabei biotechnologisch über die Verwendung einer Diterpensynthase ausgehend von GGPP. Die Produktion von 1,5 g/L Sclareol konnte bereits mit modifizierten E. coli Zellen etabliert werden (Brück et al. 2014).

Weitere bekannte terpenoid-basierte Duftstoffe sind das Sandelholz-Öl, welches seinen besonderen Duft den Sesquiterpenoiden α- und β-Santalol verdankt, sowie das Patchuoli-Öl, bei dem der orientalische Geruch ebenfalls auf ein Sesquiterpenol zurückzuführen ist (Leavell et al. 2016; Moniodis et al. 2015). Menthol ist ein Beispiel für ein Monoterpenoid, welches ebenfalls in der Aroma- und Duftindustrie weit verbereitet ist (Bicas et al. 2009; Bohlmann u.

23

Einleitung

Keeling 2008). Darüber hinaus hat es einen hohen Marktanteil als Geschmacksstoff in Menthol-Zigaretten (Wayne u. Connolly 2004).

Auch in anderen Bereichen der Kosmetikindustrie finden Terpenoide bereits breite Anwendung. Ein Beispiel sind die Pseudopterosine (Abb. 2), deren Struktur auf einem Diterpengerüst basiert. Aufgrund ihrer antiinflammatorischen und antibakteriellen Eigenschaften sind sie bereits ein gängiger Bestandteil in verschiedenen Hautcremes (Kijjoa u. Sawangwong 2004).

Vor allem die Terpengemische in Form von ätherischen Ölen finden heutzutage bereits breite pharmazeutische Anwendung (Kayser u. Averesch 2015). So finden sie vor allem bei Erkältungsbeschwerden der Atemwege, Gelenkschmerzen (Latschenkieferöl), Hautentzündungen (Hamamelisöl), Verstauchungen (Calendula officinalis) und Hämatomen (Arnica montana) große Anwendung. Auch werden terpenoid-haltige ätherische Öle häufig als Insektizide verwendet. So enthält zum Beispiel das Öl der Geranien verschiedene bioaktive Terpenoide wie das Geraniol oder das 10-epi-γ-Eudesmol, welche jeweils eine hohe insektizide Aktivität aufzeigen (Jaenson et al. 2006; Jain et al. 2001; Paluch et al. 2009).

Aber auch reine Terpenoide dienen heutzutage bereits als gängige Pharmazeutika (Kayser u. Averesch 2015; Bohlmann u. Keeling 2008). Das Artemisinin ist ein Sekundärmetabolit der Pflanze Aremisia annua und ist ein bekanntes Anti-Malaria-Mittel.

a.) b.) c.)

Abb. 2: Strukturen des Anti-Malaria-Medikamentes Artimisinin (a), des Anti-Tumor-Mittels Paclitaxel (b), sowie eines bioaktiven Pseudopterosines (c).

Wie anhand der Struktur von Artemisinin deutlich wird, ist die chemische Synthese dieser Verbindung nicht trivial: Das Molekül weist ingesamt sieben Stereozentren und eine Peroxidgruppe in einem Trioxanring auf, was die synthetische Herstellung aufwändig macht (Kayser u. Averesch 2015). Auch die Extraktion aus Pflanzen erwies sich als schwierig, da nach Angaben der World Health Organisation rund 1.000 Tonnen Wirkstoff pro Jahr benötigt werden. Problematisch war, dass die von Malaria betroffenen Länder aufgrund des Klimas nicht die optimalen Bedingungen für die Kultivierung der Pflanze bieten, sodass es häufig zu Ernteausfällen kam. Mit der Entdeckung der Sesquiterpensynthase namens Amorpha-4,11- dien-Synthase und weiterer Enzyme konnte die Biosyntheseroute bis auf den letzten Schritt 24

Einleitung

(die Peroxidbildung) aufgeklärt werden, sodass heutzutage für die Artemisinin-Herstellung ein semisynthetischer Prozess verwendet wird.

Ein weiteres bekanntes Beispiel für pharmazeutisch aktive Terpenoide sind die Ginkgolide, welche aus den Blättern des Ginkgobaums (Ginkgo biloba) isoliert wurden (Kayser u. Averesch 2015). Diese sollen die Durchblutung im Gehirn fördern und werden daher zur Behandlung neurodegenerativer Erkrankungen angewendet.

Darüber hinaus spielen Diterpenoide bereits bei der Behandlung von Krebs eine große Rolle (Bohlmann u. Keeling 2008; Kayser u. Averesch 2015). Das Molekül Paclitaxel, auch bekannt unter seinem Markennamen Taxol, ist ein Naturstoff, welcher ursprünglich aus der pazifischen Eibe (Taxus brevifolia) isoliert wurde und heutzutage als Gebärmutterhals-, Eierstock- und Brustkrebs-Medikament auf dem Markt ist. Paclitaxel weist ein diterpenoides Grundgerüst auf, welches auf der Struktur des Diterpenes Taxadien basiert. Da das Paclitaxel aus der Rinde von pazifischen Eiben isoliert wird, müssen diese für die Gewinnung des Zytostatikums abgeholzt werden. Dieser Vorgang ist weder ökologisch, noch kann er den heutigen Gesamtbedarf an Wirkstoff abdecken, da die Konzentrationen in der Rinde nur sehr gering sind. Aus diesem Grund wurden zwei andere Strategien entwickelt, um alternative Herstellungsprozesse zu ermöglichen. Bei dem ersten Prozess wird ein Vorläufermolekül, das 10-Deacetyl-Baccatin III aus den Nadeln isoliert und anschließend das Paclitaxel ausgehend von dieser Verbindung chemisch synthetisiert. Dieses Verfahren bietet gegenüber der direkten Naturstoffextraktion den Vorteil, dass die Nadeln regelmäßig nachwachsen. Der zweite Prozess wurde von der Firma Phyton Biotech GmbH (Deutschland) entwickelt und basiert auf einem komplett biotechnologischen Herstellungsverfahren2: Pflanzenzellen werden aus dem Taxus extrahiert und die Explantkultur auf festem Medium kultiviert. Der Kallus, also die undifferenzierten, aber vitalen Pflanzenzellen wird kultiviert und kann durch die Zugabe von Phytohormonen gezielt differenziert werden. Anschließend werden die gewünschten Pflanzenzellen ex planta fermentiert und das gebildete Paclitaxel extrahiert. Dieser Prozess ist ein sehr gutes Beispiel dafür, wie mit Hilfe moderner biotechnologischer Verfahren ökologisch bevorzugte Prozesse mit sehr hohen Ausbeuten generiert werden können.

2.2.3. Entstehung und Generierung von Terpendiversität 2.2.3.1. Unterteilung pflanzlicher TPS

Terpene werden sowohl in Angiospermen als auch in Gymnospermen über TPS gebildet. Die Enzyme werden über phylogenetische Studien klar voneinander getrennt und in sieben Gruppen unterteilt (Bohlmann et al. 1998). Die TPS der Angiospermen werden dabei in sechs

2 Informationsmaterial der Firma Phyton Biotech GmbH, Deutschland, 2017. 25

Einleitung

Gruppen getrennt: TPS-a enthält die Sesquiterpensynthasen und eine Diterpensynthase (Casben-Synthase), TPS-b beinhaltet die Monoterpensynthasen, welche aus der Familie der Lamiaceae stammen, TPS-c enthält die Copalyl-Pyrophosphat-Synthasen, TPS-e besteht aus den ent-Kauren-Synthasen, TPS-f enthält hauptsächlich die Linalool-Synthase aus Clarkia breweri und die Gruppe TPS-g umfasst Monoterpensynthasen, welche azyklische Produkte bilden. Auf der anderen Seite werden alle TPS aus Gymnospermen der Gruppe TPS-d zugeordnet. Die Enzyme aus TPS-d werden heutzutage in drei weitere Kladen unterteilt (Keeling u. Bohlmann 2006; Singh u. Sharma 2015): Die Klade TPS-d1 führt die Pinen- Synthasen, die Linalool-Synthasen und die Farnesen-Synthasen. In Klade TPS-d2 sind die Longifolin-Synthasen und zu TPS-d3 gehören die Abietadien-Synthasen sowie die Isoprimaradien-Synthasen (Singh u. Sharma 2015).

Höchstwahrscheinlich stammen alle pflanzlichen TPS aus einem evolutionären Vorläufer (Bohlmann et al. 1998) und es scheint, als habe die Verzweigung der TPS des Primär- und Sekundärmetabolismus vor der Teilung von Angio- und Gymnospermen stattgefunden. Nach der Trennung von Angio- und Gymnospermen erfolgte vermutlich eine unabhängige funktionelle Spezialisierung der TPS ausgehend von dem gemeinsamen Vorfahren. So zeigen zum Beispiel die Limonen-Synthasen aus der Familie der Lamiaceae und aus Koniferen trotz gleicher Produktbildung nur eine Sequenzidentität von 30-35 %.

Die TPS des Primärmetabolismus (TPS-c und TPS-e) zeigen eine viel geringere Diversität als die des Sekundärmetabolismus (Bohlmann et al. 1998). Der Grund für die enorme Vielfalt der Sekundärmetabolite, basierend auf nur sehr kleinen Änderungen der Aminosäuresequenz, könnte evolutionär gesehen zwei einhergehende Gründe haben. Ein Grund könnte die Anzahl an Genkopien sein: Viele TPS des Sekundärmetabolismus sind auf mehreren Genkopien codiert, wohingegen die TPS des Primärmetabolismus häufig nur als eine einzelne Genkopie vorliegen. Diese hohe Anzahl an Genkopien bietet eine gute Möglichkeit für die Entstehung von Terpendiversität. Auch sind die Gene des Sekundärmetabolismus nicht essentiell für das Pflanzen-Wachstum oder die Entwicklung, sodass Mutationen, die eine Veränderung des Produktes mit sich führen, nicht zu einem Absterben der Pflanze führen, wie es bei Genen des Primärmetabolismus der Fall wäre. Eine erhöhte chemische Vielfalt an Terpenen kann sogar hohe Vorteile für die ökologische Interaktion der Pflanze mit sich bringen.

Interessant ist jedoch, dass allein aufgrund der Aminosäuresequenz kaum eine Aussage über die Produktbildung der jeweiligen TPS getroffen werden kann (Tholl 2006). So können TPS zwar eine hohe Sequenzähnlichkeit aufweisen, aber dennoch eine unterschiedliche Produktbildung katalysieren. Andersherum können, wie oben beschrieben, TPS mit geringer Sequenzidentität die gleiche Produktbildung aufzeigen. Daher gestaltet sich auch die Vorhersage der katalytischen Funktion einzig und allein auf Basis der Aminosäuresequenz als schwierig, da bereits der Austausch eines einzigen Aminosäurerestes zu einer Änderung des 26

Einleitung

Produktspektrums führen kann (Keeling u. Bohlmann 2006; Tholl 2006). Dies ist vor allem auch für Mutagenese Studien von TPS von Bedeutung. Viele Studien verwenden daher dreidimensionale Modelle oder protein threading, um ein besseres Verständnis über die molekularen Mechanismen der Produktbildung zu erlangen (Tholl 2006; Cao et al. 2010).

Pflanzliche TPS können basierend auf ihrem Reaktionsmechanismus und den daraus entstehenden Produkten in zwei Klassen unterteilt werden (Chen et al. 2011; Tholl 2006). Die meisten bekannten TPS, wie die Mono- und Sesquiterpensynthasen, gehören zur Klasse I der TPS. Diese Enzyme katalysieren die Kationen-abhängige Ionisierung des Prenyldiphosphates unter Bildung eines Carbokation-Intermediates (Chen et al. 2011; Tholl 2006). Ein wichtiger Punkt hierbei ist, dass aufgrund der stochastischen Eigenschaften der Bindungsumlagerungen, welche nach der Carbokationen-Bildung folgen, eine einzelne TPS mit einem Substrat mehrere Produkte bilden kann (Chen et al. 2004; Chen et al. 2011). Ein Beispiel hierfür ist die Monoterpensynthase AtTPS-Chin aus der Modellpflanze Arabidopsis thaliana, welche die Bildung von 10 verschiedenen Monoterpenen katalysiert (s. Abb. 3). Das Hauptprodukt ist in diesem Fall das 1,8-Cineol. Die Reaktion, welche von AtTPS-Chin katalysiert wird, beginnt mit der Metall-abhängigen Ionisierung des Substrates GPP. Das daraus resultierende Carbokation kann durch Zyklisierungen, Umlagerungen oder Hydrid- Wanderungen umgebaut werden. Die Reaktion wird dann durch Deprotonierung oder einen nukleophilen Angriff von Wasser beendet, wobei sich bei letzterem ein Terpenol bildet.

Im Gegensatz zu den oben beschriebenen Klasse I TPS beginnt der Reaktionsmechanismus der Klasse II Enzyme mit der Protonierungs-induzierten Zyklisierung des Substrates, wobei für gewöhnlich ein bizyklisches Diphosphat gebildet wird (Abb. 5) (Chen et al. 2011). Im Falle der Klasse II Diterpensynthasen erfolgt die Protonierung hierbei immer an der C14-C15 Doppelbindung des GGPP-Substrates (Schrader et al. 2015).

27

Einleitung

Abb. 3: Postulierter Reaktionsmechanismus der Monoterpensynthase AtTPS-Chin aus der Pflanze Arabidopsis thaliana (modifiziert übernommen aus Chen et al. 2004). OPP stellt den Diphosphat-Rest dar. Über Hydrid-Wanderungen und Zyklisierungen werden die verschiedenen Produkte ausgehend von GPP gebildet.

28

Einleitung

2.2.3.2. Aufbau pflanzlicher TPS

TPS lassen sich in verschiedene funktionale Kategorien unterteilen wie beispielsweise die Monoterpensynthasen, Sesquiterpensynthasen und Diterpensynthasen (Bohlmann et al. 1998). Je nach Funktion sind sie zwischen 550-860 Aminosäuren lang und weisen ein Molekulargewicht von 50-100 kDa auf. Allgemein sind die Klassen der TPS schwierig zu unterscheiden, da die stark konservierten Motive sowohl in Mono-, Sesqui-, als auch in Diterpensynthasen vorkommen. Eine geeignete Methode zur Unterscheidung der TPS ist zunächst einmal die Länge der Aminosäuresequenz (Abb. 4). Während Mono- und Diterpene in den Plastiden gebildet werden, findet die Synthese der Sesquiterpene im Zytoplasma statt. Aus diesem Grund weisen Mono- und Diterpensynthasen eine 50-70 Aminosäuren lange N- terminale plastidäre Signalsequenz auf. Diese Signalsequenzen sind schwer zu identifizieren, verfügen jedoch häufig über einen hohen Serin- und Threonin-Gehalt sowie eine geringe Anzahl an sauren Aminosäuren. Bedingt durch diese N-terminale Sequenz sind Monoterpensynthasen mit rund 600-650 Aminosäuren für konifere Synthasen meistens etwas länger als Sesquiterpensynthasen, welche eine Länge von 550-600 Aminosäuren aufzeigen.

Abb. 4: Charakteristischer Aufbau der drei Klassen von TPS aus Koniferen (basierend auf Keeling u.

Bohlmann 2006). Alle drei Klassen weisen das konservierte RRX8W-Motiv (rot) sowie das DDxxD-Motiv (gelb) auf. Mono- und Diterpensynthasen verfügen außerdem über eine plastidäre Signalsequenz (blau). Diterpensynthasen aus Koniferen weisen außerdem ein zusätzliches konserviertes DxDD-Motiv (violet) sowie eine 210 Aminosäuren lange konservierte Sequenz auf (braun). Allgemein unterscheiden sich die drei Klassen der TPS vor allem in ihrer Länge.

29

Einleitung

Darüber hinaus weisen Diterpensynthasen aus Koniferen eine 210 Aminosäuren lange konservierte Sequenz auf, weshalb diese Synthasen eine Gesamtlänge von 800-860 Aminosäuren aufzeigen (Keeling u. Bohlmann 2006). Allerdings konnte bereits in einigen Studien diese konservierte Sequenz ebenfalls für mehrere Sesquiterpensynthasen aus Koniferen sowie eine Monoterpensynthase aus einem Angiosperm gefunden werden, was die Unterteilung der TPS weiter problematisiert.

Weiterhin zeigen alle drei Klassen sowohl für Enzyme aus den Gymnospermen, als auch aus den Angiospermen zwei besonders stark konservierte Motive: Das RRX8W-Motiv am N- Terminus, welches in die Zyklisierung des Substrates involviert ist, sowie das DDxxD-Motiv, welches bei der Bindung des Metall-Kofaktors eine Rolle spielt (Bohlmann et al. 1998; Galata et al. 2014; Keeling u. Bohlmann 2006). Das Diphosphat des jeweiligen Substrates wird durch zwei divalente Kationen am Eingang der aktiven Tasche koordiniert (Bohlmann et al. 1998). Während das erste Kation durch das DDxxD-Motiv koordiniert wird, wird das zweite durch ein weiteres konserviertes Asparat sowie einen konservierten Glu/Asp-Rest koordiniert. Durch das Koordinieren des Pyrophosphates durch die Metalle wird der hydrophobe Teil des Substrates in der aktiven Tasche positioniert (Lopez-Gallego et al. 2010). Zwei weitere in der aktiven Tasche konservierte Arginine sowie die beiden divalenten Kationen dienen vermutlich ebenfalls der Stabilisierung der negativen Ladung des Diphosphates nach der Ionisierung sowie der Orientierung des Diphosphates aus der aktiven Tasche heraus (Bohlmann et al. 1998). Im Bereich der aktiven Tasche befinden sich häufig viele aromatische Aminosäuren, welche das Carbokation über ihre π-Elektronen stabilisieren.

Darüber hinaus gibt es weitere konservierte Motive pflanzlicher TPS, wie z.B. das (N/D)D(L/I/V)x(S/T)xxxE-Motiv (NSE/DTE), welches ebenfalls in die Metall-Koordination involviert ist oder das weniger stark konservierte Motiv LQLYEASFLL, das bei der Substratbindung eine Rolle spielt (Galata et al. 2014).

Diterpensynthasen können als Klasse I, Klasse II oder als bifunktionales Klasse I/II Enzym vorliegen (Zerbe et al. 2013). Klasse I Enzyme weisen das DDxxD-Motiv auf, wohingegen Klasse II Diterpensynthasen über ein DxDD-Motiv verfügen. Eine bifunktionale Diterpensynthase besitzt beide konservierten Motive. Aus der Literatur ist bekannt, dass bifunktionale Diterpensynthasen ausschließlich in Gymnospermen vorkommen. In Angiospermen wird GGPP über Klasse I Diterpensynthasen ausschließlich in azyklische oder makrozyklische Diterpene umgwandelt. Die Biosynthese weiterer Diterpene, wie beispielweise dem ent-Kaur-16-en, einem Vorläufer der Gibberellin-Phytohormone, erfolgt ausgehend von GGPP zunächst über ein Klasse II Enzym, welches ein Intermediat erzeugt (s. Abb. 5). Dieses Intermediat dient dann als Substrat für eine Klasse I Diterpensynthase, wie beispielweise einer ent-Kauren-Synthase und wird weiter umgebaut (Liu et al. 2014). Ein solches Intermediat ist

30

Einleitung für gewöhnlich ein bizyklisches Diphosphat wie das ent-Copalyl-Diphosphat (Tholl 2006; Zerbe et al. 2013).

Abb. 5: Darstellung des postulierten Reaktionsmechanismus einer Klasse II sowie einer Klasse I Diterpensynthase am Beispiel von ent-Kaur-16-en (modifziert übernommen aus Liu et al. 2014). Das Substat GGPP wird zunächst mit Hilfe einer Klasse II TPS über eine Protonierungs-induzierte Reaktion zu dem Intermediat ent-Copalyl-Diphosphat (ent-CPP) zyklisiert. Anschließend erfolgt die Metall-basierte Ionisierung dieses Intermediates und die Umwandlung zu ent-Kaur-16-en mit Hilfe einer Klasse I ent- Kauren-Synthase (ent-KS).

2.2.3.3. Terpendiversität der australischen Wüstenpflanze Eremophila serrulata (A. DC.) Druce

Aufgrund seiner hohen geologischen Vielfalt, der klimatischen Eigenschaften sowie der geographischen Isolation konnte der australische Kontinent seine einzigartige und unabhängige Flora entfalten (Sadgrove u. Jones 2014). Aus diesem Grund sind auch die ätherischen Öle vieler australischer Pflanzen interessant, da sie sich stark von denen auf den anderen Kontinenten vorkommenden Ölen unterscheiden (Sadgrove u. Jones 2014). Die australische Pflanze Eremophila serrulata (A. DC.) Druce (E. serrulata) gehört zur Ordnung der und zur Familie der (Chinnock 2007). Während sie früher zur Gattung der Myoporaceae gehörte, fassen neuere Studien die Spezies der Myoporaceae und der Eremophila zur Gattung der Eremophila zusammen. Insgesamt beinhaltet der Genus der Eremophila über 200 verschiedene Spezies. Er ist weit verbreitet in den australischen Wüstenregionen und im gemäßigten Grünland (Sadgrove u. Jones 2014). Daher stammt auch der Name Eremophila, welches aus dem Griechischen als „die Trockenheit-liebende Pflanze” übersetzt werden kann (eremos - Trockenheit, philos – liebend). Diese Studie befasst sich mit der Spezies Eremophila serrulata (A. DC.) Druce. Diese Spezies ist vor allem in Zentral-West

31

Einleitung

New South Wales über Südaustralien bis hin zur Westküste weit verbreitet (Chinnock 2007). Ein Busch (Abb. 6) wird bis zu 2,5 m hoch und weist sowohl Blüten als auch Früchte auf.

a.) b.) c.)

Abb. 6: Fotos der E. serrulata, kultiviert im Gewächshaus der Ruhr-Universität Bochum. Der Busch (a) weist eine gelbe Blüte (b) auf. Die Blätter (c) wurden im Rahmen dieser Studie in alte (links) und junge (rechts) Blätter unterteilt.

Für die Wissenschaft ist der Eremophila Genus besonders interessant, da die Pflanzen eine wichtige Rolle in der traditionellen Medizin der Ureinwohner Australiens, den Aborigines, einnehmen (Ghisalberti 1994). So gibt es bereits zahlreiche Publikationen, die von der Linderung von Hautverletzungen oder Halsschmerzen durch Eremophila-Spezies als Bestandteil der traditionellen Medizin berichten (Ndi et al. 2007; Richmond u. Ghisalberti 1994). Darüber hinaus zeigten viele wissenschaftliche Studien bereits antibakterielle Eigenschaften verschiedener Eremophila-Spezies und brachten diese in Zusammenhang mit den gebildeten Terpenoiden. Weiter zeigten verschiedene Pflanzenextrakte bzw. Naturstoffe aus den Eremophila-Spezies ebenfalls antivirale-, antiinflammatorische- sowie zytotoxische Effekte (Barnes et al. 2013). Auch zeigten Eremophila-Extrakte bereits Anti-Malaria- (Barnes et al. 2013) und Anti-Tumor-Aktivitäten auf (Ghisalberti 1994).

Im Falle der E. serrulata konnten bereits drei serrulatane Diterpenoide identifiziert werden, welche eine antibakterielle Aktivität gegenüber Gram-positiven Bakterien aufwiesen (Ndi et al. 2007; Croft et al. 1979). Zahlreiche serrulatane Diterpenoide konnten bereits auch in mehreren anderen Eremophila-Spezies wie beispielsweise der Eremophila duttonii und der Eremophila latrobei nachgewiesen werden (Tippett u. Massy-Westropp 1993; Smith et al. 2007; Barnes et al. 2013; Ghisalberti 1994; Forster et al. 1986). Besonders interessant ist, dass es sich bei diesen Verbindungen um Vorläufer der bereits erwähnten Pseudopterosine handelt

32

Einleitung

(Ghisalberti 1992), deren Bioaktivität aus einer ganz anderen Klasse von Organismen bekannt ist.

Pseudopterosine sind trizyklische Diterpenoid-Glykoside, welche aus der Weichkoralle Pseudopterogorgia elisabethae (neuer Name: Antillogorgia elisabethae) isoliert wurden (Robertson et al. 2016). Es gibt zahlreiche verschiedene Pseudopterosine, welche sich durch die Position des Zuckers sowie dem Zucker selbst voneinander unterscheiden (Correa et al. 2011). Pseudopterosine weisen zahlreiche Bioaktivitäten auf. So können sie sowohl antiinflammatorische, antibakterielle oder schmerzlindernde Wirkungen zeigen. Auch wurden erste Wirksamkeiten als Malaria- und Tuberkulose-Mittel gezeigt (Rodriguez et al. 2004). Als Teil des Sekundärmetabolismus werden je nach Lebensraum der Korallen unterschiedliche Arten der Pseudopterosine extrahiert: So bildet die Pseudopterogorgia elisabethae auf den Bahamas eher die Pseudopterosine A-L, während Extrakte der Pseudopterogorgia elisabethae aus Florida hauptsächlich die Pseudopterosine M-O aufweisen (Rodriguez et al. 2004).

Aufgrund der hohen Bioaktivität werden Pseudopterosine heutzutage bereits als fester Bestandteil von Hautpflegeprodukten verwendet (Kijjoa u. Sawangwong 2004). Sie sind zum Beispiel ein gängiger Wirkstoff zur Heilung von Sonnenbränden in dem Produkt Resilience von Estée Lauder. Zwar konnte bereits die Totalsynthese von verschiedenen Pseudopterosinen etabliert werden, allerdings handelt es sich um eine 20-Stufen Synthese, welche aufgrund der geringen Ausbeuten für industrielle Prozesse uninteressant ist (Broka et al. 1988). Daher - und höchstwahrscheinlich auch aus Marketing-Gründen - werden die Pseudopterosine heutzutage immer noch durch „natürliche” Extraktion aus den Korallen gewonnen (Harrison u. Hester 2000), was jedoch ein Absterben der Korallenriffe mit enormen Umwelteinflüssen mit sich bringt (Robertson et al. 2016). Bis heute konnte keine enzymatische Route für die Synthese der Pseudopterosine gefunden werden.

Interessanterweise weisen die Verbindungen aus der E. serrulata die gleiche Grundstruktur wie die Verbindungen aus der Koralle auf (Abb. 7) (Mydlarz et al. 2003). Aus vorherigen Studien ist bekannt, dass das grundlegende Molekül der Biosynthese von Pseudopterosinen das Elisabetatrien ist (Brück u. Kerr 2006). Dieses wird durch eine Diterpensynthase, die sogenannte Elisabethatrien-Synthase, aus dem Substrat GGPP gebildet. Da die Verbindungen aus den Pflanzen das selbe Grundgerüst wie die Diterpene aus den Korallen aufzeigen, wurde in dieser Studie davon ausgegangen, dass die E. serrulata ebenfalls über eine Art Elisabethatrien-Synthase verfügen muss, welche das Elisabethatrien, als Vorstufe der serrulatanen Diterpensynthese, bildet.

33

Einleitung

Abb. 7: Biosyntheseweg der Pseudopterosine ausgegehend von GGPP in der Weichkoralle Antillogorgia elisabethae (oben) sowie der potentielle Biosyntheseweg der serrulatanen Diterpenoide in der Pflanze E. serrulata (unten). Beide Biosynthesen verlaufen vermutlich über die Zwischenstufe Elisabethatrien, welches in der Koralle, ausgehend von GGPP, durch die Elisabethatrien-Diterpensynthase gebildet wird (Brück u. Kerr 2006; Mydlarz et al. 2003).

Ein wichtiger Punkt ist jedoch, dass bis heute kontrovers diskutiert wird, ob die wertvollen Pseudopterosine überhaupt von der Koralle selbst gebildet werden oder nicht doch von Dinoflagellaten (Mydlarz et al. 2003). Dinoflagellaten sind einzellige Lebewesen, welche häufig in Symbiose mit den Korallen leben. Eine Studie der Gruppe um Russell Kerr zeigte, dass isolierte Dinoflagellaten signifikante Level an endogenen Pseudopterosinen aufzeigten.

Dieses Problem muss allgemein auch bei Pflanzen in Betracht gezogen werden. Obwohl bestimmte Naturstoffe aus Pflanzen extrahiert werden, kann dennoch nicht ausgeschlossen werden, dass Endophyten die Terpenoide gebildet haben. Verschiedene Studien diskutierten beispielsweise die Bildung des Taxols durch die Pflanze Taxus brevifolia oder aber durch einen in Symbiose lebenden Pilz (Wildung u. Croteau 1996; Williams et al. 2000; Zhou et al. 2007;

34

Einleitung

Stierle et al. 1993). Da mittlerweile bekannt ist, dass auch bakterielle Endophyten, wie z.B. die Streptomyceten, terpenoide Strukturen bilden können, erweist sich eine Aussage über den eigentlichen terpenoid-bildenden Organismus als schwierig und kann nur durch die Isolierung der Gene des Syntheseweges geklärt werden (Yamada et al. 2012; Rabe u. Dickschat 2013).

2.2.3.4. Experimenteller Ansatz zur Identifizierung von TPS aus Nicht-Modell- Pflanzen

Zur Identifizierung potentieller TPS aus Nicht-Modell-Pflanzen, wird häufig eine de novo Transkriptomsequenzierung durchgeführt (Zerbe et al. 2013). Neben dem Kostenfaktor für das next generation sequencing (NGS) bietet die Sequenzierung des pflanzlichen Transkriptoms ebenfalls den Vorteil, dass die Sequenzen keine Introns enthalten, sodass die ORFs einfacher detektiert werden können. Die sich aus dem NGS ergebenden potentiellen Proteinsequenzen werden anschließend mit bekannten TPS der Literatur verglichen und bezüglich der charakteristischen TPS-Motive analysiert. Ein Nachteil der Illumina Sequenzierungsmethode ist allerdings, dass aufgrund der kurzen reads und der schwierigen de novo Assemblierung, nicht alle Transkripte vollständig sequenziert bzw. assembliert werden können. Daher müssen die Gene häufig mittels RACE-PCR vervollständigt werden. Anschließend erfolgt die heterologe Expression der Pflanzengene und die rekombinanten Proteine werden in Biokatalysen mit den verschiedenen Substraten (GPP, FPP und GGPP) untersucht. Hierbei können zum einen radioaktiv-markierte Substrate verwendet werden, um mit Hilfe einer sehr sensitiven Methode allgemein die Aktivität der Proteine zu bestimmen. Die eigentliche Identifizierung der Produkte erfolgt jedoch für gewöhnlich mittels GC/MS unter Berücksichtigung des Retentionsindex (RI). Während in dieser Arbeit für die potentiellen Mono- und Diterpensynthasen in vitro Tests durchgeführt wurden, konnten die Sesquiterpensynthasen in ein Ganzzell-System einbracht (Martin et al. 2003) und ihre Produktbildung anschließend mittels GC/MS analysiert werden. Dieses E. coli-basierte Produktionssystem verwendet einen heterologen MEV-Pfadweg aus Saccharomyces cerevisiae, wodurch die Umsetzung des Substrates FPP durch die potentielle Sesquiterpensynthase direkt in vivo ablaufen kann. Mit Hilfe dieser Methode können wesentlich höhere Produktmengen als bei den in vitro Experimenten generiert werden (Newman et al. 2006).

35

Einleitung

2.2.3.4.1 Das Next generation sequencing

Die Entwicklung und Etablierung des NGS hat die Forschungsarbeiten zur Entdeckung neuer TPS revolutioniert. Während es zu Zeiten der Sanger Sequenzierung unvorstellbar war, Pflanzentranskriptome aufzuklären, können heutzutage eine Vielzahl an NGS Methoden eine kostengünstige und zeitsparende Plattform zur Aufklärung pflanzlicher Genome und Transkriptome darstellen (Nowrousian 2010; Egan et al. 2012). Zwar konnte 2001 das komplette humane Genom mit Hilfe der Sanger Sequenzierung aufgeklärt werden, allerdings wurde hierbei auch deutlich, dass diese Methode aufgrund der Kosten, Dauer und Datenauswertung kein breites Anwendungsmaß zur Aufklärung von Genomen finden wird (van Dijk et al. 2014). Eine der ersten Methoden zur Hochdurchsatz-Sequenzierung, die Roche 454 Sequenzierung, wurde im Jahr 2005 von der Firma Roche auf den Markt gebracht (Egan et al. 2012; van Dijk et al. 2014). Im Jahr 2006 folgte die Illumina Sequenzierung, kommerzialisiert von der Firma Solexa. Zwei Jahre später führte eine heute zu Life Technologies gehörende Firma die SOLiD Technologie ein, welche auf der Roche 454 Methode basiert. Während Life Technologies 2010 die Ion Torrent PGM auf den Markt brachte, fanden Anfang 2011 zwei weitere Methoden kommerzielle Anwendung: Die Nanoporen Sequenzierung der Firma Oxford Nanopore Technologies sowie die PacBio Methode der Firma Pacific Biosciences. Die PacBio Methode basiert auf der Technologie des sogenannten zero-mode waveguides und wird heutzutage sogar als Sequenzierung der 3. Generation bezeichnet.

Die Illumina Sequenzierung, auch bekannt als Solexa Sequenzierung, hat ihren Ursprung in den Arbeiten von Trucatti und Kollegen sowie der Kooperation mit vier Firmen (Fedurco et al. 2006; Turcatti et al. 2008; Shendure u. Ji 2008). In der hier durchgeführten Studie wurde die Illumina MiSeq Sequenzierung zur Sequenzierung eines pflanzlichen Transkriptoms herangezogen. Hierbei wurde die RNA zunächst einer Normalisierung unterzogen, bevor das NGS durchgeführt wurde.

Anders als bei der Genomsequenzierung, bei der alle Gene in gleicher Konzentration vorliegen, ist die Qualität der Transkriptomsequenzierung von der Stärke der Transkription des jeweiligen Genes abhängig. Während sogenannte Haushaltgene normalerweise stark transkribiert vorliegen, findet sich für gewöhnlich nur eine geringe Anzahl an Gen-Transkripten des Sekundärmetabolismus in der Gesamt-mRNA wieder. Daher wurde zunächst eine sogenannte Normalisierung durchgeführt, welche zum Angleichen der Anzahl an Gen- Transkripten verwendet wurde. Hierbei wurde nach erfolgter PCR der cDNA die klassische Denaturierung-Reassoziations-Technik angewendet (Gschloessl et al. 2013). Dabei wird die doppelsträngige DNA (ds-DNA) zunächst denaturiert, um einzelsträngige (ss-DNA) zu erzeugen. Darauffolgend wird die cDNA erneut renaturiert und die nicht-reassozierte (normalisierte) DNA über Chromatographie von der ds-DNA getrennt. Die ss-DNA wird

36

Einleitung anschließend über PCR amplifiziert, sodass nahezu alle Transkripte in derselben Menge vorhanden sind. Da TPS Gene als Teil des Sekundärmetabolismus häufig nur gering transkribiert werden, sollte diese Methode helfen, die Transkripte anzureichern und die NGS- Daten zu verbessern (Ralph et al. 2006).

Zur Amplifizierung wird die cDNA-library fragmentiert und an beiden Enden verschiedene Adaptoren ligiert, welche komplementär zu den zwei Typen an Oligonukleotiden auf der Durchflusszelle sind (Shendure u. Ji 2008). Der DNA-Strang hybridisiert an die auf der Durchflusszelle immobilisierten komplementären Oligonukeotide und eine sogenannte Cluster-PCR (auch Bridge-PCR genannt) wird initiiert (s. Abb. 8).

Abb. 8: Schematischer Ablauf der Cluster-PCR (übernommen aus Shendure u. Ji 2008). Die immobilisierten Einzelstränge bilden Brücken, welche als template für die PCR dienen und zur Generierung von doppelsträngigen „DNA-Brücken“ führen. Über Denaturierung kann anschließend erneut immobilisierte ss-DNA erzeugt werden, welche erneut als template dient. Mit Hilfe dieser Methode können mehrere Millionen cluster gleichzeitig auf der Durchflusszelle erzeugt werden.

Dazu wird der hybridisierte Einzelstrang mittels Polymerase amplifiziert, der Doppelstrang anschließend denaturiert und das Ursprungstemplat herunter gewaschen. Der komplementäre Strang bindet nun mit seinem zweiten Adaptermolekül an den zweiten Typ der Oligonukleotide auf der Durchflusszelle und formt somit eine „Brücke“. Die klonale Amplifizierung findet anschließend erneut über PCR statt, unter Bildung einer doppelsträngigen „DNA-Brücke“. Die erneute Denaturierung führt zu zwei immobilisierten gleichen Kopien des Moleküls auf der flow cell. Dieser Prozess wird ständig wiederholt und führt zur Bildung von Millionen clustern auf der Durchflusszelle. Nach erfolgter PCR werden die reverse-Stränge abgespalten und von der Durchflusszelle herunter gewaschen, sodass nur noch die forward-Stränge auf der Zelle immobilisiert sind. Die freistehenden 3`-Enden werden anschließend blockiert, um eine erneute Brückenbildung zu verhindern.

Die eigentliche Sequenzierung findet anschließend über die sogenannte sequencing by synthesis Methode mit einem zum 3`-Adapter komplementären Primer statt. Hierzu werden außerdem reversible Terminatoren verwendet, welche die Basis der sogenannten cyclic reversible termination Methode darstellen (Metzker 2010). Diese Methode besteht aus drei Schritten: dem Einbau des komplementären, fluoreszent-markierten Nukleotids, der

37

Einleitung

Fluoreszenz-Detektion sowie der anschließenden Abspaltung. Durch die reversiblen Terminatoren an den Nukleotiden wird die Synthese gestoppt und die übrigen Nukleotide werden von der Durchflusszelle herunter gewaschen. Das nun durchgeführte Imaging über total internal reflection fluorescence Mikroskopie (TIRF-Mikroskopie) dient zur Identifizierung der eingebauten Nukleobase. Die Terminatoren und Farbstoffe werden abgespalten, die Durchflusszelle gewaschen und der gesamte Prozess wiederholt.

Abb. 9: Prinzip der Illumina Sequenzierung (modifiziert übernommen aus Metzker 2010). Über sequencing by synthesis werden unterschiedlich markierte Nukleotide eingebaut. Nach dem Einbau wird die Synthese aufgrund von reversiblen Terminatoren unterbrochen, die Durchflusszelle gewaschen und die Fluoreszenz des eingebauten Nukleotids bestimmt. Nach Abspaltung des Terminators beginnt der Prozess von vorne.

Chemisch betrachtet werden bei den reversiblen Terminatoren 3´-O-Azidomethyl-dNTPs verwendet, welche die weitere DNA-Synthese inhibieren. Darüber hinaus befindet sich an der Nukleobase ein chemischer Spacer, welcher ebenfalls über einen Azidolinker mit dem Fluorophor verknüpft ist (Guo et al. 2008). Über eine Staudinger-Reaktion und der Verwendung von Tris(2-Carboxyethyl)Phosphin (TCEP) können die Azide anschließend abgespalten und die freistehenden Hydroxygruppen zur weiteren Synthese verwendet werden.

38

Einleitung

Abb. 10: Struktur des reversiblen Terminators (Guo et al. 2008; Metzker 2010). Der Fluorophor (orange) ist reversibel über einen Azidolinker (Pfeil) und einen chemischen Spacer (blau) an das dNTP gekoppelt. Auch das dNTP ist über eine 3`-O-Azidomethyl-Gruppe (Pfeil) chemisch geschützt. Die Schutzgruppe und der Fluorophor werden bei der Illumina Sequenzierung nach der Fluoreszenzmessung abgespalten.

Zum Abschluss der Sequenzierung werden die reversiblen Terminatoren am 3´-Ende abgespalten, sodass der Adapter wieder entschützt vorliegt und sich erneut eine „DNA- Brücke“ ausbilden kann. Der komplementäre Strang wird erneut erzeugt, die ds-DNA wieder denaturiert und die 3´-Enden wieder geschützt. Anschließend wird der ursprüngliche Strang abgespalten und die Sequenzierung erfolgt wie oben beschrieben mit dem reverse-Strang.

Mit Hilfe dieser Sequenzierungsmethode werden daher Millionen von reads der einzelnen Fragmente generiert, die anschließend gepaart und assembliert werden müssen. Die Auswertung der Daten ist besonders problematisch, wenn keine Daten eines Referenzgenoms oder Referenztranskriptoms (z.B. einer eng verwandten Pflanze) vorliegen, mit dem die einzelnen reads verglichen werden können.

2.2.3.4.2. Die RACE-PCR

Die rapid amplification of cDNA ends polymerase chain reaction (RACE-PCR) ist eine Methode zur Verlängerung von cDNA-Enden mit Hilfe einer PCR-Reaktion (Borson et al. 1992). Hierbei können, je nach Primer, sowohl die 3`- Enden als auch die 5`-DNA-Enden amplifiziert werden. Da bei der Illumina Sequenzierung immer nur kurze Fragmente generiert werden können, stellt es sich häufig als schwierig heraus, komplette Gene zu assemblieren. Daher wurden für zahlreiche Gene nur Fragmente erhalten, deren 3`/5`- Enden fehlten. Zur Generierung dieser Enden wurde die RACE-PCR verwendet.

39

Einleitung

Abb. 11: Schematische Darstellung der 3`-RACE-PCR (gemäß Roche 2014). Die cDNA-Synthese erfolgt mit einem Oligo(dT)-Primer. Anschließend wird die mRNA verdaut und die PCR mit einem genspezifischen Primer und dem Anker-Primer durchgeführt. Das PCR-Produkt wird aufgereinigt, zwischenkloniert und sequenziert.

Bei der 3`-RACE-PCR handelt es sich um eine Methode zur Generierung der fehlenden 3`- Enden (s. Abb. 11). Die Methode basiert auf der Tatsache, dass die mRNA eukaryotischer Zellen eine 3`-Polyadenylierung aufzeigt. Mit Hilfe des Oligo(dT)-Anker-Primers, welcher komplementär zur Polyadenylierung ist und eine weitere Ankersequenz anfügt, wurde die cDNA-Synthese durchgeführt. Anschließend wurde die mRNA mit einer RNAse degradiert und eine PCR mit einem genspezifischen Primer und einem zum Anker komplementären Primer durchgeführt.

Bei der 5`-RACE-PCR werden die 5`-DNA-Enden mit Hilfe einer nested PCR erzeugt (s. Abb. 12). Aus der mRNA wird zunächst unter der Verwendung einer reversen Transkriptase cDNA generiert. Der hierzu eingesetzte genspezfische Primer bindet dabei downstream der 3`- Polyadenylierung. Die mRNA wird anschließend mit einer RNAse abgebaut und die cDNA aufgereinigt. Mit Hilfe einer rekombinanten terminalen und einer dATP Lösung wird anschließend versucht, einen neuen 3`-Poly(A)-Schwanz zu generieren. Das 3`-Ende der cDNA ist dabei komplementär zu dem 5`-Ende der mRNA. Die nachfolgende nested PCR soll helfen, das Zielgen spezifisch zu amplifizieren. Dabei wird zunächst ein Oligo(dT)-Primer, der an die 3`-Polyadenylierung der cDNA bindet, zusammen mit dem spezifischen Primer der cDNA-Synthese verwendet. Anschließend erfolgt eine zweite PCR mit einem Anker-Primer und einem weiter upstream liegenden spezifischen Primer.

40

Einleitung

Abb. 12: Schematische Darstellung der 5`-RACE-PCR (gemäß Roche 2014). Zunächst wird die cDNA- Synthese mit Hilfe eines spezifischen Primers (SP1) durchgeführt. Die mRNA wird darauffolgend verdaut und ein tailing durchgeführt, sodass eine 3`-Polyadenylierung generiert wird. Zwei weitere nested PCRs dienen dann zur Vervollständigung des fehlenden 5`-Endes. Schlussendlich wird das PCR-Produkt aufgereinigt, zwischenkloniert und sequenziert.

2.2.3.4.3. Der Retentionsindex

Nachdem die potentiellen TPS Gene hinsichtlich ihrer Länge vervollständigt wurden, konnten sie kloniert und heterolog exprimiert werden. Anschließend wurden die Enzyme in Biokatalysen eingesetzt und hinsichtlich ihrer Produktbildung untersucht. Die Analytik der Terpene basiert für gewöhnlich auf GC/MS-Messungen (Moniodis et al. 2015), da die generierten Mengen häufig zu gering für NMR-Experimente sind. Da es sich bei Terpenen größtenteils um Isomere handelt, die bei GC/MS Analysen teilweise sehr ähnliche Massenspektren aufzeigen (s. Abb. 13), wurde daher eine weitere Größe in die Messung einbezogen, welche auf der Retentionszeit der Produkte basiert.

41

Einleitung

Intensität [%]

m/z

Abb. 13: Beispielhafte Darstellung des GC/MS Fragmentierungsmusters dreier verschiedener Terpene (übernommen aus König et al. 2008). Es lässt sich deutlich erkennen, wie ähnlich die Massespektren verschiedener Terpene sein können, was die schwierige Identifizierung der Moleküle verdeutlicht. Allerdings weisen die Terpene unterschiedliche RIs auf, welche eine Unterscheidung erleichtern.

Der RI ist eine Messgröße, welche die Retentionszeit der Analyten und interner Standards normalisiert. Das Problem bei der Bestimmung der Retentionszeit allgemein ist jedoch, dass diese nur unter komplett identischen chromatographischen Bedingungen gleich ist und leichte Variationen z.B. in der Temperatur oder im Druck bereits eine Verschiebung der Elution auslösen können. Eine Alternative hierzu ist die Verwendung von relativen Retentionszeiten, bei denen die Retentionszeit des Analyten mit der eines internen Standards ins Verhältnis gesetzt wird (van den Dool u. Kratz 1963). Leichte Veränderungen z.B. in der Temperatur wirken sich hierbei gleich auf den Analyten und den internen Standard aus, sodass die Variationen keine Auswirkungen mehr haben. Allerdings wird diese Methode immer ungenauer, je weiter die Retentionszeiten zwischen Analyt und internem Standard auseinander liegen. Da nach der Elution der ersten Verbindung immer noch Variationen auftreten können, beeinflussen diese dann nur die Elution des zweiten Moleküls. Dieses Problem kann größtenteils gelöst werden, indem zwei interne Standards verwendet werden. Einer von ihnen eluiert kurz vor dem Analyten, der andere etwas später. Auf diesem Prinzip

42

Einleitung basiert der RI. Hierbei werden mehrere n-Alkan-Standards gemessen, um nahezu das gesamte Zeitfenster der Messung abzudecken. Anschließend wird der Unterschied in den Retentionszeiten zweier benachbarter Alkan-Peaks in 100 Teile geteilt (König et al. 2008). Daher wird der RI eines n-Alkans bei der temperaturprogrammierten Messung als 100 n definiert und mit folgender Formel bestimmt (1):

100 (RTx−RTn0) RI (X) = 100 n0 + (1) (RTn1−RTn0) mit RI(X) = Retentionsindex des Analyten, n0 = n-Alkan, welches direkt vor dem Analyten eluiert, n1 = n-Alkan, welches direkt nach dem Analyten eluiert,

RT = Retentionszeit.

Da auch bei sehr ähnlichen Fragmentierungsmustern die RIs der Terpene häufig unterschiedlich sind, wird diese Größe allgemein bei Produktbestimmungen von TPS hinzugegzogen.

2.2.3.5. Enzyme Engineering

Zwar finden Biokatalysatoren bereits große Anwendung in der Industrie, dennoch müssen die Enzyme häufig optimiert werden, bevor sie in industrielle Prozesse eingesetzt werden können (Turner 2009). Einige Nachteile des Einsatzes von Enzymen gegenüber traditionellen Prozessen sind zum Beispiel die oft geringe Toleranz gegenüber organischen Lösemitteln, das häufig sehr enge Temperaturspektrum der Enzyme ebenso wie die teilweise geringe Aktivität oder aber die Instabilität über lange Zeiträume (Salleh et al. 2002; Gaßmeyer 2015). Aus diesem Grund befassen sich heutzutage zahlreiche Studien mit dem Engineering von Enzymen, um beispielsweise die katalytische Aktivität, die Spezifität oder die Lösemitteltoleranz der Enzyme hinsichtlich industrieller Prozesse zu verändern (Bornscheuer u. Kazlauskas 2004; Turner 2009; Salleh et al. 2002).

Allgemein kann das Enzyme Engineering in zwei Hauptmethoden unterteilt werden (Bornscheuer u. Pohl 2001; Bottcher u. Bornscheuer 2010; Bloom et al. 2005): das Rationale Protein Design und die Gerichtete Evolution (Abb. 14).

43

Einleitung

Abb. 14: Schematische Darstellung der beiden gängigen Methoden des Protein Engineerings. Das Rationale Protein Design (links) basiert auf einer Kristallstruktur bzw. einem Homologie-Modell. Die Mutationen werden basierend auf der strukturellen bzw. mechanistischen Information ortsspezifisch eingeführt. Anschließend wird die Auswirkung der Mutation untersucht. Bei der Gerichteten Evolution wird über Zufallsmutagenese eine möglichst hohe Anzahl an Mutanten erstellt und anschließend hinsichtlich eines bestimmten Parameters untersucht. Hierzu sollte ein Hochdurchsatz Screening vorhanden sein.

Während für das Rationale Protein Design eine Kristallstruktur verfügbar sein sollte, wird die Methode der Gerichteten Evolution eher dann angewendet, wenn keinerlei Strukturinformationen vorliegen (Bornscheuer u. Pohl 2001).

Bei dem Rationalen Protein Design werden, basierend auf der Kenntnis der Struktur und des Reaktionsmechanismus, gezielte Mutationen in das Gen eingebaut. Ist die Kristallstruktur nicht bekannt, können Homologie-Modelle helfen, ein Verständnis von der Enzymstruktur zu bekommen. Allgemein werden bei dem Rationalen Protein Design zunächst Aminosäurereste bestimmt, welche eine entscheidende Rolle in der Aktivität des Enzyms einnehmen könnten. Anschließend erfolgen Überlegungen hinsichtlich der Substitution der Aminosäurereste. Das Einführen der Mutationen erfolgt schlussendlich über site-directed mutagenesis, meistens mittels QuikChange-Polymerase chain reaction. Die QuikChange-PCR ist eine PCR-basierte Methode, bei der über mutagene Primer die gewünschte Mutation ortsspezifisch eingebracht werden kann. Im Gegensatz zum Rationalen Protein Design werden bei der Gerichteten Evolution zufällige Mutationen in das Gen des zu optimierenden Enzyms eingefügt (Bloom et al. 2005; Bornscheuer u. Pohl 2001). Anschließend werden die Auswirkungen der jeweiligen Mutation bezüglich eines gewünschten Parameters (z.B. der Aktivität) untersucht. Diese Methode ist jedoch nur sinnvoll, wenn ein geeignetes Hochdurchsatz-Verfahren zum 44

Einleitung

Screening hinsichtlich des gewünschten Paramaters vorhanden ist, da hierbei eine enorme Anzahl an Mutanten generiert wird. Gängige Methoden zur Erstellung einer solchen Mutantenbibliothek sind zum Beispiel die Verwendung von UV-Licht, welches eine mutagene Wirkung auf Mikroorganismen aufweist oder die Durchführung einer error prone-PCR. Bei dieser Methode wird durch den Austausch von Mg2+ zu Mn2+ die Fehlerrate der Polymerase erhöht, sodass während der PCR zufällig Fehler in die Gensequenz eingebaut werden.

2.2.3.5.1. Rationales Protein Design von promiskuitiven TPS

Die promiskuitiven Eigenschaften von TPS sind weit verbreitet. So bilden, wie bereits erwähnt, die meisten TPS mehrere Produkte mit einem Substrat (Bohlmann et al. 1998; Chen et al. 2011; Moniodis et al. 2015). Diese Promiskuität brachte im Verlauf der Evolution höchstwahrscheinlich einen großen Vorteil für den Organismus mit sich, da eine hohe Diversität an Sekundärmetaboliten auch eine Vielfalt an Eigenschaften mit sich bringt (Bohlmann et al. 1998; Tholl 2006). So könnte der Selektionsdruck dazu geführt haben, dass sich die Bildung neuer oder mehrerer Produkte mit unterschiedlichen Bioaktivitäten durchgesetzt hat. Bereits ein einzelner Aminosäure-Austausch kann das Produktspektrum der TPS verändern oder aber das Enzym komplett inaktivieren (Tholl 2006; Bohlmann u. Keeling 2008; Bohlmann et al. 1998). Höchstwahrscheinlich haben plastizierbare Reste während der Evolution bei der schnellen und erfolgreichen Adaption der Enzyme an neue Umweltbedingungen eine entscheidene Rolle gespielt. Aus diesem Grund wird angenommen, dass ein Austausch der Aminosäure an diesen plastizierbaren Resten zu einer veränderten Enzymfunktion führen kann (Yoshikuni et al. 2006).

Dass bereits ein einzelner Aminosäure-Austausch ausreichend sein kann, um das Produktspektrum von TPS zu verändern, konnte bereits in mehreren Studien gezeigt werden. So konnte zum Beispiel die Mutation von einem Tyrosin zu einem Alanin (Position 92) mehr Platz in der aktiven Tasche einer fungalen Aristolochen-Synthase erzeugen, weshalb das Enzym statt des zyklischen Aristolochens zwei lineare Farnesene, das (E)-β-Farnesen, sowie das (E, E)-α-Farnesen bildete (Deligeorgopoulou u. Allemann 2003). Auch für Diterpensynthasen konnten in mehreren Studien dieselben Beobachtungen gemacht werden: So führte beispielsweise die Mutation einer einzelnen Aminosäure einer pflanzlichen ent- Kauren-Synthase zu der Bildung von 16-α-Hydroxy-ent-Kauran (Irmisch et al. 2015).

Eine andere Studie aus dem Jahr 2006, durchgeführt von der Gruppe um Jay Keasling, befasst sich mit der Bestimmung und Mutagenese der plastizierbaren Reste einer γ-Humulen- Synthase aus Abies grandis (Yoshikuni et al. 2006). Diese Sesquiterpensynthase zeigt eine enorme Promiskuität und bildet durch verschiedene Zyklisierungen 52 Produkte ausgehend von FPP. Zwar gibt es einige wenige Hochdurchsatz-Screenings zur Aktivitätsbestimmung von

45

Einleitung

TPS, wie beispielsweise den Malachitgrün-Assay, allerdings geben diese aber keine Auskunft über die Struktur der Produkte und sind daher für Mutagenesestudien wenig geeignet (Vardakou et al. 2014). Aus diesem Grund bietet die Gerichtete Evolution keine Möglichkeit für die Mutagenese von TPS (Yoshikuni et al. 2006). Für das Rationale Protein Design ist die Kenntnis über die plastizierbaren Reste von Vorteil, welche allerdings schwierig zu bestimmen sind. Aus diesem Grund hatte die Gruppe um Jay Keasling einen Algorithmus entwickelt, mit dem plastizierbare Reste in dieser Synthase in silico bestimmt werden konnten. Dieser Algorithmus sollte die Auswirkung einer Mutation vorhersagen und damit eine Alternative zum Hochdurchsatz-Screening darstellen. Mit Hilfe diese Methode konnten vier plastizierbare Reste bestimmt werden, W315, M447, S484 und Y566, deren Mutation sieben Enzyme mit einem neuen Produktspektrum hervorbrachte. Das übertragen dieses Algorithmus auf andere Enzyme ist jedoch nicht möglich und muss weiter verbessert werden.

Da allgemein keine Hochdurchsatz-Screenings sowie gängige in silico Methoden für die Mutagenese von TPS vorhanden sind, kann nur eine überschaubare Anzahl an Mutationen durchgeführt werden. Eine durch einen Aminosäure-Austausch herbeigeführte Veränderung der Hydrophobizität kann z.B. die Interaktionen innerhalb der aktiven Tasche verändern (Lassila et al. 2007; Bornscheuer u. Pohl 2001). Gemäß des Hydrophobizität-Plots, entwickelt von Kyte und Doolittle, zählen Isoleucin, Valin, Leucin, Phenylalanin, Cystein, Methionin und Alanin zu den hydrophoben Aminosäuren (Kyte u. Doolittle 1982). Im Gegensatz dazu scheinen Substitutionen durch die anderen Aminosäuren die Hydrophobizität zu verringern (Tab. 1).

Tab. 1: Hydrophobizitäts-Werte der 20 proteinogenen Aminosäuren gemäß Kyte und Doolittle (Kyte u. Doolittle 1982). Positive Werte stellen eine hohe Hydrophobizität dar, wohingegen Aminosäuren mit einem negativem Wert als hydrophil gelten.

I V L F C M A G T W 4.5 4.2 3.8 2.8 2.5 1.9 1.8 -0.4 -0.7 -0.9

S Y P H E Q D N K R -0.8 -1.3 -1.6 -3.2 -3.5 -3.5 -3.5 -3.5 -3.9 -4.5

Eine weitere Strategie der Mutagenese ist die Veränderung der räumlichen Ausdehnung der Seitenreste. Sterische Effekte, z.B. durch die Substitution eines großen Restes durch einen kleinen, können Auswirkungen auf die Interaktionen in der aktiven Tasche nehmen und den katalytischen Mechanismus des Enzyms verändern. Dies konnte beispielsweise bereits in der oben gennanten Studie aus dem Jahr 2003 für eine Sesquiterpensynthase (fungale Aristolochen-Synthase) gezeigt werden (Deligeorgopoulou u. Allemann 2003). Auch können Aminosäure-Substitutionen dazu beitragen, die Struktur oder Konformation des Enzyms zu 46

Einleitung verändern. Prolin kann α-helikale Strukturen aufbrechen, da ein Wasserstoff-Brücken-Donor fehlt (Sansom u. Weinstein 2000). Es kann außerdem cis-Amidbindungen eingehen, wodurch sich die Konformation des Enzyms ändern kann (Brandl u. Deber 1986). Auch für TPS ist dies von Bedeutung, da bekannt ist, dass die Bindung des Substrates in der aktiven Tasche eine Konformationsänderung initiiert, die zu einem „Schließen” der aktiven Tasche führt (Lopez- Gallego et al. 2010). Gleichzeitig wird hierbei auch das Pyrophosphat abgespalten und das Carbokation generiert.

Gerade im Zusammenhang mit TPS können auch Substitutionen durch Histidine eine große Rolle spielen. Histidin hat eine hohe Affinität zu metallischen Kationen (Liao et al. 2013), welches Auswirkungen auf den Mechanismus der TPS haben kann, da diese für ihre Aktivität Mn2+ oder Mg2+ benötigen (Bohlmann et al. 1998).

2.2.3.5.2. Die pflanzliche Sesquiterpensynthase TPS4

Die Sesquiterpensynthase TPS4 wurde im Jahr 2015 von der Gruppe um Jörg Bohlmann in der australischen Pflanze Santalum spicatum, auch Sandelholz genannt, entdeckt (Moniodis et al. 2015). Diese Pflanze hat aufgrund ihres speziellen ätherischen Öls eine hohe wirtschaftliche Bedeutung für West-Australien (Leavell et al. 2016; Moniodis et al. 2015). Das ätherische Öl beinhaltet eine Mischung aus Sesquiterpenen, Sesquiterpen-Alkohlen und Alkohlen und hat aufgrund seines angenehmen Geruchs eine hohe Relevanz in der Parfum- und Kosmetik-Industrie. Die Zusammensetzung des Öls variiert je nach Santalum Spezies und Umwelteinflüssen (Moniodis et al. 2015). Die Hauptkomponenten sind α- und β-Santalol sowie (E,E)-Farnesol, aber auch weitere Sesquiterpenoide, wie Sesquisabinen oder Sesquiphellandren sind Bestandteile des wertvollen ätherischen Öls. Je höher die Konzentrationen an α- und β-Santalol, desto wertvoller ist das Öl. Die derzeitige Forschung befasst sich daher vor allem mit den Biosynthesewegen dieser Sesquiterpene, um die Ausbeuten und Qualität der ätherischen Öle zu erhöhen.

Bei der Analyse der biosynthetischen Gene konnten in der beschriebenen Studie (Moniodis et al. 2015) die Gene für die Bildung des α- und β-Santalols nicht gefunden werden. Dennoch wurde die Sesquiterpensynthase TPS4 entdeckt, welche insgesamt sechs Sesquiterpene bildet (s. Abb. 15). Das Hauptprodukt ist hierbei Sesquisabinen B (2), welches auch ein bekannter Inhaltsstoff der ätherischen Öle der Santalum Spezies ist. Bei den Nebenprodukten handelt es sich um α-Acoradien (3), γ-Curcumen (4), β-Bisabolen (5), β-Sesquiphellandren (6) sowie ein unbekanntes Produkt (1).

47

Einleitung

Abb. 15: GC/MS Chromatogramm der Produkte des Enzyms TPS4 mit FPP und Mg2+ als Kofaktor (übernommen aus Moniodis et al. 2015). Es wurden insgesamt sechs Sesquiterpene gebildet. Peak 1: unbekannt, Peak 2: Sesquisabinen B, Peak 3: α-Acoradien, Peak 4: γ-Curcumen, Peak 5: β-Bisabolen, Peak 6: β-Sesquiphellandren.

Darüber hinaus zeigte das Enzym auch eine Aktivität mit GPP (Abb. 16) und bildete sechs Produkte: α-Pinen (1), β-Pinen (2), Myrcen (3), Sabinen (4) sowie die Monoterpen-Alkohole α- Terpeniol (5) und Linalool (6).

Abb. 16: GC/MS Chromatogramm der Produkte von TPS4 mit GPP als Substrat (übernommen aus Moniodis et al. 2015). Sowohl die Biokatalysen, welche in Anwesenheit von Mg2+ durchgeführt wurden (durchgezogenen Linie), als auch die, bei denen Mn2+ verwendet wurde (gestrichelte Linie), zeigen insgesamt die Bildung von sechs Monoterpenoiden. Peak 1: α-Pinen, Peak 2: β-Pinen, Peak 3: Myrcen, Peak 4: Sabinen, Peak 5: α-Terpeniol und Peak 6: Linalool.

48

Einleitung

Bei Betrachtung der Aminosäuresequenz sowie des Molekulargewichtes von TPS4 fällt eine hohe Ähnlichkeit zu Charakteristikern von pflanzlichen Sesquiterpensynthasen auf (Moniodis et al. 2015). Das Enzym hat eine Länge von 566 Aminosäuren und ein Molekulargewicht von rund 66 kDa. Es verfügt über die stark konservierten Motive pflanzlicher TPS, das am N-

Terminus zu findende R(R/P)X8W-Motiv sowie das DDxxD-Motiv. Darüber hinaus weist es keine N-terminale Signalsequenz auf, was auf eine natürliche Sesquiterpensynthase-Aktivität hindeutet. Während Sesquiterpene, wie bereits erwähnt, im Cytosol gebildet werden, findet die Synthese der Mono- und Diterpene in den Plastiden statt, weshalb diese Enzyme eine plastidäre Signalsequenz aufweisen (Bohlmann et al. 1998). Pflanzliche Monoterpensynthasen bevorzugen im Allgemeinen Mn2+ gegenüber Mg2+ als Kofaktor (Bohlmann et al. 1998; Moniodis et al. 2015). Anhand der Abb. 16 wird deutlich, dass TPS4 zwar eine Aktivität mit Mn2+ aufweist, allerdings ist diese geringer als mit Mg2+, was erneut darauf hindeutet, dass die natürliche Funktion von TPS4 die Umsetzung von FPP ist. Auch zeigt TPS4 eine hohe Verwandtschaft (97 %) zu der Sesquisabinen B Synthase aus Santalum album (Moniodis et al. 2015).

Der postulierte Mechanismus für die Sesquiterpensynthase-Aktivität von TPS4 kann der Abb. 17 entnommen werden (Moniodis et al. 2015). Wie bei allen Klasse I TPS wird das FPP zunächst unter Bildung eines Carbokations ionisiert. Anschließend erfolgt die Umlagerung zu einem Nerolidylkation. Das cis-Konformer dieses Kations kann über Zyklisierung zu dem 1,6- Bisabolylkation umgewandelt werden. Über Hydrid-Wanderungen und Zyklisierungen können sechs zyklische Sesquiterpene generiert werden.

49

Einleitung

Abb. 17: Darstellung eines typischen Mechanismus einer Klasse I TPS anhand des postulierten Mechanismus der Sesquiterpensynthase TPS4 (modifiziert übernommen aus Moniodis et al. 2015) ausgehend von (E, E)-FPP. Nach Bildung des Carbokations folgt die Umlagerung zu einem Nerolidylkation, welches entweder über einen 6,1 Ringschluss zu einem β-Bisabolen oder über 1,2 Hydrid-Verschiebung zu einem Bisabolylkation umgewandelt werden kann. Ausgehend von diesem Bisabolylkation können über verschiedene Umlagerungen und Zyklisierungsreaktionen die weiteren Produkte β-Sesquiphellandren, α- Acoradien, γ-Curcumen und Sesquisabinen B gebildet werden.

2.2.4. Entstehung von Terpendiversität in Bakterien 2.2.4.1. Kenntnisse und Aufbau bakterieller TPS

Während die meisten Terpenoide in Eukaryoten entdeckt wurden, zeigen bereits ein paar Studien die Bildung von Terpenoiden durch Bakterien (Yamada et al. 2012). Vor allem Actinomyceten zeigen häufig die Bildung von Naturstoffen (Genilloud et al. 2011). Die erste Studie zu bakteriellen Terpenoiden wurde im Jahr 1891 von den Forschern Berthelot und André durchgeführt (Yamada et al. 2015). Die Forscher konnten zeigen, dass der erdige Geruch von gepflügtem Boden auf eine flüchtige Verbindung zurückzuführen ist, welche mit

50

Einleitung

Hilfe der Wasserdampfdestillation extrahiert werden konnte. Die Stuktur konnte jedoch nicht aufgeklärt werden und die Forschungsarbeiten gerieten zunehmend in Vergessenheit, bis rund 75 Jahre später die Gruppe um Nancy Gerber die ersten modernen Studien zum Terpenmetabolismus von Bakterien durchführte (Gerber u. Lechevalier 1965; Gerber 1971; Gerber 1969). Die Wissenschaftler nahmen an, dass die typischen Gerüche der Actinomyceten, welche hauptsächlich in der Erde vorkommen, auf die Produktion von flüchtigen Terpenen zurückzuführen ist. So konnte der degradierte Sesquiterpen-Alkohol Geosmin identifiziert und mit dem erdigen Geruch der Actinomyceten in Zusammenhang gebracht werden. In den nachfolgenden Jahren konnten einige Terpene sowie Terpenole aus Bakterien, vor allem aus den Streptomyceten, isoliert werden (Gerber u. Lechevalier 1965). Die drei am häufigsten in Streptomyceten vorkommenden Terpenoide sind das Geosmin, das 2-Methylborneol sowie das Albaflavenon (Yamada et al. 2015).

Die meisten Actinomyceten besitzen keinen MEV-Pfadweg, sondern nur den MEP-Weg (Rohmer 1999). Ein großes Problem bei der Entdeckung bakterieller TPS ist zum einen, dass diese eine geringe Ähnlichkeit zu eukaryotischen TPS aufzeigen, zum anderen aber auch, dass die bakteriellen TPS untereinander eine verhältnismäßig geringe Aminosäuresequenz- Homologie aufweisen (Yamada et al. 2015). Alle TPS, sowohl eukaryotische als auch prokaryotische, verfügen über ein konserviertes Metall-bindendes Motiv, das DDxxD-Motiv (Yamada et al. 2015; Yamada et al. 2012). Dieses befindet sich in der Regel bei bakteriellen TPS rund 80-120 Aminosäuren downstream des N-Terminus und kann auch leicht abgewandelt als (D/N)Dxx(D/E) oder DDxxx(D/E) vorliegen. Davon rund 140 Aminosäuren downstream entfernt liegt die NSE-Triade [(N/D)Dxx(S/T)xx(K/R)(D/E)]. Im Gegensatz zu pflanzlichen TPS haben bakterielle TPS kein zusätzliches charakteristisches Motiv am N- Terminus (Yamada et al. 2015).

Die Unterscheidung zwischen bakteriellen Mono-, Sesqui- und Diterpensynthasen auf Basis der Sequenz gestaltet sich, wie bei Eukaryoten auch, als sehr schwierig. Wie bereits erwähnt, zeigen die bakteriellen TPS weder hohe Homologien zu den Sequenzen eukaryotischer TPS, noch zeigen sie hohe Aminosäure-Ähnlichkeiten untereinander (Yamada et al. 2012). So hat z.B. die 2-Methylisoborneol-Synthase aus Streptomyces coelicolor weniger als 20 Prozent Übereinstimmung zu der Aminosäuresequenz der Pentalenen-Synthase aus Streptomyces exfoliatus. Bei Betrachtung der konservierten Metall-bindenden Motive fällt auf, dass bakterielle Sesquiterpensynthasen häufig über eine hohe Anzahl an aromatischen Aminosäuren in diesem Motiv verfügen. So findet man für bakterielle Sesquiterpensynthasen (wie z.B. die Pentalenen-Synthase) das WFF[V/L][F/W]DD[L/R][F/H]D-Motiv während Sesquiterpenol-Synthasen häufig ein WVF[F/Y]FDDHFLE-Motiv aufzeigen. Im Vergleich dazu weisen bakterielle Diterpensynthasen (LIVNDDRWD) und Monoterpensynthasen

51

Einleitung

[AVDDxxx(D/E)] einen geringeren Gehalt an aromatischen Aminosäuren in dem konservierten Motiv auf.

2.2.4.2. Das Bakterium Streptomyces chartreusis

Viele interessante Naturstoffe wurden bereits in Actinomyceten und vor allem den Streptomyceten gefunden (Wang et al. 2013; Doroghazi et al. 2011; Taechowisan et al. 2005; Strobel 2003). Streptomyceten sind Gram-positive Bakterien, welche einen hohen GC-Gehalt in ihrer genomischen DNA aufweisen und häufig als Endophyten agieren (Castillo et al. 2003; Cao et al. 2004; Wright u. Bibb 1992). Sie sind vor allem in der Erde weit verbreitet und produzieren einen „erdig-riechenden” Geruch, welcher auf die Bildung von Terpenoiden zurückzuführen ist (Gerber u. Lechevalier 1965). Vor allem sind die Streptomyceten heutzutage wichtige Bakterien bei der Entdeckung neuer Antibiotika (Strobel 2003). So stammen über 70 Prozent der heutigen Antibiotika ursprünglich aus den Streptomyceten.

Auch das Bakterium Streptomyces chartreusis (S. chartreusis) produziert ein Antibiotikum, das Chartreusin, welches namensgebend für diese Spezies war (Leach et al. 1953). Die Spezies wurde im Jahr 1953 in afrikanischen Erdproben entdeckt. Da die kristalline Struktur des Antibiotikums die gleiche grünliche Farbe wie der französische Likör „Chartreuse” aufwies, wurde dieses nach dem Likör benannt. Abgesehen von seiner antibakteriellen Aktivität hat Chartreusin auch eine Anti-Tumor-Aktivität. Abhängig von dem jeweiligen Stamm bildet S. chartreusis verschiedene Sekundärmetabolite, wie das Cephamycin (Inouye et al. 1983), Calcimycin (Wu et al. 2011) oder das Tunicamycin (Doroghazi et al. 2011), welche alle antibakterielle Wirkungen haben.

Im Jahr 2011 wurde der Stamm S. chartreusis NRRL 3882 erstmalig sequenziert (Doroghazi et al. 2011) und es wurden bereits die ersten Gene aus S. chartreusis Spezies näher charakterisiert, allerdings lag der Fokus dieser Studien nicht auf der Entdeckung neuer TPS (Matsuo et al. 2000; Katsuyama et al. 2014; Zhu et al. 2012).

Die Gruppe von Prof. Dr. Julia Bandow (Ruhr-Universität Bochum) hat das Genom des S. chartreusis NRRL 3882 Stamm noch einmal mit einer Illumina MiSeq Sequenzierung untersucht (nicht publizierte Daten). Mit Hilfe dieser Daten sollen neue TPS sowie die Gene für die Antibiotika-Synthese identifiziert werden.

52

Einleitung

2.3. Zielsetzung

Diese Arbeit befasst sich mit der biokatalytischen Bildung von Terpendiversität. Dabei sollten sowohl neue pflanzliche als auch bakterielle TPS identifiziert und charakterisiert werden. Darüber hinaus sollte am Beispiel der pflanzlichen Sesquiterpensynthase TPS4 neue Terpendiversität über Rationales Protein Design erzeugt und das Verständnis der Struktur- Funktionsbeziehung pflanzlicher TPS erhöht werden. Im Rahmen der Analyse der katalytischen Bildung pflanzlicher Terpendiversität wurde die australische Wüstenpflanze E. serrulata herangezogen. Hierbei wurde der Fokus vor allem auf die Entdeckung einer Diterpensynthase, der Elisabethatrien-Synthase, gelegt. Aufgrund der antibakteriellen und antiinflammatorischen Eigenschaften der Pseudopterosine, welche aus einem Elisabethatrien- Gerüst aufgebaut sind, sowie der derzeitigen Gewinnung dieser aus Korallen, schien eine umweltfreundliche biotechnologische Alternative zur Gewinnung dieser Verbindungen von großer Bedeutung. Über Transkriptomsequenzierung und Alignments mit bereits bekannten TPS sollte die potentielle Elisabethatrien-Synthase gefunden werden. Da nach der Illumina MiSeq Sequenzierung häufig nur die Sequenzen von Genfragmenten vorliegen, sollten RACE- PCR-Experimente angewendet werden, um die Volllängen-Gene zu generieren. Ein großes Problem bei der Analyse von TPS ist jedoch, dass kaum eine Vorhersage über die Produktbildung möglich ist. Daher müssen alle generierten TPS erst heterolog exprimiert und in Biokatalysen eingesetzt werden, bevor die Produkte letztendlich mittels GC/MS bestimmt werden können.

In einem komplentären Ansatz sollte im Rahmen einer Kooperation mit der Arbeitsgruppe von Prof. Dr. Julia Bandow (Ruhr-Universität Bochum) eine weitere Studie zur Entdeckung neuer TPS aus dem Bakterium S. chartreusis durchgeführt werden. Bislang galten vor allem Pflanzen und Pilze als Terpenproduzenten, neuere Studien zeigten aber die Bildung von diversen Terpenen durch Bakterien. In dieser Arbeit sollte die bakterielle Terpendiversität als eine einfacher zugängliche Alternative zu pflanzlichen Terpen-Biosynthese Genen analysiert werden. Da der Stamm S. chartreusis bereits für seine interessanten Naturstoffe wie das Antibiotikum Chartreusin bekannt ist und es bislang keine Studien zu der Terpendiversität dieses Organismus gibt, schien dieses Bakterium ein geeigneter Kandidat für diese Untersuchungen.

In einem dritten Teilprojekt sollte die Terpendiversität einer pflanzlichen Sesquiterpensynthase durch Rationales Protein Design verändert und untersucht werden. Basierend auf den Kenntnissen der Literatur (Yoshikuni et al. 2006), sollten plastizierbare Aminosäurereste bestimmt und gezielt mutiert werden, um das Verständnis der Struktur-Funktionsbeziehung von TPS zu erhöhen. Das promiskuitive Enzym TPS4, welches sowohl mit FPP als auch mit GPP mehrere Produkte bildet, sollte als Basis dieses Teilprojektes verwendet werden.

53

Material und Methoden

3. Material und Methoden 3.1. Material 3.1.1. Geräte

In Tab. 2 sind die spezifikationsrelevanten, in dieser Arbeit verwendeten Geräte aufgeführt.

Tab. 2: Auflistung der wichtigsten Geräte.

Gerät Modell Hersteller Gas Chromatograph mit GC-2010 plus Shimadzu FID-Detektor GC/FID Säule CP-Sil 5CB, 0,25 µm, Agilent 30 m x 0,25 mm Gas Chromatograph mit Trace GC Ultra DSQ II Thermo Scientific MS-Detektor GC/MS Säule OPTIMA 1MS, 0,25 µm, 30 m x Macherey-Nagel 0,25 mm UHPLC/MS Waters HPLC tandem MS with Waters fraction collector UHPLC/MS Säule Sunfire Prep C18, 5 µM column, 10 x Waters 250 mm ID Combi-Flash Combi-Flash Rf TELEDYNE ISCO Combi-Flash Säule Gold 50 g, C18 Säule, RediSepRf TELEDYNE ISCO PCR-cycler Mastercycler Nexus GX2 Eppendorf Schüttler Infors HAT Ecotron Infors HT Thermoshaker BioShakeiQ Analytik Jena Zellaufschluss Ultraschall Branson (Danbury, USA) Sonifier 250 Zentrifugen Avanti-J-26S XP BeckmanCoulter Szintillationszähler Perkin-Elmer Tri-Carb 2800 TR

3.1.2. Chemikalien

Alle Chemikalien wurden, wenn nicht anders angegeben, von Sigma Aldrich (Deutschland), TCI (Deutschland) und Carl Roth (Deutschland) in der jeweils höchsten Reinheit erworben. Die Substrate FPP und GGPP wurden von Sigma Aldrich (Deutschland) erworben, wohingegen GPP von AxonMedchem (Niederlande) bezogen wurde. Die einfach Tritium- markierten Substrate wurden von HARTMANN ANALYTIC (Deutschland) und BIOTREND Chemikalien GmbH (Deutschland) kommerziell erworben. Der Szintillationscocktail Ultima Gold F wurde von Perkin Elmer (Deutschland) bezogen.

54

Material und Methoden

3.1.3. Enzyme

Alle Restriktionsenzyme wurden von Thermo Fisher Scientific (Deutschland) als fast digest Enzyme bezogen. Für die PCRs wurde die Phusion-DNA Polymerase (Thermo Fisher Scientific, Deutschland) verwendet. Ligationen wurden mit der T4-DNA von Thermo Fisher Scientific (Deutschland) durchgeführt.

3.1.4. Kits

In Tab. 3 sind die in dieser Arbeit verwendeten Kits sowie deren Hersteller aufgelistet.

Tab. 3: Auflistung der in dieser Arbeit verwendeten Kits. Name Hersteller Verwendung GeneJET Plasmid Miniprep Kit Thermo Fisher Scientific Plasmidpräperation 5´/3´ RACE Kit, 2nd Generation Roche RACE-PCR High Pure PCR Product Purification Roche PCR Aufreinigung RevertAid First Strand cDNA Thermo Fisher Scientific cDNA-Synthese Synthesis Kit GeneJET Gel Extraction Kit Thermo Fisher Scientific Gelextraktion Nucleo Spin RNA Plant Macherey-Nagel RNA Isolierung aus Pflanzen Nucleo Spin RNA Macherey-Nagel RNA Isolierung aus Pflanzen peqGOLD TriFast peqlab RNA Isolierung Nucleo Spin RNA Midi Macherey-Nagel RNA Isolierung PolyAT tract mRNA Isolation System Promega mRNA-Aufreinigung NucleoTrap mRNA Mini Macherey-Nagel mRNA-Aufreinigung RNeasyMinEluteCleanup Kit Qiagen Aufreinigung von RNA Nucleo Spin Plant II Macherey-Nagel gDNA Isolierung aus Pflanzen CloneJET PCR Cloning Kit Thermo Fisher Scientific pJET Klonierung

55

Material und Methoden

3.1.5. Medien

In Rahmen dieser Arbeit wurden die in Tab. 4 aufgelisteten Medien verwendet.

Tab. 4: Auflistung der verwendeten Medien. Medium Zusammensetzung LB Agar 5 g/L Hefeextrakt, 10 g/L Trypton, 10 g/L NaCl, 15 g/L Agar LB Flüssigmedium 5 g/L Hefeextrakt, 10 g/L Trypton, 10 g/L NaCl

3.1.6. Puffer

Die in dieser Studie verwendeten Pufferzusammensetzungen sowie pH-Werte sind der Tab. 5 zu entnehmen.

Tab. 5: Auflistung der in dieser Arbeit verwendeten Puffer. Name Zusammensetzung pH TXS-Puffer 30 mM Tris, 8,5

5 mM Na2S2O5, (7,5-8,5) 5 mM DTT,

10 mM MgCl2,

5 mM Ascorbinsäure

Bis-Tris-Propan Puffer 50 mM Bis-Tris-Propan, 7,5

20 mM MgCl2 Britton-Robinson Puffer 50 mM Borsäure, 5,5-9,0 50 mM Phosphorsäure, 2,5 50 mM Essigsäure,

5 mM Na2S2O5, 5 mM DTT,

10 mM MgCl2, 5 mM Ascorbinsäure MOPS-Puffer 50 mM MOPS, 6,5-7,5

5 mM Na2S2O5, 5 mM DTT,

10 mM MgCl2, 5 mM Ascorbinsäure Tris-Puffer 50 mM Tris-Cl 7,0 His-tag- 50 mM Tris-HCl, 7,5 Äquilibrierungspuffer 300 mM NaCl, 5 mM Imidazol 56

Material und Methoden

Name Zusammensetzung pH His-tag-Waschpuffer 50 mMTris-HCl, 7,5 300 mM NaCl, 25 mM Imidazol His-tag-Elutionspuffer 50 mMTris-HCl, 7,5 300 mM NaCl, 250 mM Imidazol MES-Puffer 20 mM MES, 5,0 100 mM NaCl TAE-Puffer 400 mM Tris-HCl, 8,0 1 mM EDTA, 20 mM Essigsäure RNA-MOPS-Puffer 20 mM MOPS, 7,0 1 mM EDTA, 5 mM NaOAc, RNAse-freies DECP Wasser

3.1.7. Organismen

Die verschiedenen Organismen, deren Genotyp sowie deren Anwendung sind in Tab. 6 aufgeführt.

Tab. 6: Übersicht über die in dieser Arbeit verwendeten Organismen. Organismus Genotyp Anwendung E. coli endA1 gyrA96(nalR) thi-1 recA1 relA1 lac Plasmidamplifikation. XL1blue glnV44 F'[::Tn10 proAB+lacIq Δ(lacZ)M15] Der Stamm verfügt über

- + hsdR17(rK mK ) eine hohe Transfor- mationseffizienz und die Möglichkeit der Reparatur von nicked DNA. Aus diesem Grund wird der Stamm auch bei der QuikChangeMutagenese verwendet, bevor die Plasmide mit dem eigentlichen Expressions- stamm transformiert werden.

57

Material und Methoden

Organismus Genotyp Anwendung

– – – E. coli BL21 F ompT gal dcmlonhsdSB(rB mB ) λ(DE3 [lacI Expressionsstamm.

+ (DE3) lacUV5-T7p07 ind1 sam7 nin5]) [malB ]K- Der Stamm enthält eine

S 12(λ ) chromosomal codierteT7- RNA-Polymerase, welche eine hohe Affinität zu dem T7-Promotor des Plasmids (z.B. pET) aufzeigt.

– – – E. coli BL21 F ompT gal dcmlonhsdSB(rB mB ) λ(DE3 [lacI Expressionsstamm.

+ (DE3)pLysS lacUV5-T7p07 ind1 sam7 nin5]) [malB ]K- Es handelt sich um einen

S R 12(λ ) pLysS[T7p20 orip15A](Cm ) BL21(DE3) Stamm, der zusätzlich das pLysS- Plasmid enthält, welches das T7 Lysozym kodiert. Dieses inhibiert die T7- RNA-Polymerase was zu einer Verringerung der Basaltranskription führt. Durch die starke Kontrolle der T7-RNA-Polymerase eignet sich dieser Stamm besonders für die Expression von toxischen Genen.

– – – E. coli F ompT gal dcmhsdSB(rB mB ) λ(DE3 [lacI Expressionsstamm.

+ Rosetta lacUV5-T7p07 ind1 sam7 nin5]) [malB ]K- Der Stamm ist aufgebaut

S (DE3)pLysS 12(λ ) pLysSRARE[T7p20 wie BL21(DE3)pLysS. Er ileXargUthrUtyrUglyTthrTargWmetTleuWproL kodiert allerdings

R orip15A](Cm ) zusätzlich tRNAs für seltene Codons von E. coli und eignet sich damit zur heterolgen Expression von eukaryotischen Genen.

58

Material und Methoden

3.1.8. Plasmide

Die in dieser Arbeit verwendeten Plasmide, deren Besonderheiten, Resistenzen und Referenzen können der Tab. 7 entnommen werden.

Tab. 7: Auflistung und Erläuterung der verwendeten Plasmide. Kan = Kanamycin, Amp = Ampicillin, Cm = Chloramphenicol, Tet = Tetracyclin.

Plasmid Besonderheiten Resistenz Referenz pET28a(+) T7-Promotor, Lac-Operator, Kan Novagen, Polylinker, N- und C-terminaler Deutschland Hexahistidin-tag pET21b(+) T7-Promotor, Lac-Operator, Amp Novagen, Polylinker, C-terminaler Deutschland Hexahistidin-tag pMEVT Lac-Promotor, AtoB, HMGS, Cm Addgene, USA HMGR (Martin et al. 2003) pMBIS Lac-Promotor, MK, PMK, PMD, Tet Addgene, USA idi, ispA (Martin et al. 2003) pET28a_ ok4a Insertion von ok4a Kan (Kracht et al. 2017) pET21b_ ok4b Insertion von ok4a Amp (Kracht et al. 2017) pET21b_ ok1a Insertion von ok1a Amp Diese Studie pET21b_ ok1b Insertion von ok1b Amp Diese Studie pET21b_ ok3_lang Insertion von ok3_lang Amp Diese Studie pET21b_ ok3_kurz Insertion von ok3_kurz Amp Diese Studie pET28a_ok6 Insertion von ok6 Kan Diese Studie pET28a_jk7 Insertion von jk7 Kan Diese Studie pET28a_strep_01776 Insertion von strep_01776 Kan Diese Studie pET28a_strep_07544 Insertion von strep_07544 Kan Diese Studie pET28a_strep_07041 Insertion von strep_07041 Kan Diese Studie pET28a_tps4 Insertion des tps4 Gens aus S. Kan Diese Studie spicatum pET28a_TPS4_Y288F TPS4 mit Einzelmutation Y288F Kan Masterarbeit Stockmann

59

Material und Methoden

Plasmid Besonderheiten Resistenz Referenz pET28a_TPS4_Y288H TPS4 mit Einzelmutation Y288H Kan Masterarbeit Stockmann pET28a_TPS4_Y288W TPS4 mit Einzelmutation Y288W Kan Masterarbeit Stockmann pET28a_TPS4_F419C TPS4 mit Einzelmutation F419C Kan Masterarbeit Stockmann pET28a_TPS4_F419I TPS4 mit Einzelmutation F419I Kan Masterarbeit Stockmann pET28a_TPS4_F419L TPS4 mit Einzelmutation F419L Kan Masterarbeit Stockmann pET28a_TPS4_F419M TPS4 mit Einzelmutation F419M Kan Masterarbeit Stockmann pET28a_TPS4_F419V TPS4 mit Einzelmutation F419V Kan Masterarbeit Stockmann pET28a_TPS4_C456G TPS4 mit Einzelmutation C456G Kan Masterarbeit Stockmann pET28a_TPS4_C456S TPS4 mit Einzelmutation C456S Kan Masterarbeit Stockmann pET28a_TPS4_Y536C TPS4 mit Einzelmutation Y536C Kan Masterarbeit Stockmann pET28a_TPS4_Y536F TPS4 mit Einzelmutation Y536F Kan Masterarbeit Stockmann pET28a_TPS4_Y536W TPS4 mit Einzelmutation Y536W Kan Masterarbeit Stockmann pET28a_TPS4_Y288W TPS4 mit Doppelmutation Kan Masterarbeit /Y536F Y288W/Y536F Stockmann pET28a_TPS4_C456S/ TPS4 mit Doppelmutation Kan Masterarbeit Y288W C456S/Y288W Stockmann pET28a_TPS4_Y536F/ TPS4 mit Doppelmutation Kan Masterarbeit C456S Y536F/C456S Stockmann

60

Material und Methoden

3.1.9. Oligonukleotide

Alle Oligonukleotide wurden von Eurofins MWG Operon (Deutschland) bezogen. Die Tab. 8 zeigt die Oligonukleotide, die für die Klonierungen verwendet wurden.

Tab. 8: Übersicht über die für Klonierungen verwendeten Oligonukleotide. Name Sequenz (5`→3`) OK4a_CO_NcoI fw CGATCCATGGCAGCAATGGTTACCACCAGTCT OK4a_CO_XhoI_rev CGTACTCGAGCAGGATCGGTTCAAACAGCAGAC OK4b_CO_NdeI_fw CGTGCATATGTTCACCAAAATGACCGCAAT OK4b_CO_XhoI_rv CGTACTCGAGCAGGATCGGTTCAAACAG OK3_CO_NdeI_fw_lang GCGTCATATGAGCCTGCAATTTAGCATT OK3_CO_XhoI_rev CGTACTCGAGCAGTTCGTTCAGCACAATCG OK3_CO_142NdeI_fw_kurz GAGTCATATGCGTGTGAGTGGTGTTGC OK6_Codon_fw_NcoI CGTACTCGAGGATCACAATCGGATCAACAAAC OK6_Codon_rev_XhoI CGATCCATGGTTGATACCGTTACCC OK1a_NdeI_fw GCGTCATATGACGATGGCAAGCATTATGATGCG OK1a_XhoI_rev CGTACTCGAGCACAATCGGTTCAAAGATCAGTTTG OK1b_CO_NdeI_fw GCGTCATATGACGATGGCAAGCATT OK1b_CO_XhoI_rv CGTGCTCGAGCACAATCGGTTCAAAGATCAG JK7_CO_XhoI_rev CGTACTCGAGAATATCAATCGGATCAACCAGCAGTG JK7_CO_NcoIfw CGATCCATGGCAGCAGCAACCACCG 01776_fw_NdeI GCGTCATATGACGCAGCCGTTCGAACTCC 01776_rev_XhoI CGTACTCGAGGCCGAGAGCGGGCAC TPS4JB_NcoI_fw CGATCCATGGATCTGTGTCAGATTCCGCCTAC TPS4JB_XhoI_rev CGTACTCGAGTTCCTCATCCAGGGTAACCG

In Tab. 9 sind die degenerierten Primer für die Bestimmung der pflanzlichen internal transcribed spacer Region (ITS) aufgelistet.

Tab. 9: Auflistung der degenerierten Primer zur Bestimmung der ITS der E. serrulata. Name Sequenz (5`→3`) ITS-Primer_2_fw CGCGGAATGCGCCAANGAAA

ITS_Primer_1_rev AGCACGGGNGACAATATCCG

In Tab. 10 sind die Oligonukleotide für site-directed mutagenesis aufgeführt.

61

Material und Methoden

Tab. 10: Auflistung der für die site-directed mutagenesis verwendeten Oligonukleotide. Name Sequenz (5`→3`)

TPS4_C456S_fw GCAAGCTGTATTCTGAGTCGCATTATTAAC

TPS4_C456S_rev AGATCGTTAATAATGCGACTCAGAATACAG

TPS4_F419M_fw AATGCACTGGTTAGCATTGGTATGCCGAATCTGC

TPS4_F419M_rev AGATAGCTGGTAACCAGCAGATTCGGCATACCAATG

TPS4_Y288F_fw GATTCAGAGCTATATGTTTGCAATCGGTATG

TPS4_Y288F_rev CAAACAGCATACCGATTGCAAACATATAGC

TPS4_Y288W_fw GGTCTGATTCAGAGCTATATGTGGGCAATCGGTATG

TPS4_Y288W_rev GGTTCAAACAGCATACCGATTGCCCACATATAG

TPS4_Y566F_fw CAGCCATTTCTTTTTTCAGTATGGTG

TPS4_Y566F_rev AGCCATCACCATACTGAAAAAAGAAA

TPS4_Y566W_fw GTGCGTGGCAGCCATTTCTTTTGGCAGTATGGTG

TPS4_Y566W_rev CTTTCGGCATTACCATAGCCATCACCATACTGCCAAAAGA

F419M_fw_a TTAGCATTGGTATTCCGAATCTGCTGGTTACCAGCTATC

F419M_rev_t ACCAGCAGATTCGGAATACCAATGCTAACCAGT

Y566W_fw_g TTTCTTTTGTCAGTATGGTGATGGCTATGGTAATG

Y566W_rev_c ACCATACTGACAAAAGAAATGGCTGCCACG

F419V_Gtt_fw GCATTGGTGTTCCGAATCTGCTGGTTAC

F419V_Gtt_rev CCAGCAGATTCGGAACACCAATGCTAACC

F419H_Ctt_fw AGCATTGGTCTTCCGAATCTGCTGGTTAC

F419H_Ctt_rev AGCAGATTCGGAAGACCAATGCTAACCAGTG

F419H_CAt_fw AGCATTGGTCATCCGAATCTGCTGGTTAC

F419H_CAt_rev GCAGATTCGGATGACCAATGCTAACCAGTG

F419W_tGt_fw CATTGGTTGTCCGAATCTGCTGGTTAC

F419W_tGt_rev GATTCGGACAACCAATGCTAACCAGTG

F419W_tGG_fw CATTGGTTGGCCGAATCTGCTGGTTAC

F419W_tGG_rev GATTCGGCCAACCAATGCTAACCAGTG

Y288P_Cat_fw TATATGCATGCAATCGGTATGCTGTTTGAACCGTATC

62

Material und Methoden

Name Sequenz (5`→3`)

Y288P_Cat_rev CGATTGCATGCATATAGCTCTGAATCAGACCATTAC

Y288P_CCt_fw TATATGCCTGCAATCGGTATGCTGTTTGAACCGTATC

Y288P_CCt_rev CGATTGCAGGCATATAGCTCTGAATCAGACCATTAC

Y566I_Aat_fw CATTTCTTTAATCAGTATGGTGATGGCTATGGTAATGC

Y566I_Aat_rev CCATACTGATTAAAGAAATGGCTGCCACGCACAAC

Y566I_ATt_fw CATTTCTTTATTCAGTATGGTGATGGCTATGGTAATGC

Y566I_ATt_rev CCATACTGAATAAAGAAATGGCTGCCACGCACAAC

C456G_Ggt_fw GCAAGCTGTATTCTGGGTCGCATTATTAACGATCTG

C456G_Ggt_rev ATGCGACCCAGAATACAGCTTGCACGAACAAAC

3.2. Methoden 3.2.1. Molekularbiologische Methoden 3.2.1.1. RNA-Extraktion aus E. serrulata

Zur Induktion der Expression der TPS als Teil der allgemeinen Stressantwort, wurden die Blätter der E. serrulata mit dem Phytohormon MeJa induziert. Dazu wurden die Blätter der Pflanze mit einer 10 µM MeJa-Lösung (in 40 % Aceton und 0,1 % Tween 20 aufgefüllt mit dH2O) eingestrichen und für 24 h mit dem Phytohormon bei Raumtemperatur inkubiert. Anschließend wurden die Blätter geerntet, in junge (weiche) und alte (harzige) Blätter unterteilt und sofort in flüssigem Stickstoff eingefroren. Als Vergleich dienten nicht-induzierte Blätter, die auf dieselbe Weise unterteilt und geerntet wurden. In dieser Arbeit wurden verschiedene Methoden zur RNA-Extraktion getestet, die im Ergebnisteil näher diskutiert werden. Die Durchführung erfolgte hierbei jeweils gemäß Herstellerprotokoll.

Am besten geeignet schienen folgende Methoden: Die jungen Blätter wurden mit Hilfe des Nucleo Spin RNA Midi (Macherey-Nagel, Deutschland) Kits gemäß Herstellerprotokoll extrahiert. Bei alten Blättern erfolgte die Extraktion mit Hilfe der Phenol-Chloroform-Methode (Mehlmer et al. 2010). Da sich Phenol jedoch störend auf die Illumina Sequenzierung auswirkt, wurde die RNA anschließend über ein RNeasyMinEluteCleanup Kit (Qiagen, Deutschland) gereinigt. Die Überprüfung der RNA Extraktion erfolgte mit Hilfe eines 1,25 % RNA-Agarose- Gels. Anschließend wurde die RNA spektroskopisch quantifiziert und mit einem Bioanalyzer auf Basis einer Gelelektrophorese bezüglich ihrer Reinheit überprüft.

63

Material und Methoden

3.2.1.2. Synthese von cDNA

Die cDNA Synthese erfolgte mit dem RevertAid First Strand cDNA Synthesis Kit (Thermo Fisher Scientific, Deutschland) gemäß Herstellerprotokoll.

3.2.1.3. Next-Generation Sequencing

Das NGS wurde von unseren Kooperationspartnern am CeBiTec in Bielefeld (Deutschland) durchgeführt. Für die E. serrulata Sequenzierung wurde zunächst die RNA normalisiert, um Transkripte mit geringen Konzentrationen aufzukonzentrieren und besser detektieren zu können. Anschließend erfolgte die Illumina MiSeq Sequenzierung (2 x 300 bp) und die bioinformatische Analyse der Sequenzierungsdaten mit Hilfe der Software antiSMASH. Das genaue Vorgehen ist der Publikation (Kracht et al. 2017) zu entnehmen. Im Falle des S. chartreusis wurde die selbe Form der Illumina Sequenzierung auf genomischer DNA durchgeführt.

3.2.1.4. Kultivierung von Bakterien

Transformierte Zellen wurden auf LB-Agarplatten mit dem entsprechenden Antibiotikum ausgestrichen. Für Plasmidpräparationen oder Expressionskulturen wurden LB- Flüssigkulturen mit dem entsprechenden Antibiotikum verwendet (Tab. 11):

Tab. 11: Auflistung der verwendeten Antibiotika und deren Konzentrationen. Antibiotikum Stock-Konzentration Endkonzentration

Ampicillin 100 mg/mL 100 µg/mL

Kanamycin 30 mg/mL 30 µg/mL

Chloramphenicol 50 mg/mL 25 µg/mL

Tetracyclin 7,5 mg/mL 5 µg/mL

Für Plasmidpräparationen und Vorkulturen wurden jeweils 3 mL LB-Flüssigkultur mit dem entsprechenden Antibiotikum und einer Einzelkolonie inokuliert. Für Expressionskulturen wurden 200 mL LB-Flüssigmedium mit dem entsprechenden Antibiotikum versetzt und in einen 1 L Erlenmeyerkolben gegeben. Anschließend wurde die Expressionskultur in einem Volumenverhältnis von 1:100 mit der jeweiligen Vorkultur inokuliert. Vorkulturen wurden bei 37 °C und 200 rpm über Nacht im Schüttelinkubator kultiviert. Die Inkubation der Agar-Platten erfolgte über Nacht bei 37°C im Brutschrank.

64

Material und Methoden

3.2.1.5. Plasmidpräparation

Die Plasmidpräperation erfolgte mit dem GeneJET Plasmid Miniprep Kit (Thermo Fisher Scientific, Deutschland) gemäß Herstellerprotokoll. Abweichend hiervon wurden die Plasmide jedoch in 35 µL Wasser, anstatt 50 µL Elutionspuffer, eluiert.

3.2.1.6. Polymerase Kettenreaktion

Zur Amplifizierung des gewünschten Zielgens wurde die Methode der PCR verwendet. Diese wurde nach folgendem Standardprotokoll (Tab. 12) durchgeführt.

Tab. 12: Zusammensetzung eines PCR-Ansatzes. Komponente Konzentration Nukleinsäure 10-100 ng Primer, forward 10 pmol Primer, reverse 10 pmol HF-Puffer (5x) 1 x dNTP-Mix 10 mmol Phusion Polymerase 2,5 U

ddH2O Auf ein Gesamtvolumen von 50 µL

Folgendes Programm wurde verwendet (Tab. 13), wobei die Schritte der Denaturierung, Anlagerung und Elongation in insgesamt 30 Zyklen wiederholt wurden.

Tab. 13: Standard-PCR-Programm. Schritt Temperatur Zeit Initiale Denaturierung 98 °C 3 min Denaturierung 98 °C 10 s

Anlagerung Tm (Primer) – 2 °C 30 s Elongation 72 °C 2 kB/min (Phusion-Polymerase) Finale Elongation 72 °C 10 min

Anschließend wurden die PCR-Produkte mittels Gelextraktion (GeneJET Gel Extraction Kit) oder über eine Säule (GeneJET Plasmid Miniprep Kit) aufgereinigt.

65

Material und Methoden

3.2.1.7. PCR mit degenerierten Primern

Zur Bestimmung der ITS-Region (Internal transcribed spacer) wurden degenerierte Primer basierend auf den ITS-Sequenzen der Eremophila rotundifolia, Eremophila macdonnellii und verschiedenen species entworfen. Die PCR erfolgte wie oben beschrieben (Tab. 12 und Tab. 13) unter Verwendung der degenerierten Primer (Tab. 9) und einer Anlagerungstemperatur von 56 °C. Die Elongationszeit betrug hierbei 45 s. Anschließend wurde der Erfolg der PCR auf einem 1 %igen Agarosegel überprüft und die Sequenz mittels Sanger Sequenzierung (Absatz 3.2.1.13) bestimmt.

3.2.1.8. Mutagenese mittels QuikChange-PCR

Für die Mutagenesestudien des Gens TPS4 aus S. spicatum wurde die QuikChange-Methode verwendet. Mit dieser Methode können unter Verwendung mutagener Primer (s. Tab. 10) gezielt einzelne Mutationen generiert werden. In der Tab. 14 sind die Standardbedingungen der QuikChange-Mutagenese aufgeführt.

Tab. 14: Zusammensetzung einer QuikChange-PCR. Komponente Konzentration

Nukleinsäure 20 ng

Mutagenese Primer forward 10 pmol

Mutagenese Primer reverse 10 pmol

dNTP-Mix 10 mmol

HF-Puffer (10 x) 1x

DMSO 5 %

Phusion-Polymerase 2,5 U

ddH2O Auf ein Gesamtvolumen von 50 µL

66

Material und Methoden

Folgendes Standardprogramm wurde für die QuikChange-Mutagenese verwendet (Tab. 15).

Tab. 15: Standard-Programm für die QuikChange-PCR. Schritt Temperatur Zeit

Initiale Denaturierung 98 °C 2 min

Denaturierung 98 °C 30 s

Anlagerung Tm (Primer) – 5 °C 30 s

Elongation 72 °C 3,5 min

Finale Elongation 72 °C 5 min

Für das Einfügen von Einzelmutationen wurden die Denaturierung, Anlagerung und Elongation insgesamt in 11 Zyklen wiederholt, beim Einfügen von Doppelmutationen wurden stattdessen 16 Zyklen verwendet.

Nach der QuikChange-PCR wurde der Reaktionsansatz für 1-2 h mit DpnI inkubiert, um die methylierte Template-DNA zu verdauen. Anschließend wurden 1-5 µL dieses Ansatzes mit 50 µL E. coli XL1 blue Zellen transformiert. Abweichend vom Standardprotokoll (s. Tab. 19) wurden die Zellen hierbei mindestens 30 min auf Eis mit dem Plasmid inkubiert, bevor der Hitzeschock folgte. Anschließend wurden die Zellen für 2 h bei 37 °C regeneriert, um die Transformationseffizienz zu erhöhen. Die Zellen wurden 10 min bei 3.000 rpm abzentrifugiert und in 50 µL LB Medium aufgenommen, bevor sie auf LB-Platten mit dem entsprechenden Antibiotikum ausplattiert wurden. Um das Vorhandensein der erwünschten Mutation zu bestätigen, wurden die Plasmide mittels Sanger Sequenzierung überprüft.

3.2.1.9. RACE-PCR und Klonierung in pJET

Die RACE-PCR ist eine Methode zur Generierung fehlender 5`- oder 3´- Enden von DNA- Fragmenten. Sie wurde nach dem Next Generation Sequencing verwendet, um Volllängen- Gene zu erzeugen. Die Durchführung der RACE-PCRs erfolgte mit dem 5´/3´ RACE Kit 2nd generation (Roche, Deutschland) gemäß Hersteller-Protokoll mit einigen Modifikationen: Sowohl bei der 5´-RACE-PCR als auch bei der 3´-RACE-PCR wurde eine nested PCR angewendet, um die Spezifität zu erhöhen. Außerdem wurden die PCR-Produkte der ersten PCR immer gereinigt, bevor sie in die zweite PCR eingesetzt wurden. Die finalen PCR- Produkte wurden anschließend in pJET zwischenkloniert (CloneJET PCR Cloning Kit), bevor sie mittels Sanger Sequenzierung überprüft wurden.

67

Material und Methoden

Insgesamt konnte eine Gensequenz mittels RACE-PCR komplett vervollständigt werden. Die Primersequenzen hierfür können der Tab. 16 entnommen werden.

Tab. 16: Primersequenzen der erfolgreichen RACE-PCRs. Oligonukleotid 5´ → 3´Sequenz Anwendung JK7_5R_RT_rev CGAGCTCTGCAAGATGTTAAAGTTC cDNA Synthese JK7_5R_N1_300_rev GACCCTGTGGATTGGTTGATCT Primer für 1. PCR der 5´-RACE-PCR in Kombination mit Oligo(dT) anchor primer JK7_5R_N2_rev TGACACTTTTTCTCGAAGACAAGACGC Primer für 2. PCR der 5´-RACE-PCR in Kombination mit dem PCR anchor primer JK7_3R_N1_850_fw GGGCAAGAGATGCCTAGATTTGAAG Primer für 1. PCR der 3´-RACE-PCR in Kombination mit Oligo(dT) anchor primer JK7_3R_N2_fw CCAATGCGGTTATTGTGGGTGGCTG Primer für 2. PCR der 3´-RACE-PCR in Kombination mit dem PCR anchor primer

3.2.1.10. Restriktion und Ligation

Die Restriktion wurde nach folgendem Protokoll (Tab. 17) angesetzt:

Tab. 17: Zusammensetzung eines Restriktionsverdaus. Komponente Konzentration DNA 1 µg Plasmid-DNA, 300 ng Insert-DNA FD-Enzym 1 1 FD FD-Enzym 2 1 FD FD-Puffer (10 x) 1 x FD-Alkalische Phosphatase (nur beim Vektor) 1 FD

dH2O Auf 50 µL auffüllen

68

Material und Methoden

Die Restriktion erfolgte für 15 min bei 37 °C. Anschließend wurden die Restriktionsenzyme gemäß Herstellerangaben für 5 min bei der entsprechenden Temperatur hitzeinaktiviert. Der Erfolg der Restriktion wurde mittels eines 1 %igem Agarosegel überprüft. Der geschnittene Vektor wurde über eine Gelextraktion (GeneJET Gel Extraction Kit, s. 3.1.4) und die geschnittenen Inserts über eine Säule aufgereinigt (GeneJET Plasmid Miniprep Kit, s. 3.1.4). Die DNA-Konzentration wurde mit Hilfe eines UV/VIs Spektrophotometers bestimmt. Die Ligation wurde anschließend entsprechend folgender Formel (2) angesetzt.

x (ng Insert)·L (kB Vektor) Vektor 푥 (µ퐿 Vektor) = · Verhältnis (2) L (kB Insert) Insert

Für die hier durchgeführten Klonierungen wurde jeweils ein Vektor zu Insert Verhältnis von 1:3 gewählt, wodurch sich folgende Konzentrationen ergaben (Tab. 18).

Tab. 18: Zusammensetzung einer Ligation. Komponente Konzentration Insert-DNA 150 ng Vektor-DNA 130 ng (Eremophila DNA) bzw. 260 ng (Streptomyces DNA) T4-DNA-Ligase (5 U/µL) 0,05 U/ng T4-Ligase-Puffer (5x) 1x

Die Ligation wurde für 30 min bei Raumtemperatur durchgeführt. Anschließend erfolgte die Hitzeinaktivierung der T4-DNA-Ligase für 10 min bei 65 °C.

3.2.1.11. Hitzeschock-Transformation von kompetenten Zellen

Die Transformation der kompetenten E. coli Zellen (XL1 blue, Rosetta, BL21(DE3), BL21(DE3)pLysS) erfolgte mit Hilfe der Hitzeschock Methode. Für die Retransformation wurden 20-50 ng Plasmid-DNA mit 50 µL Zellen vermengt. Für Klonierungen wurden 8-13 µL des Ligationsansatzes zu den Zellen hinzugegeben. Anschließend wurde nach folgendem Protokoll (Tab. 19) vorgegangen.

Tab. 19: Protokoll für die Hitzeschock-Transformation. Beschreibung Zeit Inkubation der DNA und den auf Eis aufgetauten kompetenten Zellen 20 min Hitzeschock bei 42 °C 45 s Inkubation auf Eis 5 min Zugabe von 700 µL LB-Flüssigmedium und Inkubation im Schüttelinkubator 1 h

69

Material und Methoden

Anschließend wurden die transformierten Zellen auf LB-Agarplatten mit dem entsprechenden Antibiotikum (s. Tab. 11) ausplattiert und über Nacht bei 37 °C im Brutschrank inkubiert.

3.2.1.12. Klonierungsstrategien

Alle hier untersuchten Gene aus E. serrulata wurden als Codon-optimierte Gene für E. coli geliefert (GeneArt Gene Synthesis, Thermo Fisher Scientific, Deutschland). Die bakteriellen Gene strep_07041 und strep_07544 wurden ebenfalls für E. coli Codon-optimiert und bereits in pET28a mit C-terminalem Hexahistidin-tag bestellt (Genescript Biotech Cooperation, USA). Das Gen strep_01776 wurde direkt aus der genomischen DNA des Streptomyces chartreusis kloniert.

Folgende Konstrukte wurden mit Hilfe der Restriktionsenzym-basierten Klonierungsmethode generiert. Die Durchführung der einzelnen Schritte erfolgte wie oben beschrieben. Folgende Primer, Anlagerungstemperaturen und Elongationszeiten wurden für die PCR verwendet (Tab. 20). Eine Auflistung der verwendeten Restriktionsenzyme ist ebenfalls der Tab. 20 zu entnehmen.

Anschließend wurde eine Kolonie-PCR mit den jeweiligen PCR-Primern durchgeführt, um positive Kolonien zu detektieren. Diese wurden anschließend mittels Sanger Sequenzierung hinsichtlich ihrer Sequenz analysiert.

70

Material und Methoden

Tab. 20: Auflistung der für die Klonierung verwendeten Primer mit PCR Anlagerungstemperatur, Elongationszeit sowie Restriktionsschnittstellen.

Konstrukt Primer Anlagerung Elongation Restriktion pET28a_ok4a OK4a_CO_NcoI_fw 68,8 °C 1:30 min NcoI, XhoI OK4a_CO_XhoI_rev pET21b_ok4b OK4b_CO_NdeI_fw 62,0 °C 1:30 min NdeI, XhoI OK4b_CO_XhoI_rv pET21b_ok3_lang OK3_CO_NdeI_fw_lang 61,7 °C 1:30 min NdeI, XhoI OK3_CO_XhoI_rev pET21b_ok3_kurz OK3_CO_142NdeI_fw_ 61,7 °C 1:30 min NdeI, XhoI kurz OK 3_CO_XhoI_rev pET28a_ok6 OK_6_Codon_fw_NcoI 62,2 °C 54 s NcoI, XhoI OK_6_Codon_rev_XhoI pET21b_ok1a OK1a_NdeI_fw 67,9 °C 1:30 min NdeI, XhoI OK1a_XhoI_rev pET21b_ok1b OK1b_CO_NdeI_fw 59,0 °C 1:30 min NdeI, XhoI OK1b_CO_XhoI_rv pET28a_ jk7 JK7_CO_NcoI_fw 67,5 °C 1:30 min NcoI, XhoI JK7_CO_XhoI_rev pET28a_tps4 TPS4JB_NcoI_fw 68,8 °C 1:30 min NcoI, XhoI TPS4JB_XhoI_rev pET28a_strep_ 01776_fw_NdeI 62,5 °C 1:30 min NdeI, XhoI 01776 01776_rev_XhoI pET28a_strep_ Genescript Biotech Cooperation, USA 07544 Genescript Biotech Cooperation, USA pET28a_strep_ Genescript Biotech Cooperation, USA 07041

3.2.1.13. DNA-Sequenzierung mittels Sanger Sequenzierung

Zur Überprüfung von Klonierungsprodukten wurde die DNA mit den Klonierungsprimern, speziellen Sequenzierprimern sowie vektorspezifischen Oligonukleotiden sequenziert. Die Sequenzierung wurde hierbei vom Sequenzierservice der Ruhr-Universität Bochum (Deutschland) durchgeführt.

71

Material und Methoden

3.2.2. Proteinbiochemische Methoden 3.2.2.1. Genexpression

Die Expression aller TPS erfolgte heterolog in E. coli Zellen. Es wurden jeweils verschiedene Stämme hinsichtlich der löslichen Expression des gewünschten Proteins getestet und verglichen. Der Stamm mit der höchsten Ausbeute an löslichem Protein wurde schließlich für die Überexpression des Zielgens verwendet. Die höchste Ausbeute an löslichem Protein wurde hierbei mittels sodium dodecylsulfate polyacrylamide gelelectrophoresis (SDS-PAGE) abgeschätzt. Die Genkonstrukte und jeweiligen Expressionsstämme lassen sich der Tab. 21 entnehmen.

Tab. 21: Für die Genexpression verwendete Stämme. Gen Bevorzugter Expressionsstamm

pET28a_ok4a E. coli BL21(DE3)

pET21b_ok4b E. coli BL21(DE3)

pET21b_ok3_lang E. coli BL21(DE3)pLysS

pET21b_ok3_kurz E. coli BL21(DE3)pLysS

pET28a_ok6 E. coli BL21(DE3)

pET21b_ok1a E. coli BL21(DE3)pLysS

pET21b_ok1b E. coli BL21(DE3)pLysS

pET28a_ jk7 E. coli BL21(DE3)

pET28a_tps4 und tps4-Mutanten E. coli BL21(DE3)

pET28a_01776 E. coli BL21(DE3)

pET28a_07544 E. coli BL21(DE3)

pET28a_07041 E. coli BL21(DE3)

Die Kultivierungsbedingungen der Vor- und Hauptkultur lassen sich dem Abschnitt 3.2.1.4 entnehmen. Die Hauptkultur wurde bei einer optischen Dichte bei 600 nm (OD600) von 0,6 mit 0,5 mM Isopropyl-β-D-thiogalactopyranosid (IPTG) auf Eis induziert. Anschließend erfolgte die Genexpression für 18-20 h bei 16 °C und 200 rpm. Die Zellen wurden für 20 min bei 6.000 rpm und 4 °C zentrifugiert und der Überstand verworfen. Das Zellpellet wurde entweder bei -20 °C gelagert, oder direkt für die Proteinaufreinigung verwendet.

72

Material und Methoden

3.2.2.2. Proteinaufreinigung 3.2.2.2.1. Zellaufschluss

Das in 50 mM Tris-Puffer (pH 7,0) resuspendierte Zellpellet wurde für insgesamt 5 min mit Ultraschall behandelt. Hierzu wurden die Zellen jeweils 15 s auf Eis mit Ultraschall (Output control 3) behandelt, worauf eine 15 s Pause folgte. Anschließend wurde die lösliche Fraktion von den Zelltrümmern über Zentrifugation (20 min, 4 °C, 10.000 rpm) getrennt.

3.2.2.2.2. Metall-Affinitätschromatographie

Die Aufreinigung der Proteine erfolgte mit Hilfe eines Hexahistidin-tags. Der lösliche Überstand des Zellaufschlusses wurde auf eine äquilibrierte Nickel-Nitrilotriessigsäure-Säule (Ni-NTA- Säule) gegeben und das Protein mit dem Säulenmaterial für eine Stunde bei 4 °C unter Rotation inkubiert. Anschließend wurde dreimal mit 2 mL His-tag Waschpuffer gewaschen, bevor das Zielprotein mit Hilfe des His-tag Elutionspuffers (dreimal 2 mL) von der Säule eluiert wurde. Die Aufreinigung wurde mit Hilfe einer SDS-PAGE überprüft.

Zum Austausch des Puffers nach der Affinitätschromatographie und zum Aufkonzentrieren des Zielproteins wurde ein Vivaspin Turbo Ultrafiltrationsgefäß (Satorius, 30 KDa MWCO) verwendet. Das Protein wurde dazu dreimal für 30 min bei 4.500 rpm und 4 °C mit dem gewünschten Puffer gewaschen. Für die TPS aus E. serrulata wurde der TXS-Puffer verwendet, wohingegen für die Proteine aus S. chartreusis der Bis-Tris-Propan-Puffer verwendet wurde.

3.2.2.3. Biokatalysen 3.2.2.3.1. Biokatalysen (in vitro)

Die in vitro Biokatalysen wurden in 1,5 mL Glasgefäßen durchgeführt. Dazu wurde je nach Protein 0,5 µM bis 11 µM Enzym mit 100 µM Substrat (GPP, FPP oder GGPP) vermengt und mit TXS-Puffer (E. serrulata Proteine) bzw. Bis-Tris-Propan-Puffer (S. chartreusis Proteine) auf ein Gesamtvolumen von 500 µL aufgefüllt. Die Proben wurden anschließend mit 500 µL Hexan oder Heptan überschichtet und für 2 h oder über Nacht bei 30 °C inkubiert. Darauffolgend wurden die Biokatalysen durch starkes Mischen und sofortiges Abnehmen der organischen Phase gestoppt. Um die Produktkonzentration zu erhöhen, wurden teilweise die organischen Phasen mehrerer in vitro Biokatalysen vereint und das Lösemittel unter einem Luftstrom abgedampft. Die Proben wurden anschließend mittels GC/MS oder GC/FID analysiert.

73

Material und Methoden

3.2.2.3.2. Umsetzung von isotopenmarkierten Terpen-Vorläufern (in vitro)

Für die radioaktiv-markierten Biokatalysen wurde jeweils ein einfach Tritium-markiertes Substrat verwendet. Die Durchführung erfolgte analog zu den nicht-radioaktiv-markierten in vitro Biokatalysen mit 2 µM Enzym. Insgesamt wurden 60 kBq Substrat eingesetzt. Nach der Inkubation wurden die Proben nicht vereint, sondern jede Probe einzeln über eine Kieselgel- Säule gereinigt. Dazu wurde die organische Phase auf eine mit Hexan äquilibrierte 6 cm Kieselgel-Säule geladen und zweimal mit 2 mL Hexan gewaschen. Die Säule diente hierbei zur Trennung der reinen Terpene von den Terpenolen (Hezari et al. 1995). Zur Elution der Terpenole wurde die Säule danach zweimal mit 2 mL tert-Butylmethylether (tBME) gewaschen. Vor der Messung in einem Szintillationszähler wurde zu den jeweils 4 mL der einzelnen Fraktionen 20 mL Ultima Gold F (Perkin Elmer, Deutschland) hinzugegeben. Die anschließende Messung im Szintillationszähler erfolgte für 10 min.

3.2.2.3.3. Ganzzell-Biokatalysen (in vivo)

Zur Erhöhung der Produktkonzentration wurde ein Produktionsstamm speziell für die Erzeugung von Sesquiterpenen etabliert (Martin et al. 2003). Dazu wurden die bereits publizierten Plasmide pMEVT und pMBIS mit kompetenten E. coli BL21(DE3) Zellen transformiert. Als Selektionsmarker dienten hierbei Chloramphenicol (s. Tab. 11) und Tetracyclin (s. Tab. 11). Die beiden Plasmide erhalten hierbei die Gene des Mevalonat- Pfadweges aus Saccharomyces cerevisiae. Für die Ganzzellkatalyse wurden die gewünschten Plasmide mit kompetenten E.coli BL21(DE3) pMEVT, pMBIS Zellen transformiert. Zusätzlich zu Chloramphenicol und Tetracyclin wurden LB-Agarplatten mit einem weiteren Antibiotikum als Selektionsmarker für das Zielplasmid verwendet. Die Vorkulturen wurden, wie bereits in Abschnitt 3.2.1.4 beschrieben, angesetzt. Am nächsten Tag wurde die Hauptkultur, wie in Abschnitt 3.2.2.1 bereits genannt, angefertigt und in der frühen exponentiellen

Wachstumsphase (OD600 circa 0,3) mit 0,5 mM IPTG auf Eis induziert. Anschließend wurden die Zellen für 3 Tage bei 16 °C und 180 rpm inkubiert. Nach erfolgter Zentrifugation (20 min. 6.000 rpm und 4 °C) wurde das Zellpellet verworfen und der Überstand zweimal mit 200 mL Ethylacetat und zweimal mit 200 mL Hexan extrahiert. Nach erfolgter Trocknung der organischen Phasen mit wasserfreiem Magnesiumsulfat und anschließender Filtration wurde das Lösemittel an einem Rotationsverdampfer eingeengt. Die Extraktionsprodukte wurden später mittels GC/MS analysiert.

74

Material und Methoden

3.2.2.4. Enzymcharakterisierung 3.2.2.4.1. Bestimmung des pH-Optimums der TPS

Zur Bestimmung des pH-Optimums der TPS, wurden in vitro Biokatalysen wie oben beschrieben in verschiedenen Puffersystemen durchgeführt. Getestet wurden hierbei jeweils der Britton Robinson-Puffer (pH: 5,5-9,0), der MOPS-Puffer (pH: 6,5-7,5) sowie der TXS-Puffer (pH: 7,5-9,0). Die Unterteilung der pH-Werte erfolgte hierbei in 0,5er-Schritten. Als Negativkontrolle diente eine in vitro Biokatalyse mit einem Britton-Robinson-Puffer von pH 2,5. Die Biokatalysen wurden mit internem Standard (1,6 mM Octanol für OK1a bzw. 0,9 mM Pentadecanol für OK4a) versehenem n-Heptan überschichtet und bei 30 °C für 2 h inkubiert. Anschließend wurden die organische und wässrige Phase gemischt und die organische Phase einer einzelnen in vitro Biokatalyse in einem GC/FID gemessen. Alle Biokatalysen wurden in biologischen Triplikaten durchgeführt.

3.2.2.4.2. Bestimmung der optimalen divalenten Kationenkonzentration

Für die Bestimmung der optimalen divalenten Kationenkonzentration wurden, wie bereits beschrieben, in vitro Biokatalysen durchgeführt. Hierzu wurden unterschiedliche Konzentrationen an Magnesiumchlorid (1 mM, 5 mM, 10 mM, 25 mM, 50 mM) und Manganchlorid (0,1 mM, 1 mM, 5 mM, 10 mM) dem TXS-Puffer (pH 8,5) hinzugefügt. Als Negativkontrolle dienten Biokatalysen, zu denen kein divalentes Kation hinzugegeben wurde. Die Proben wurden mit n-Heptan extrahiert und im GC/FID analysiert. Alle Messungen wurden in biologischen Triplikaten durchgeführt.

3.2.3. Analytische Methoden 3.2.3.1. Naturstoffextraktion

Die Untersuchung der Naturstoffe aus E. serrulata erfolgte im Labor von Prof. Russell Kerr an der University of Prince Edward Island in Kanada. Dazu wurden zunächst 500 g mit MeJa induzierte (10 µM in 40 % Aceton und 0,1 % Tween 20 für 24 h) Blätter (Gewächshaus der Ruhr-Universität Bochum, Bochum, Deutschland) über Nacht unter Rühren in reinem Ethylacetat extrahiert. Der Überstand wurde abfiltriert und die Extraktionsprodukte mittels Rotationsverdampfer getrocknet. Durch die folgende Zugabe eines Hexan/Methanol- Gemisches (95:5) wurden die Extraktionsprodukte in zwei Fraktionen unterteilt. Die getrockneten hydrophoben Verbindungen (Hexan Fraktion) wurden über eine Kieselgel-Säule gereinigt und weiter fraktioniert. Anschließend wurden die einzelnen Fraktionen mittels Gaschromatographen mit Massenspektrometer (Thermo Electron Corporation, Focus, Polaris Q, Kanada) analysiert. Hierzu wurde eine 30 x 0,25 mm Rxi-5ms Kapillarsäule mit 0,25 μm 75

Material und Methoden

Innendurchmesser (Restek, Kanada) verwendet. Insgesamt wurde 1 µL Probe in einem Split- Verhältnis von 10:1 injiziert. Als Trägergas wurde Helium mit einer Flussrate von 1,0 mL/min verwendet. Die Ofentemperatur betrug 120 °C und wurde für 3 min bei dieser Temperatur gehalten. Anschließend stieg die Temperatur mit einer Rate von 17 °C/min auf 280 °C an. Bei dieser Temperatur wurde die Messung noch einmal für weitere 8 min durchgeführt.

Die Methanol Fraktion wurde über eine präperative LC, die sogenannte Combi-Flash Chromatographie (Gold 50 g, C18-Säule, RediSepRf, Kanada) mit dem folgenden Programm (Tab. 22) weiter fraktioniert:

Tab. 22: Programm der Combi-Flash Chromatographie.

Zeit [h] H2O % MeOH % 0 90 10 2 90 10 20 0 100 28 0 100

Die Flussrate betrug 40 mL/min und die UV-Wellenlängen von 214 und 254 nm wurden für die Einleitung der Fraktionen verwendet. Anschließend wurden die einzelnen Fraktionen in einer UHPLC/MS (Waters HPLC tandem MS mit Fraktionskollektor, Waters, Kanada) unter Verwendung einer „SunfirePrep C18 5 µM“ Säule (Waters, Kanada, 10 x 250 mm ID) gemessen. Dazu wurden 50 µL einer 10 mg/mL Probe (in Methanol) injiziert und nach folgendem Protokoll (Tab. 23) im Negativmodus gemessen.

Tab. 23: Programm der LC/MS-Messung.

Zeit [ min] H2O % + 0,1 % Ameisensäure MeOH % + 0,1 % Ameisensäure 0 40 60 42 40 60

Einige Fraktionen mit scheinbar interessanten compounds wurden weiter mit einer präparativen LC aufgereinigt und im NMR analysiert (1H, COSY, HSQC).

Darüber hinaus wurden die einzelnen Fraktionen hinsichtlich ihrer antibakteriellen Wirkung untersucht. Dazu wurden die Bioaktivität der Proben mit zwei Gram-negativen (Pseudomonas aeruginosa, Proteus vulgaris) und drei Gram-positiven Mikroorganismen (Vancomycin- resistente Enterokokken (VRE), wobei es sich um den Enterococcus faecium handelte, sowie Methicillin-resistenter Staphylococcus aureus (MRSA) und Staphylococcus warneri) getestet. Auch die Wirkung gegenüber dem Pilz Candida albicans wurde untersucht. Die Experimente wurden von der Gruppe von Prof Russell Kerr in Kanada durchgeführt und die Ergebnisse

76

Material und Methoden jeweils mit dem Referenzantibiotikum Vancomycin verglichen. Das genaue Vorgehen ist in (Correa et al. 2011) beschrieben.

3.2.3.2. GC/FID-Messungen

Für GC/FID Messungen wurden insgesamt 4 µL der Probe in einem Split-Verhältnis von 10:1 injiziert. Stickstoff diente hierbei als Trägergas und wurde mit einem Gasfluss von 40 mL/min bereit gestellt. Das folgende Programm wurde anschließend für die Messung verwendet.

1. Ofentemperatur 40 °C → für 3 min 2. Rate 10 °C/min → auf 230 °C 3. Final: 230 °C → für 8 min

3.2.3.3. GC/MS-Messungen

Für die GC/MS-Messungen (Elektron Impact) wurden bei Produkten der in vitro Biokatalyse 8 µL, bei Extrakten der in vivo Biokatalysen ein Volumen von 1 µL jeweils in einem Split- Verhältnis von 10:1 injiziert. Die Messung erfolgte mit einer Scanrate von 1,9685 Scans pro Sekunde. Detektiert wurden hierbei Ionen in einem Masse-Bereich von 50-350 u. Als Trägergas diente Helium, welches mit einer Flussrate von 1,2 mL/min bereit gestellt wurde. Folgendes Programm wurde für die Messungen verwendet

1. Ofentemperatur 40 °C → für 3 min 2. Rate 4 °C/min → auf 280 °C 3. Final: 280 °C → für 5 min

Zur anschließenden Identifizierung der Produkte wurde sowohl das Massespektrum, der Vergleich mit authentischen Standards, als auch der RI herangezogen. Zur Bestimmung des RI wurde das Gerät mit einer Standard–Alkan-Reihe (C8-C20, Sigma Aldrich) kalibriert und die Software MassFinder 4.0 (Hochmuth Scientific Consulting) hinzugezogen.

77

Ergebnisse

4. Ergebnisse

Im Rahmen dieser Studie wurde die enzymatische Terpendiversität anhand der Pflanze E. serrulata sowie des Bakteriums S. chartreusis untersucht. Bislang galten vor allem Pflanzen als Terpenproduzenten. Neuere Studien zeigten jedoch die Bildung von Terpenen durch Endophyten, weshalb ebenfalls ein Streptomycet zur Untersuchung der Terpenbiosynthese herangezogen wurde. Darüber hinaus sollte eine Mutagenesestudie einer pflanzlichen TPS dazu dienen, das Verständnis der Struktur-Funktionsbeziehung zu erhöhen, um dadurch gezielt die Produktbildung pflanzlicher TPS verändern zu können. Die Ergebnisse dieser drei Teilprojekte sind im Folgenden dargestellt.

4.1. Identifizierung und Charakterisierung neuer TPS aus der Pflanze E. serrulata 4.1.1. Naturstoffextraktion

Zur Bestätigung der Produktion von Terpenen in Blättern der E. serrulata, welche im Gewächshaus der Ruhr-Universität Bochum kultiviert wurden, wurde zunächst in Kooperation mit Prof. Russell Kerr von der University of Prince Edward Island (Kanada) eine Metabolitenanalyse durchgeführt. Da aus der Literatur bekannt ist, dass Terpene meistens in den Geweben gebildet werden, in denen sie auch benötigt werden (McGarvey u. Croteau 1995), können die Transkripte der Gene nur detektiert werden, wenn die Pflanze unter induzierten Bedingungen die Terpene tatsächlich in ihren Blättern produziert. Anders als bei der Genom-Sequenzierung können bei der Transkriptomsequenzierung selbstverständlich nur aktiv transkribierte Gene gefunden werden. Eine erfolgreiche Isolierung von Terpenen macht es daher wahrscheinlich, dass die Gene der pflanzlichen TPS aus den Blättern isoliert werden können (McGarvey u. Croteau 1995).

Für die Extraktion der Naturstoffe wurden die Blätter zunächst über Nacht in Ethylacetat gerührt. Ethylacetat wurde verwendet, da es sich besonders gut eignet, um ein breites Spektrum an Naturstoffen zu lösen. So können sowohl die reinen, als auch die modifizierten Terpene, wie beispielsweise glykosylierte Terpenoide, mit Hilfe dieses Lösemittels extrahiert werden. Anschließend wurden die Extrakte in eine polare und eine unpolare Fraktion unterteilt. Hierbei wurde einerseits wässriges Methanol für die Extraktion polarer Verbindungen verwendet. Zur Extraktion unpolarer Moleküle diente andererseits n-Hexan als Lösungsmittel.

Beide Fraktionen wurden anschließend flüssigchromatographisch weiter fraktioniert, um die Anzahl an verschiedenen Molekülen pro Probe zu reduzieren und die Analyse zu erleichtern. Die Strukturaufklärung der polaren Verbindungen erfolgte über LC/MS-Messungen und teilweise mittels NMR-Analysen. Die unpolaren Verbindungen wurden im GC/MS analysiert. 78

Ergebnisse

Da die für E. serrulata publizierten serrulatanen Diterpenoide sowie das Naphthochinon mehrere funktionelle Gruppen aufzeigen (Ndi et al. 2007), wurden sie in der Methanol-Fraktion erwartet. Auf der anderen Seite wurden nicht funktionalisierte Terpene in der Hexan-Fraktion erwartet. Die GC/MS-Messungen dieser Fraktionen zeigten für Sesquiterpenoide spezifische Fragmentierungsmuster und Retentionszeiten (Daten nicht gezeigt). Eine genaue Strukturaufklärung dieser Sesquiterpenoide war jedoch nicht möglich.

Die drei serrulatanen Diterpenoide und das isolierte Naphthochinon weisen folgende Massen auf (Tab. 24). Mittels der LC/MS-Messungen im Negativ-Modus konnten Massen detektiert werden, welche auf das Vorhandensein von zwei der drei serrulatanen Diterpenoide hindeuten (Verbindungen 1 und 2). Die Masse der Verbindung 3 und des Naphthochinons konnte nicht detektiert werden.

79

Ergebnisse

Tab. 24: Masse der publizierten antibakteriellen Verbindungen aus E. serrulata sowie der mittels LC/MS detektierten Massen (Massengenauigkeit < 10ppm).

Verbindung Struktur Akkurate Masse [M-1]

Serrulatanes 374,209325 373,20102 g/mol Diterpen 1

Serrulatanes 332,19876 g/mol 331,19061 g/mol Diterpen 2

Serrulatanes 416,21989 g/mol - Diterpen 3

Naphthochinon 296.14130 g/mol -

Um genauere Informationen über die Struktur dieser Verbindungen zu erhalten, wurde die Analyse mittels NMR versucht. Da sich jedoch mehrere Verbindungen in der Probe befanden, mussten diese zunächst voneinander getrennt werden. Hierzu wurde eine präparative HPLC verwendet, jedoch konnten die Proben nicht ausreichend getrennt werden. Über NMR- 80

Ergebnisse

Experimente konnte nur das Molekül Verbascosid identifiziert werden (s. Abb. 18), welches eine durchblutungsfördernde Wirkung aufzeigt und somit kardioaktiv ist (Pennacchio et al. 1996).

Abb. 18: Struktur des Verbascosids (CAS: 61276-17-3).

Die Verbindung konnte bereits in mehreren Pflanzen gefunden werden und ist auch bekannter Metabolit der Eremophila alternifolia (Pennacchio et al. 1996). Die Präsenz dieses Antioxidants in der nah verwandten E. serrulata war daher zu erwarten. Das Vorhandensein der serrulatanen Diterpenoide konnte somit nicht mittels NMR bestätigt werden.

Darüber hinaus wurden die einzelnen flüssigchromatographisch erzeugten Fraktionen hinsichtlich ihrer antibakteriellen Aktivität getestet. Für die Fraktion, in der unter anderem das Verbascosid enthalten war, konnte eine starke antibakterielle Wirkung gegenüber den Gram- positiven Bakterien MRSA und Staphylococcus warneri nachgewiesen werden. So zeigte diese, verglichen zu Vancomycin, welches als Referenzgröße diente, nahezu die gleiche Inhibierung (≥80 Prozent) des Pathogens. Außerdem wies diese Fraktion auch eine starke Bioaktivität gegenüber dem Gram-negativem Bakterium Proteus vulgaris auf. Die Fraktion, in welcher unter anderem die vermeintlichen Massen der serrulatanen Diterpene gefunden wurden, zeigt ebenfalls eine hohe antibakterielle Wirkung bezüglich MRSA (≥ 80 Prozent Inhibierung).

Zwar konnte nicht bewiesen werden, dass die im Gewächshaus der Ruhr-Universität Bochum gezüchtete E. serrulata die bioaktiven publizierten serrulatanen Diterpenoide produziert, gleichwohl konnte nachgewiesen werden, dass die Extrakte der Blätter eine antibakterielle Wirkung aufzeigen.

81

Ergebnisse

4.1.2. Etablierung einer Methode zur Isolierung von Nukleinsäuren aus den Blättern der E. serrulata

Verschiedene Methoden wurden zur RNA Extraktion aus den Blättern der E. serrulata verwendet. Hierbei wurden die Blätter zunächst in junge, weiche Blätter sowie alte, harzige Blätter unterteilt (s. Abb. 6 c). Ein großes Problem bei der Illumina Sequenzierung von cDNA ist, dass Rückstände von Phenol die Sequenzierung stören können, weshalb vorwiegend phenolfreie Vorgehensweisen getestet wurden. Darüber hinaus stellte sich die RNA Isolierung aus den älteren, harzigen Blättern als schwierig heraus, da die Zellen sich kaum aufschließen ließen.

Generell ist die Isolierung von RNA wesentlich anspruchsvoller als von DNA, da RNAsen auch bei hohen Temperaturen sehr stabil sind und im Gegensatz zu DNAsen auch keine Kofaktoren benötigen (Lottspeich u. Engels 2012). Eine gute Methode zur Zersetzung von RNAsen ist die Verwendung von Diethylpyrocarbonat (DECP), welches kovalente Bindungen vor allem mit den Histidinen in der aktiven Tasche der RNAsen eingeht und die Enzyme dadurch inhibiert.

Es gibt zahlreiche Methoden zur Isolierung von Nukleinsäuren aus verschiedenen Geweben. Standardmäßig werden aber hauptsächlich zwei Methoden zur Isolierung von RNA aus Pflanzen verwendet, die Zwei-Phasen-Extraktion, bei der ein Gemisch aus Phenol/Chloroform zum Einsatz kommt (Lottspeich u. Engels 2012) und die Ein-Schritt-Methode, bei der Guanidinium-Salze verwendet werden (Chomczynski u. Sacchi 1987). Bei der Ein-Schritt- Methode kann entweder ein Phenol/Chloroform/Guanidinium-Salz-Gemisch zum Einsatz kommen oder es erfolgt eine säulenchromatographische Guanidinium-Salz-basierte Extraktion. Letztere wird heutzutage als Basis für zahlreiche Kits von verschiedenen Herstellern verwendet und ist mittlerweile komplett phenolfrei.

Die Basis der RNA-Extraktion ist grundsätzlich zunächst einmal die Zersetzung der Blätter unter starkem Rühren und unter Verwendung von flüssigem Stickstoff. Das „Schockgefrieren“ der Blätter ist hierbei wichtig, um die Nukleaseaktivität zu inhibieren und einen enzymatischen Abbau der RNA zu verhindern (Lottspeich u. Engels 2012).

Bei der Verwendung der phenolfreien Extraktionskits erfolgt nach dem Zersetzen des jeweiligen Gewebes sofort die Denaturierung der RNA-abbauenden RNAsen mit Hilfe von chaotropischen Ionen. Hierzu können verschiedene Guanidinium-Salze mit unterschiedlichen Konzentrationen verwendet werden. Die Guanindinium-Salze fördern außerdem die Dehydrierung der RNA/DNA und ermöglichen damit das Binden der Polynukleotide an eine Silika-Membran. Die DNA wird durch die Zugabe einer DNAse-haltigen Lösung degradiert. Anschließend erfolgen mehrere Waschschritte, zunächst mit einem Puffer mit einer hohen Konzentration an chaotropischen Ionen, dann mit Ethanol, um die RNA von Metaboliten,

82

Ergebnisse makromolekularen Zellkomponenten und Salzen zu trennen. Die Elution der RNA von der Säule erfolgt anschließend mit RNAse-freiem Wasser, wodurch die Hydratbindungen der RNA wieder ausgebildet werden.

Der Hauptunterschied der verschiedenen Ein-Schritt-Methode-Kits liegt in den Guanidinium- Salzen (meist Guanidinium-Thiocyanat oder Guanidinium-HCl) und deren Konzentration. Da vor allem Pflanzen über viele besondere Metabolite verfügen, wird häufig die Verwendung des Guanidinium-HCl bevorzugt, da das Thiocyanat häufig mit den Metaboliten wechselwirkt und sich das Lysat dadurch „verfestigt“. Diese Verfestigung nach Behandlung mit Guanidinium- Thiocyanat konnte in der Tat beobachtet werden.

Weiterhin wurde auch ein Kit auf Basis der Phenol/Chloroform/Guanidinium-Isothiocyanat- Methode verwendet. Durch die Zugabe dieser drei Komponenten bilden sich drei Phasen, wobei sich die RNA in der wässrigen Phase befindet. Die Trennung von der DNA erfolgt ebenfalls über die Phasenbildung, da die DNA in die Zwischenphase übergeht. Proteine sollen sich hierbei komplett in der dritten, der organischen Phase, befinden. Da bei dieser Methode Phenol verwendet wird, musste die RNA anschließend aufgereinigt werden. Hierzu wurden erneut verschiedene Methoden getestet: Zwei Kits zur Aufreinigung von mRNA sowie die traditionelle Alkoholfällung. Beide Kits basieren auf der Tatsache, dass eukaryotische mRNA eine 3`-Polyadenylierung aufzeigt, nutzen jedoch verschiedene Vorgehensweisen:

Das eine Kit verfügt über eine Oligo(dT) beschichtete Oberfläche und ermöglicht unter hohen Salzkonzentrationen das Binden der DNA. Nach dem Waschen, zum Entfernen des Phenols und der rRNA sowie tRNA, wird die mRNA mit Wasser eluiert, da unter geringen Salzkonzentrationen die A-T-Wechselwirkungen nachlassen.

Das andere Kit verwendet magnetische Partikel zur Aufreinigung der mRNA. Hierbei wird ein biotinylierter Oligo(dT)-Primer verwendet, welcher in Lösung mit der Polyadenylierung der eukaryotischen mRNA hybridisiert. Dieses Konstrukt bindet dann, basierend auf dem Biotin/Streptavidin-System, mit hoher Affinität an Streptavidin-gekoppelte paramagnetische Kügelchen. Die Kügelchen werden gewaschen und anschließend über eine magnetische Trennung gefiltert. Anschließend lässt sich die mRNA einfach mittels Ribonuklease-freiem Wasser eluieren.

Desweiteren wurde die traditionelle Methode der Nukleotid-Fällung mit Hilfe von Alkohol verwendet, um die RNA weiter aufzureinigen. Hierbei dienten Ethanol und Isopropanol zum Ausfällen der Nukleotide.

Schlussendlich wurde auch noch eine Zwei-Phasen-Extraktion unter Verwendung einer Phenol/Chloroform/Isoamylalkohol-Lösung (Mehlmer et al. 2010) getestet. Durch die Zugabe des Phenols zu der Nukleinsäurelösung bilden sich zwei Phasen, wobei das Phenol Proteine

83

Ergebnisse denaturiert, welche sich dann in der Interphase zwischen organischer und wässriger Phase befinden (Lottspeich u. Engels 2012). Ein Problem ist jedoch, dass sich manche Enzyme, wie beispielsweise die RNAsen, nicht vollständig durch Phenol inaktivieren lassen. Darüber hinaus löst reines Phenol besonders gut RNA-Moleküle, die lange adeninreiche Bereiche aufweisen. Daher werden bei der Zwei-Phasen-Extraktion grundsätzlich Phenol/Chloroform-Gemische verwendet. Durch das Chloroform wird die instabile Phasengrenze zwischen Phenol und wässriger Phase stabilisiert und der Anteil an wässriger Lösung in der Phenolphase reduziert (Lottspeich u. Engels 2012). Darüber hinaus zeigt auch Chloroform eine denaturierende Wirkung, was die Inaktivierung der störenden RNAsen unterstützt. Die Phasen werden gemischt und über Zentrifugation wieder getrennt. Der Grund für die Verwendung von Isoamylalkohol ist, dass hierdurch ein Schäumen während des Mischvorganges verhindert werden kann. Der Prozess wird wiederholt, bis eine vollständige Deproteinierung der Nukleinsäuren stattgefunden hat. Anschließend wird die RNA unter Verwendung von LiCl ausgesalzt (Mülhardt 2013). Die Verwendung von hohen Salzkonzentrationen dient zur Trennung der DNA und RNA. DNA ist im Gegensatz zu hochmolekularen RNAs, wie mRNA und rRNA, in Lösungen mit hoher Ionenstärke löslich. Auch kleine RNAs, wie tRNA, lösen sich in dem LiCl-Gemisch, weshalb durch die Zugabe hoher Salzkonzentrationen spezifisch rRNA und mRNA gefällt werden können. Nach der spezifischen RNA-Fällung wurde die Probe aufkonzentriert und schlussendlich noch einmal säulenchromatographisch aufgereinigt, um Phenolreste zu minimieren.

84

Ergebnisse

Tab. 25: Übersicht der Methoden, welche die Basis für die jeweiligen kommerziell erhältlichen Kits darstellen.

Name Hersteller Methode

Nucleo Spin RNA Plant Macherey-Nagel Isolierung mit der Ein-Schritt-Methode: Phenolfrei unter Verwendung von 30- 60 % Guanidinium-Thiocyanat sowie 24-36 % Guanidinium-HCl

Nucleo Spin RNA Macherey-Nagel Isolierung mit der Ein-Schritt-Methode: Phenolfrei unter Verwendung von 30- 60 % Guanidinium-Thiocyanat

Nucleo Spin RNA Midi Macherey-Nagel Identisch zu Nucleo Spin RNA, Verwendung größerer Mengen Blattmaterial

peqGOLD TriFast peqlab Isolierung mit der Ein-Schritt-Methode: Kombination aus Phenol und 10-30 % Guanidinium-Thiocyanat

PCI - Isolierung mit der Zwei-Phasen- Methode unter Verwendung eines Phenol/Chloroform/Isoamylalkohol- Gemisches. Die RNA wird anschließend mittels LiCl spezifisch gefällt

PolyATtract mRNA Isolation Promega mRNA-Aufreinigung über magnetische System Partikel basierend auf der Polyadenylierung der mRNA

NucleoTrap mRNA Mini Macherey-Nagel mRNA-Aufreinigung über eine Oligo(dT)-beschichtete Oberfläche

RNeasyMinEluteCleanup Kit Qiagen Säulenchromatographische RNA- Aufreinigung

Eine Übersicht der durchgeführten Experimente ist der Abb. 19 zu entnehmen.

85

Ergebnisse

Abb. 19: Übersicht der durchgeführten Experimente zur RNA-Isolierung und Aufreinigung. Insgesamt wurden drei grundsätzlich verschiedene Methoden verwendet: die phenolfreien Methoden, eine phenolhaltige und Guanidinium-Salz-basierte Methode sowie die PCI-Extraktion (Phenol-Chloroform- Isoamylalkohol). In Rot ist die Methode dargestellt, welche die gewünschte RNA für die Illumina Sequenzierung lieferte. Häkchen: RNA konnte isoliert werden, Daumen runter: Keine/sehr wenig RNA vorhanden.

Insgesamt wird deutlich, dass sich die RNA aus jungen Blättern wesentlich leichter isolieren ließ als aus den älteren, harzigen Blättern (Abb. 19 und Tab. 26). Dies liegt vermutlich an einem leichteren Aufschließen des Gewebes. Da mit dem Nucleo Spin RNA Kit ausreichende Mengen an RNA isoliert werden konnten, wurde die RNA anschließend exemplarisch für die Verwendung verschiedener Aufreinigungsmethoden getestet. Insgesamt war aber mit keiner der RNA-Aufreinigungsmethoden eine erfolgreiche Aufreinigung zu verzeichnen.

86

Ergebnisse

Tab. 26: Zusammenfassung der RNA-Isolierungsmethoden und der damit erreichten RNA-Konzentration bzw. Reinheit.

Blatt-Typ Methode/Kit RNA-Konzentration A260/A280

Jung Nucleo Spin RNA Plant 900 ng/µL 2,20

Jung Nucleo Spin RNA Midi 400 ng/µL 2,15

Jung Nucleo Spin RNA 280 ng/µL 2,07

Jung TriFast 120 ng/µL 2,20

Alt PCI mit RNesay MinElute clean up 1000 ng/µL 2,18

Jung PCI mit RNesay MinElute clean up 2500 ng/µL 2,13

Am besten geeignet schien, sowohl für die Extraktion junger als auch alter Blätter, die Phenol/Chloroform/Isoamylalkohol-Methode (PCI). Da bei dieser Methode jedoch Phenol verwendet wird, welches sich störend auf die Sequenzierung auswirkt, wurde für die RNA der jungen Blätter das phenolfreie Macherey-Nagel Nucleo Spin RNA-Kit (900 ng/µL) verwendet, um störende Phenolrückstände auszuschließen. Da sich die RNA aus den alten Blättern nahezu gar nicht mit den phenolfreien Methoden isolieren ließ, musste hier auf die PCI- Methode zurückgegriffen werden. Das Aufreinigen der RNA erfolgte anschließend säulenchromatographisch, wodurch ein Großteil des Phenols entfernt werden konnte.

Zum Abschätzen der Reinheit der RNA wurde das Verhältnis der Absorption bei 260 nm zu der Absorption bei 280 nm gebildet (Lottspeich u. Engels 2012). Während Nukleinsäuren aufgrund der aromatischen Ringe der Nukleobasen ein Absorptionsmaximum bei 260 nm aufzeigen, weisen die aromatischen Reste der Proteine, ebenso wie Phenol, ein

Absorptionsmaximum bei rund 280 nm auf. Das Verhältnis der A260/A280 gibt daher an, inwieweit die RNA-Lösung durch Proteine oder Phenol kontaminiert ist. Idealerweise liegt das Verhältnis der beiden Werte für RNA-Lösungen bei 2. Liegt eine Kontamination vor, so ist der Wert signifikant kleiner. Anhand der Tab. 26 wird deutlich, dass für alle dort aufgeführten RNA- Extraktions-Methoden eine ausreichende Reinheit erzeugt werden konnte. Eine weitere gelelektrophoretische Qualitätskontrolle wurde von den Kooperationspartnern am CeBiTec in Bielefeld durchgeführt.

Insgesamt gelang es, nach einigen Optimierungen und durch die Kombination verschiedener Methoden eine Methode zur Isolierung von RNA aus jungen und alten Blättern der E. serrulata in zufriedenstellender Qualität zu etablieren.

87

Ergebnisse

4.1.3. Transkriptomdaten

Zur Sequenzierung des Transkriptoms wurde die Illumina MiSeq de novo Sequenzierung (2 x 300 bp) verwendet. Hierzu wurde zunächst die mRNA über die 3`-Polyadenylierung aufgereinigt, um Kontaminationen durch prokaryotische Fremd-RNA auszuschließen. Darüber hinaus besteht die Gesamt-RNA zu über 95 % aus rRNA bzw. tRNA, was zu einer sehr hohen Anzahl nicht relevanter reads führen würde (Yi et al. 2011). Anschließend wurde die RNA, wie in der Einleitung beschrieben, normalisiert, um eine bessere Detektion schwach transkribierter Gene zu erlauben. Allgemein stellt die Illumina MiSeq Sequenzierung eine gute Möglichkeit für Transkriptionsstudien dar, da sie relativ schnell und kostengünstig ist und nur eine geringe Anzahl an Sequenzierungsfehlern aufweist.

Die ITS-Region (internal transcribed spacer) wird häufig zur phylogentischen Analyse von Pflanzen herangezogen, da diese Region mehr Variationen aufzeigt als zum Beispiel die ribosomalen Sequenzen einer Pflanze. Wie in Kapitel 4.1.7 noch näher erläutert wird, konnte bereits vor dem NGS die ITS-Region der E. serrulata über degenerierte Primer rekonstruiert werden. Über BLAST und anschließende phylogenetische Analyse wurde die E. serrulata eingeordnet, um Pflanzen mit hoher Verwandtschaft zu identifizieren. Hierbei war Sesamum indicum die nächste bereits sequenzierte Pflanze. Die phylogentische Analyse der ITS zeigt jedoch, dass zwischen den beiden Pflanzen kaum Verwandtschaft besteht, sodass ein de novo Ansatz zur Assemblierung und Auswertung der NGS-Daten gewählt wurde (Abb. 31).

Insgesamt ergaben sich aus der Sequenzierung nach Prozessierung und Qualitätskontrolle 7.084.170 gepaarte reads. Die Assemblierung wurde von der CeBiTec in Bielefeld (Deutschland) durchgeführt (Kracht et al. 2017). Aus der Assemblierung ergaben sich 34.505 Isogruppen, welche aus insgesamt 103.404 Isotigs zusammengeführt wurden. Die Annotierungen der Isogruppen ergaben über 3.000 Gene, die anschließend bezüglich ihrer Funktionalität in folgendem Diagramm zusammengefasst wurden.

88

Ergebnisse

Abb. 20: Überblick der Transkriptomdaten der induzierten E. serrulata Blätter (modifiziert übernommen aus Kracht et al. 2017). Insgesamt konnten über Annotierung 53,4 % der Gene keiner funktionellen Kategorie zugeordnet werden. Allgemein scheinen 1,2 % der Gene eine Rolle im Sekundärmetabolismus zu spielen.

Mit seinem GC Gehalt von 41,16 % zeigt das Transkriptom einen für Pflanzen typischen Bereich auf. So weist beispielsweise das Transkriptom der Färberdisteln einen GC Gehalt von 46,97 % auf (Lulin et al. 2012). Allgemein konnten 53,4 % der annotierten Gene keiner funktionellen Kategorie zugeordnet werden, da ihre potentielle Proteinsequenz keine große Aminosäuresequenz-Homologie zu bereits bekannten Proteinen der KEGG Datenbank aufzeigte. Durch Vergleich mit Proteinen der KEGG Datenbank konnten jedoch 12,2 % der annotierten Gene eine Rolle in der Proteinbiosynthese und Proteinmodifikation zugeordnet werden. Insgesamt 8,8 % der annotierten Gene haben vermutlich eine generelle Funktion und 7,7 % sind wahrscheinlich in den allgemeinen Metabolismus involviert. Darüber hinaus zeigen 4,4 % der translatierten annotierten Gene hohe Homologien zu Enzymen, die die Signaltransduktion steuern und 3,5 % scheinen in das Lokalisierung- und Transportsystem der Zellen involviert zu sein. Für das Reproduktions- bzw. Zellwachstum/Zelltod-System scheinen 1,8 % der annotierten Gene eine wichtige Rolle zu spielen. Besonders interessant für diese Studie ist, dass 1,2 % des Transkriptoms der E. serrulata in dem Sekundärmetabolismus der Pflanze eine Rolle spielen und 0,3 % mit dem Immunsystem der Pflanze in Zusammenhang stehen. Weitere 6,2 % haben weitere Funktionen, die keiner der anderen Kategorien zugeordnet werden konnten (wie z.B. Biosynthese der Zellwand).

89

Ergebnisse

4.1.4. Bestimmung potentieller TPS aus E. serrulata

Zur Bestimmung potentieller TPS aus dem Transkriptom diente die antibiotics and Secondary Metabolite Analysis SHell Software (antiSMASH) sowie zusätzlich ein manuell durchgeführter BLASTX (NCBI).

Die antiSMASH Software ist eine bioinformatische Plattform zur Entdeckung von biosynthetischen-Genclustern für Sekundärmetabolite (Medema et al. 2011; Blin et al. 2013). Dabei aligned die Software zum einen die neuen Gene gegen eine Datenbank, basierend auf dem Hidden-Markov-Modell der möglichen open reading frames (ORFs). Zum anderen wird außerdem die BLAST- sowie die Pfam-Methode angewendet, wobei sogar ganze Genome miteinander verglichen werden können. Ein Nachteil dieser Software ist jedoch, dass sie hauptsächlich für Bakterien- und Pilz-Genome geeignet ist und keine pflanzlichen Gencluster beinhaltet.

Alle Proteinsequenzen möglicher TPS wurden nach den konservierten Strukturmotiven für pflanzliche TPS begutachtet. Hierbei wurde vor allem nach den stark konservierten DDxxD- sowie dem RRX8W-Motiv am N-Terminus Ausschau gehalten (Bohlmann et al. 1998). Weitere nicht so stark konservierte Motive wie das NSE- und DTE wurden ebenfalls zur Analyse der Proteinsequenz herangezogen (Zerbe et al. 2013). Da die Unterscheidung der TPS allein aufgrund der Sequenz schwierig ist, wurde zusätzlich protein threading angewandt, um ein erstes Verständnis über die mögliche Produktbildung zu bekommen. Diese Methode beruht auf einem Sequenz-Strukturalignment, bei der basierend auf statistischen Kenntnissen mögliche Faltungsstrukturen des Proteins erstellt werden (Lathrop u. Smith 1996; Soding et al. 2005). Diese Methode ist prinzipiell vor allem für Proteine mit geringer Sequenzidentität geeignet. Zwar zeigen TPS häufig eine geringe Sequenzidentität, allerdings sind sie strukturell stark konserviert und weisen für gewöhnlich nur α-helikale Strukturen auf (Whittington et al. 2002). Eine Unterscheidung bezüglich der Funktion ist daher auch mittels threading schwierig, dennoch wird diese Methode häufig für TPS verwendet (Degenhardt et al. 2009; Cao et al. 2010).

Darüber hinaus wurden, wie bereits in der Einleitung beschrieben, die Proteinsequenzen hinsichtlich ihrer Länge sowie einer potentiellen Signalsequenz untersucht (Bohlmann et al. 1998). Während Mono- und Diterpensynthasen eine Signalsequenz aufzeigen, da ihre Produkte in den Plastiden gebildet werden, findet die Bildung der Sesquiterpene im Cytoplasma statt, weshalb Sesquiterpensynthasen keine Signalsequenzen enthalten. Die Signalsequenzen der TPS weisen oft einen hohen Serin- und Threonin-Gehalt auf und eine geringe Anzahl saurer Aminosäuren (Bohlmann et al. 1998).

90

Ergebnisse

Basierend auf der Suche mittels antiSMASH wurden insgesamt acht potentielle TPS- Kandidaten-Gene gefunden, von denen jedoch keins direkt für weitere Experimente verwendet werden konnte. Die nachfolgende Tabelle (Tab. 27) gibt nähere Informationen über die potentiellen Kandidaten-Gene.

Tab. 27: Übersicht über die mittels antiSMASH gefundenen potentiellen TPS sowie deren Zusammensetzung aus den NGS-Daten.

Name Zusammensetzung Bemerkung

jk 1 72 Isotigs Keine Volllänge, potentielle Assemblierungsfehler,

jk 2 6 Isotigs hohe Ähnlichkeit zu Klasse II TPS

jk 3 4 Isotigs Keine Volllänge, potentielle Assemblierungsfehler, mögliche Artefakte

jk 4 6 Isotigs Potentielle Klasse I TPS, aber eventuelle Assemblierungsfehler

jk 5 2 Isotigs Keine Volllänge, keine charakteristischen TPS- Motive vorhanden

jk 6 2 Isotigs Keine Volllänge, keine charakteristischen TPS- Motive vorhanden

jk 7 1 Isotig Keine Volllänge, aber charakteristisches Motiv

jk 8 11 Isotigs Keine Volllänge, aber charakteristisches Motiv, potentielle Assemblierungsfehler

Die reads der Sequenzierung werden zu Contigs zusammengesetzt, welche anschließend zu einzelnen Isotigs assembliert werden, die dann zu einer entsprechenden Isogruppe zusammengefasst werden. Hierbei können häufig Assemblierungsfehler entstehen, insbesondere bei de novo Assemblierungen, da bei diesem Ansatz kein Referenzgenom vorliegt. Ein Beispiel für die Zusammensetzung einer Isogruppe ist im nachfolgenden Bild (Abb. 21) für jk 1 dargestellt. Diese Isogruppe setzt sich aus insgesamt 72 sehr kurzen Isotigs zusammen, was verdeutlicht, wie anspruchsvoll eine richtige Assemblierung potentieller TPS ist.

91

Ergebnisse

Abb. 21: Zusammensetzung der Isogruppe des Gens jk 1. Links sind vertikal jeweils die einzelnen Isotigs aufgeführt, die aus den jeweiligen Contigs (schwarze Balken) assembliert wurden. Für jk 1 gibt es 72 verschiedene Isotigs.

Zur Bestimmung potentieller Assemblierungsfehler wurden die Isotigs über einen BLAST (NCBI) mit anderen TPS verglichen, um ein erstes Verständnis über ihren Aufbau zu bekommen. Die nachfolgende Abbildung (Abb. 22) zeigt am Beispiel von jk 3, inwiefern dieses zur Detektion potentieller Assemblierungsfehler beitrug. 92

Ergebnisse

Abb. 22: BLASTX durchgeführt mit jk 3 zum Nachweis von Assemblierungsfehlern. Es wird deutlich, dass nur ein kleiner Teil des ORFs (1300-1600 Basen) des Gens (rot) mit den Aminosäuresequenzen bekannter pflanzlicher TPS (türkis) übereinstimmt.

Anhand der Abb. 22 lässt sich erkennen, dass im Fall von jk 3 die ersten rund 1.300 Basen bei Analyse des open reading frames (ORF) keinerlei Identität zu Aminosäuresequenzen bekannter pflanzlicher TPS aufweisen. Auf der anderen Seite gibt es eine hohe Übereinstimmung des ORF von jk 3 im Bereich von 1.300-1.600 Basen mit den ORFs bekannter TPS. Dies lässt eindeutig auf Assemblierungsfehler schließen. Auch bei Betrachtung der Sequenz von jk 3 scheint es, als wären Assemblierungs-Artefakte am N- Terminus aufgetreten (s. Anhang S. 1). Diese treten häufig bei der automatisierten Assemblierung auf (Chen et al. 2014).

Es stellte sich somit als schwierig heraus, aus den Daten des NGS und der antiSMASH- Analyse richtig assemblierte Volllängen-Gene zu generieren. Im weiteren Vorgehen wurden Gene mit sehr vielen Isotigs vernachlässigt, da hier die Wahrscheinlichkeit von Assemblierungsfehlern sehr hoch lag (z.B. jk 1). Außerdem wurden Gene mit hoher Ähnlichkeit zu Klasse II TPS ebenfalls vernachlässigt (jk 2), ebenso wie Gene mit potentiellen Artefakten (jk 3). Auch Sequenzen, die eine überdurchschnittliche Länge aufzeigen, aber keines der charakteristischen Motive enthalten, wurden in der weiteren Analyse vernachlässigt (jk 5 und jk 6). Diese Gene wiesen rund 400-500 Aminosäuren auf, wobei keines der charakteristischen TPS-Motive gefunden werden konnte. Da diese Gene höchstwahrscheinlich keine Volllängen- Sequenzen aufzeigten, könnte sich das stark konservierte DDxxD-Motiv zwar in der noch fehlenden Sequenz befinden, allerdings konnten auch am N-Terminus keine charakteristischen Motive entdeckt werden, weshalb diese Gene vernachlässigt wurden.

93

Ergebnisse

Besonders interessant schien anfangs die potentielle Diterpensynthase JK 4. Bei Betrachtung der Sequenz konnten charakteristische Diterpensynthase-Sequenzmotive identifiziert werden (s. Abb. 23). Hierbei fielen vor allem das DxDD- und das DDxxD-Motiv auf, welche verwunderlicherweise in bifunktionalen Klasse I/II Diterpensynthasen von Koniferen vorkommen (Zerbe et al. 2013). Eine protein threading Analyse zeigte außerdem die Taxadien- Synthase als nächsten Treffer (E-Wert: 8 E-138).

Abb. 23: Potentielles ORF der möglichen Diterpensynthase JK 4. Charakteristische Strukturmotive für Diterpensynthasen sind in Rot dargestellt.

Insgesamt ergaben sich für JK 4 sechs verschiedene Isotigs, welche aus sieben verschiedenen Contigs aufgebaut waren (s. Abb. 24).

Abb. 24: Zusammensetzung einer Isogruppe des assemblierten Gens jk 4. Links sind vertikal die Isotigs aufgeführt, welche sich aus den einzelnen Contigs (nummeriert) zusammensetzen. Insgesamt wurden für jk 4 sechs Isotigs generiert.

Um zu überprüfen, bei welchem der Isotigs es sich um das richtig assemblierte Gen handelt, wurden zunächst weitere Experimente mit der cDNA durchgeführt und das Transkript mittels Sanger Sequenzierung nachsequenziert. Auf die Ergebnisse hierzu wird im nachfolgenden Abschnitt näher eingegangen.

94

Ergebnisse

Ein weiterer interessanter Kandidat war das Gen jk 7, welches jedoch nicht als Volllängen-Gen vorlag. Hierzu mussten zunächst RACE-PCR-Experimente durchgeführt werden, auf die im Abschnitt 4.1.6 näher eingegangen wird.

Zusätzlich zu der antiSMASH Software wurde manuell ein Alignment des Transkriptoms gegen bekannte TPS durchgeführt und die potentiellen Kandidatengene bezüglich ihrer Länge, Strukturmotive und mittels BLAST-Analyse näher untersucht.

Durch den BLAST wurden 15 weitere potentielle TPS-Gene gefunden, sodass insgesamt 23 potentielle TPS-Gene aus dem Transkriptom der E. serrulata identifiziert werden konnten. Abgesehen von jk 4 wurden mit Hilfe der BLAST-Analyse insgesamt sechs Gene mit möglicher Volllänge entdeckt. Alle von ihnen wiesen die charakteristischen Motive pflanzlicher TPS auf.

Tab. 28: Durch BLAST-Analyse detektierte Gene sowie deren Zusammensetzung aus den NGS-Daten und deren potentielle Aktivität.

Gen Zusammensetzung Potentielle Aktivität (BLAST P nächster Treffer) ok 1a 2 Isotigs aus 3 Contigs Mono-TPS (Limonen/Myrcen-Synthase) ok 2 2 Isotigs aus 2 Contigs Sesqui-TPS (Patchulol-Synthase) ok 3 1 Isotig aus 1 Contig Diterpen-TPS (Kauren-Synthase) ok 4a 1 Isotig aus 1 Contig Mono-TPS (Limonen/Myrcen-Synthase) ok 5 1 Isotig aus 1 Contig Isopren-Synthase ok 6 1 Isotig aus 1 Contig Sesqui-TPS (γ-Cadinen-Synthase)

Wie bereits erwähnt, wurden aus den einzelnen reads des NGS einzelne Contigs generiert, welche anschließend zu einem Isotig assembliert und zu einer Isogruppe zusammengefasst wurden. Normalerweise basiert die Assemblierung der Isotigs auf der Verwendung eines Referenzgenoms oder Referenztranskriptoms. Da bislang noch keine nahverwandte Pflanze zu E. serrulata sequenziert wurde, musste ein de novo Ansatz verwendet werden, welcher grundsätzlich schwieriger ist als der Ansatz mit einem Referenzgenom und häufiger zu Assemblierungsfehlern führt.

Die potentiellen sechs Volllängen-Gene, welche über das Alignment detektiert wurden, waren alle maximal aus zwei Isotigs zusammengesetzt, was die Wahrscheinlichkeit von Assemblierungsfehlern reduzierte. Dennoch wurden, um Assemblierungsfehler, aber auch Sequenzierungsfehler auszuschließen, alle potentiellen TPS-Kandidaten-Gene noch einmal mit Hilfe der Sanger Sequenzierung nachsequenziert.

95

Ergebnisse

Abb. 25: Zusammensetzung der Isogruppe des Gens ok 1a. Zur Bestimmung, ob der Contig 2 Bestandteil des Gens ist, wurde eine PCR mit spezifischen Primern an Contig 1 (Fw-Primer) und Contig 3 (Rv-Primer) durchgeführt. Das Produkt wurde zum Sequenzieren gegeben, um zu überprüfen, ob das Gen mit oder ohne Contig 2 vorgefunden wird.

Dazu wurde eine spezifische PCR zum Nachweis jedes einzelnen Contigs durchgeführt (s. beispielhaft Abb. 25). Anschließend wurde eine PCR mit spezifischen Primern am 5`- und 3`- Ende eines Isotigs durchgeführt. Hierbei sollte die richtige Assemblierung der einzelnen Isotigs überprüft werden. Die Ergebnisse der Resequenzierung mittels Sanger werden im nachfolgenden Abschnitt genauer erläutert.

Die Daten zeigen, dass ein de novo Alignment von eukaryotischen Transkriptomen, vor allem bei kurzer read-Länge, Probleme aufweisen kann, dennoch konnten im Rahmen dieser Studie mögliche TPS Gene gefunden werden.

4.1.5. Resequenzierung der NGS-Daten und Entdeckung potentieller Isoenzyme

Zur Überprüfung der Genauigkeit der Illumina Sequenzierung und der richtigen Assemblierung, wurden die potentiellen TPS noch einmal mit der Sanger Sequenzierung überprüft. Dabei wurden sowohl die sechs mittels BLAST entdeckten Gene als auch jk 3, jk 4, jk 5, jk 6 und jk 8 analysiert, um die richtige Assemblierung zu bestimmen. Es wurde jeweils eine PCR mit der cDNA der E. serrulata und spezifischen Primern durchgeführt. Die in pJET klonierten PCR-Produkte wurde anschließend mittels Sanger Sequenzierung sequenziert und mit der Sequenz der Illumina-Daten verglichen. Um sicherzustellen, dass sich auch tatsächlich PCR-Produkt in dem pJET Vektor befindet, wurden mehrere Konstrukte pro Gen sequenziert und analysiert. Dabei fiel auf, dass einige Gene regelmäßige Mutationen aufwiesen. In allen Fällen war die Sequenz der Illumina Sequenzierung auch in den Sanger Sequenzierungsdaten wiederzufinden. Die folgende Tabelle gibt einen Überblick über die Ergebnisse der durchgeführten Sanger Sequenzierungen.

96

Ergebnisse

Tab. 29: Zusammenfassung der durchgeführten Sanger Sequenzierungen zu den mittels antiSMASH detektierten potentiellen TPS Genen.

Gen Ergebnis der Sequenzierung

jk 3 Kein PCR-Produkt, einzelne Contigs sequenziert

jk 4 PCR-Produkt, Contig-Zusammensetzung entsprach Isotig F

(Abb. 24), kein Volllängen-Gen

jk 5 Kein PCR-Produkt

jk 6 Kein PCR-Produkt

jk 8 Kein PCR-Produkt, einzelne Contigs sequenziert

Da die meisten PCRs von den mittels antiSMASH detektierten Isogruppen keine Produkte lieferten, wurde stark von Assemblierungsfehlern ausgegangen. Daher wurden zunächst spezifisch die einzelnen Contigs sequenziert, um sicherzustellen, dass diese tatsächlich im Transkriptom vorhanden sind. Anschließend wurde durch Kombination verschiedener Primer versucht, die richtige Contig-Zusammensetzung nachzuvollziehen.

Für das Gen jk 4 (s. Abb. 24) konnte mit Hilfe eines für Contig 1 spezifischen forward und eines für Contig 7 spezifischen reverse Primers eine PCR durchgeführt werden, welche ein spezifisches Produkt ergab. Mittels Sanger Sequenzierung konnte dann festgestellt werden, dass sich in der cDNA ausschließlich der Isotig F befand. Contig 2 und 3 scheinen kein Bestandteil der Gensequenz von jk 4 zu sein. Ein Alignment des Isotigs F mit bekannten pflanzlichen TPS deutete jedoch darauf hin, dass es sich bei der Sequenz nur um ein Genfragment handelt, welches sowohl in 5`- als auch in 3`- Richtung vervollständigt werden muss. Daher wurden mit diesem Gen RACE-PCR-Experimente durchgeführt, auf welche im Abschnitt 4.1.6 näher eingegangen wird.

Mit den weiteren Genen, welche mittels antiSMASH detektiert wurden, wurden weitere PCR- basierte Experimente zum Vorhandensein sowie der Zusammensetzung der Contigs durchgeführt. Da hierbei jedoch keine überzeugenden Ergebnisse erzeugt werden konnten, wird in dieser Arbeit nicht näher darauf eingegangen.

Auch mit den über BLAST detektierten Genen wurden Resequenzierungs-Experimente durchgeführt. Die Ergebnisse hierzu sind in Tab. 30 zusammengefasst.

97

Ergebnisse

Tab. 30: Ergebnisse der Sanger Sequenzierung für die mit BLAST ermittelten potentiellen TPS Gene.

Gen Ergebnis der Sanger Sequenzierung

ok 4a Zwei verschiedene Varianten gefunden

ok 4a: Variante identisch zu der Sequenz aus der Illumina Sequenzierung

ok 4b: Variante ok 4a mit 7 Punktmutationen und 5 weiteren stillen Mutationen

ok 2 Keine positiven PCR-Ergebnisse

ok 3 Nur eine Variante gefunden, welche identisch zur Sequenz aus dem NGS war

ok 1a Drei verschiedene Varianten gefunden

ok 1a: Variante identisch zu der Sequenz aus der Illumina Sequenzierung

ok 1b: ok 1a mit 10 Punktmutationen

ok 1c: ORF der Variante OK 1b mit einer zusätzlichen Aminosäuredeletion, welche weder in OK 1a noch in OK 1b vorkommt

ok 5 Zahlreiche Mutationen und Insertionen

ok 6 Nur eine Variante gefunden, welche identisch zur Sequenz aus dem NGS war

Aus den Daten wurde insgesamt deutlich, dass die Illumina MiSeq Sequenzierung eine hohe Sequenzierungsgenauigkeit aufzeigt, da in fast allen Fällen die exakte Sequenz wiedergefunden werden konnte.

Beim Resequenzieren der Gene ok 4a und ok 1a wurden regelmäßige Mutationen gefunden, sodass von Isoenzymen ausgegangen wurde. Während die Gensequenz von ok 4b 13 Mutationen im Vergleich zu ok 4a aufwies, zeigte die anschließende Analyse des ORFs insgesamt 7 Punktmutationen (Abb. 26).

98

Ergebnisse

Abb. 26: Alignment des ORFs von OK 4a und OK 4b (modifziert übernommen aus Kracht et al. 2017). Stark konservierte Motive pflanzlicher TPS sind farbig markiert. Punktmutationen zwischen OK 4a und OK 4b sind in Rot dargestellt.

Um ein erstes Verständnis darüber zu bekommen, wo die Punktmutationen von OK 4b liegen und inwieweit diese die aktive Tasche beeinflussen, wurde ein Homologie-Modell, basierend auf der Struktur einer Limonen-Synthase (PDB: 2ONG) erstellt (Abb. 27). Es lässt sich deutlich erkennen, dass die Punktmutationen außerhalb der aktiven Tasche, im Bereich der loop- Regionen, vorzufinden sind.

99

Ergebnisse

Abb. 27: Homologie-Modell von OK 4a und OK 4b basierend auf der Struktur einer Limonen-Synthase (übernommen aus Kracht et al. 2017). Die modellierte Struktur von OK 4a ist in Grau dargestellt. Der Ligand 2-Fluorogeranyl-Diphosphat (türkis) sowie die divalenten Kationen (pink) zeigen das aktive Zentrum des Enzyms. Die Punktmutationen von OK 4b (in Blau dargestellt) liegen hauptsächlich in den loop-Regionen und befinden sich nicht in räumlicher Nähe zum aktiven Zentrum.

Für das Gen ok 1 wurden insgesamt drei Varianten gefunden (Abb. 28). Das ORF von OK 1b zeigte zehn Punktmutationen im Vergleich zu OK 1a. Die Variante ok 1c entsprach der Gensequenz von ok 1b mit einer zusätzlichen Triple-Codon-Deletion.

100

Ergebnisse

Abb. 28: Alignment der ORFs von OK 1a, OK 1b und OK 1c. Stark konservierte Motive pflanzlicher TPS sind farbig markiert. Punktmutationen zwischen OK 1a, OK 1b und OK 1c sind in Rot dargestellt.

Das Homologie-Modell der verschiedenen Varianten von OK 1, basierend auf der Struktur einer Limonen-Synthase (PDB: 2ONG), lässt deutlich erkennen, dass die Punktmutationen außerhalb der aktiven Tasche vorliegen.

101

Ergebnisse

Abb. 29: Homologie-Modell der verschiedenen Varianten von OK 1, basierend auf der Struktur einer Limonen-Synthase. Die modellierte Struktur von OK 1a ist in Grau dargestellt. Der Ligand 2-Fluorogeranyl- Diphosphat (türkis) sowie die divalenten Kationen (pink) zeigen das aktive Zentrum des Enzyms. Die Punktmutationen der OK 1 Varianten (in Blau dargestellt) liegen hauptsächlich in den loop-Regionen und befinden sich nicht in räumlicher Nähe zum aktiven Zentrum.

Für das Gen ok 5 konnte die NGS-Sequenz mittels Sanger Sequenzierung nicht wiedergefunden werden. Stattdessen wies die mittels Sanger Sequenzierung detektierte Sequenz zahlreiche Mutationen und Insertionen auf, sodass von einer anderen Splicing- Variante ausgegangen wurde.

Insgesamt fiel bei den Resequenzierungs-Experimenten auf, dass diese stark vom cDNA- batch abhängig waren. Auch wenn die cDNA aus denselben RNA-Proben in parallelen Ansätzen revers transkribiert wurde, konnten die PCR-Experimente nicht immer reproduziert werden. Eine mögliche Erklärung ist eine Beeinträchtigung der PCR durch Kontaminationen aus den sehr harten, alten Blättern. Daher war es schwierig zu bestimmen, ob diese Gene als Teil des Sekundärmetabolismus tatsächlich nur in der mRNA induzierter Blätter vorhanden war oder auch in der von nicht induzierten Blättern. Ein nicht vorhandenes PCR-Produkt basierend auf der cDNA von nicht induzierten Blättern konnte daher nicht zwangsläufig bestätigen, dass dieses Gen in den Sekundärmetabolismus involviert ist. Aus diesem Grund wurden die Experimente mit der cDNA nicht induzierter Blätter weitestgehend vernachlässigt.

Zusammenfassend war die Resquenzierung der Transkripte mittels Sanger eine wichtige Methode, um umfassende Informationen über den Genpool zu bekommen und Assemblierungsfehler zu detektieren. Allgemein war die Sequenzierungsqualität der einzelnen Contigs durch das NGS sehr hoch, allerdings wiesen die Assemblierungen zu den jeweiligen 102

Ergebnisse

Isotigs Probleme auf. Trotz der hohen Sequenzierungsqualität ist ein Nachteil der Illumina MiSeq Transkriptomsequenzierung, dass diese häufig aufgrund von Sekundärstrukturen vorzeitig abbricht, weshalb die generierten reads sehr kurz sein können (Xiao et al. 2013; Nowrousian 2010). Diese erschweren häufig die de novo Assemblierung, insbesondere bei eukaryotischen Transkriptomen.

4.1.6. RACE-PCR zur Generierung von Volllängen-Genen

Wie in der Einleitung beschrieben, handelt es sich bei der RACE-PCR um eine Methode zur Generierung von Volllängen-Genen. In dieser Arbeit wurde sowohl die 5`- als auch die 3`- RACE-PCR Methode verwendet, da zahlreiche Contigs aus dem NGS nur Genfragmente einer TPS darstellten.

Da vor allem die Durchführung der 3`-RACE-PCR zu einer Vielzahl von unspezifischen PCR- Produkten führte, wurde das Standardprotokoll abgewandelt und auch hierbei eine nested PCR durchgeführt. Dies bedeutet, dass mit dem aufgereinigten PCR-Produkt der ersten PCR eine weitere PCR mit weiter innen liegenden Primern durchgeführt wurde. Hierdurch konnte die Spezifität zwar erhöht werden, jedoch gelang eine erfolgreiche 3`-RACE-PCR nur für ein einziges Gen. Allgemein wurden alle PCR-Produkte gelextrahiert und in pJET zwischenkloniert, bevor sie mittels Sanger Sequenzierung hinsichtlich ihrer Sequenz überprüft wurden.

Insgesamt konnten unter Verwendung der RACE-PCR ein 3`-Ende und zwei 5`-Enden hinsichtlich ihrer Gensequenz vervollständigt werden. Hierbei handelte es sich zum einen um das 5`-Ende von jk 4, wobei das 3`-Ende nicht erzeugt werden konnte und das Gen damit trotz erfolgreicher RACE-PCR nicht als Volllängen-Gen vorlag. Zum anderen konnten beide fehlenden Enden des Gens jk 7 generiert werden, sodass insgesamt ein Gen mit Hilfe der RACE-PCR-Experimente komplett vervollständigt werden konnte (jk 7).

Abb. 30: ORF der potentiellen TPS JK 7. Charakteristische Motive pflanzlicher TPS sind in Rot dargestellt. Die mittels RACE-PCR generierten Sequenzen sind in Orange darstellt. Das ORF weist ein Start- (rot) sowie Stopcodon (Stern) auf.

103

Ergebnisse

Die Gensequenz wurde ab dem potentiellen Startcodon mittels Sanger Sequenzierung nachsequenziert, um die Richtigkeit der RACE-PCR Ergebnisse zu überprüfen. Um abschätzen zu können, ob tatsächlich die gesamte Länge des 5`-Endes generiert wurde, wurde die Gensequenz in einem BLAST mit der von bekannten TPS verglichen. Bei dem Alignment fiel auf, dass andere pflanzliche Sesquiterpensynthasen ungefähr die gleiche Länge aufzeigen. Am 3`-Ende konnte zudem ein Stopcodon detektiert werden, sodass bei jk 7 von einem Volllängen-Gen ausgegangen werden konnte.

4.1.7. Phylogenetische Einordnung der E. serrulata

Die australische Wüstenpflanze E. serrulata gehört zur Ordnung der Lamiales und zur Familie der Scrophulariaceae. Sie ist die erste sequenzierte Spezies ihrer Gattung (Kracht et al. 2017). Um nähere Aufschlüsse über die phylogenetische Einordnung dieser Pflanze zu bekommen, wurden typische house-keeping Gene, wie die ITS oder die Zitratsynthase näher betrachtet.

Bei der ITS handelt es sich um eine Nukleotidsequenz, die als Spacer-DNA zwischen zwei rRNA-Genen liegt und während der RNA-Prozessierung über Spleißen entfernt wird (Coleman 2015; Michot et al. 1983). Da diese Region mehr Variationen aufzeigt als zum Beispiel die ribosomalen Sequenzen, wird sie häufig als phylogenetischer Marker verwendet (Baldwin 1992; Coleman 2015). Weitere Vorteile sind, dass zahlreiche ITS-Sequenzen bekannt und in Datenbanken hinterlegt sind und dass im Genom zahlreiche Genkopien vorliegen, was die Detektion mittels PCR erleichtert (Schoch et al. 2012; Baldwin 1992).

Da die Sequenz der ITS aufgrund des Splicings nicht in den Transkriptomdaten vorzufinden ist, wurde eine PCR mit degenerierten Primern durchgeführt, um die ITS-DNA-Sequenz zu amplifizieren. Für das Design der degenerierten Primer, diente die ITS-Sequenz einer anderen Eremophila Spezies als template (s. 3.2.1.7). Mit Hilfe dieser Methode konnte die ITS-Region der E. serrulata erfolgreich amplifiziert werden und mittels Sanger Sequenzierung bestimmt werden. Anschließend erfolgte eine phylogenetische Analyse der Sequenz unter Verwendung des Neighbor-Joining-Algorithmus.

104

Ergebnisse

Abb. 31: Mit dem Neighbor-Joining-Algorithmus erstellter phylogenetischer Baum der ITS-Region von E. serrulata und ausgewählten ITS-Genen anderer Spezies (übernommen aus Kracht et al. 2017). Sequenzen wurden mittels Clustal W aligned und der phylogenetische Baum mit Hilfe der MEGA7-Software unter Verwendung von 1.000 Replikationen erstellt (Hall 2013).

Wie zu erwarten, zeigt die ITS der E. serrulata eine hohe Ähnlichkeit zu den Genen aus anderen Eremophila Spezies sowie zu Spezies der Myoporum Gattung, welche ebenfalls zur Familie der Scrophulariaeceae gehört. Darüber hinaus wurde eine weitere phylogenetische Analyse mit einer Zitratsynthase aus E. serrulata durchgeführt (Birtles u. Raoult 1996; Roux et

105

Ergebnisse al. 1997). Das Gen wurde über NGS sequenziert und über ein Alignment annotiert. Erneut wurde ein phylogenetischer Stammbaum auf der Basis der Zitratsynthase Sequenz erstellt.

Abb. 32: Mit dem Neighbor-Joining-Algorithmus erstellter phylogenetischer Baum der Zitratsynthase von E. serrulata und ausgewählten Zitratsynthasen anderer Spezies (übernommen aus Kracht et al. 2017). Sequenzen wurden mittels Clustal W aligned und der phylogenetische Baum mit Hilfe der MEGA7-Software unter Verwendung von 1.000 Replikationen erstellt (Hall 2013).

Aufgrund der Tatsache, dass es keine weiteren Zitratsynthase-Sequenzen aus der Eremophila bzw. Myoporum Gattung gibt, zeigte die Sequenz der Zitratsynthase die höchste Verwandtschaft zu der Zitratsynthase aus Erythranthe guttatus. Die gelbe Gauklerblume (E. guttatus oder auch Mimulus gutattus) gehört ebenfalls zu der Ordnung der Lippenblüterartige (Lamiales), jedoch zur Familie der Gauklerblumengewächse (Phrymaceae) (Lowry et al. 2008). Frühere Untersuchungen ordneten E. guttatus aber in die Familie der Scrophulariaceae ein.

4.1.8. Heterologe Genexpression potentieller TPS in E. coli

Die Gene der Eremophila serrulata wurden als Codon-optimierte Gene synthetisiert und heterolog in E. coli exprimiert. Hierzu wurden für jede potentielle TPS verschiedene Expressionsbedingungen getestet. Die Gene wurden jeweils in drei verschiedenen Stämmen (E. coli BL21(DE3), E. coli BL21(DE3)pLysS und E. coli Rosetta(DE3)) unter verschiedenen Expressionstemperaturen (30 °C, 20 °C und 16 °C) und verschiedenen IPTG Konzentrationen (1 mM, 0,5 mM und 0,1 mM) getestet. Insgesamt konnte für alle sieben Gene die höchste Konzentration an löslichem Protein bei einer Expressionstemperatur von 16 °C und einer IPTG Konzentration von 0,5 mM generiert werden. Je nach Gen wurde die höchste Konzentration an löslichem Protein in verschiedenen Stämmen generiert. Eine Zusammenfassung der Gene

106

Ergebnisse und zugehörigen Expressionsstämme sowie die durchschnittlich erzeugten Proteinkonzentrationen lassen sich der Tab. 31 entnehmen. Zwar befand sich in allen Fällen auch unlösliches Protein im Pellet, allerdings war die Menge an löslichem Protein recht hoch einzustufen, sodass weitere Experimente ohne Probleme durchgeführt werden konnten. Alle Proteine wurden mittels Hexahistidin-tag aufgereinigt und zur biokatalytischen Anwendung verwendet.

Tab. 31: Zuordnung der zur heterologen Expression der potentiellen TPS Gene verwendeten Expressionsstämme sowie die ungefähre Proteinmenge (aufgereinigtes Enzym) die pro Liter Expressionskultur erzeugt werden konnte. Proteinmenge nicht bestimmt: n.b.

Gen Expressionsstamm Proteinmenge pro Liter Kultur pET 28a_OK 4a E. coli Bl21(DE3) 400 mg/L pET 21b_OK 4b E. coli Bl21(DE3) 225 mg/L pET 21b_OK3_kurz E. coli Bl21(DE3)pLysS n.b. pET 21b_OK 3_lang E. coli Bl21(DE3)pLysS 2 mg/L pET 21b_OK 1a E. coli Bl21(DE3)pLysS 100 mg/L pET 21b_OK 1b E. coli Bl21(DE3)pLysS 225 mg/L pET 28a_OK 6 E. coli Bl21(DE3) 85 mg/L pET28a_JK 7 E. coli Bl21(DE3) n.b.

Da aus der Literatur (Bohlmann et al. 1998) bekannt ist, dass Signalsequenzen die heterologe Expression von Mono- oder Diterpensynthasen stören können, wurden für das Gen OK 3 zwei verschiedene Varianten kloniert. Da Sesquiterpene im Cytoplasma gebildet werden, besitzen deren Synthasen keine Transitsequenz, sodass Sesquiterpensynthasen von dieser Problematik ausgenommen sind. Die Bestimmung von plastidären Signalsequenzen, welche am N-Terminus der Proteine vorliegen, ist problematisch, da diese häufig variieren (Heijne 1985). Aus der Literatur (Bohlmann et al. 1998) ist jedoch bekannt, dass TPS- Signalsequenzen häufig einen hohen Anteil an Serin und Threonin, sowie einen geringen Anteil saurer Aminosäuren aufzeigen. Daher wurde OK 3 einmal in seiner kompletten Länge in E. coli exprimiert (OK 3_lang) und einmal wurde eine Variante ohne potentielle Signalsequenz gewählt (OK 3_kurz). Da bei beiden Varianten ein kleiner Teil des überexprimierten Proteins löslich war, wurden die weiteren Experimente mit der Variante OK3_lang durchgeführt, um sicherzustellen, dass die Trunkierung des N-Terminus nicht zu einem Verlust der Aktivität führt.

107

Ergebnisse

4.1.9. Aktivitätsmessungen mit isotopenmarkierten Substraten

Da TPS im Allgemeinen eine sehr geringe Aktivität aufweisen, wurden zunächst in vitro Biokatalysen mit isotopenmarkiertem Substrat durchgeführt (Hezari et al. 1995). Diese sehr sensitive Methode sollte zunächst Aufschlüsse über die Aktivität und Substratspezifität der potentiellen TPS geben. Hierbei wurde jede potentielle TPS mit deuteriertem GPP, FPP und GGPP getestet. Die Biokatalysen wurden in einem Zwei-Phasen-System mit n-Heptan Überschichtung und auf eine Silika-Säule aufgetragen. Anschließend wurde zunächst mit n- Heptan gewaschen, um die hydrophoben, rein olefinischen Terpene von der Säule zu eluieren. Darauf folgend wurden hydroxylierte Terpenoide mit tBME eluiert. Die Fraktionen wurden getrennt voneinander gesammelt, mit einem Szintillationscocktail vermengt und an einem Szintillationszähler gemessen. Die Mittelwerte der abgegebenen Zerfälle pro Minute (DPM) sind in Tab. 32 zusammengefasst und wurden mit den Negativkontrollen (Reaktion ohne Enzym) verglichen. Als Positivkontrolle diente eine Biokatalyse mit einer bereits publizierten und aktiven Taxadien-Synthase (TXS) und GGPP.

Tab. 32: Messungen der Zerfälle pro Minute (DPM) der radioaktiv-markierten Biokatalysen mit 2 µM der verschiedenen Enzyme und 60 kBq der verschiedenen Substrate (GPP, FPP und GGPP). Die Biokatalysen wurden säulenchromatographisch in eine Heptan- (Hep) und eine tert-Butylmethylether (tBME)-Fraktion unterteilt, wobei sich die reinen Kohlenwasserstoffe in der n-Heptan-Fraktion befinden sollten. Die Negativkontrollen (Biokatalyse mit Substrat aber ohne Enzym) sind unten aufgeführt. N.b.: Nicht bestimmt.

Enzym DPM mit GPP DPM mit FPP DPM mit GGPP OK 4a 136 (Hep) 105 (Hep) 33 (Hep) 431 (tBME) 852 (tBME) 417(tBME) OK 4b 392 (Hep) 11 (Hep) 30 (Hep) 626 (tBME) 20 (tBME) 845 (tBME) OK 3 n.b. n.b. 33 (Hep) 2316 (tBME) OK 6 3024 (Hep) 54 (Hep) 224 (Hep) 8042 (tBME) 1512 (tBME) 2011 (tBME) OK 1a 57(Hep) n.b 33 (Hep) 779 (tBME) 2073 (tBME) OK 1b 56 (Hep) 272 (Hep) 26 (Hep) 332 (tBME) 676 (tBME) 291(tBME) JK 7 n.b. n.b. n.b. TXS n.b. n.b. 1502 (Hep) 714 (tBME) - 61 (Hep) 34 (Hep) 68 (Hep) 312 (tBME) 524 (tBME) 196 (tBME)

108

Ergebnisse

Insgesamt sind die Daten der radioaktiven Messung schwer auszuwerten, da aufgrund der teilweise hohen Anzahl an Zerfällen pro Minute in den Negativkontrollen eine eindeutige Aktivitätszuordnung schwierig ist. Da nicht alle Experimente in Replikaten durchgeführt wurden, schließlich sollte nur eine initiale Aussage getroffen werden, ob diese überhaupt aktiv sind, ist es fragwürdig, wie hoch die Schwankungen der DPM sein können. Beim Vergleich mit der Positivkontrolle (TXS) scheint OK 6 mit allen drei Substraten aktiv zu sein, sowie OK 3 mit GGPP. Für die anderen Enzyme ist es schwierig zu bestimmen, ob die Messungen innerhalb der Standardabweichungen der Negativkontrollen liegen oder eine wirkliche Enzymaktivität verdeutlichen. Da diese Experimente keinerlei Aussagen über die eigentliche Produktstruktur liefern und zudem auch in der Negativkontrolle teilweise zu hohe Werte an ß-Strahlung aufzeigten, wurden die Experimente für JK 7 nicht mehr durchgeführt.

4.1.10. Produktbestimmung der potentiellen TPS

Zur Identifizierung der potentiellen TPS wurden Biokatalysen durchgeführt, im GC/MS gemessen und die Produkte teilweise identifiziert. Als herausfordernd stellten sich jedoch bei den in vitro Biokatalysen die geringen Produktmengen heraus, die eine Identifizierung der Produkte mittels Masse erschwerten. Hierbei war es vor allem problematisch zwischen Hintergrundsignalen und Messwerten zu unterscheiden. Die Vereinigung von mehreren in vitro Biokatalysen zu einer konnte das Problem zwar verbessern, jedoch musste hierzu auch das Lösemittel abgedampft werden, wobei auch Produkt verloren gegangen sein könnte. Aus diesem Grund konnten die Produkte der TPS OK 1a, OK 3 und JK7 nicht eindeutig bestimmt werden. Für die potentiellen Isoenzyme OK 4a und OK 4b konnten zufriedenstellende GC/MS- Messungen generiert werden, die eine Produktidentifizierung ermöglichten. Abgesehen von den Massen dienten außerdem die RIs zur Produktidentifizierung.

4.1.10.1. Produktbestimmung von OK 4a und OK 4b

Mit HiIfe der beiden Größen konnten die Produkte der Enzyme OK 4a und OK 4b bestimmt werden. Die beiden Enzyme konnten als Isoenzyme identifiziert werden, die Myrcen und Z- (β)-Ocimen in ungefähr gleichem Verhältnis bilden. Die nachfolgenden Abbildungen zeigen das Massespektrum von OK 4a und die Referenzspektren (Datenbank-Eintrag). Abgesehen von den Massespektren (Abb. 34) stimmen bei beiden Enzymen ebenfalls die Retentionszeiten der Produkte überein (Abb. 33), was eindeutig auf Isoenzyme schließen lässt.

109

Ergebnisse

a) b)

Abb. 33: GC/MS Chromatogramme der Produkte des Enzyms OK 4a mit GPP (modifiziert übernommen aus Kracht et al. 2017). Es sind zwei Peaks sichtbar (a) welche eine identische Retentionszeit zu den Peaks der Produkte des Enzyms OK 4b mit GPP aufweisen (b). Dies lässt eindeutig auf eine isoenzymatische Aktivität zwischen OK 4a und OK 4b schließen.

a) b)

c) d)

Abb. 34: GC/MS Spektren der Produkte von OK 4a und OK 4b (modifiziert übernommen aus Kracht et al. 2017). Die Peak Nummern sind identisch zu denen in Abb. 33. Peak 1 (a) zeigt nahezu das gleiche Massespektrum auf wie Myrcen (MassFinder 4.0 Datenbank) (b). Der Peak 2 (c) zeigt ein nahezu identisches Fragmentierungsmuster zu Z-(β)-Ocimen (MassFinder 4.0 Datenbank) (d).

110

Ergebnisse

Die RIs wurden außerdem bestimmt und stimmen mit denen der Datenbank überein (s. Tab. 33).

Tab. 33: Auflistung der RIs der Produkte von OK4a und OK4b mit GPP als Substrat (modifiziert übernommen aus Kracht et al. 2017). Die Messung erfolgte am GC/MS und die RIs wurden mit der Datenbank MassFinder 4.0 verglichen. Die Peak Nummern entsprechen denen der Abb. 33.

Peak-Nr. RI (Messung) RI (Referenz) Produkt 1 985 987 Myrcen 2 1030 1029 Z-(β)-Ocimen

Durch die GC/MS-Messungen konnten OK 4a und OK 4b eindeutig als Isoenzyme identifiziert werden. Anhand des Homologie-Modells (Abb. 27) lässt sich deutlich erkennen, dass die sieben Punktmutationen hauptsächlich in den loop-Regionen und damit außerhalb der aktiven Tasche liegen. Dies war auch zu erwarten, da beide Enzyme (OK 4a und OK 4b) dieselbe Aktivität aufweisen. Das Vorhandensein von Isoenzymen lässt sich vermutlich durch verschiedene allelische Varianten der heterozygoten Pflanze erklären.

4.1.10.2. Produktbestimmung von OK 6

Weiterhin konnten die Produkte der Sesquiterpensynthase OK 6 bestimmt werden. Hierzu wurden Ganzzell-Biokatalysen angewendet, die die Produktion von hohen Sesquiterpen- Mengen erlauben. Für diese Biokatalysen wurde ein E. coli Produktionsstamm verwendet, der einen heterologen MEV-Pfadweg aus Saccharomyces cerevisiae in sich trägt (pMEVT und pMBIS Plasmide) (Martin et al. 2003). Dieser Stamm liefert hohe Substratkonzentrationen (FPP) und erlaubt daher die direkte Umsetzung des FPPs zum Sesquiterpen mit Hilfe der heterolog exprimierten TPS. Ingesamt konnten sechs Produkte mit FPP als Substrat detektiert werden (Abb. 35). Bei den weiteren Peaks handelt es sich um Verbindungen des E. coli Stamms, da diese ebenfalls in der Negativkontrolle (E. coli pMEVT mit pMBIS) ohne TPS-Gen vorgefunden wurden.

111

Ergebnisse

Abb. 35: GC/MS Chromatogramm der Produkte des Enzyms OK 6 mit FPP. Insgesamt konnte die Bildung von sechs Produkten detektiert werden.

Zur Identifizierung der Produkte wurden die Massespektren (Abb. 36) sowie die RIs (Tab. 34) herangezogen. Die Produkte Geranylacetat, Sesquisabinen B (Hauptprodukt), γ-Bisabolen sowie (E)-Nerolidol konnten mit sehr großer Wahrscheinlichkeit identifiziert werden. Ebenfalls scheinen (3Z, 6E)-α-Farnesen sowie (E, E)-α-Farnesen Produkte von OK 6 zu sein. Abgesehen von den Massespektren, zeigten auch die RIs eine hohe Übereinstimmung der von OK 6 gebildeten Produkte zu den jeweiligen Referenzen.

a.) b.)

112

Ergebnisse c.) d.)

e.) f.)

g.) h.)

113

Ergebnisse

i.) j.)

k.) l.)

Abb. 36: GC/MS Spektren der Produkte von OK 6 mit FPP als Substrat. Peak 1 (a) zeigt nahezu das gleiche Massespektrum wie Gernaylacetat (MassFinder 4.0 Datenbank) (b). Der Peak 2 (c) zeigt ein nahezu identisches Fragmentierungsmuster zu Sesquisabinene B (MassFinder 4.0 Datenbank) (d). Das Spektrum des Peaks Nummer 3 (e) zeigt Ähnlichkeiten zu dem Massespektrum von (3Z, 6E)-α-Farnesen (MassFinder 4.0 Datenbank) (f), allerdings konnten nicht alle Signale zugeordnet werden. Ebenso zeigt Peak 4 (g) Ähnlichkeiten zu dem Massespektrum von (E, E)-α-Farnesen (MassFinder 4.0 Datenbank) (h), allerdings war eine genaue Zuordnung aufgrund der geringen Produktmenge schwierig. Peak 5 (i) konnte anhand seines Massespektrums γ-Bisabolen (j) zugeordnet werden (MassFinder 4.0 Datenbank). Das Fragmentierungsmuster des Peak 6 (k) zeigt hohe Ähnlichkeit zu dem Massespektrum von (E)-Nerolidol (MassFinder 4.0 Datenbank) (l).

Die RIs der Produkte von OK 6 sowie der Referenzen sind in der nachfolgenden Tabelle aufgelistet.

114

Ergebnisse

Tab. 34: Zuordnung der RIs der Produkte von OK 6 mit FPP zu den jeweiligen Referenz-Indices. Für alle Proben ergab sich eine hohe Übereinstimmung zu den Referenzen.

Nr. RI (Messung) RI (Referenz) Produkt 1 1357 1362 Geranylacetat 2 1444 1446 Sesquisabinen B 3 1478 1480 (3Z, 6E)-α-Farnesen 4 1495 1498/1503 (E, E)-α-Farnesen 5 1516 1505 γ-Bisabolen 6 1547 1553 (E)-Nerolidol

Darüber hinaus zeigte OK 6, wie auch bereits die radioaktiv-markierten Biokatalysen vermuten ließen, Aktivität mit GPP. Da für Monoterpene kein Produktionsstamm vorhanden war, mussten hier in vitro Experimente durchgeführt werden, welche wesentlich geringere Produktmengen lieferten. Allgemein ist die Identifizierung der Produkte umso schwieriger, je geringer die Produktkonzentration ist. Geringe Produktsignale sind häufig schwer von Hintergrundsignalen zu unterscheiden. Außerdem könnten charakteristische Fragmentierungssignale fehlen, da ihre Konzentration zu gering für die Detektion ist.

Das gebildete Produkt zeigte ein für Monoterpene typisches Fragmentierungsmuster (z.B. m/z: 121, welche sich aus der Abspaltung einer Methylgruppe ergibt), sowie den Massepeak bei 136 g/mol, allerdings konnte das Terpen nicht identifiziert werden.

a.) b.)

Abb. 37: GC/MS Chromatogramm und Fragmentierungsmuster des Produktes von OK 6 mit GPP. Das Chromatogramm (hier stark vergrößert) zeigt einen Produktpeak (a), der ein für Monoterpene typisches Fragmentierungsmuster aufzeigt, sowie die molare Masse von 136 g/mol.

115

Ergebnisse

4.1.10.3. Produktbestimmung von OK 1a und OK 1b

Das Enzym OK 1b unterscheidet sich durch zehn Punktmutationen von dem Enzym OK 1a (Abb. 28). Während für OK 1a ein einzelnes Produkt gemessen werden konnte, welches jedoch nur im GC/FID detektiert werden konnte, konnten für OK 1b zwei Produkte mittels GC/MS als α- und β-Pinen identifiziert werden (Abb. 38).

Abb. 38: GC/MS Chromatogramm der Produkte von OK 1b mit GPP. Es handelt sich um die Isomere α-Pinen und β-Pinen.

a.) b.)

116

Ergebnisse

c.) d.)

Abb. 39: GC/MS-Spektren der Produkte von OK 1b mit GPP. Der erste Peak (a) zeigt eine hohe Übereinstimmung zu dem Massespektrum von α-Pinen (MassFinder 4.0 Datenbank) (b). Der zweite Peak (c) weist nahezu das selbe Fragmentierungsmuster wie β-Pinen (MassFinder 4.0 Datenbank) (d) auf.

Auch die Analyse der RIs (Tab. 35) half bei der Identifizierung der beiden Produkte und wies eine hohe Übereinstimmung zu den Referenz-Indices auf.

Tab. 35: Zuordnung der RIs der Produkte von OK 1b zu den RIs der Referenzen. Die RIs zeigten eine hohe Übereinstimmung.

Peak RI (gemessen) RI (Referenz) Produkt

1 938 936 α-Pinen

2 981 978 β-Pinen

Interessant ist hierbei, dass die vermeintlichen Isoenzyme eine unterschiedliche Anzahl an Produkten erzeugen. Es muss jedoch in Betracht gezogen werden, dass OK 1a eventuell eine geringere Aktivität aufweist als OK 1b, weshalb die generierte Produktmenge zu gering für die Detektion war.

Ebenso wie bei den Isoenzymen OK 4a und OK 4b wurde auch für diese beiden Enzyme ein Homologie-Modell erstellt (Abb. 29). Auch bei diesem scheinen die Mutationen außerhalb der aktiven Tasche vorzuliegen, was eine isozenzymatische Aktivität vermuten lässt.

117

Ergebnisse

4.1.10.4. Gesamtübersicht der pflanzlichen TPS-Aktivität

Insgesamt wurden sieben Enzyme aus der E. serrulata bezüglich ihrer Aktivität gaschromatographisch untersucht (s. Tab. 36). Vier Enzyme (OK 4a, OK 4b, OK 1a, OK 1b) zeigten ausschließlich Monoterpensynthase-Aktivität. Das Enzym OK 6 zeigte als einziges Sesquiterpensynthase-Aktivität, allerdings konnte ebenfalls eine Produktbildung mit GPP nachgewiesen werden. Zwei Enzyme (OK 3 und JK 7) zeigten keine Aktivität bei den gaschromatographischen Analysen.

Tab. 36: Gaschromatographische Bestimmung der Aktivität der sieben Enzyme aus E. serrulata. Insgesamt konnten vier Monoterpen-Synthasen und eine Sesquiterpen-Synthase mit gleichzeitiger Monoterpen- Synthase-Aktivität gefunden werden. Zwei Enzyme zeigten keine Produktbildung bei der gaschromatographischen Analyse.

Enzym Gaschromatographischer Aktivitätsnachweis

OK 1a Nur aktiv mit GPP: Produkt konnte nicht identifiziert werden, da der Nachweis nur im GC/FID erfolgte

OK 1b Nur aktiv mit GPP: Bildung von α- und β-Pinen

OK 3 Keine Aktivität nachweisbar

OK 4a Nur aktiv mit GPP: Bildung von Myrcen und Z-(β)-Ocimen

OK 4b Nur aktiv mit GPP: Bildung von Myrcen und Z-(β)-Ocimen

OK 6 Aktiv mit GPP: Bildung eines unbekannten Produktes

Aktiv mit FPP: Bildung von 6 Produkten: Geranylacetat, Sesquisabinen B, (E)-Nerolidol, (Z)-γ-Bisabolen, (E, E)-α-Farnesen, (3Z 6 E)-α-Farnesen

JK 7 Keine Aktivität nachweisbar

4.1.11. Enzym-Charakterisierung von OK 4a und OK 1a

Zur näheren Charakterisierung der Enzyme OK 4a und OK 1a wurden diese hinsichtlich ihres pH-Optimums und der Präferenz für divalente Kationen untersucht. Dies erfolgte im Rahmen der Bachelorarbeit von Dennis Sander an der Ruhr-Universität Bochum.

Zur Bestimmung des pH-Optimums wurde das Enzym jeweils mit dem modifizierten Britton- Robson-Puffer (pH 5,5-9,0), MOPS (6,5-7,5) und TXS-Puffer (7,5-8,5) getestet. Als Negativkontrolle wurde eine Biokatalyse in dem Britton-Robson-Puffer bei pH 2,5 durchgeführt, welche keine Produktbildung aufzeigte. Folgende Messungen haben sich für die beiden Produkte von OK 4a ergeben (Abb. 40).

118

Ergebnisse

0,07 0,06 0,05

0,04 Fläche Fläche - 0,03

Peak 0,02 0,01 0 5,5 6 6,5 7 7,5 8 8,5 9 pH-Wert

Abb. 40: pH-Spektrum von OK 4a in Bezug auf die Myrcen-Bildung (modifiziert übernommen aus Sander 2016). Die Messung erfolgte am GC/FID und wurde im pH-Bereich von 5,5-9 durchgeführt. Dabei wurde neben dem Britton-Robson-Puffer (blau) auch noch der MOPS-Puffer (rot) sowie der TXS-Puffer (gelb) getestet. Die Standardabweichung ergibt sich aus der Messung der biologischen Triplikate.

0,02

Fläche 0,01

- Peak

0 5,5 6 6,5 7 7,5 8 8,5 9 pH-Wert

Abb. 41: pH-Spektrum von OK 4a in Bezug auf die Z-(β)-Ocimen-Bildung (modifiziert übernommen aus Sander 2016). Die Messung erfolgte am GC/FID und wurde im pH-Bereich von 5,5-9 durchgeführt. Dabei wurde neben dem Britton-Robson-Puffer (blau) auch noch der MOPS-Puffer (rot) sowie der TXS-Puffer (gelb) getestet. Die Standardabweichung ergibt sich aus der Messung der biologischen Triplikate.

Es lässt sich deutlich erkennen, dass OK 4a ein pH-Optimum zwischen 6,5-9,0 aufzeigt. Daher scheint das Enzym wenig pH-sensitiv zu sein. Auch scheint die Veränderung des pH-Wertes keine Auswirkungen auf das Produktspektrum des Enzyms zu haben. Die Durchführung der Negativkontrolle (pH 2,5) führte, wie erwartet, zu keiner Produktbildung.

Für OK 1a stellte sich die Bestimmung des pH-Optimums als schwierig heraus, da trotz mehrfacher Wiederholungen, die Standardabweichung extrem hoch war. Somit konnte keine Aussage über das pH-Optimum von OK 1a gemacht werden.

119

Ergebnisse

Da die meisten Monoterpen-Synthasen Mn2+ statt Mg2+ favorisieren (Bohlmann et al. 1998), wurde sowohl der Einfluss von verschiedenen Mg2+- also auch Mn2+-Konzentrationen auf die Reaktion getestet. Die Reaktionen erfolgten im TXS-Puffer (pH 8,5) und wurden mit 1 mM,

5 mM, 10 mM, 25 mM und 50 mM MgCl2 bzw. 0,1 mM, 1 mM, 5 mM und 10 mM MnCl2 durchgeführt. Als Negativkontrolle dienten Ansätze ohne divalente Kationen, wobei keine Produktbildung zu verzeichnen war. Folgende Messungen ergaben sich für OK 4a (Abb. 42 und Abb. 43).

0,05

0,04

0,03

Fläche Fläche -

0,02 Peak 0,01

0 1 5 10 25 50

MgCl2-Konzentration [mM]

Abb. 42: Auswirkungen der MgCl2-Konzentration auf die Myrcen-Bildung katalysiert durch OK 4a (modifiziert übernommen aus Sander 2016). Die Messung erfolgte am GC/FID und wurde mit fünf verschiedenen MgCl2-Konzentrationen durchgeführt. Die Standardabweichung ergibt sich aus der Messung der biologischen Triplikate.

0,02 Fläche

- 0,01 Peak

0 1 5 10 25 50

MgCl2-Konzentration [mM]

Abb. 43: Auswirkungen der MgCl2-Konzentration auf die Z-(β)-Ocimen-Bildung katalysiert durch OK 4a (modifiziert übernommen aus Sander 2016). Die Messung erfolgte am GC/FID und wurde mit fünf verschiedenen MgCl2-Konzentrationen durchgeführt. Die Standardabweichung ergibt sich aus der Messung der biologischen Triplikate.

120

Ergebnisse

Die optimale Konzentration von MgCl2 lag über 5 mM. Erneut zeigt sich, dass auch die

Verwendung verschiedener MgCl2-Konzentrationen keine Auswirkungen auf das

Produktspektrum des Enzyms hat. Allerdings konnte in dieser Arbeit keine Aktivität mit MnCl2 detektiert werden, was verwunderlich war, da Monoterpen-Synthasen laut Literatur Mangan gegenüber Magnesium bevorzugen.

OK 1a war hingegen sowohl mit MnCl2 als auch mit MgCl2 aktiv. Insgesamt zeigt sich, dass es kaum Variationen in der Produktbildung unter den verschiedenen Bedingungen gibt (Abb. 44 und Abb. 45). Darüber hinaus wurde auch bei OK 1a eine Negativkontrolle ohne divalentes Kation durchgeführt, wobei bei der Biokatalyse keine Produktbildung verzeichnet werden konnte.

0,06 0,05 0,04

0,03

Fläche Fläche - 0,02

Peak 0,01 0 0,1 1 5 10 MnCl -Konzentration [mM] 2

Abb. 44: Auswirkungen der MnCl2-Konzentration auf die Produktbildung von OK 1a (modifiziert

übernommen aus Sander 2016). Die Messung erfolgte am GC/FID und wurde mit 4 verschiedenen MnCl2- Konzentrationen durchgeführt. Die Standardabweichung ergibt sich aus der Messung der biologischen Triplikate.

0,06 0,05 0,04

Fläche 0,03 -

0,02 Peak 0,01 0 1 5 10 25 50

MgCl2 Konzentration [mM]

Abb. 45: Auswirkungen der MgCl2-Konzentration auf die Produktbildung von OK 1a (modifiziert

übernommen aus Sander 2016). Die Messung erfolgte am GC/FID und wurde mit 5 verschiedenen MgCl2- Konzentrationen durchgeführt. Die Standardabweichung ergibt sich aus der Messung der biologischen Triplikate.

121

Ergebnisse

Sowohl mit Mg2+ als auch Mn2+ wird ungefähr die gleiche Produktmenge gebildet. Außerdem scheinen die verschiedenen Konzentrationen des divalenten Kations ebenfalls kaum Auswirkungen auf die Produktbildung zu haben.

4.2. Entdeckung und Identifizierung neuer TPS aus S. chartreusis

Nachdem der erste Teil dieser Studie sich mit der enzymatischen Terpendiversität von Pflanzen am Beispiel der E. serrulata befasste, sollte dieses Teilprojekt das Verständnis über bakterielle TPS erhöhen. Hierzu diente der Endophyt S. chartreusis, welcher bereits für die Bildung eines Naturstoffes, dem Antibiotikum Chartreusin, bekannt ist.

Zur Entdeckung neuer TPS aus dem Bakterium S. chartreusis wurde zunächst eine Genomsequenzierung durchgeführt. Über den Pfam-Ansatz und Hidden-Markov-Modelle sollten potentielle TPS entdeckt werden. Bislang gab es über die Terpenbildung dieses Bakteriums keine Erkenntnisse, allerdings zeigten neuere Studien, dass zahlreiche Streptomyceten Terpene bilden können (Yamada et al. 2012). Aus diesem Grund wurden die Gene potentieller TPS heterolog exprimiert und die Enzyme in biokatalytischen Untersuchungen analysiert. Die Produktbildung wurde mittels GC/MS identifiziert.

4.2.1. Generierung der genomischen DNA und NGS

Das Projekt der Entdeckung und Identifizierung neuer TPS aus dem Endophyten S. chartreusis fand im Rahmen einer Kooperation mit der AG für Angewandte Mikrobiologie von Prof. Julia Bandow der Ruhr-Universität Bochum sowie der Masterarbeit von Frau Julia Stockmann (Ruhr-Universität Bochum) statt. Da Bakterien, im Gegensatz zu Pflanzen, kein Spleißen der prä-mRNA aufweisen und deren Genome einfacher strukturiert sind, konnte hier eine Genomsequenzierung durchgeführt werden.

Die genomische DNA wurde von den Kooperationspartnern bereitgestellt. Das NGS (Illumina MiSeq Sequenzierung 2 x 300 bp) wurde von der CeBiTec (Arbeitsgruppe von Prof. Jörn Kalinowski) in Bielefeld (Deutschland) durchgeführt. Die Ergebnisse der Illumina MiSeq Sequenzierung wurden assembliert und die Contig-Zusammensetzung überprüft. Insgesamt konnten alle Gene ihrer vollen Länge generiert und assembliert werden. Obwohl es sich um einen de novo Ansatz handelte, konnten keine Assemblierungsfehler detektiert werden.

122

Ergebnisse

4.2.2. Bestimmung potentieller TPS

Potentielle TPS wurden mit dem Hidden-Markov-Modell (HHPred) und dem Pfam-Ansatz gemäß (Yamada et al. 2015) bestimmt. Insgesamt konnten sieben potentielle TPS gefunden werden. Eine nähere Analyse der Strukturmotive deutete darauf hin, dass es sich bei fünf Enzymen um Klasse I TPS handelt, wohingegen zwei weitere Enzyme Klasse II TPS-Motive (Strep_01090 und Strep_05707) aufzeigten. Die nachfolgende Tabelle (Tab. 37) zeigt die jeweils drei durch HHPred vorhergesagte Proteinfunktionen, sowie die experimentell bestimmten Produkte des Enzyms. Die fünf potentiellen Klasse I Synthasen deuten alle auf eine Sesquiterpensynthase-Aktivität hin, da sie jeweils die größte Identität zu bereits bekannten Sesquiterpensynthasen zeigen.

Insgesamt schienen alle Gene als Volllängen-Gene vorzuliegen, weshalb keine weiteren RACE-PCR-Experimente durchgeführt werden mussten. Alle potentiellen Klasse I Enzyme wiesen eines der für bakterielle TPS bekannten DDxxD- oder DDxxxD/E-Motive rund 80-105 Aminosäuren vom N-Terminus entfernt auf (Yamada et al. 2012). Abgesehen von Strep_07544 konnte auch die Asn/Ser/Glu Triade (NxxxSxxxE) in der AS-Sequenz der vier potentiellen Sesquiterpensynthasen wiedergefunden werden. Die Länge der ORFs der potentiellen Klasse I TPS variierte von 335-361 AS. Eine Ausnahme stellte das Enzym Strep_01776 dar, welches mit 720 AS fast doppelt so lang war wie die anderen vermeintlichen Sesquiterpensynthasen. Im Gegensatz zu den fünf potentiellen Sesquiterpensynthasen, zeigten die ORFs der beiden potentiellen Klasse II Enzyme keines der für bakterielle TPS konservierte Motive auf.

Da der Forschungsschwerpunkt dieser Arbeit auf der Entdeckung neuer Klasse I TPS lag, wurden die beiden potentiellen Klasse II Enzyme bzw. Transferasen (Strep_01090 und Strep_05707) für das weitere Vorgehen vernachlässigt. Aus Zeitgründen konnten nur drei der fünf Enzyme im Rahmen dieser Arbeit weiter analysiert werden (Strep_07544, Strep_01776, und Strep_07041).

123

Ergebnisse

Tab. 37: Über HHPred vorhergesagte Proteinfunktion mit zugehörigem E-Wert und PDB-Code (Tabelle modifiziert übernommen aus Stockmann 2016). Die drei nächsten Treffer wurden jeweils aufgelistet sowie das experimentell bestimmte Hauptprodukt der jeweiligen TPS. N.b.: Nicht bestimmt.

Protein PDB- Vorhersage E-Wert Produkt Code

Strep_06147 4okz Selinadien-Synthase 1,2E-57 n.b.

5a0j Labdan-Diterpen-Synthase 3,5E-50

4mc3 Hedycaryol-Synthase 9,3E-50

Strep_02673 3kb9 Epi-Isozizaen-Synthase 1,4E-57 n.b.

4mc3 Hedycaryol-Synthase 7,1E-51

5i1u Germacradien-4-ol-Synthase 9,49E-51

Strep_07544 1ps1 Pentalen-Synthase 2,9E-53 7-epi-α- Eudesmol 5i1u Germacradien-4-ol-Synthase 8,1E-52

4mc3 Hedycaryol-Synthase 8,7E-51

Strep_01776 5dz2 Germacradienol/Geosmin- 3,8E-48 Germacradien-

3v1v Synthase 5,3E-49 11-ol 2-Methylisoborneol-Synthase 4mc3 1,4E-46 Hedycaryol-Synthase

Strep_07041 5i1u Germacradien-4-ol-Synthase 4,1E-52 α-Amorphen

4mc3 Hedycaryol-Synthase 5,1E-51

4okz Selinadien-Synthase 9,7E-51

Strep_01090 1w6k Lanosterol-Synthase 8,4E-94 n.b.

2sqc Squalen-Synthase 6,7E-91

5bp8 Ent-Copalyl-Diphosphat- 5,9E-38 Synthase

Strep_05707 3dss Rab Geranyl-Geranyl- 4,5E-22 n.b. Transferase 2h6f 1,9E-20 Farnesyltransferase 1n4q 1,5E-19 Geranyltransferase

124

Ergebnisse

4.2.3. Phylogenetische Einordnung der TPS

Um die phylogenetische Verwandtschaft der Sesquiterpensynthasen zueinander abzuschätzen wurde ein phylogenetischer Baum erstellt. Darüber hinaus wurden die TPS weiterer Bakterien als auch einiger Pflanzen miteinbezogen (Abb. 46). Insgesamt zeigt der phylogenetische Baum die Verwandtschaft von 25 bakteriellen TPS (Yamada et al. 2012) und fünf pflanzlichen Enzymen. Allgemein werden TPS der Actinomyceten, zu denen auch die Streptomyceten gehören, hauptsächlich in zwei Klassen unterteilt: Die Germacradienol/Geosmin-Synthasen und die 2-Methylisoborneol/2-Methylenbornan- Synthasen. Aus diesem Grund wurde vermutet, dass die entdeckten TPS aus S. charteusis ebenfalls eine hohe Verwandtschaft zu diesen beiden Klassen aufweisen. Insgesamt zeigt jedoch nur Strep_01776 eine hohe Verwandtschaft zu einer Germacradienol-Synthase aus S. avermitilis und gruppiert sich mit weiteren bakteriellen Germacradienol-Synthasen. Die potentielle TPS Strep_07544 weist eine hohe Verwandtschaft zu einer α-Eudesmol-Synthase aus S. viridochromogenes auf. Strep_07041 hingegen weist hohe Verwandtschaft zu einer α- Amorphen-Synthase aus dem selben Organismus auf. Das Enzym Strep_02673 zeigt eine hohe Verwandtschaft zu einer epi-Isozizaen-Synthase aus S. coelicolor. Die potentielle TPS Strep_06147 weist hohe Verwandtschaft zu einer Selinadien-Synthase aus einem Streptomyceten auf. Die putative Transferase Strep_05707 sowie das vermeintliche Klasse II Enzym Strep_01090, zeigen nahezu keinerlei Verwandtschaft zu den hier aufgeführten TPS, was nicht verwunderlich ist, da keine Klasse II Enzyme in den Stammbaum miteinbezogen wurden.

125

Ergebnisse

Abb. 46: Phylogenetische Analyse der putativen TPS von S. chartreusis. Die phylogenetische Analyse wurde mit der Maximum Likelihood Methode, basierend auf dem JTT Matrix-basierten Modell (Replikate: 1000). Der phylogenetische Baum wurde mit der MEGA7 Software erstellt. Die Enzyme des S. chartreusis sind hervorgehoben. Hierbei wurden hauptsächlich bakterielle, aber auch einige pflanzliche Enzyme hinzugezogen.

4.2.4. Heterologe Expression der potentiellen TPS in E. coli

Die potentiellen TPS Gene aus dem S. chartreusis wurden teilweise aus der genomischen DNA des Bakteriums kloniert, teilweise aber auch als synthetische Gene mit Codon- Optimierung für E. coli bestellt. Anschließend wurden alle drei in E. coli heterololg exprimiert. Da Prokaryoten im Gegensatz zu Eukaryoten keine Introns aufweisen, konnte im Falle der S. chartreusis Gene eine PCR mit der genomischen DNA durchgeführt werden. Im Falle der E. serrulata Gene führten Klonierungsexperimente mit der cDNA jedoch nicht zum gewünschten Erfolg, weshalb ausschließlich synthetische Gene verwendet wurden. Ebenso wie bei den Genen der E. serrulata wurden auch im Falle der potentiellen S. chartreusis TPS Gene die verschiedenen Expressionsbedingungen getestet. 126

Ergebnisse

Wie auch bei den E. serrulata Genen, wurden jeweils die drei verschiedenen Stämme für die Expression getestet. Die Menge an löslichem Protein wurde über SDS-PAGE analysiert. Bei allen drei Genen konnte das meiste lösliche Protein bei einer Expressionstemperatur von 18 °C unter Induzierung mit 0,5 mM IPTG erzeugt werden. Für alle drei Gene wurden schlussendlich E. coli BL21(DE3) Zellen für die heterologe Genexpression verwendet. In der nachfolgenden Abbildung (Abb. 47) sind die Expressionsstudien zu den Genen strep_01776 (a-c) und strep_07544 (d-f) unter Verwendung verschiedener Stämme beispielhaft dargestellt.

Abb. 47: Expressionsstudien zu zwei Streptomyceten Genen in drei verschiedenen E. coli Stämmen (modifiziert übernommen aus Stockmann 2016). Alle Gelbilder zeigen das gleiche Beladungsschema: 1: vor Induktion, 2: 1 Std nach Induktion, 3: 2 Std nach Induktion, 4: 4 Std nach Induktion, 5: 9 Std nach Induktion, 6: Über-Nacht-Probe, M: Page Ruler unstained protein ladder (Thermo Fisher Scientific, Deutschland). Die Gelbilder a-c zeigen die Expression des Gens strep_01776 unter Verwendung verschiedener Expressionsstämme. Die erwartete Größe des Proteins liegt bei 81 kDa. Die Gelbider d-f zeigen die Expression des Gens strep_07544 unter Verwendung verschiedener Expressionsstämme. Die erwartete Größe des Proteins liegt bei 40 kDa.

Anhand der Gelbilder (Abb. 47) lässt sich erkennen, dass sich das Gen strep_01776 deutlich in E. coli BL21(DE3) und BL21(DE3)pLysS überexprimieren ließ. Durch die Zugabe von IPTG wird ein rund 80 kDa großes Protein gebildet, welches der Größe von Strep_01776 entspricht (erwartet: 81 kDa). Das Gen strep_07544 ließ sich deutlich in BL21(DE3) und BL21(DE3) Rosetta überexprimieren. Auch hier erkennt man nach circa 9 Std eindeutig die Bildung eines Proteins, welches der erwarteten Größe von 40 kDa entspricht. 127

Ergebnisse

Um zu überprüfen, ob die Proteine löslich exprimiert wurden oder in inclusion bodies vorliegen, wurden alle Zellen aufgeschlossen, zentrifugiert und der lösliche Überstand sowie das Zellpellet aufgetragen (beispielhaft gezeigt anhand von Abb. 48). Außerdem erfolgte die affinitätschromatographische Aufreinigung aller drei Streptomyceten-Proteine.

Abb. 48: Analyse der Löslichkeit und Aufreinigung der beiden Streptomyceten-Proteine Strep_01776 (a und b) und Strep_07544 (c und d). Die Abbildung wurde modifiziert aus Stockmann 2016 übernommen. Die Gelbilder zeigen alle das gleiche Beladungsschema: ÜS: löslicher Überstand nach Zellaufschluss, P: Pellet nach Zellaufschluss, DF: Durchfluss der Affinitätschromatographie nach dem Beladen der Säule mit dem Protein, W1-W3: Drei Waschfraktionen der Affinitätschromatographie, E1-E3: Drei Elutionsfraktionen der Affinitätschromatographie. Die Bilder zeigen, dass sowohl bei Strep_01776 (a) als auch bei Strep_07544 (c) mit allen drei Expressionsstämmen lösliches Protein erzeugt werden konnte. Der lösliche Überstand der BL21(DE3) Expression wurde anschließend über eine Ni-NTA-Säule aufgereinigt (b und d). Es wird deutlich, dass sowohl Strep_01776 (b) als auch Strep_07544 (d) aufgereinigt werden konnten.

Alle drei Gene konnte in allen drei Expressionsstämmen als lösliches Protein exprimiert werden. Ebenfalls konnten alle Proteine über den Hexahistidin-tag affinitätschromatographisch aufgereinigt werden. Dies ist noch einmal beispielhaft für die Enzyme Strep_01776 und Strep_07544 in Abb. 48 b und d gezeigt.

128

Ergebnisse

4.2.5. Produktbestimmung der TPS

Die Produktbestimmung der TPS erfolgte mittels GC/MS unter Bestimmung des Massespektrums, kombiniert mit dem RI (s. Abschnitt 4.1.10). Alle TPS zeigten ausschließlich Aktivität mit FPP, es konnte keine Produktbildung bei der Verwendung von GPP oder GGPP als Substrat nachgewiesen werden. Folgende Produkte ließen sich für die jeweiligen Sesquiterpensynthasen sowohl für in vivo als auch für in vitro Experimente bestimmen.

Tab. 38: Übersicht über die Enzymaktivität der Sesquiterpensynthasen aus S. chartreusis. Die Hauptprodukte konnten für alle drei Enzyme identifiziert werden. Blau: Verbindung konnte nicht eindeutig identifiziert werden.

Enzym Hauptprodukt Nebenprodukte

Strep_01776 Germacradien-11-ol Geosmin und ein unbekanntes Produkt

Strep_07544 7-epi-α-Eudesmol 10-epi-γ-Eudesmol, Elemol

Strep_07041 α-Amorphen γ-Muurolen, δ-Amorphen, zwei unbekannte Produkte

4.2.5.1. Produktbestimmung von Strep_01776

Das nachfolgende Chromatogramm (Abb. 49) zeigt die Produktverteilung des Enzyms Strep_01776. Zur Identifizierung wurden in vivo Biokatalysen durchgeführt. Insgesamt wurden drei Produkte detektiert. Bei den weiteren Peaks handelt es sich um Produkte aus E. coli, da diese auch in der Negativkontrolle (Produktionsstamm ohne rekombinantes Streptomyceten Enzym) gefunden wurden.

Abb. 49: GC/MS Chromatogramm der Produkte von Strep_01776 mit FPP. Es werden drei Produkte gebildet, wobei eines nicht identifiziert werden konnte. Das Hauptprodukt ist Germacradien-11-ol, bei dem Nebenprodukt handelt es sich um Geosmin. 129

Ergebnisse

Über folgende Massespektren und RIs wurden die Produkte identifiziert. Hierbei wurden erneut die Massespektren mit bekannten Spektren aus der Datenbank (MassFinder 4.0) verglichen. Für Geosmin war ebenfalls ein authentischer Standard vorhanden, welcher die gleiche Retentionszeit wie das Produkt von Strep_01776 aufwies.

a.) b.)

c.) d.)

Abb. 50: GC/MS Spektren der beiden identifizierten Produkte von Strep_01776. Der erste Peak (a) konnte als Geosmin (b) über einen authentischen Standard identifiziert werden. Das zweite Produkt ist unbekannt, bei dem dritten Produkt (c) handelt es sich um Germacradien-11-ol (d).

Neben den Massespektren halfen auch die RIs bzw. die Retentionszeit bei der Bestimmung der Produkte (Tab. 39). Für beide Produkte konnte hierbei eine hohe Übereinstimmung zu der jeweiligen Referenz gefunden werden.

130

Ergebnisse

Tab. 39: Zuordnung der RIs bzw. Retentionszeiten der Produkte von Strep_01776 zu denen der Referenzen. Es zeigt sich jeweils eine hohe Übereinstimmung.

Nr. RI (Messung) RI (Referenz) Produkt 1 1389 1392 Geosmin

2 1627 1633 Germacradien-11-ol

4.2.5.2. Produktbestimmung von Strep_07544

Für das Enzym Strep_07544 ergab sich folgendes Chromatogramm (Abb. 51) der Produktbildung. Zur Identifizierung wurden in vivo Biokatalysen durchgeführt. Insgesamt wurden drei Produkte detektiert. Bei den weiteren Peaks handelt es sich um Produkte aus E. coli, da diese auch in der Negativkontrolle (Produktionsstamm ohne rekombinantes Streptomyceten Enzym) gefunden wurden.

Abb. 51: GC/MS Chromatogramm der Produkte von Strep_07544 mit FPP. Es werden drei Produkte gebildet. Das Hauptprodukt ist 7-epi-α-Eudesmol, bei den Nebenprodukten handelt es sich um Elemol und 10-epi-γ- Eudesmol.

Es waren keine authentischen Standards für die Produkte kommerziell erhältlich. Jedoch besteht afrikanisches Geraniumöl zu einem Großteil aus 10-epi-γ-Eudesmol, sodass dieses ebenfalls im GC/MS untersucht und mit dem Produkt von Strep_017544 verglichen wurde. Die Retentionszeit und das Massespektrum des putativen 10-epi-γ-Eudesmol-Signals stimmte mit denen des 10-epi-γ-Eudesmols aus dem Geraniumöls überein.

Für die Produkte ergaben sich folgende Massespektren sowie Referenzspektren (Abb. 52).

131

Ergebnisse

a.) b.)

c.) d.)

e.) f.)

Abb. 52: GC/MS Spektren der beiden identifizierten Produkte von Strep_07544. Der erste Peak (a) konnte als Elemol (b) über die MassFinder 4.0 Datenbank identifiziert werden. Das zweite Produkt konnte als 10- epi-γ-Eudesmol identifiziert werden. Bei dem Hauptprodukt handelt es sich um 7-epi-α-Eudesmol.

Es ergaben sich folgende RIs bzw. Übereinstimmungen für die Retentionszeiten (Tab. 40).

132

Ergebnisse

Tab. 40: Zuordnung der RIs bzw. Retentionszeiten der Produkte von Strep_07544 zu denen der Referenzen. Es zeigt sich jeweils eine hohe Übereinstimmung.

Nr. RI (Messung) RI (Referenz) Produkt 1 1534 1541 Elemol

2 1601 1609 10-epi-γ-Eudesmol

3 1649 1653 7-epi-α-Eudesmol

4.2.5.3. Produktbestimmung von Strep_07041

Das nachfolgende Chromatogramm zeigt die Produktbildung von Strep_07041. Zur Identifizierung wurden in vivo Biokatalysen durchgeführt. Insgesamt wurden fünf Produkte detektiert, wovon jedoch nur drei identifiziert werden konnten. Bei den weiteren Peaks handelt es sich um Produkte aus E. coli, da diese auch in der Negativkontrolle (Produktionsstamm ohne rekombinantes Streptomyceten Enzym) gefunden wurden.

Abb. 53: GC/MS Chromatogramm der Produkte von Strep_07041 mit FPP. Es werden fünf Produkte gebildet, wovon zwei unbekannt sind. Das Hauptprodukt ist α-Amorphen, bei den Nebenprodukten handelt es sich höchstwahrscheinlich um γ-Muurolen und δ-Amorphen. Zwei weitere Nebenprodukte konnten nicht identifiziert werden.

Die Massespektren der drei identifizierten Peaks von Strep_07041 mit FPP sowie deren zugehörige Referenzspektren sind in Abb. 54 aufgeführt.

133

Ergebnisse

a.) b.)

c.) d.)

e.) f.)

Abb. 54: GC/MS Spektren der drei identifizierten Produkte von Strep_07041. Der erste Peak (a) konnte als α-Amorphen (b) über die MassFinder 4.0 Datenbank identifiziert werden. Bei dem zweiten Produkt (c) handelt es sich um γ-Muurolen (d). Das Fragmentierungsmuster des dritten Peaks (e) zeigt hohe Ähnlichkeit zu dem von δ-Amorphen (f).

134

Ergebnisse

Auch die RIs der drei Produkte und Referenzen halfen bei der Identifizierung der Sesquiterpensynthase Strep_07041. Die RIs der Produkte und Referenzen zeigten eine hohe Übereinstimmung.

Tab. 41: Zuordnung der RIs der identifizierten Produkte von Strep_07041 zu den RIs der Referenzen. Die RIs zeigten eine hohe Übereinstimmung.

Nr. RI (Messung) RI (Referenz) Produkt 1 1467 1477 α-Amorphen

2 1479 1474 γ-Muurolen

3 1493 1499 δ-Amorphen

4.3. Mutagenesestudien einer pflanzlichen TPS

Dieses Teilprojekt fand im Rahmen der Masterarbeit von Frau Julia Stockmann (RUB) statt (Stockmann 2016). Es wurden Mutagenesestudien mit der pflanzlichen TPS (TPS4) aus S. spicatum durchgeführt.

4.3.1. Modellierung von TPS4

TPS4 ist eine promiskuitive TPS, die sowohl mit FPP als auch mit GPP mehrere Produkte bildet. Aus der Literatur ist bekannt, dass diese promiskuitiven Enzyme sehr sensitiv gegenüber einzelnen Aminosäure-Austauschen sind (Yoshikuni et al. 2006). So kann bereits ein Aminosäure-Austausch an den plastizierbaren Resten eine Veränderung im Produktspektrum der TPS hervorrufen.

Da bereits noch keine Kristallstruktur von TPS4 vorhanden ist, wurde ein Homologie-Modell unter der Verwendung des Programmes PHYRE2 erstellt (Abb. 55)

135

Ergebnisse

Abb. 55: In silico-Modell des Enzyms TPS4 basierend auf der Struktur einer Limonen-Synthase aus Mentha spicata (pdb ID: 2ong) mit dem Inhibitor Farnesyl-Hydroxyphosphat (blau/rot) in der aktiven Tasche (übernommen aus Stockmann 2016). Das gesamte Homologie-Modell (a) zeigt in gelb das stark konservierte

RRX8W-Motiv, in grün ist das DDxxD-Motiv dargestellt. Die detallierte Darstellung der putativen aktiven Tasche (b) zeigt die potentiellen plastizierbaren Reste von TPS4.

Hierbei zeigte die Limonen-Synthase aus Mentha spicata (pdb ID: 2ong) mit 41 % die höchste Sequenzidentität zu der hier verwendeten Sesquiterpensynthase und diente daher zur Erstellung des Homologie-Modells.

Zur Bestimmung der potentiellen aktiven Tasche, wurde der Ligand Farnesyl- Hydroxyphosphat über ein Alignment mit der Kristallstruktur der Aristolochen-Synthase aus Nicotiana tabacum (pdb ID_ 5eat) in das Homologie-Modell eingefügt. Die katalytisch aktiven

Motive RRX8W und DDxxD konnten in unmittelbarer Nähe der aktiven Tasche gefunden werden.

4.3.2. Generierung der TPS4 Mutanten

Basierend auf einer anderen Studie, bei der eine γ-Humulen-Synthase aus A. grandis durch einzelne Punktmutationen ein anderes Produktspektrum aufzeigte (Yoshikuni et al. 2006), wurde auch TPS4 mutiert. In der Studie von Yoshikuni et al. konnte sowohl die Produktbildung als auch die Produktverteilung verändert werden, sodass insgesamt sieben neuartige TPS generiert wurden. Hierbei wurden vor allem die Aminosäuren W315, M447, S484 und Y566 mutiert, welche daher auch als plastizierbare Reste der γ-Humulen-Synthase gelten. Durch ein Alignment von TPS4 mit der γ-Humulen-Synthase aus der Literatur, sollten die plastizierbaren Reste von TPS4 bestimmt werden.

136

Ergebnisse

Tab. 42: Alignment von TPS4 mit der γ-Humulen-Synthase (γ-HS), welche in der Studie von Yoshikuni et al. verwendet wurde (übernommen aus Stockmann 2016). Putative plastizierbare Reste sind in Rot markiert.

Aus dem Alignment ergaben sich für TPS4 folgende potentielle plastizierbare Reste: Y288, F419, C456 und Y536, welche im weiteren Verlauf mittels QuikChange-Mutagenese mutiert wurden (s.Tab. 42). Da kein geeignetes Hochdurchsatzscreening für Mutagenesestudien an TPS vorhanden war, konnte nur eine begrenzte Anzahl an Mutanten im Rahmen dieser Arbeit erstellt werden.

Insgesamt wurden zwölf Mutanten generiert, löslich exprimiert und deren Produktbildung im GC/MS analysiert. Während neun Mutanten nur einen einzelnen Aminosäure-Austausch aufzeigten, wurden ebenfalls drei Doppelmutanten erzeugt. Weitere neun Mutanten sollten erzeugt werden, jedoch lieferte die QuikChange hier nicht das gewünschte Ergebnis bzw. die heterologe Expression konnte aus Zeitgründen nicht durchgeführt werden.

137

Ergebnisse

Tab 43: Übersicht über die generierten Mutanten von TPS4 (modifiziert übernommen aus Stockmann 2016). Zunächst wurden die Mutanten mittels QuikChange-Mutagenese generiert, anschließend in E. coli BL21(DE3) heterolog exprimiert und schlussendlich die biokatalytische Aktivität im GC/MS analysiert. Kreise bedeuten, dass der Arbeitsschritt erfolgreich war. Das Minus bedeutet, dass die Mutante nicht generiert werden konnte bzw. dass keine heterologe Expression oder GC/MS Analyse durchgeführt wurde.

Mutation Generierte Mutante Heterologe Expression GC/MS Analyse Y288F ○ ○ ○ Y288H - - - Y288P - - - Y288W ○ ○ ○ F419C ○ - - F419I ○ ○ ○ F419L ○ - - F419H - - - F419M ○ ○ ○ F419V ○ - - F419W - - - C456G ○ ○ ○ C456S ○ ○ ○ Y536A - - - Y536C ○ ○ ○ Y536I - - - Y536F ○ ○ ○ Y536W ○ ○ ○ Y288W/Y536F ○ ○ ○ C456S/Y288W ○ ○ ○ Y536F/C456S ○ ○ ○

Die Aminosäure-Substitutionen wurden so gewählt, dass sie entweder Einfluss auf die Größe innerhalb der aktiven Tasche nahmen oder die Hydrophobizität verändern sollten. Hierbei wurde von zwei Theorien ausgegangen: Eine veränderte Hydrophobizität könnte Einfluss auf die Bindungsstärke innerhalb der aktiven Tasche nehmen und eine räumliche Veränderung der aktiven Tasche könnte neue Faltungswege und daher ein anderes Produktspektrum hervorrufen (Lassila et al. 2007; Bornscheuer u. Pohl 2001). Natürlich kann eine Substitution einer Aminosäure außerdem auch zu einer unterschiedlichen Interaktion mit benachbarten Aminosäuren führen, was ebenfalls eine Veränderung des Produktspektrums hervorrufen kann.

138

Ergebnisse

4.3.3. Heterologe Expression von TPS4 und seinen Varianten

Das Gen von TPS4 wurde für E. coli Codon-optimiert und in den Expressionsvektor pET28a kloniert. Die heterologe Expression von TPS4 und seinen Varianten wurde dann in E. coli BL21(DE3) durchgeführt. Wie in Abschnitt 4.1.8 beschrieben, wurden auch hier drei verschiedene E. coli Stämme für die Expressionsstudien verwendet. Weiter wurde eine Expressionstemperatur von 30 °C und von 18 °C verwendet und mit 1 mM, 0,5 mM und 0,1 mM IPTG induziert. Die lösliche Expression dieser Bedingungen wurde jeweils mittels SDS-PAGE verglichen.

Während bei allen Proben bei 30 °C nahezu kein lösliches Protein generiert werden konnte, wiesen alle drei Stämme bei einer Expressionstemperatur von 18 °C lösliches Protein auf. Standardmäßig wurde daher der Stamm E. coli Bl21(DE3) für die Expression gewählt. Am besten geeignet schien außerdem die Induktion mit 0,5 mM IPTG. Die nachfolgenden Gelbilder zeigen die lösliche Expression und die anschließende affinitätschromatographische Aufreinigung des Proteins TPS4 (Abb. 56).

Mit dem typischen Molekulargewicht einer pflanzlichen Sesquiterpensynthase von 66 kDa, konnte die Überexpression sowie die anschließende Aufreinigung über den Hexahistidin-tag eindeutig über die SDS-PAGE nachgewiesen werden. Zwar lagen auch inclusion bodies im Zellpellet vor, dennoch konnten ausreichende Mengen an löslichem und aufgereinigtem Protein generiert werden.

Die Expression wurde nur für TPS4 optimiert und die TPS4 Mutanten auf dieselbe Weise exprimiert. Da jedoch bereits eine einzelne Mutation Auswirkung auf die lösliche Expression haben kann, wurde auch die Expression der Mutanten auf einer SDS-PAGE analysiert. Insgesamt konnten aber 12 Mutanten unter denselben Bedingungen wie TPS4 heterolog exprimiert werden. Es wurden dabei pro Liter Expressionskultur zwischen 125 mg/L und 375 mg/L aufgereinigtes Protein gewonnen.

139

Ergebnisse

a.)

b.)

Abb. 56: Heterologe Expression (a) von TPS4 in E. coli BL21(DE3) sowie die anschließende affinitätschromatographische Aufreinigung des Proteins (b). Das erwartete Molekulargewicht von TPS4 liegt bei 66 kDa. Die Expressionsstudie (a) zeigt die Genexpression vor der Induktion (v.I.), 30 min (0,5), 1 Std (1), 2 Std (2), 4 Std (4), 8 Std (8) nach Induktion, sowie die Über-Nacht-Probe (Ü.N.). Es lässt sich deutlich erkennen, dass ein Protein mit dem gewünschten Gewicht überexprimiert wird. Die Auftragung des löslichen Überstandes (Ü.S.) nach der Behandlung mit Ultraschall sowie des Zellpellets (P) verdeutlichen, dass ein Teil des Proteins löslich vorlag. Mit der anschließenden affinitätschromatographischen Aufreinigung (b) mittels Hexahistidin-tag konnte das Zielprotein mit einem Molekulargewicht von knapp 70 kDa in allen drei Elutionsfraktionen (E1, E2, E 3) aufgereinigt wiedergefunden werden. Des Weiteren sind der Durchfluss (DF), sowie die Waschfraktionen 1-3 (W1, W2, W3) der Aufreinigung auf dem SDS-Gel aufgetragen.

4.3.4. Produktbildung von TPS4

Wie in der Einleitung beschrieben, bildet die pflanzliche Sesquiterpensynthase TPS4 laut Literatur mit FPP insgesamt sechs Produkte, wovon Sesquisabinen B das Hauptprodukt ist (Moniodis et al. 2015). Obwohl Sesquiterpene und Monoterpene eigentlich in unterschiedlichen Zellkompartimenten gebildet werden, kann das Enzym ebenfalls GPP konvertieren. Hierbei entstehen ebenfalls 6 Produkte, wobei β-Pinen das Hauptprodukt darstellt.

140

Ergebnisse

4.3.4.1. Sesquiterpensynthase-Aktivität von TPS4

Zunächst wurden Experimente mit dem Wildtyp durchgeführt, um die Daten aus der Literatur zu reproduzieren. Dabei wurden in vitro Experimente sowohl mit FPP als auch mit GPP als Substrat durchgeführt. Trotz Durchführung wie in der Literatur beschrieben, konnte für FPP immer nur das Hauptprodukt, Sesquisabinen B, gemessen werden. Aufgrund der geringen Produktmengen ist es möglich, dass die Nebenprodukte im GC/MS nicht detektiert werden konnten. Aus diesem Grund wurden ebenfalls in vivo Experimente durchgeführt, welche wesentlich höhere Produktmengen liefern (Abb. 57). Auch hier konnten nur zwei der 5 vorhandenen Produkte eindeutig identifiziert werden, sodass die Literaturergebnisse nicht vollständig reproduziert werden konnten.

Abb. 57: GC/MS Chromatogramm der Produkte von TPS4 mit FPP. Es werden fünf Produkte gebildet, wovon zwei denen aus der Literatur zugeordnet werden konnten (Peak 1 und 4). Das Hauptprodukt (1) ist Sesquisabinen B, bei den Nebenprodukten konnte Peak 4 dem Sesquiphellandren zugeordnet werden.

Folgende Massespektren ergaben sich zu den jeweiligen Peaks und wurden mit den für TPS4 publizierten Produkten verglichen (Abb. 58). Erneut wurden ebenfalls die RIs der jeweiligen Produkte herangezogen und mit den Literaturangaben verglichen, um die Produktidentizierung zu ermöglichen (Tab. 44).

141

Ergebnisse a.) b.)

c.) d.)

e.) f.)

142

Ergebnisse

g.) h.)

i.) j.)

Abb. 58: GC/MS Spektren der fünf Produkte von TPS4 mit FPP, durchgeführt in in vivo Experimenten. Die Peak Nummern entsprechen dem Chromatogramm (dargestellt in Abb. 57). Der erste Peak (a), welcher ebenfalls dem Hauptprodukt entsprach, konnte als Sesquisabinen B (b) über die MassFinder 4.0 Datenbank identifiziert werden. Die weiteren Massepektren (c, e, g, i) wurden denen der Literatur (d, f, h, j) gegenübergestellt. Hierbei zeigte nur der Peak 4 (g) hohe Ähnlichkeit zu dem erwarteten Produkt Sesquiphellandren B.

Bei Betrachtung der Massespektren und der RIs (s. Tab. 44) konnten nur zwei der fünf Peaks den Produkten der Literatur sicher zugeordnet werden: Das Fragmentierungsmuster des Produktes 1 entsprach dem von Sesquisabinen B. Außerdem konnte Peak 4 dem β- Sesquiphellandren zugeordnet werden. Die weiteren drei Produkte zeigten, vor allem bei Berücksichtigung der Massespektren, wenig Übereinstimmung zu den publizierten Sesquiterpen-Produkten von TPS4. Die Daten der Literatur (Moniodis et al. 2015) konnten daher nicht vollständig reproduziert werden. 143

Ergebnisse

Tab. 44: Vergleich der RIs der Sesquiterpen-Produkte von TPS4 mit denen der Literatur (Moniodis et al. 2015). Die Peak Nummern entsprechen denen der Abb. 57.

Peak Nummer RI Messwert Produkte TPS4 Literatur RI Literatur

1 1444 Sesquisabinen B 1446

2 1472 α-Acoradien 1464

3 1495 γ-Curcumen 1503

4 1508 Sesquiphellandren B 1516

5 1517 β-Bisabolen 1503

4.3.4.2. Monoterpensynthase-Aktivität von TPS4

Auch bezüglich der Monoterpensynthase-Aktivität von TPS4 erwies sich die Zuordnung der in der Literatur beschriebenen Produkte als schwierig. Die in vitro Biokatalysen mit GPP lieferten zunächst sieben statt wie beschrieben sechs Produkte und nicht alle Peaks konnten einem Produkt zugeordnet werden (Abb. 59).

Abb. 59: GC/MS Chromatogramm von TPS4 mit GPP. Es wurden sieben Produkte detektiert, wohingegen in der Literatur nur die Produktbildung von sechs Verbindungen beschrieben ist (Moniodis et al. 2015). Peak 1 konnte α-Pinen, Peak 2 Sabinen, Peak 3 β-Pinen und Peak 4 Myrcen zugeordnet werden. Die weiteren Peaks (5, 6 und 7) scheinen nicht den aus der Literatur erwarteten Produkten zu entsprechen und konnten auch keiner anderen Verbindung zugeordnet werden.

144

Ergebnisse

Gemäß der Peak Nummern der Abb. 59 ergaben sich folgende Massespektren, wobei nur die ersten vier Produkte hohe Ähnlichkeit zu denen in der Literatur aufzeigten (Moniodis et al. 2015).

a.) b.)

c.) d.)

145

Ergebnisse

e.) f.)

g.) h.)

Abb. 60: GC/MS Spektren der vier identifizierten Produkte von TPS4 mit GPP in Anwesenheit von Mg2+. Die Peak Nummern entsprechen dem Chromatogramm, dargestellt in Abb. 59. Der erste Peak (a) konnte als α- Pinen (b) über die MassFinder 4.0 Datenbank identifiziert werden. Der zweite Peak (c) konnte als Sabinen (d) identifiziert werden. Peak Nummer 3 (e) entsprach β-Pinen (f) und Produkt 4 (g) konnte als Myrcen (h) identifiziert werden.

Für die RIs der Produkte ergaben sich folgende Werte, welche denen der Literatur gegenübergestellt wurden (Tab 45).

146

Ergebnisse

Tab 45: Vergleich der RIs der Monoterpen-Produkte von TPS4 mit denen der Literatur (Moniodis et al. 2015). Die Peak Nummern entsprechen denen der Abb. 59.

Peak Nummer RI Messwert Produkte TPS4 Literatur RI Literatur

1 933 α-Pinen 936

2 971 Sabinen 973

3 977 β-Pinen 978

4 985 Myrcen 987

5 990 Linalool 1086

6 1028 α-Terpineol 1176

7 1134 -

Die ersten vier Peaks der Produkte von TPS4 mit GPP ließen sich eindeutig denen aus der Literatur zuordnen: So stimmen die Massespektren und RIs der ersten vier Produkte mit denen von α-Pinen, Sabinen, β-Pinen und Myrcen überein. Die beiden Monoterpen-Alkohole konnten nicht identifiziert werden, stattdessen wurden drei unbekannte Produkte aufgenommen, welche im Rahmen dieser Arbeit nicht identifiziert werden konnten.

4.3.5. Mutanten mit einem veränderten Produktspektrum

Obwohl nicht alle Peaks aus der Literatur für das hier analysierte TPS4 reproduziert werden konnten, wurden einige Mutagenesestudien durchgeführt, um eventuell eine Mutante mit höherer Aktivität oder verändertem Produktspektrum zu generieren. Da kein Hochdurchsatz- Screening vorhanden war, konnte nur eine überschaubare Anzahl an Mutanten generiert, exprimiert und gemessen werden. Die 12 Mutanten wurden alle jeweils mit FPP und GPP als Substrat getestet.

4.3.5.1. Auswirkung auf Sesquiterpensynthase-Aktivität

Durch die Mutagenese konnte die Sesquiterpensynthase-Aktivität von TPS4 nicht verbessert werden oder neue Produkte generiert werden. Insgesamt waren nur sechs der 12 getesteten Mutanten überhaupt aktiv mit FPP (Tab 46). Die Varianten Y288W, F419M, C456G, Y536C, Y536F sowie die Doppelmutante Y288W/C456S zeigten zwar Umsätze mit FPP, allerdings wiesen alle von ihnen eine verringerte Aktivität gegenüber dem Wildtyp auf und bildeten meist ausschließlich Sesquisabinen B. Nur die Varianten F419M und Y288W zeigten überhaupt die

147

Ergebnisse

Bildung von Nebenprodukten, wobei bei F419M neben dem Sesquisabinen B das vermeintliche α-Acoradien bildete. Die Variante Y288W zeigte neben dem Peak für Sesquisabinen B noch zwei weitere: Mit geringen Signalen konnte im GC/MS der vermeintliche Peak für das γ-Curcumen und der Peak des potentiellen β-Bisabolen dektiert werden. Jedoch zeigte keine der Mutanten eine gesteigerte Aktivität im Vergleich zum Wildtyp oder die Bildung neuer Produkte.

4.3.5.2. Auswirkung auf die Monoterpensynthase-Aktivität

Da nicht alle sieben Peaks der Produktbildung von TPS4 mit GPP den Produkten der Literatur zugeordnet werden konnten, war es sehr anspruchsvoll, die Ergebnisse der Mutagenesestudien zu analysieren. Dennoch konnte die Mutagenese bzgl. der Monoterpensynthase-Aktivität interessante Ergebnisse liefern. Von den 12 analysierten Mutanten waren erneut lediglich sechs Mutanten überhaupt mit GPP aktiv, was eindeutig die Wichtigkeit der Aminosäurereste an dieser Position unterstreicht. Die anderen sechs Mutanten zeigten keine Aktivität mit GPP (Tab 46). Vier der aktiven Mutanten (C456G, F419M, Y288W sowie die Doppelmutante Y288W/C456S) zeigten sowohl mit FPP als auch mit GPP Aktivität, wohingegen für die Mutanten F419I und Y288F nur mit GPP Aktivität beobachtet wurde.

Keine der aktiven Mutanten wies exakt das gleiche Produktspektrum wie der Wildtyp auf (Abb. 61). Alle Mutanten (C456G, F419M, Y288W, Y288F sowie die Doppelmutante Y288W/C456S) bildeten gewisse Produkte entweder gar nicht mehr oder zeigten zum Teil eine verringerte Aktivität bei der Bildung bestimmter Produkte. So zeigt beispielsweise die Mutante F419M das größte Signal für die Produktbildung von Myrcen, wohingegen die Bildung von Sabinen, welches das höchste Signal für den Wildtyp ergab, reduziert ist. Relativ betrachtet zeigt jedoch keine der Mutanten eine signifikante Steigerung der Aktivität. Interessanterweise bildet aber die Mutante Y288F ein weiteres Produkt (Nummer 8), welches für den Wildtyp nicht detektiert werden konnte (Abb. 61). Dafür konnte das unbekannte Produkt Nummer 7 von der Variante Y288F nicht gebildet werden.

148

Ergebnisse

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkte 5, 6, 7

_

α-Pinen Sabinen β-Pinen Myrcen unbekannt

Abb. 61: Produktbildung von TPS4 und sechs Mutanten mit GPP als Substrat. Der Wildtyp TPS4 (unten) zeigt sieben Produkt-Peaks, welche unten den entsprechenden Produkten zugeordnet sind. Die Produkbildung der Mutanten wurde auf die des Wildtyps normalisiert. Keine der Mutanten zeigt eine erhöhte Produktbildung verglichen zum Wildtyp. Die Mutante TPS_Y288F jedoch zeigt die Bildung eines neuen Produktes (Peak Nummer 8).

149

Ergebnisse

Für das Produkt 8 der Mutante Y288F ergab sich das folgende Massespektrum, welches nicht identifiziert werden konnte (Abb. 62).

Abb. 62: GC/MS Spektrum des unbekannten Produktes der Mutante TPS4_Y288F mit GPP. Es handelt sich um den Peak Nummer 8 gemäß Abb. 59.

Interessanterweise zeigte die Variante TPS4_Y288F die Bildung eines neuen Produktes mit GPP, wohingegen diese Substitution zu einem Verlust der Sesquiterpensynthase-Aktivität des selben Enzymes führte. Ebenfalls interessant ist, dass die Mutation C456S zu einer Inaktivierung der Enzymaktivität mit beiden Produkten führt, die Doppelmutante Y288W/C456S aber in beiden Fällen, wenn auch eine verringerte, Aktivität aufzeigt. Bei Betrachtung der aktiven Tasche (s. Abb. 55) scheint es, als weisen die Reste Y288 und C456 keine starke räumliche Nähe zueinander auf.

150

Ergebnisse

Tab 46: Auswirkungen der 12 generierten Mutationen von TPS4 auf die Enzymaktivität mit FPP und GPP. In Rot sind die Varianten dargestellt, die mit beiden Substraten Aktivität zeigten, wohingegen in Blau die Mutanten dargestellt sind, die mit keinem der beiden Substrate Aktivität zeigten. Schwarz dargestellte Varianten zeigten jeweils mit einem der beiden Substrate Aktivität. Kreis: Aktivität, -: keine Aktivität.

Mutation Aktivität mit FPP Aktivität mit GPP Y288F - ○ Y288W ○ ○ F419I - ○ F419M ○ ○ C456G ○ ○ C456S - - Y536C ○ - Y536F ○ - Y536W - - Y288W/Y536F - - Y288W/C456S ○ ○ Y536F/C456S - -

151

Diskussion

5. Diskussion

Im Rahmen dieser Arbeit wurden verschiedene Möglichkeiten zur Generierung von Naturstoffen auf enzymatischer Ebene analysiert. Zum einen sollten neue TPS aus der Pflanze E. serrulata entdeckt und charakterisiert werden. Hierbei lag der Fokus vor allem auf der Entdeckung der Elisabethatrien-Synthase, welche die Bildung des Elisabethatriens, dem Grundgerüst der serrulatanen Diterpenoide, katalysiert. Auf der anderen Seite ist über bakterielle TPS bislang nur sehr wenig bekannt, sodass der Streptomycet S. chartreusis, zu dessen Terpenproduktion noch keine Studien bekannt sind, näher untersucht wurde. Wie bereits in der Einleitung beschrieben, diskutierten verschiedene Studien bereits die Bildung bestimmter Terpene durch Pflanzen oder aber durch die jeweiligen Endophyten. Somit könnten beispielsweise bakterielle Endophyten eine leichter zugängliche Alternative zu biosynthetischen Genen neuer Terpendiversität darstellen.

Weiter sollte eine Mutagenesestudie dazu dienen, neue Terpendiversität zu generieren und das Verständnis über die Struktur-Funktionsbeziehung pflanzlicher TPS zu erhöhen. Hierdurch sollten mehr Kenntnisse über plastizierbare Reste erzeugt werden, die dann zur Veränderung der Produktbildung anderer TPS herangezogen werden können.

5.1. Entdeckung neuer TPS aus der australischen Wüstenpflanze E. serrulata 5.1.1. Naturstoffextraktion und Induktion der E. serrulata

Zur Überprüfung, ob die im Gewächshaus der Ruhr-Universität Bochum kultivierten Pflanzen der E. serrulata überhaupt die in der Literatur beschriebenen terpenoiden Verbindungen herstellen, wurde die Naturstoffextraktion durchgeführt. Die Daten sind jedoch unschlüssig, da NMR-Daten ausstanden. Insgesamt konnten jedoch mit einem UHPLC-MS zwei der drei gemäß der Literatur zu erwartenen Massen detektiert werden (Ndi et al. 2007). Ob es sich dabei tatsächlich um die serrulatanen Diterpenoide handelt, kann nicht sicher gesagt werden.

Der Terpenmetabolismus in Pflanzen ist sehr komplex, zum einen aufgrund der unterschiedlichen Funktionen der Terpenoide, zum anderen aufgrund der großen Unterschiede in der Regulierung der Terpenbildung. Hierbei spielen vor allem räumliche und zeitliche Bedingungen innerhalb der noch zusätzlichen Pflanzenentwicklung eine wichtige Rolle (McGarvey u. Croteau 1995). Wie bereits ausführlich in der Einleitung beschrieben, ist das terpenbildene Gewebe nicht für jede Pflanze und nicht für jedes Terpen das selbe.

Eine bedeutende Fragestellung war daher im Allgemeinen, in welchem Gewebe die serrulatanen Diterpenoide der E. serrulata überhaupt gebildet werden. In dieser Studie wurden alte und junge Blätter vereint und hinsichtlich des Vorhandenseins von Terpenoiden

152

Diskussion untersucht. Da bei der Terpenbildung hohe Mengen an hydrophoben Verbindungen generiert und akkumuliert werden, müssen spezielle sekretorische Strukturen in der Pflanze gegeben sein (McGarvey u. Croteau 1995). Interessanterweise konnten in Koniferen spezielle Harzkanäle nachgewiesen werden und die Bildung von Monoterpenen konnte relativ zur Komplexität dieser Strukturen ins Verhältnis gesetzt werden. So bildet beispielsweise die Spezies Thuja plicata, welche ein einfach verzweigtes Harzzellensystem aufzeigt, nur geringe Mengen an Monoterpenen und die Aktivität der Monoterpensynthase ist sehr gering. Im Gegensatz dazu zeigten Spezies mit etwas komplexeren sekretorischen Strukturen, angefangen bei Tannen, welche Harzbläschen aufweisen, über Fichten, welche über Harzkanäle verfügen, bis hin zu Kiefern, welche ein komplexes Harzkanalsystem aufweisen, immer höhere Level an endogenen Monoterpenen. Auch die Monoterpensynthase-Aktivität konnte hierbei mit dem Grad der Spezialisierung in Zusammenhang gebracht werden. Eine wichtige Schlussfolgerung bei der Entdeckung neuer TPS aus Pflanzen ist daher, dass die Terpenproduktion sowie die dadurch bedingte TPS-Aktivität nicht in allen Pflanzen gleich stark ausgeprägt ist, sondern von der Spezialisierung der sektretorischen Systeme der Pflanzen abhängig ist.

Wie bereits in der Einleitung beschrieben, gibt es zahlreiche pflanzliche Gewebe, in denen bereits die Terpenproduktion nachgewiesen wurde. Neben den Blättern, konnten Terpene und Terpenoide beispielsweise in Früchten, Blüten und Wurzeln gefunden werden (McGarvey u. Croteau 1995; Sharon-Asa et al. 2003; Chen et al. 2004; Croteau et al. 1994; Tholl 2006). Diese Beispiele zeigen, wie weit verbereitet die Terpenbiosynthese über die verschiedenen Gewebe der Pflanzen ist und gestalten eine Vorhersage für die Entdeckung neuer TPS als schwierig. Da diese Studie die allerersten Transkriptomdaten zu einer Spezies der Gattung der Eremophila lieferte, war es problematisch, auf andere Studien der Literatur zurückzugreifen.

Da die serrulatanen Diterpenoide der E. serrulata antibakterielle Wirkungen aufzeigen (Ndi et al. 2007), handelt es sich vermutlich um Sekundärmetabolite, welche in die pflanzliche Immunabwehr involviert sind. Im Allgemeinen dienen Diterpenoide meistens als Phytoalexine, welche die Pflanze vor Pathogenen schützen und deren Ausbereitung verhindern (Cheng et al. 2007). Die ursprüngliche Entdeckung dieser serrulatanen Terpenoide aus E. serrulata erfolgte von der Gruppe um Mary Barton, welche die Naturstoffe aus den Blättern isolierte. Auch in der traditionellen Aborigine-Medizin, in der zahlreiche Eremophila Spezies zum Einsatz kommen, werden häufig die Blätter aufgrund ihrer heilenden Wirkung verwendet (Richmond u. Ghisalberti 1994). So werden zum Beispiel die Blätter der E. maculata in Wickeln verwendet, um Erkältungsbeschwerden zu lindern oder die Blätter der E. alternifolia zur Heilung auf septische Wunden aufgelegt. Aus diesen Gründen wurden in dieser Studie die Blätter der E. serrulata für die Entdeckung neuer TPS verwendet. Selbstverständlich ist es 153

Diskussion möglich, dass die Terpene nicht in den Blättern produziert werden, sondern nur dorthin transportiert werden, allerdings ist dieses eher unwahrscheinlich, da Terpene im Allgemeinen in den Geweben gebildet werden, in denen sie auch benötigt werden (McGarvey u. Croteau 1995). Ein wichtiger Punkt, der nicht außer Acht gelassen werden darf, ist außerdem, dass die serrulatanen Diterpenoide gar nicht von der Pflanze selbst, sondern von in Australien vorkommenden Endophyten gebildet werden könnten. Auf diese Hypothese wird im späteren Verlauf näher eingegangen.

Ein weiterer wichtiger Aspekt bei der Entdeckung neuer TPS aus Eukaryoten ist das Induzieren der Pflanzen sowie die temporäre Regulation der Terpenbiosynthese. Je nach Entwicklungszustand des jeweiligen Gewebes kann die Terpenbiosynthese variieren. Eine Studie zur Juckbohne zeigte während der Blattentwicklung eine 100-fach höhere Emission an Isoprenoiden als alte Blätter und das höchste Terpenoidlevel 14 Tage nach der Blattentwicklung (Kuzma u. Fall 1993). In der Blume C. breweri wurden die höchsten Level an Linalool und Linalool-Oxiden zwei Tage nach dem Öffnen der Blüte gemessen (Pichersky et al. 1994). Auf der anderen Seite zeigten Studien zu den Monoterpenen aus Pfefferminz eine Zunahme dieser mit zunehmendem Entwicklungsstadium der Blätter (Gershenzon et al. 2000). Auch konnte eine Veränderung der Terpenzusammensetzung mit dem Entwicklungsstadium der Blätter von Pfefferminz in Zusammenhang gebracht werden: Limonen und para-Menthon sind die am meisten vorkommenden Terpene in jungen Blättern. Mit voranschreitendem Entwicklungsstadium nimmt die Limonen Konzentration sehr schnell ab, wohingegen die Menthon Konzentration ansteigt. Erst im späten Entwicklungsstadium nimmt die Menthon Bildung wieder ab, wenn die Mentholbildung ansteigt.

Diese Studien sind Beispiele dafür, dass die Transkription der natürlichen Terpenbiosynthese mit dem Entwicklungsstadium des jeweiligen Gewebes in Zusammenhang steht. Es zeigt aber auch, dass nicht pauschal für alle Pflanzen ein bestimmter Zeitpunkt gesetzt werden kann, an dem die natürliche Terpenbiosynthese besonders aktiv ist. Um ein möglichst breites Spektrum abzudecken, wurden daher in dieser Studie sowohl junge als auch ältere Blätter verwendet und deren RNA vereint. Da sich diese Blätter in unterschiedlichen Entwicklungsstadien befanden, sollte hiermit die Wahrscheinlichkeit einer aktiven Diterpensynthase erhöht werden. Die Normalisierung der RNA vor dem NGS sollte anschließend dazu dienen, die womöglich nur gering transkribierten Gene im NGS besser detektieren zu können, worauf im nachfolgenden Kapitel näher eingegangen wird.

Generell gibt es verschiedene Möglichkeiten die Terpenbiosynthese in Pflanzen künstlich zu induzieren. Pflanzen emittieren flüchtige organische Verbindungen, als Teil des Sekundärmetabolismus, meistens unter „Stress-Situtationen“, die sowohl abiotischer als auch biotischer Natur sein können (Holopainen u. Gershenzon 2010). In zahlreichen Studien konnte

154

Diskussion gezeigt werden, dass starke Lichtintensitäten, hohe Temperaturen, oxidativer Stress durch hohe Ozonwerte oder aber eine negative Veränderung des Nährbodens die Emission dieser flüchtigen Verbindungen beeinflusst. Biotisch betrachet, kann vor allem ein Schädlingsbefall die Emission von Terpenen induzieren. Auch pathogene Bakterien oder Pilzinfektionen können die Terpenproduktion als Teil des pflanzlichen Abwehrsystems induzieren. Dies erklärt auch, warum die meisten Terpene und Terpenoide eine hohe Bioaktivität aufweisen. Vor allem Monoterpene, aber auch einige Sesquiterpene weisen eine ausreichende Flüchtigkeit auf, um von den Pflanzen emittiert zu werden. Auf der anderen Seite dienen Diterpene meistens als Phytoalexine, welche die Pflanze vor mikrobiellen Angriffen schützen.

Nicht alle Terpene sind induzierbar, einige werden konstitutiv gebildet. Zwar kostet die Terpensynthese den Pflanzen ein hohes Maß an Resourcen, allerdings könnte der induzierte Abwehrmechanismus zu langsam sein, um zum Beispiel einen Schädlingsangriff rechtzeitig abzuwehren (Keeling u. Bohlmann 2006). Aus diesem Grund ist es durchaus wahrscheinlich, dass Repellantien, wie beispielsweise das Eudesmol in Geranien konstitutiv gebildet werden. Da die serrulatanen Diterpenoide antibakterielle Wirkung aufzeigen, ist es fragwürdig, ob diese konstitutiv gebildet werden oder induziert werden müssen. Eine konstitutive Bildung dieser Verbindungen würde einen großen Vorteil für die Entdeckung der biosynthetischen Gene mit sich bringen.

Da die wildlebenden Eremophila Spezies in Australien, welche von den Aborigines als Heilpflanzen verwendet werden, höchstwahrscheinlich einem hohen abiotischen sowie biotischem Stress ausgesetzt sind, wird der Terpenmetabolismus dieser Pflanzen vermutlich induziert sein. Auch die in der Literatur beschriebene Studie der Naturstoffextraktion der E. serrulata wurde mit wildlebenden Pflanzen durchgeführt (Ndi et al. 2007). Während in Australien sicherlich hohe Lichtintensitäten, hohe Ozonwerte, als auch Schädlinge oder Mikroorganismen auf die Pflanzen eingewirkt haben, wurden die Pflanzen im Bochumer Gewächshaus unter optimalen Bedingungen kultiviert. Aus diesem Grund wurde versucht, die Pflanzen künstlich zu „stressen“. Hierzu wurde das Phytohormon MeJa verwendet.

Insgesamt gibt es verschiedene Methoden künstlich „Stress“ in Pflanzen zu induzieren. Neben der mechanischen Verwundung der Pflanze, z.B. mit einem Messer, können auch chemische Induktoren wie MeJa, Coronatin oder Methylsalicylsäure die Terpenbiosynthese induzieren. Jasmonsäure und seine Derivate, wie das hier verwendete MeJa, sind Phytohormone, welche über eine Vielzahl von Effekten in der Pflanze auslösen können (Boland et al. 1995). Coronatin hingegen ist ein Phytotoxin, welches aber die selben Effekte in der Pflanze hervorrufen kann. Verwundete Blätter weisen eine sehr hohe Jasmonatkonzentration auf (Baldwin 1992), was verdeutlicht, dass die Jasmonsäure in die pflanzlichen Abwehrmechanismen involviert ist. Für die Anwendung beider Verbindungen konnte in der Literatur eine Steigerung der natürlichen

155

Diskussion

Terpenbiosynthese nachgewiesen werden. In einer Studie zu Rotfichten, konnte die MeJa Behandlung in Bezug auf die Terpenoid-Bildung sogar die gleichen Effekte auf die Pflanze auswirken, wie eine Pilzinfektion oder die mechanische Verwundung der Nadeln (Martin et al. 2002; Fäldt et al. 2003).

Auch außerhalb der Koniferen konnte die positive Regulation von MeJa auf die Terpenbiosynthese bereits festgestellt werden (Rodriguez-Saona et al. 2001; Hampel et al. 2005). In der Weinrebe (Vitis vinifera) beispielsweise konnte die Behandlung von Blättern mit MeJa zu einer Steigerung der Terpenkonzentration sowie zu einer Emission zusätzlicher Terpene im Vergleich zur unbehandelten Kontrollgruppe führen (Hampel et al. 2005). In Basilikum konnte durch die Behandlung mit MeJa sogar eine Steigerung der Emission zweier Monoterpenoide um bis zu 56 % verzeichnet werden (Kim et al. 2006). Jedoch brachten die meisten Studien außerhalb der Koniferen die Induktion durch MeJa vor allem mit der Emission flüchtiger Monoterpene in Zusammenhang.

Auf der anderen Seite zeigte eine Studie zu den Pseudopterosin-bildenden Dinoflagellaten, dass die Behandlung dieser mit pflanzlichen Induktoren, wie MeJa, eine deutliche Steigerung der Pseudopterosinbiosynthese mit sich führte (Newberger et al. 2006). Es ist schwierig den Effekt von MeJa auf die Terpenbiosynthese der E. serrualta vorherzusagen, da es keine Studien zu Spezies der Gattung der Eremophila gibt. Aufgrund der Tatsache, dass MeJa in einigen anderen Pflanzen bereits die Monoterpenemission steigern konnte, in Koniferen sowie in Dinoflagellaten auch die Diterpenkonzentration beeinflusste, schien MeJa ein geeigneter Induktor für die Aktivierung der Biosynthese der serrulatanen Diterpenoide.

Abgesehen von der Wahl des Induktors, ist auch die jeweilige Konzentration, sowie die Art der Verabreichung und die Expositionsdauer entscheidend (Martin et al. 2002). So zeigte eine Studie der Gruppe rund um Jörg Bohlmann, dass das Besprühen von Picea abies (Fichte) mit 1 mM MeJa die Monoterpenkonzentration der Pflanze um ein Fünffaches erhöht im Vergleich zu nicht induzierten Pflanzen. Ein weiteres Erhöhen der MeJa Konzentration auf 10 mM konnte sogar zu einer Steigerung der Monoterpenkonzentration um ein 12-faches führen. Eine noch weitere Steigerung der MeJa Konzentration auf 100 mM führte jedoch wieder zu einer Reduktion der Monoterpenkonzentration, allerdings war diese immer noch 7-fach erhöht, gegenüber der Kontrollgruppe. Es lässt sich vermuten, dass eine zu hohe Konzentration an MeJa einen negativen Effekt auf die Entwicklung und das Wachstum der Pflanze haben. Auch für die Produktion der Diterpene in dieser Pflanze konnte ein ähnlicher Trend bemessen werden (Martin et al. 2002). So brachte auch hier die Induktion mit 10 mM MeJa die höchste Diterpen-Produktion mit sich. Im Gegensatz dazu konnte die Bildung von Sesquiterpenen in der Fichte durch die Induktion mit MeJa überhaupt nicht beeinflusst werden. Auch zeigten die Bildung der Mono- und Diterpene zu unterschiedlichen Zeitpunkten ihr Maximum: Während

156

Diskussion die Monoterpene bereits 18 Tage nach der Induktion mit MeJa die höchste Konzentration aufzeigten und danach wieder abgebaut wurden, konnte die maximale Diterpen Konzentration erst nach 25 Tagen gemessen werden.

Auch wenn sich diese Studie mit Gymnospermen befasst hat, zeigt sie ganz deutlich wie schwierig die optimale Induktion der Terpenbiosynthese und die Bestimmung des optimalen Zeitpunktes des Erntens ist. So ist dieses Phytohormon kein „universaler“ Induktor für alle Terpene, wie anhand der Sesquiterpene für Koniferen gezeigt werden konnte (Martin et al. 2002). Auch scheinen die Monoterpen Produktion und die Diterpen Produktion zu unterschiedlichen Zeitpunkten maximal reguliert zu sein. Ebenfalls ist das Vergleichen der in der Literatur verwendeten Induktor-Konzentrationen untereinander schwierig: Durch die unterschiedliche Beschaffenheit der Blätter der verschiedenen Pflanzen, kann nicht genau bestimmt werden, wieviel des Induktors letzendlich in die Zellen gelangt. In der beschriebenen Studie zu den Koniferen wurden 10 mM MeJa verwendet (Martin et al. 2002), wohingegen in einer anderen Studie zur Emission von Terpenen aus Basilikum 0,5 mM MeJa angewendet wurden (Kim et al. 2006). Vermutlich gelangt durch die robusten Nadeln der Fichten kaum etwas von dem Pflanzenhormon in die Zellen, wohingegen die leichte Beschaffenheit der Basilikumblätter höchstwahrscheinlich durchlässiger für das Phytohormon ist.

Vor allem die alten Blätter der E. serrulata weisen eine wachsige, harte Schicht auf. Aus diesem Grund wird angenommen, dass ein Großteil des MeJas, welches auf die Blätter gegeben wurde, überhaupt nicht von der Pflanze aufgenommen wurde. Im Gegensatz dazu, sind die jungen Blätter derselben Pflanze eher weich und werden vermutlich nur eine geringe Schutzschicht für die Pflanze darstellen. Um die Terpenbiosynthese in beiden Geweben gleichermaßen zu induzieren, wurde ein Experiment durchgeführt, bei dem die Pflanzen mit einer 10 µM MeJa-Lösung gegossen wurden (Daten nicht gezeigt). Da dies aber zu einem Absterben der kompletten Pflanze führte, konnte diese Form der Induktion nicht weiter verwendet werden. Aus diesem Grund wurden die Blätter anschließend mit 10 µM MeJa eingepinselt. Da diese, wenn auch eher geringe Konzentration an MeJa, bereits zu einem Eingehen der Pflanze geführt hatte, wurde diese Konzentration als ausreichend erachtet, um künstlich einen Stress in der Pflanze hervorzurufen. Aufgrund der unterschiedlichen Beschaffenheit der jungen und alten Blätter ist es aber durchaus wahrscheinlich, dass die Terpenbiosynthese in den verschiedenen Blättern derselben Pflanze unterschiedlich stark induziert wurde.

Auch die Dauer der MeJa Exposition kann die Stressantwort der Pflanze und die damit generierte Terpenbildung beeinflussen. Wie bereits beschrieben, fand in Koniferen die Mono- und Diterpenproduktion 18 bzw. 25 Tage nach der MeJa Behandlung ihren Höhepunkt (Martin et al. 2002), wohingegen die MeJa Behandlung in Basilikum bereits nach 3 Std zu einer

157

Diskussion erhöhten Emission der Monoterpene führte (Kim et al. 2006). In dieser Studie wurde die E. serrulata für 24 Std mit der MeJa-Lösung inkubiert. Da die Inkubationszeiten mit dem Induktor je nach Pflanze in der Literatur stark variieren, war es schwierig, den optimalen Zeitpunkt der Blätterentnahme zu bestimmen. Da bei den mit MeJa gegossenen Pflanzen bereits nach 24 Std enorme Vitalitätsverluste zu verzeichnen waren, wie z.B. das Herabfallen oder Herunterhängen der Blätter, wurde davon ausgegangen, dass nach einem Tag die Stressantwort der E. serrulata bereits aktiviert wurde, aber nicht ausreichend war, um den negativen Effekt des MeJas auf die Entwicklung der Pflanze zu verhindern.

Zusammenfassend lässt sich daher sagen, dass zahlreiche Faktoren Einfluss auf die Entdeckung neuer pflanzlicher TPS nehmen können. Neben der Wahl des zu untersuchenden Gewebes, ist auch die Wahl des Induktors, sowie dessen Konzentration und Expositionsdauer entscheidend und je nach Pflanze verschieden. Literaturvergleiche lassen aufgrund der unterschiedlichen Beschaffenheit der einzelnen Gewebe, wie z.B der Blätter, kaum Rückschlüsse auf die idealen Induktionsbedingungen für die zu untersuchende Pflanze zu.

Ein weiterer wichtiger Aspekt dieser Studie, ist die Frage nach dem eigentlichen Produzenten der serrulatanen Diterpenoide. Wie bereits in der Einleitung erwähnt, ist diese Thematik nicht zu vernachlässigen, wie anhand des Beispiels der Antillogorgia elisabethathae gezeigt werden konnte (Mydlarz et al. 2003). Die Tatsache, dass womöglich Dinoflagellaten statt der Koralle die wertvollen Pseudopterosine bilden, lässt sich auch auf die Pflanzenwelt übertragen: Es kann nicht ausgeschlossen werden, dass die von den australischen Ureinwohnern verwendeten Eremophila Spezies mit Endophyten in Symbiose leben, welche die wertvollen Verbindungen produzieren. Auch die Studie rund um Mary Barton zur Naturstoffextraktion der E. serrulata Blätter wurde mit wildlebenden Pflanzen durchgeführt (Ndi et al. 2007). Diese könnten ebenfalls mit Endophyten, wie z.B. einem Pilz oder einem Streptomyceten in Symbiose gelebt haben, sodass die bioaktiven Verbindungen in den Extrakten vorzufinden waren. Diese These wird vor allem durch den derzeitigen Stand der Forschung zu dem Mechanismus der TPS verstärkt: Der postulierte Mechanismus der Elisabethatrien-Synthase aus der Koralle bzw. dem Symbionten zeigt die Bildung des Elisabethatriens über eine Klasse I Diterpensynthase (s. Abb. 63) (Brück u. Kerr 2006). Ausgehend von GGPP wird ein Carbokation gebildet, welches anschließend zum Elisabethatrien zyklisiert wird.

158

Diskussion

Abb. 63: Postulierter Mechanismus der Elisabethatrien-Synthase ausgehend von GGPP (postuliert durch Brück u. Kerr 2006). Gemäß einer Klasse I Diterpensynthase erfolgt die Zyklisierung des Carbokations zu Elisabethatrien.

Im Gegensatz dazu beginnt der Reaktionsmechanismus der Klasse II Enzyme mit der Protonierungs-induzierten Zyklisierung des Substrates, wobei für gewöhnlich ein bizyklisches Diphosphat, wie das ent-Copalyl-Diphosphat gebildet wird (s. Abb. 5). Bei Betrachtung des Mechanimus einer Klasse II TPS wird deutlich, dass die Bildung des Elisabethatriens nicht über diese Enzymklasse ablaufen kann, da die Zyklisierung des GGPP-Substrates für gewöhnlich an der C14-C15 Doppelbindung beginnt (Schrader et al. 2015).

Der bisherige Stand der Wissenschaft zu Diterpensynthasen aus Pflanzen zeigt jedoch, dass reine Klasse I Diterpensynthasen aus Angiospermen, zu denen auch die E. serrulata gehört, nur makrozyklische oder azyklische Diterpene bilden (Zerbe et al. 2013). Bi- oder polyzyklische Diterpene werden in Angiospermen über zwei Stufen generiert: Zunächst wird über eine Klasse II Diterpensynthase ein bizyklisches Diphosphat-Intermediat gebildet, welches dann als Substrat für ein weiteres Klasse I Enzym dient, sodass das finale Diterpen gebildet werden kann. Diterpensynthasen aus Gymnospermen verfügen über zwei aktive Taschen und tragen daher beide Funktionen in sich. Aufgrund dieser Tatsache deutet der postulierte Mechanismus der Elisabethatrien-Synthase eher auf die Bildung durch Endophyten als durch die Pflanze hin.

Es kann zwar in Betracht gezogen werden, dass der postulierte Mechanismus der Elisabethatrien-Bildung anders abläuft, allerdings stellt sich dann die Frage, wie das phosphorylierte Intermediat aussehen könnte. Außerdem konnte keine putative Klasse II Diterpensynthase in den Transkriptomdaten der E. serrulata gefunden werden. Eine weitere, jedoch eher unwahrscheinliche Möglichkeit wäre, dass die Klasse I Enzyme der Eremophila Gattung GGPP als Substrat direkt zyklisieren können. Bislang sind, abgesehen von dieser

159

Diskussion

Studie, keine TPS oder Transkriptomdaten zur Eremophila Gattung publiziert, sodass hier keine Vergleiche gezogen werden können. Da die Eremophila Gattung aber ebenfalls zur Ordnung der Lamiales gehört, ist dies sehr unwahrscheinlich, da bisher alle bi- oder polyzyklischen Diterpene dieser Ordnung mit Hilfe von zwei verschiedenen Diterpensynthasen gebildet wurden.

Die Daten der Naturstoffextraktion der E. serrulata Blätter aus den Gewächshaus der Ruhr- Universität Bochum zeigen zwei der drei erwarteten Massen serrulataner Diterpenoide. Da NMR Experimente ausstanden, konnte nicht bestätigt werden, dass es sich tatsächlich um die gewünschten Verbindungen handelte. Allgemein gibt es Studien, die berichten, dass bereits die Samen einer Pflanze mit Endophyten infiziert sein können (Latch et al. 1987; Ganley u. Newcombe 2006). Dies konnte sowohl für fungale (Ganley u. Newcombe 2006) als auch für bakterielle Endophyten (Cankar et al. 2005) gezeigt werden, allerdings wiesen die Samen eine wesentlich geringere Vielfalt an Endophyten als die Blätter auf. Auch ist die Wahrscheinlichkeit einer Samen-Infektion derer, welche aus wild-lebenden Pflanzen kommen höher, als derer, die aus einer Kultivierung stammen (Latch et al. 1987). Über die Endophyten der Eremophila Gattung ist bislang wenig bekannt. Es konnte aber gezeigt werden, dass die Blätter der Spezies Eremophila longifolia 17 verschiedene fungale Endophyten aufwiesen (Zaferanloo et al. 2013), was verdeutlicht, dass vermutlich auch die E. serrulata über Endophyten verfügt. Ein Zusammenhang zwischen der Eremophila Gattung und bakteriellen Endophyten wurde in der Literatur bislang nicht untersucht.

Sofern die Endophyten in den Samen der im Gewächshaus der RUB kultivierten Eremophila Spezies vorhanden waren, hätten die gebildeten Naturstoffe ebenfalls auf die Naturstoffextraktion der Blätter Einfluss genommen. Eine interessante Tatsache ist, dass bereits ein Streptomycet bekannt ist, der Isoelisabethatrien, ein Derivat des Elisabethatriens, bildet (Yamada et al. 2015). Es ist daher durchaus wahrscheinlich, dass nicht die Pflanze selbst, sondern ein Endophyt, wie beispielsweise ein Streptomycet, die serrulatanen Diterpenoide bildet.

5.1.2. Betrachtung der NGS Daten und der Transkriptom Zusammensetzung

Wie in der Einleitung beschrieben, wurde in den letzten Jahren sehr viel Forschungs- und Entwicklungsarbeit im Bereich des NGS geleistet, sodass derzeit zahlreiche Methoden zur Verfügung stehen.

Wichtige Punkte, die bei einer Transkriptomsequenzierung besondere Anwendung finden, sind vor allem die Länge der generierten reads, die Sequenziertiefe, die Sequenziergenauigkeit, die Dauer des Sequenzierungsprozesses und die anschließende Verarbeitung des

160

Diskussion

Datensatzes. Selbstverständlich ist aber auch der Preis entscheidend, so kostet beispielsweise eine PacBio Sequenzierung nahezu doppelt so viel wie eine Illumina MiSeq Transkriptomsequenzierung. Eine Transkriptomsequenzierung von Nicht-Modell-Pflanzen mit der PacBio Methode war zu Beginn dieser Studie nicht kommerziell erhältlich. Heutzutage bietet bereits die erste Firma pflanzliche Transkriptomsequenzierungen mit der PacBio- Methode an, was die Aktualität der derzeitigen Forschungs- und Etablierungsarbeiten in diesem Bereich verdeutlicht.

In der Literatur sind für die Sequenzierung von Pflanzentranskriptomen vor allem zwei Methoden weit verbreitet: die Roche 454 Sequenzierung sowie die Illumina Technologie (Xiao et al. 2013). Allgemein werden bei der Entdeckung neuer TPS aus Nicht-Modell-Pflanzen häufig Transkriptome statt Genome zur Auswertung herangezogen (Wenping et al. 2011; Keeling et al. 2011; Han et al. 2013), da die Sequenzierung dieser wesentlich kostengünstiger ist und keine störenden Introns detektiert werden (Nowrousian 2010). Eine Vorhersage, welche der beiden Methoden für das jeweilige Pflanzentranskriptom besser geeignet ist, ist schwierig. Eine vorherige Normalisierung der mRNA soll dazu dienen, die häufig unterrepräsentativen Transkripte der TPS Gene auf die gesamten Transkripte zu normalisieren und diese damit im NGS besser zu detektieren. Diese Methode ist bei Studien zur Entdeckung neuer pflanzlicher biosynthetischer Terpenbildung weit verbreitet (Pickel et al. 2012; Hall et al. 2013a).

In einer Studie der Gruppe um Christoph Sensen aus dem Jahr 2013 wurden die beiden gängigen Sequenzierungsmethoden für verschiedene Pflanzentranskriptome miteinander verglichen (Xiao et al. 2013). Allgemein konnten mit der Illumina Methode rund 100x mehr reads generiert werden, welche zusätzlich eine größere Länge aufwiesen als bei der Roche 454 Sequenzierung. Auch zeigte die Illumina Methode eine mindestens 5-fach höhere Sequenziertiefe, sodass ingesamt die Gene besser annotiert und mehr Volllängen-Gene generiert werden konnten als bei der anderen Methode (Xiao et al. 2013).

Aus diesem Grund wurde in der hier beschriebenen Studie die Illumina MiSeq Sequenzierung angewendet. Allgemein konnten nur sehr wenige Volllängen-TPS Gene gefunden werden und die Annotierung erwies sich in den meisten Fällen als problematisch. So konnten zahlreiche potentielle TPS Gene nicht über PCR aus der cDNA rekonstruiert werden, was darauf hindeutet, dass die Assemblierung fehlerhaft war. Vor allem eine de novo Assembierung höherer Eukaryoten kann bei geringer Sequenziertiefe und einem hohen Datenset Probleme aufweisen (Xiao et al. 2013). Durch ein geringes Maß an Überlappungen ist es schwierig die Transkripte entsprechend zu assemblieren. Auch wurden Sequenzierungsartefakte und Primer-Adapter Kontaminationen in den generierten Daten gefunden, welche häufig bei Illumina Sequenzierungen auftreten. Für eine Variablität der Sequenziertiefe wurden bereits

161

Diskussion mehrere Möglichkeiten postuliert, welche mit der PCR in Zusammenhang stehen: Stein et al. beispielsweise berichten, dass die Ausbildung von Sekundärstrukturen in der ss-DNA zu Problemen während der PCR und damit zu einer geringen coverage führt (Stein et al. 2010). Eine andere Studie berichtet von Problemen bei AT-reichen repetitiven Regionen (Harismendy et al. 2009). Auch GCG Sequenzen und invertierte repeats können sich negativ auf die Sequenzierung und die Überlappung der Transkripte auswirken (Nakamura et al. 2011).

Eine Möglichkeit diese Problematiken zu unterbinden, ist eine Kombination aus zwei Sequenzierungsmethoden für ein Transkriptom (Chu u. Corey 2012). Aus diesem Grund verwenden bereits einige Studien in der Literatur eine Kombination aus verschiedenen NGS Methoden wie der Illumina und der Roche 454 Sequenzierung (Zerbe et al. 2013; Hall et al. 2013b) . Auch in der bereits erwähnten Studie der Gruppe um Christoph Sensen konnten durch die Kombination aus beiden Sequenzierungen 40 Prozent mehr Volllängen-Gene generiert werden als allein durch die Illumina Sequenzierung (Xiao et al. 2013). Allerdings ist eine Kombination aus beiden Methoden auch durchaus kostspieliger und konnte daher im Rahmen dieser Studie nicht durchgeführt werden.

Bereits im Verlauf dieser Arbeit war eine enorme Entwicklung im Bereich des NGS zu vernehmen. Die PacBio Sequenzierungsmethode findet beispielsweise bei weitem nicht so große Anwendung in den bislang publizierten Studien zu Pflanzentranskriptomen, vermutlich aufgrund des hohen Preises, der relativen Neuheit sowie der wenigen Firmen, die diesen Service für RNA Sequenzierungen kommerziell anbieten. Ein großes Problem bei der Analyse der E. serrulata Transkriptomdaten war die häufig falsche Annotierung der Gene. Die Generierung längerer reads mit einer besseren Sequenziertiefe könnte hierbei Abhilfe schaffen (Chu u. Corey 2012). Mit Hilfe der PacBio-Methode können reads mit einer Länge von über 1.000 Nukleotiden erzeugt werden (Chu u. Corey 2012; van Dijk et al. 2014), was vermuten lässt, dass diese Methode nach einigen weiteren Etablierungsarbeiten in den nächsten Jahren eine gängige Technik zur Aufklärung pflanzlicher Transkriptome darstellen wird. Ein großes Problem derzeit ist jedoch die hohe Anzahl an Sequenzierungsfehlern der PacBio Methode. Während die Illumina MiSeq Sequenzierung eine Fehlerrate von rund 0,8 Prozent aufweist, sind es bei der PacBio Methode über 12 Prozent. Die geringe Fehlerrate der Illumina MiSeq Sequenzierung konnte auch in dieser Studie bestätigt werden. So konnten bei der Resquenzierung mit Sanger keine Abweichungen zu den Illumina Sequenzen festgestellt werden. Bei der Entdeckung neuer biosynthetischer Gene der Terpenbildung sollte die hohe Fehlerrate der PacBio Technik aber kein allzu großes Problem darstellen, da auch hier die Gene manuell mit Hilfe der traditionellen Sanger Sequenzierung erneut überprüft werden können.

162

Diskussion

Auch wenn die Illumina Sequenzierung eine sehr hohe Sequenzierungsgenauigkeit aufweist, zeigt die hier beschriebene Studie jedoch, wie wichtig es ist, die Daten kritisch zu betrachten und noch einmal zu analysieren. Nur durch die Resquenzierung der Daten mittels Sanger konnten beispielsweise die vermeintlichen isoenzymatischen Varianten der Gene ok 1a und ok 4a entdeckt werden. In beiden Fällen konnte die isoenzymatische Variante nicht in den NGS Daten wiedergefunden werden, was auf eine zu geringe Sequenziertiefe der Illumina Sequenzierung hindeutet (Weißmann u. Gilissen 2014). Die Sequenziertiefe gibt die Anzahl der reads, die einer bestimmten Position zugeordnet werden können, an. Je besser die Sequenziertiefe, umso wahrscheinlicher ist die Entdeckung verschiedener heterozygoter Varianten. Es ist durchaus wahrscheinlich, dass das Vorhandensein von Isoenzymen auf verschiedene allelische Varianten der heterozygoten Pflanze zurückzuführen ist. Eine Studie zu Sesquiterpensynthasen aus Mais zeigte eine Substitution von vier Aminosäuren zwischen den unterschiedlichen allelischen Varianten (Köllner et al. 2004), was verdeutlicht, dass dieses für Pflanzen nicht ungewöhnlich ist (Köllner et al. 2004; Bouwmeester et al. 2002). Dass diese für die E. serrulata Enzyme beim NGS nicht detektiert wurden, zeigt die Wichtigkeit der erneuten Begutachtung der Gene mittels Sanger Sequenzierung.

Ein wichtiger Punkt ist außerdem, dass beim NGS ein Poly(A)-fishing zu Beginn durchgeführt wurde, um die Datenmenge hauptsächlich auf mRNA zu reduzieren und auch Kontaminationen durch beispielsweise bakterielle RNA einzuschränken. Dies bedeutet, dass im Falle eines bakteriellen Endophyten, der als Diterpen-Produzent in Frage kommen könnte, das Gen für die aktive TPS nicht berücksichtigt worden wäre.

Die Auswertung der Transkriptomdaten zeigt, dass durch Vergleich mit den gängigen Datenbanken 53,4 % der ORFs der assemblierten Gene keine Ähnlichkeiten zu anderen Proteinen aufweisen. Ihre Funktion ist daher unbekannt. Diese Zahl schien recht hoch und ist vermutlich auf Assemblierungsfehler bzw. zu kurze Genfragmente zurückzuführen. Verglichen mit anderen mittels Illumina sequenzierten pflanzlichen Transkriptomen wird ebenfalls die eher geringe Qualität der für die E. serrulata durchgeführten de novo Assemblierung deutlich: Während beispielsweise bei der de novo Transkriptomanalyse von Sesamum indicum lediglich 44 % der ORFs keinem bekannten Protein zugeordnet werden konnten (Wei et al. 2011), waren es bei der Färberdistel nur 42 % (Lulin et al. 2012) und bei der de novo Analyse der Süßkartoffel sogar nur 38 % der potentiellen ORFs (Wang et al. 2010). Auch wenn diese Pflanzen nahezu keine Verwandtschaft zu der E. serrulata aufweisen, zeigen diese Studien, welche ebenfalls auf der Illumina Sequenzierung mit anschließender de novo Assemblierung basieren, ganz deutlich, dass die Assemblierung der E. serrulata Transkripte nicht optimal war. Dies konnte im Rahmen dieser Studie ebenfalls für die potentiellen TPS Transkripte festgestellt werden.

163

Diskussion

Dennoch ist das hier beschriebene Transkriptom der E. serrulata das erste publizierte Transkriptom der Gattung der Eremophila und bildet daher die Grundlage für die Aufklärung von Biosynthesewegen in dieser wichtigen Gattung der Naturstoffproduzenten.

5.1.3. Generierung von Volllängen-Genen mittels RACE-PCR

Die RACE-PCR zur Generierung von Volllängen-Genen erwies sich bei der Entdeckung neuer TPS als sehr anspruchsvoll. Insgesamt konnten in dieser Arbeit drei Enden von Genfragmenten verlängert werden. Häufig wurde entweder gar kein oder aber ein unspezifisches PCR-Produkt generiert. Allgemein ist die RACE-PCR jedoch eine gängige Methode zur Entdeckung neuer Volllängen TPS Gene aus Pflanzen (Landmann et al. 2007; Fischbach et al. 2001; Yu et al. 2008). In dieser Studie konnte mit Hilfe der RACE-PCR insgesamt ein TPS Genfragment an beiden Enden vervollständigt werden. Dies ist jedoch nicht ungewöhnlich, denn auch in anderen Studien war die RACE-PCR bereits der limitierende Faktor bei der Entdeckung neuer TPS-Aktivität. So wurden in der beschriebenen Studie zur Entdeckung neuer TPS Gene aus S. spicatum (s. Kapitel 2.2.3.5.2) insgesamt sieben potentielle TPS Genfragmente gefunden (Moniodis et al. 2015). Mittels RACE-PCR konnte lediglich das Gen tps4 vervollständigt werden. Da dieses Gen eine Sesquisabinen B Aktivität aufweist, blieb die Identifizierung der wichtigen Gene, welche in die Biosynthese des Sandelholz-Öls involviert sind, aus. Die Herausforderung der Generierung von Volllängen- Genen mittels RACE-PCR zeigt erneut, wie wichtig die Etablierung möglichst langer Transkripte im NGS mit einer guten Assemblierung ist.

5.1.4. Heterologe Genexpression pflanzlicher TPS in E. coli

Die heterologe Genexpression pflanzlicher Enzyme in E. coli ist meistens mit enormen Problemen verbunden (Yesilirmak u. Sayers 2009). Ein großes Problem ist häufig, dass E. coli keine posttranslationalen Modifikationen durchführen kann. Auch eukaryotische Proteine, die eine hohe Anzahl an Disulfidbrücken ausbilden, lassen sich nur schwierig rekombinant in E. coli generieren. Daher kommt es häufig zu Fehlfaltungen der gewünschten Proteine und zur Bildung von Proteinaggregaten, den sogenannten Einschlusskörperchen, durch E. coli. Zwar gibt es bereits einige Möglichkeiten zur Renaturierung der in Einschlusskörperchen vorliegenden Proteine, dennoch sind diese Methoden nicht trivial und resultieren häufig in geringen Ausbeuten (Hill et al. 1996; Tsumoto et al. 2003). Darum werden pflanzliche Gene auch häufig in eukaryotischen Wirten, wie Hefen, Insekten- oder aber Pflanzenzellen heterolog exprimiert (Yesilirmak u. Sayers 2009). Diese Wirte bieten den Vorteil, dass sie über Mechanismen zur posttranslationalen Modifikation der rekombinaten Enzyme verfügen.

164

Diskussion

Darüber hinaus ist die Proteinfaltung in eukaryotischen Zellen häufig erleichtert, da sich Disulfidbrücken ausbilden können und Signalsequenzen weiterverarbeitet werden können. Große Nachteile der Verwendung von eukaryotischen Wirten, vor allem der Insekten- und Pflanzenzellen, ist die Aufwändigkeit der Konstruktion von Expressionsvektoren, die schwierige Handhabung, die speziellen Laborausstattungen sowie das langsame Wachstum.

Daher bleibt E. coli aufgrund seiner leichten Handhabung, schnellen Zellteilung und geringen Kosten dennoch die erste Wahl als Wirt für die heterologe Expression von Genen (Yesilirmak u. Sayers 2009). Da die meisten TPS keine posttranslationalen Modifikationen benötigen, konnten bereits zahlreiche pflanzliche TPS Gene in E. coli überexprimiert werden (Bertea et al. 2006; Wise et al. 1998; Schnee et al. 2002). Auch in dieser Studie konnte unter Verwendung einer für E. coli Codon-optimierten Gensequenz eine hohe Ausbeute an löslichem Protein gebildet werden.

Die größten Probleme bei der löslichen Expression pflanzlicher TPS in E. coli sind zum einen die Transitsequenzen von Mono- und Diterpensynthasen sowie die Verwendung seltener Codons, speziell für die Aminosäure Arginin (Williams et al. 1998; Bohlmann et al. 1998). Da, wie in der Einleitung beschrieben, bekannt ist, dass die Transitsequenzen der Mono- und Diterpensynthasen häufig zu Problemen bei der heterologen Expression in E. coli führen (Bohlmann et al. 1998), wurden im Falle des hier entdeckten Enzymes OK 3 zwei verschiedene Varianten des Genes in den Expressionsvektor kloniert. Die Verwendung von Trunkierungsvarianten, welchen die N-terminale Signalsequenz fehlt, kann zu einer löslichen Expression des „pseudogereiften“ aktiven Proteins führen (Williams et al. 1998). Da sowohl das ursprüngliche, als auch das trunkierte Gen teilweise löslich in E. coli exprimiert werden konnte, wurde die Trunkierungsvariante in dieser Studie vernachlässigt. Da es äußerst schwierig ist pflanzliche Transitsequenzen vorherzusagen, wurde die Trunkierungsvariante vernachlässigt, da ein Deletieren zu vieler Aminosäuren am N-Terminus ebenfalls zu einem Aktivitätsverlust des Enzyms führen kann (Williams et al. 2000). Auch für die Monoterpensynthasen der E. serrulata konnten die Gene problemlos in E. coli überexprimiert werden, sodass keine Trunkierungsvarianten erstellt werden mussten. Da in dieser Studie ausschließlich Codon-optimierte Gene für E. coli verwendet wurden, stellten die seltenen Arginin Codons ebenfalls kein Problem dar. Die Expression aller in dieser Studie entdecken TPS wurde, wie im Ergebnisteil beschrieben, in drei verschiedenen E. coli Stämmen durchgeführt und verglichen. Am besten eigneten sich der unmodifzierte Stamm E. coli BL21(DE3) sowie die Variante E. coli BL21(DE3)pLysS, welche eine verringerte Basaltranskription aufzeigt. Der Stamm E. coli Rosetta (DE3)pLysS schienen für keines der TPS Gene besonders geeignet, was nicht verwunderlich ist, da Codon-optimierte Gene verwendet wurden. Dieser Stamm ist besonders für die Expression von Genen, welche viele für E. coli ungewöhnliche Codons aufweisen, geeignet. 165

Diskussion

Insgesamt ist die heterologe Expression pflanzlicher Gene in E. coli als kritisch einzustufen. So konnte in einer Studie der Ruhr-Universität Bochum die Ausbeute der rekombinanten Expression einer Nicotianamin-Synthase aus einer Arabidopsis Spezies nach sorgfältiger Optimierungsarbeit auf knapp 1mg/L Expressionskultur gesteigert werden (Kürten 2014). Auch verglichen zu anderen pflanzlichen TPS war die Ausbeute an löslichem Protein mit 2-400 mg/L sehr hoch. In einer Studie zu einer pflanzlichen Germacrene D Synthase konnten nach Expressionsoptimierung lediglich 4-6 mg/L lösliche TPS generiert werden (Hackel 2009).

5.1.5. Produktbestimmung der TPS

Ein großes Problem bei der Bestimmung von Terpenen ist vor allem, dass die Verbindungen aufgrund der Tatsache, dass es sich um Isomere handelt, ein sehr ähnliches Fragmentierungsmuster im GC/MS aufweisen. Mit über 30 pflanzlichen Mono- und rund 300 Sesquiterpenen (Adam et al. 1996), welche einzig und alleine auf einem Kohlenwasserstoff- Gerüst basieren, sind die Möglichkeiten der Fragmentierung begrenzt, sodass die Spektren enorme Ähnlichkeiten aufweisen (s. Abb. 13). Ein weiteres Problem stellte die geringe Produktbildung durch die TPS dar, was die Qualität der GC/MS Spektren negativ beeinflusste.

Aufgrund dieser Herausforderungen wurden zwei Strategien angewendet, um die Produktidentizierung zu ermöglichen: Zum einen wurde eine zweite Messgröße, der RI, herangezogen. Zum anderen wurde ein Produktionsstamm verwendet, um die Produktausbeuten zu steigern. Der RI ist, wie in der Einleitung beschrieben, eine Größe, welche auf der Retentionszeit der Analyten basiert. Obwohl die Moleküle häufig Isomere sind, können sich ihre RIs stark unterscheiden. Mit Hilfe dieser beiden Größen, dem RI und dem Massespektrum, konnten mehrere Produkte pflanzlicher TPS identifiziert werden.

Ein wichtiger Punkt war ebenfalls die Etablierung der Verwendung eines Sesquiterpen- Produktionsstammes (Martin et al. 2003). Dazu wurden E. coli BL21(DE3) Zellen zusammen mit zwei Plasmiden, welche die Gene des MEV-Pfadwegs aus Saccharomyces cerevisiae beinhalten, transformiert. Die hieraus gebildeten kompetenten Zellen wurden anschließend mit dem TPS-enthaltenen Plasmid transformiert. Durch das Zusammenfügen der Gene des MEV- Pfadwegs, zusammen mit einer Sesquiterpensynthase, können die Sesquiterpene ausgehend von FPP direkt in vivo gebildet werden. Die sich im Medium befindenen Sesquiterpene können anschließend extrahiert und im GC/MS analysiert werden. Die Ausbeuten befinden sich hierbei im mg-Bereich pro Liter Medium, sodass klare Peaks im GC/MS zu erkennen waren. Dies erleichtert die Produktidentifizierung enorm, da der Hintergrund weniger störend ist und die einzelnen Fragmente besser zugeordnet werden können. Die Produktion von Monoterpenen oder Diterpenen ist mit diesem System jedoch nicht möglich, da eine gleichzeitige

166

Diskussion

Überexpression des ispA-Gens, eines FPP-Synthase Genes, die FPP Synthese ausgehend von DMAPP und IPP generiert (Martin et al. 2003).

Abgesehen von E. coli, gibt es z.B. auch Hefe-basierte Systeme, die als Produktionsstamm für Sesquiterpene dienen können (Gruchattka u. Kayser 2015; Wriessnegger et al. 2014). Interessanterweise kann die Auswahl des Wirtes einen hohen Einfluss auf die Produktbildung der Enzyme nehmen. In einer Studie der Gruppe um Jay Keasling, welche ebenfalls die Plasmide für den hier verwendeten E. coli Produktionsstamm entwickelte, konnte dieser Zusammenhang hergestellt werden (Newman et al. 2006). Die Gruppe verwendete eine synthetische Amorpha-4,11-dien-Synthase aus der Pflanze Artemesia annua und untersuchte die Produktbildung in Aspergillus nidulans. Während die in vivo Biokatalysen mit E. coli hauptsächlich zur Bildung von Amorpha-4,11-dien führten, ergab die Verwendung von Aspergillus nidulans nur sehr wenig Amorphadien, dafür wesentlich höhere Mengen der Nebenprodukte. Dies bedeutet, dass auch die in vivo Bedingungen Einfluss auf die TPS Aktivität nehmen können. So kann beispielsweise die Veränderung des Produktionsstammes auch dazu dienen, die Produktbildung hinsichtlich eines gewünschten Produktes zu verschieben, ohne dass Punktmutationen in dem Enzym vonnöten sind.

In dieser Studie konnten zwei isoenzymatische Varianten einer Myrcen/Z-(β)-Ocimen Synthase identifiziert werden. Beide Monoterpene sind bekannte Verbindungen der ätherischen Öle verschiedener Pflanzenarten (Dudareva et al. 2003; Zini et al. 2002) und sind höchstwahrscheinlich in die Abwehr von Fressfeinden involviert (Navia-Giné et al. 2009). Die Bildung der beiden isomeren Verbindungen durch ein Enzym ist ebenfalls bereits bekannt und erfolgt höchstwahrscheinlich, wie in der Einleitung beschrieben, ausgehend von einem Geranylkation. Ebenfalls konnte bereits ein Zusammenhang zwischen der Induktion von Pflanzen mit Jasmonsäure und der daraus resultierenden Überexpression der Gene für eine β-Ocimen-Synthase hergestellt werden.

Die Monoterpensynthase OK 1b bildete in den in vitro Biokatalysen ausgehend von GPP zwei Produkte: das α-Pinen und das β-Pinen. Beide Verbindungen sind höchstwahrscheinlich ebenfalls in die Abwehr von Fressfeinden involviert, da ihre Expression durch Insektenangriffe oder künstliches Verletzten der Pflanze hervorgerufen werden kann (Bohlmann et al. 1997).

Die Promiskuität von TPS ist weit verbreitet und lässt sich damit erklären, dass der Mechanismus der Produktbildung auf vielen Umlagerungen anstatt der spezifischen Spaltung von Bindungen basiert (Newman et al. 2006). Wie bereits in der Einleitung beschrieben, brachte die Promiskuität der Enzyme des Sekundärmetabolismus höchstwahrscheinlich evolutionär betrachtet enorme Vorteile für die Pflanze mit sich.

167

Diskussion

Die sechs Produkte der neuen Sesquiterpensynthase OK 6 konnten ebenfalls größtenteils identifiziert werden. Für die Bildung des Hauptproduktes Sesquisabinen B sind bereits andere pflanzliche Enzyme, hauptsächlich aus Santalum sp. bekannt. So bildet beispielsweise auch das Enzym TPS4, welches im Rahmen dieser Arbeit für Mutagenesestudien herangezogen wurde, Sesquisabinen B als Hauptprodukt und ebenfalls ein Bisabolen als Nebenprodukt (Moniodis et al. 2015). Für die Bildung der fünf Nebenprodukte von OK 6 konnten ebenfalls in der Literatur bereits beschriebene Enzyme gefunden werden. Interessanterweise bilden OK 6 und TPS4 trotz geringer Sequenzidentität von 31 % das selbe Hauptprodukt, jedoch nicht die selben Nebenprodukte. Diese Beobachtung verdeutlicht noch einmal, wie schwierig die Vorhersage von TPS-Aktivitäten basierend auf Sequenzdaten ist und wie vielfältig die Zyklisierungsmechanismen der Enzyme sein können. Ein anderes pflanzliches Enzym, welches ebenfalls Sesquisabinen B bildet, zeigt das Vorhandensein von insgesamt 21 Produkten (Köllner et al. 2004), wobei auch hier nicht alle Nebenprodukte von OK 6 wiedergefunden werden konnten. Ebenso wie OK 6 zeigt auch TPS4 Aktivität mit GPP, wobei im Falle von TPS4 laut Literatur sechs Produkte gebildet werden. Das Monoterpen-Produkt von OK 6 konnte keinem dieser Produkte zugeordnet werden, was nocheinmal verdeutlicht, dass die Zyklisierungsmechanismen zwischen verschiedenen TPS stark variieren. Wie bereits erwähnt kann die Substitution einer einzelnen Aminosäure bereits die Produktbildung der TPS verändern. Diese „Sensitivität“ könnte auch erklären, warum beispielsweise OK 6 und TPS4 zwar das selbe Hauptprodukt bilden, sich aber in der Bildung der Nebenprodukte unterscheiden. Vermutlich finden unterschiedliche Zyklisierungsmechanismen in Abhängigkeit von der Beschaffenheit der aktiven Tasche statt.

Interessant ist hierbei vor allem aber auch, dass die Sesquiterpensynthase OK 6 ein unbekanntes Produkt mit GPP bildet, wohingegen die Monoterpensynthasen OK 4a/OK 4b keinerlei Aktivität mit FPP zeigten. Diese Substrat-Promiskuität wurde auch in anderen Studien bereits beobachtet, wie z.B. bei dem Enzym TPS4, welches neben den sechs Sesquiterpenen ebenfalls sechs Monoterpene bildet (Moniodis et al. 2015). Strukturell betrachtet handelt es sich sowohl bei OK 6, als auch bei TPS4 um Sesquiterpensynthasen, da diese die typische Länge einer Sesquiterpensynthase, sowie das Fehlen einer Transit-Peptid-Sesquenz aufweisen. Bislang konnte diese Promiskuität nur für Sesquiterpensynthasen beobachtet werden. Diese setzen, wenn auch eher ineffizient, GPP, jedoch kein GGPP um (Moniodis et al. 2015). Im Gegensatz dazu weisen Mono- und Diterpensynthasen diese Promiskuität nicht auf, was im Falle der Monoterpensynthasen höchstwahrscheinlich auf sterische Aspekte in der aktiven Tasche zurückzuführen ist. Unterdessen passt das kleinere GPP-Substrat in die aktive Tasche der Sesquiterpensynthasen, während GGPP vermutlich aufgrund seiner Größe nicht umgesetzt werden kann. Ein wichtiger Punkt hierbei ist jedoch, dass die Sesquiterpensynthasen unter physiologischen Bedingungen kein GPP umsetzen, da sich

168

Diskussion dieses in den Plastiden befindet, wohingegen die Sesquiterpensynthasen im Cytosol agieren. Da vermutlich der evolutionäre Druck auf dieses Enzym, aufgrund der Tatsache, dass nur ein Substrat vorhanden war, nicht so stark war, wurde die Spezifität bezüglich FPP nicht weiter ausgebildet (Bohlmann et al. 1998; Keeling u. Bohlmann 2006).

Allgemein zeigten die Enzyme der E. serrulata verglichen zu anderen TPS wie TPS4, welches aus der Pflanze S. spictatum stammt, keine hohe Aktivität. Wie bereits erläutert, hängt die Aktivität der TPS stark von den sekretorischen Begebenheiten der Pflanze ab, was bedeutet, dass die Enzyme je nach Pflanze unterschiedlich hohe Aktivität aufweisen können (McGarvey u. Croteau 1995). Nach Stand der Technik wurden daher zunächst Experimente mit radioaktiv- markierten Substraten durchgeführt, um hiermit eine möglichst sensitive Methode zur Überprüfung der TPS Aktivität zu generieren. Die Daten waren jedoch aufgrund der hohen Messwerte an β-Stahlung in den Negativkontrollen unschlüssig. Hohe Abweichungen der Szintillation wurden auch bereits in einer anderen Studie zu einer pflanzlichen Germacren D- Synthase diskutiert (Hackel 2009). Die geringe Aktivität der TPS stellte jedoch ein hohes Problem bei der GC/MS-Analytik dar, sodass nicht alle hier entdeckten potentiellen Volllängen- Gene für TPS hinsichtlich ihrer Produktbildung identifiziert werden konnten.

5.2. Entdeckung und Identifizierung neuer TPS aus S. chartreusis

Ziel dieser Arbeit war es, das Verständnis über die bakterielle Terpendiversität und die zugehörigen Biosynthesewege zu erweitern. Während im ersten Teil der Arbeit die Pflanze E. serrulata zur Entdeckung neuer TPS und vor allem der Elisabethatrien-Synthase herangezogen wurde, sollten in diesem Teil neue bakterielle TPS entdeckt werden. Wie bereits umfassend erläutert, gibt es mehrere Beispiele in denen die Terpenproduktion durch den Wirt oder einen Symbionten kontrovers diskutiert werden (Zhou et al. 2007; Wildung u. Croteau 1996; Miao et al. 2009; Williams et al. 2000; Nakamura et al. 2011; Mydlarz et al. 2003; Brück u. Kerr 2006). Somit scheint es grundsätzlich wichtig, neben den Biosynthesewegen der Pflanze auch immer die Mikrobiome zu analysieren.

5.2.1. Bakterien als alternative Terpenproduzenten

In mehreren neueren Studien konnte bereits gezeigt werden, dass auch Bakterien als Terpenproduzenten in Frage kommen (Yamada et al. 2015). Mehrere Terpene, welche aus Pflanzen bekannt sind, können auch durch Streptomyceten gebildet werden (Dickschat 2016). Ein Beispiel hierfür ist die 1,8-Cineol-Synthase aus dem Streptomyceten Streptomyces clavuligerus ATCC 27064 (Nakano et al. 2011). Diese zeigte keine Verwandtschaft zu anderen bakteriellen TPS und auch nur eine sehr weitläufige Verwandtschaft zu anderen TPS aus 169

Diskussion

Pflanzen und Pilzen auf. Es handelt sich bei diesem Enzym um die erste bekannte bakterielle 1,8-Cineol-Synthase. Auf der anderen Seite konnten bereits zahlreiche 1,8-Cineol-Synthasen aus Pflanzen identifiziert werden, wie z.B. die in der Einleitung beschriebende AtTPS, welche aus einer Arabidopsis Spezies stammt (Chen et al. 2004). Somit können Bakterien als eine leichter zugängliche Alternative zu neuen Biosynthesegenen der Terpenbildung herangezogen werden. Interessant ist ebenfalls, dass Bakterien und Pflanzen teilweise die selben Terpene bilden, obwohl die Evolution der Gene unabhängig voneinander abgelaufen sein muss (Fischbach u. Clardy 2007). Daher scheinen gewisse Faktoren auf die konvergente Evolution der Enzyme hinsichtlich der Bildung eines gewissen Sekundärmetaboliten Einfluss genommen zu haben.

Verglichen mit der hier durchgeführten Studie der pflanzlichen TPS, waren die Enzyme aus dem Streptomyceten wesentlich einfacher zu generieren. Zunächst einmal konnte mit Hilfe der selben Sequenzierungsmethode das Genom des Bakteriums aufgeklärt werden. Obwohl hier ebenfalls ein de novo Ansatz verwendet wurde, konnten alle Contigs zu Volllängen-Genen assembliert werden. Dies ist nicht verwunderlich, da aus der Literatur bekannt ist, dass vor allem die de novo Assemblierung größerer, komplexerer Eukaryoten Probleme bereitet (Nowrousian 2010). Ein großer Vorteil von Bakterien ist außerdem, dass die Experimente auf gDNA-Basis erfolgen können, da Prokaryoten keine Spleiß-Mechanismen aufweisen. Die Handhabung von RNA und die Resequenzierung der pflanzlichen cDNA erwies sich als wesentlich anspruchsvoller als der Umgang mit der bakteriellen DNA, obwohl die Genome von Streptomyceten im Allgemeinen einen sehr hohen GC Gehalt von rund 70 % aufweisen (Ikeda et al. 2003).

Da die Studie zum S. charteusis auf einer Genomsequenzierung basiert, musste die Gentranskription künstlich induziert werden, welches eines der größten Herausforderungen bei der Studie zu pflanzlichen TPS war. Auch musste keine Auswahl bezüglich des zu untersuchenden Gewebes getroffen werden, was Bakterien zu geeigneten Kandidaten zur Analyse der Terpenbiosynthese werden lässt.

Da dieser Streptomycet ein einzigartiges Antibiotikum produziert und bislang keine Studien zu dessen Terpenbiosynthese publiziert sind, schien er ein geeigneter Kandidat für die Analyse der biosynthetischen Gene der Terpenbildung zu sein. Da nicht ausgeschlossen werden kann, dass das Elisabethatrien von einem Endophyten anstatt von der E. serrulata gebildet wird, kann die Untersuchung des S. chartreusis dazu dienen, die Entdeckung neuer bakterieller TPS zu etablieren, um in späteren Studien die originalen Endophyten der E. serrulata zu analysieren.

Das Genom des S. chartreusis zeigte sieben potentielle TPS auf, wobei es sich bei fünf Enzymen um Klasse I TPS zu handeln schien. Alle fünf ORFs deuteten hierbei auf eine 170

Diskussion

Sesquiterpensynthase-Aktivität hin, wohingegen keine potentiellen Mono- oder Diterpensynthasen entdeckt wurden. Interessanterweise sind bislang nur sehr wenige Monoterpensynthasen aus Bakterien bekannt (Dickschat 2016). Abgesehen von der 2- Methylisoborneol-Synthase, welche unter den Actinomyceten weit verbreitet ist, sind bislang nur zwei weitere Monoterpen-Synthasen bekannt: die 1,8-Cineol-Synthase sowie die Linalool- Synthase, deren Produkte ebenfalls für pflanzliche TPS bekannt sind (Dickschat 2016; Nakano et al. 2011). Die meisten bakteriellen TPS weisen Sesquiterpensynthase-Aktivität auf, wobei neben der Geosmin-Synthase, die epi-Isozizaen-Synthase am weitesten verbreitet ist. Das Fehlen von potentiellen Mono- und Diterpensynthase Genen war daher zu erwarten. Eine Erklärung, warum die Streptomyceten scheinbar nur sehr wenig Monoterpene produzieren, aber eine hohe Diversität an Sesquiterpenen, gibt es derzeit nicht. Die Gruppe um Yasuo Ohinishi nahm an, dass Streptomyceten zwar Monoterpene bilden, deren Gene aber bislang einfach noch nicht gefunden werden konnten, da sich potentielle Mono- und Sesquiterpensynthasen allein auf Sequenzebene kaum unterscheiden lassen (Nakano et al. 2011).

5.2.2. Heterologe Genexpression und Aktivität der bakteriellen TPS

Während das Gen Strep_01776 direkt aus der gDNA des Streptomyceten kloniert wurde, wurden die anderen potentiellen Sesquiterpensynthase Gene als Codon-optimierte Sequenzen in E. coli exprimiert. Aus der Literatur ist bekannt, dass die Expression dieser Gene in E. coli häufig zur Bildung von unlöslichen Einschlusskörperchen führt. Durch den Vergleich der Genexpression in den drei E. coli Stämmen sowie das Herabsenken der Expressionstemperatur auf 18 °C, konnten ausreichende Mengen an löslichem Protein generiert werden. Neben den in vitro Tests wurden auch hier in vivo Experimente zur Produktbestimmung der Enzyme herangezogen (Martin et al. 2003). Dabei konnten erneut durch die Verwendung des Produktionsstammes hohe Produkttiter erzielt werden, welche die Analyse mittels GC/MS positiv beeinflussten.

5.2.3. Identifizierung der potentiellen TPS

Alle drei untersuchten Sesquiterpensynthasen konnten im Rahmen dieser Studie identifiziert werden. Während es sich bei dem Enzym Strep_01776 um eine Gesomin/Germacradienol- Synthase handelte, welche für zahlreiche Streptomyceten bereits bekannt ist, sind die Enzyme Strep_07044 (7-epi-α-Eudesmol-Synthase) und Strep_07041 (α-Amorphen-Synthase) von hohem Interesse. Bei beiden Enzymen handelt es sich jeweils um das zweite bekannte bakterielle Enzym mit dieser Produktbildung. Von den rund 50 bislang entdeckten TPS aus

171

Diskussion

Bakterien ist bislang nur eine Eudesmol-Synthase aus S. viridochromogenes DSM 40736 bekannt (Rabe u. Dickschat 2013; Dickschat 2016). Dieses Enzym bildet ebenfalls das 7-epi- Eudesmol als Hauptprodukt und geringe Mengen von 11 Nebenprodukten: 10-epi-γ- Eudesmol, 5-epi-7-α-Eudesmol, Hedycaryl, Valerianol, β-Dihydroagarofuran, α-Selinen, 7-epi- Selinen, (E)-β-Caryophyllen, (E)-β-Farnesen, Germacren A und β-Elemen. Das hier entdeckte Enzym weist zwar eine 94 prozentige Sequenzidentität zu der TPS aus S. viridochromogenes DSM 40736 auf, zeigt aber lediglich zwei Nebenprodukte, das Elemol, sowie ebenfalls das 10- epi-γ-Eudesmol. Die einzige aus Pflanzen bekannte Eudesmol-Synthase stammt aus Ingwer und bildet hauptsächlich β-Eudesmol (Yu et al. 2008). Als Nebenprodukte konnten ebenfalls das 10-epi-γ-Eudesmol sowie Aristolochen und α-Eudesmol identifiziert werden. Zwei weitere Nebenprodukte konnten für das pflanzliche Enzym nicht aufgeklärt werden. Vor allem das 10- epi-γ-Eudesmol, aber auch das Elemol zeigen ein hohes Potential als Insekten-Repellent. So konnte ihre Aktivität gegenüber Gelbfiebermücken bereits gezeigt werden (Paluch et al. 2009). Auch gegenüber Zecken wies das 10-epi-γ-Eudesmol bereits eine hohe Aktivität auf (Tabanca et al. 2013). Somit zeigt sich, dass bakterielle Enzyme eine geeignete Alternative gegenüber pflanzlichen Enzymen darstellen können.

Desweiteren wurde im Rahmen dieser Studie die zweite α-Amorphen-Synthase (auch Zizanen genannt) gefunden. Die bislang einzig bekannte weitere α-Amorphen-Synthase stammt, wie die 7-epi-Eudesmol-Synthase auch, aus dem Bakterium S. viridochromogenes. Die hier beschriebene α-Amorphen-Synthase bildet insgesamt vier Nebenprodukte, wobei zwei von ihnen als γ-Muurolen und δ-Amorphen identifiziert wurden. Die TPS aus S. viridochromogenes hingegen bildete 10 Nebenprodukte, wobei γ-Muurolen und δ-Amorphen nicht gefunden wurden (Rabe u. Dickschat 2013). Diese Beobachtung entspricht ebenfalls den Daten zu OK 6 und TPS4. Bei beiden Enzymen handelt es sich um pflanzliche Sesquisabinen B-Synthasen, jedoch bilden beide unterschiedliche Nebenprodukte. Wie bereits erläutert, könnte dies auf die Tatsache zurückzuführen sein, dass der Reaktionsmechanismus der TPS ausgehend vom Carbokation auf Umlagerungs- und Zyklisierungsreaktionen basiert, welche scheinbar stark von den Gegebenheiten der aktiven Tasche abhängen.

Eine Totalsynthese des α-Amorphens ist bereits publiziert (Gregson u. Mirrington 1976), allerdings ist hierbei abzuwägen, ob die biotechnologische Herstellung des Produktes eine umweltfreundliche Alternative zu der chemischen Synthese bietet. Auch das α-Amorphen konnte bereits als Bestandteil von zahlreichen ätherischen Ölen nachgewiesen werden (Gaydou et al. 1986; Gopalakrishnan et al. 1993), sodass auch hier ein Bakterium eine Alternative zur pflanzlichen Biosynthesewegen darstellt. Es verdeutlicht außerdem noch einmal, dass Bakterien und Pflanzen über konvergente Evolution ihre Enzyme hinsichtlich derselben Produkte optimiert haben.

172

Diskussion

Interessanterweise zeigte keine der hier gefundenen bakteriellen Sesquiterpensynthasen Umsatz mit GPP. Während die durch Transkriptomsequenzierung der E. serrulata gefundene Sesquiterpensynthase OK 6 ein unbekanntes Produkt mit GPP bildete und auch die von der Gruppe um Jörg Bohlmann entdeckte TPS4 sechs Produkte mit GPP bildete, schienen die Sesquiterpensynthasen aus dem S. chartreusis sehr substratspezifisch zu sein. Während im Bereich der pflanzlichen TPS nahezu die Hälfte aller Sesquiterpensynthasen diese Promiskuität aufzeigt, sind bislang nur sehr wenige bakterielle TPS bekannt, welche mit beiden Substraten Produkte bilden (Dickschat et al. 2014; Dickschat 2016). Wie bereits erörtert, wird diese Promiskuität pflanzlicher TPS in der Literatur mit evolutionären Gründen erklärt: Da Sesquiterpene und Monoterpene in unterschiedlichen Kompartimenten der Zelle gebildet werden, kommen sie mit dem jeweils anderen Substrat in der Natur nicht in Berührung (Bohlmann et al. 1998). Während Mono- und Diterpene in den Plastiden gebildet werden, findet die Synthese der Sesquiterpene im Cytosol statt. Da vermutlich der evolutionäre Druck auf die Sesquiterpensynthasen gefehlt hat, da nur ein Substrat vorhanden war, wurde die Spezifität bezüglich FPP im Laufe der Evolution nicht weiter ausgebildet. Umgekehrt scheinen Mono- und Diterpensynthasen, welche im selben Zellkompartiment vorhanden sind, stark substratspezifisch zu sein.

Die mögliche Erklärung der Promiskuität der pflanzlichen TPS könnte aber auch eine Begründung für die stärkere Substratspezifität von bakteriellen Sesquiterpensynthasen darstellen: Streptomyceten weisen keine Plastide auf, sodass die Bildung der verschiedenen Terpene nicht räumlich getrennt stattfindet. Vermutlich war aufgrund der „Konkurrenzsituation“ der evolutionäre Druck auf diese TPS höher, als auf die pflanzlichen Sesquiterpensynthasen. Interessant ist ebenfalls, dass eine vermeintlich natürliche bakterielle Monoterpensynthase ebenfalls FPP umsetzen kann, wohingegen diese Substratpromiskuität bei Pflanzen eigentlich nur für Sesquiterpensynthasen beobachtet wurde. Diese Beobachtung stützt ebenfalls die These, dass die Kompartimentierung Auswirkungen auf die Substratspezifität der Enzyme hatte. Während bei Pflanzen der evolutionäre Druck auf Mono- und Diterpensynthasen vermutlich höher war als auf die Sesquiterpensynthasen, befinden sich die bakteriellen TPS alle im gleichen Kompartiment und haben den selben evolutionären Druck erfahren. Daher können sowohl bakterielle Mono-, als auch Sesquiterpensynthasen diese Promiskutität aufzeigen.

Zwar erfolgte im Rahmen dieser Studie keine Quantifizierung der Produktbildung der in vitro Studien, dennoch schienen die Enzyme im Vergleich zu denen aus der E. serrulata eine wesentlich höhere Aktivität aufzuzeigen. So wurden bei den GC/MS-Messungen der Produkte der bakteriellen Sesquiterpensynthasen wesentlich stärkere Signale verzeichet, als bei denen der pflanzlichen Enzyme. Diese Beobachtung stimmt ebenfalls mit denen anderer Studien überein: Allgemein scheinen bakterielle TPS gegenüber pflanzlichen TPS eine höhere 173

Diskussion

katalytische Effizienz (kcat/KM) aufzuzeigen (Nakano et al. 2011), was ebenfalls in Übereinstimmung mit der geringeren Substratpromiskuität von bakteriellen TPS steht.

Allgemein war die Enzymaktivität der TPS nur schwer vorherzusehen. So lieferten HHPred Alignments keine zuverlässigen Vorhersagen über die Produktbildung. Auf der anderen Seite zeigte die phylogenetische Analyse der Enzyme eine hohe Verwandtschaft von Enzymen mit gleicher Produktbildung. Da bislang nur rund 50 bakterielle TPS bekannt sind, eignet sich die phylogenetische Analyse potentieller neuer TPS zur Vorhersage der Aktivität.

5.3. Mutagenesestudie zur pflanzlichen Sesquiterpensynthase TPS4

Das Ziel dieser Studie war die Untersuchung der Struktur-Funktionsbeziehung von TPS am Beispiel von TPS4 und die Generierung neuer Terpendiversität durch Rationales Protein Design. Durch die Entdeckung von plastizierbaren Resten sollte das Verständnis über die Struktur-Funktionsbeziehung pflanzlicher TPS erhöht werden und das Enzym gezielt mutiert werden, um neue Terpendiversität zu generieren.

TPS4 ist, wie viele TPS, ein promiskuitives Enzym, welches sechs Produkte mit FPP und sechs weitere Produkte mit GPP bildet. In der Literatur konnte bereits gezeigt werden, dass die Substitution eines einzelnen plastizierbaren Restes die Produktbildung einer TPS verändern kann (Yoshikuni et al. 2006). Da über die Position von plastizierbaren Resten in TPS keine zuverlässige Vorhersage getroffen werden kann, sollten durch ein Alignment mit einer bekannten TPS, welche insgesamt vier plastizierbare Reste aufzeigt, die Positionen für die Mutagenese von TPS4 bestimmt werden.

Allgemein erwies sich die Reproduktion der Daten aus der Literatur als schwierig. So konnten nicht alle in der Literatur beschriebenen Produkte von TPS4 rekonstruiert werden. Stattdessen zeigte das Wildtyp-Enzym neue Produkte. Dies verdeutlicht die Schwierigkeit der Rekonstruktion von enzymatischer Terpenbildung. Da der Mechanismus von TPS ausgehend vom Carbokation nicht auf der spezifischen Spaltung von chemischen Bindungen basiert, sondern vielmehr auf Umlagerungs- und Zyklisierungsreaktionen, können scheinbar bereits kleinste Variationen in der Handhabung Auswirkungen auf den katalytischen Mechanismus nehmen.

174

Diskussion

5.3.1. Strukturbestimmung und Analyse potentieller plastizierbarer Reste

Da kein Hochdurchsatz-Screening für die Analyse der Produktbildung von TPS zur Verfügung steht, wurde von der Methode des Rationalen Protein Designs Gebrauch gemacht. Diese wurde basierend auf einem Homologie-Modell verwendet, da keine Kristallstruktur von TPS4 vorhanden war. Als Templat für das Homologie-Modell diente eine Limonen-Synthase aus der Pflanze Mentha spicata. Ein Alignment der beiden Synthasen zeigte eine Identität von 41 %. Gemäß Fiser haben Sequenzidentitäten über 40 % einen main-chain-root-mean-square error von 1,0 Å (Fiser 2010). Allerdings publizierte der Wissenschaftler ebenfalls, dass Sequenzidentitäten über 30 % ausreichend sind, um zuverlässige Homologie-Modelle zu erstellen. Über ein Alignment mit der Kristallstruktur einer 5-epi-Aristolochen-Synthase aus Nicotiana tabacum konnte die aktive Tasche der TPS4 identifiziert werden und ein Inhibitor, das Farnesylhydroxyphosphat, in diese modelliert werden. Die stark konservierten Motive

DDxxD und RRX8W konnten, wie erwartet, in der aktiven Tasche des Homologie-Modells wiedergefunden werden. Aus der Literatur ist weitläufig bekannt, dass diese beiden Motive stark in den katalytischen Mechanismus von TPS involviert sind (Bohlmann et al. 1998).

Da kein allgemeines Programm zur Vorhersage von plastizierbaren Resten in TPS vorhanden war, wurden versucht diese über ein Alignment mit einer γ-Humulen-Synthase (s. Tab. 42) zu bestimmen (Yoshikuni et al. 2006). Diese γ-Humulen-Synthase wies vier plastizierbare Reste auf, welche den Resten F419, C456, Y536 und Y288 von TPS4 entsprachen. Da diese Reste in der aktiven Tasche des Homologie-Modells zu finden waren, wurden diese entsprechend mutiert, um die Auswirkungen auf das Produktspektrum zu analysieren.

Wie bereits in der Einleitung beschrieben, können z.B. eine veränderte Hydrophobizität oder veränderte sterische Bedingungen Auswirkungen auf die katalytische Aktivität des Enzyms nehmen. Hierbei ist zu bedenken, dass ausgehend vom Carbokation keine spezifischen Bindungen gespalten werden, sondern Umlagerungs- und Zyklisierungsmechanismen stattfinden. Daher wurden die vier potentiellen plastizierbaren Reste hinsichtlich ihrer Hydrophobizität und sterischen Eigenschaften mutiert.

Eine Mutagenese des katalytisch aktiven und sehr stark konservierten DDxxD-Motives wurde nicht durchgeführt, da bereits in mehreren Studien gezeigt werden konnte, dass eine Veränderung dieses Motives eine starke Verringerung der Enzymaktivität bzw. eine Inaktivierung des Enzyms mit sich führt (Bohlmann et al. 1998).

175

Diskussion

5.3.2. Auswirkungen der Mutagenese auf das Produktspektrum

Durch die Mutationen konnte kein positiver Einfluss auf die Sesquiterpensynthase-Aktivität beobachtet werden. Die meisten Varianten zeigten entweder eine verringerte oder gar keine Sesquiterpensynthase-Aktivität, was darauf hindeutet, dass die Konservierung dieser Positionen für den katalytischen Mechanismus von großer Bedeutung ist. Eine verringerte Aktivität bzw. eine komplette Inaktivierung eines Enzyms durch eine Mutation, vor allem im Bereich der aktiven Tasche, ist nicht verwunderlich, da diese im Rahmen der Evolution bereits stark optimiert wurde.

Auf der anderen Seite scheinen TPS ebenfalls über Reste zu verfügen, welche wenig konserviert sind. Dies konnte anhand der beiden Isoenzyme OK 4a und OK 4b im Rahmen dieser Studie gezeigt werden. Obwohl sich die Sequenzen der beiden Varianten in sieben Punktmutationen unterschieden haben, zeigten beide Enzyme die gleiche Produktbildung. Bei Betrachtung der Homologie-Modelle fiel allerdings auch auf, dass die Substitutionen der Reste alle außerhalb der aktiven Tasche lagen und sich eher im Bereich der loop-Region befanden.

Interessant ist ebenfalls, dass gewisse Mutationen zwar eine der beiden Aktivitäten (Mono-, Sesquiterpensynthase-Aktivität) des Enzyms inaktivieren konnten, dies jedoch nicht zwangsläufig mit einer Inaktivierung der anderen Aktivität einherging. Ebenfalls konnte keine Position einer gewissen Produktbildung zugeordnet werden. So zeigt z.B. die Mutation F419M bzgl. der Monoterpensynthase-Aktivität den Verlust der Bildung von α-Pinen. Auf der anderen Seite bildet die Mutante F419I aber wieder das α-Pinen. Darüber hinaus zeigte die Doppelmutante Y288W/C456S ebenfalls den Verlust der α-Pinen-Aktivität. Somit konnte die Konservierung einer bestimmten Position nicht mit der Bildung eines bestimmten Produktes in Zusammenhang gebracht werden.

Interessanterweise führte eine der Mutationen in der aktiven Tasche zu einer Veränderung der Produktbildung der Monoterpensynthase-Aktivität der Sesquiterpensynthase TPS4. Die Mutation Y288F führte zur Bildung eines zusätzlichen Produktes, allerdings konnte dieses nicht identifiziert werden. Interessant ist hierbei, dass diese Mutation nur die Monoterpensynthase-Aktivität positiv beeinflusste, jedoch zu einer Inaktivierung der Sesquiterpensynthase führte. Pflanzliche Sesquiterpensynthasen können im Gegensatz zu pflanzlichen Mono- oder Diterpensynthasen eine Substrat-Promiskuität aufzweisen. So ist es nicht unüblich, dass Sesquiterpensynthasen neben FPP auch GPP umsetzen, wohingegen Mono- und Diterpensynthasen ausschließlich die Umsetzung von GPP bzw. GGPP katalysieren (Bohlmann et al. 1998). Der Grund hierfür ist vermutlich, wie bereits erläutert, dass Sesquiterpensynthasen bis auf wenige Ausnahmen im Cytosol agieren und daher im Laufe der Evolution immer nur ein Substrat zur Verfügung hatten, weshalb der evolutionäre Druck für eine erhöhte Spezifität ausblieb. Dennoch ist die Bildung von Monoterpenen durch 176

Diskussion diese Enzyme meistens wesentlich ineffektiver und bei weitem nicht so spezifisch (Moniodis et al. 2015). Vermutlich ist der Rest Y288 stark in die katalytische Aktivität der eher spezifischen Sesquiterpensynthase involviert, sodass die veränderte Hydrophobizität durch die Mutation von einem Thyrosin zu einem Phenylalanin starke Auswirkungen auf den Mechanismus hat. Auf der anderen Seite kann die Erhöhung der Hydrophobizität in der aktiven Tasche durch den Austausch Y288F den ohnehin eher ineffektiven Mechanismus der Monoterpenbildung positiv beeinflusst haben, weshalb ein zusätzliches Produkt generiert wurde.

177

Fazit

6. Fazit

Diese Studie befasst sich mit der Entdeckung und Generierung neuer biosynthetischer Gene der Terpendiversität und konnte in drei Bereiche unterteilt werden: Die Entdeckung neuer pflanzlicher TPS am Beispiel der E. serrulata, der Vergleich der Zugänglichkeit pflanzlicher und bakterieller TPS sowie die Mutagenese einer pflanzlichen TPS zur Erhöhung des Verständnisses der Struktur-Funktionsbeziehungen pflanzlicher TPS und zur Generierung neuer Terpendiversität.

Die Pflanze E. serrulata wurde hierbei aufgrund ihrer antiinflammatorischen und antibakteriellen Diterpenoide ausgewählt. Hauptziel war die Entdeckung der Elisabethatrien- Synthase. Die Annahme, dass die Pflanze über eine Elisabethatrien-Synthase verfügt, basiert auf einer Studie, in der durch Naturstoffextraktion der Blätter serrulatane Diterpenoide, welche ein Elisabethatrien-Gerüst aufweisen, entdeckt wurden (Ndi et al. 2007). Die Elisabethatrien- Synthase konnte im Rahmen dieser Studie nicht gefunden werden. Dieses kann verschiedene Gründe haben: Wie bereits erläutert, wurde eine Transkriptomsequenzierung der Blätter der E. serrulata für die Entdeckung neuer TPS herangezogen. Die größten Herausforderungen waren hierbei vor allem die Induktion der Terpenbiosynthese, die Wahl des richtigen Gewebes sowie die Assemblierung der Contigs nach erfolgter Illumina MiSeq Sequenzierung. Die Wahl des Induktors sowie dessen Konzentration und Inkubationszeit sind bei Studien zu pflanzlichen TPS entscheidend, da nur aktiv transkribierte Gene bei der Transkriptomsequenzierung detektiert werden können. Ebenfalls spielt die Wahl des richtigen terpenbildenen Gewebes eine große Rolle bei der Entdeckung neuer Biosynthesegene. Dieses ist nicht für jedes Terpen und jede Pflanze gleich, sodass abgewogen werden muss, welches Gewebe untersucht werden soll. Es könnte daher möglich sein, dass das Gen der Elisabethatrien-Synthase nicht gefunden wurde, da es zum Zeitpunkt der Probenentnahme oder in diesem Gewebe nicht aktiv war.

Ein großes Problem stellte außerdem die Illumina MiSeq Sequenzierung dar. Aufgrund der kurzen reads und der fehlerhaften de novo Assemblierung war die Detektion von Volllängen- Genen mit TPS-Aktivität schwierig. Da über 20 Genfragmente aus dem NGS eine Ähnlichkeit zu TPS aufwiesen, ist es durchaus möglich, dass das Gen der Elisabethatrien-Synthase durch die Induktion der Blätter zwar aktiviert wurde, jedoch als Genfragment in den Sequenzierungsdaten vorhanden war und deshalb nicht gefunden wurde.

Ein wichtiger Punkt ist außerdem, dass ein Endophyt als Produzent der bioaktiven Diterpenoide in Frage kommen könnte. Wie bereits anhand von mehreren Beispielen beschrieben, ist die Unterscheidung, ob gewisse Naturstoffe von der Pflanze oder ihren Endophyten gebildet werden, häufig eine große Herausforderung. Neben der Tatsache, dass bereits ein Streptomycet für die Bildung eines Elisabetharien-Derivates bekannt ist, deutet 178

Fazit auch der postulierte Reaktionsmechanismus der Elisabetharien-Synthase aus der Weichkoralle auf einen Endophyten hin. Sofern bakterielle Endophyten für die Bildung der serrulatanen Diterpenoide verantwortlich sind, konnten diese in dieser Studie nicht berücksichtigt werden, da vor dem NGS ein Poly(A)-fishing durchgeführt wurde.

Wie schwierig die Entdeckung neuer pflanzlicher TPS sein kann, konnte auch in einer Studie von Jörg Bohlmann zu den Biosynthesegenen aus S. spicatum gezeigt werden (Moniodis et al. 2015). Während in dieser Studie eigentlich die Biosynthesegene zur Produktion des wertvollen α- und β-Santalols aufgeklärt werden sollten, konnte ebenfalls aufgrund von zu kurzen reads im NGS nur eine einzige TPS entdeckt werden. Hierbei handelte es sich um TPS4, welches Sesquisabinen B produziert und für die hier durchgeführten Mutagenesestudien herangezogen wurde.

Dennoch konnten im Rahmen dieser Dissertation die ersten TPS aus einer Spezies der Eremophila Gattung aufgeklärt werden. Ebenso handelt es sich um die allerersten Transkriptomdaten zu dieser Gattung, welche das Verständnis über die Biosynthesewege dieses Genus vorantreiben.

Aufgrund der großen Herausforderungen bei der Entdeckung neuer biosynthetischer Gene der pflanzlichen Terpendiversität wurde ebenfalls eine Studie zu den katalytischen Mechanismen zur Bildung bakterieller Terpendiversität durchgeführt. Da bereits einige Studien die Bildung von Terpenen durch Bakterien gezeigt haben und bislang rund 50 bakterielle TPS entdeckt worden sind, sollte in dieser Dissertation das Bakterium S. chartreusis als leichter zugängliche Alternative zur Entdeckung neuer TPS herangezogen werden.

Allgemein gestaltete sich die Entdeckung neuer biosynthetischer Gene aus der E. serrulata im Vergleich zu der Analyse der bakteriellen TPS aus S. chartreusis als wesentlich anspruchsvoller. Dies verdeutlicht das großes Potential von Bakterien als leichter zugängliche Alternative für die Entdeckung neuer biosynthetischer Gene der Terpenbildung. Einen großen Vorteil stellt vor allem das Arbeiten auf genomischer Basis dar, da Bakterien keine Introns erhalten. Somit können keine Probleme mit der künstlichen Induktion von TPS oder der Wahl des richtigen Gewebes entstehen. Außerdem lieferte die Assemblierung der Contigs wesentlich zuverlässigere Daten, als es bei dem pflanzlichen Transkriptom beobachtet wurde. Dies war zu erwarten, da bereits in der Literatur beschrieben ist, dass vor allem die de novo Assemblierung der Transkriptomdaten komplexerer Eukaryoten, wie Pflanzen, Probleme bereitet. Allgemein scheinen Bakterien daher ein großes Potential für die Zugänglichkeit von Terpen-Biosynthesegenen darzustellen. Ebenfalls konnte gezeigt werden, dass Bakterien bioaktive Terpene, wie das 10-epi-γ-Eudesmol, produzieren und daher ein großes Potential für die Entdeckung neuer bioaktiver Naturstoffe aufzeigen.

179

Fazit

Im Rahmen der Mutagenesestudie einer pflanzlichen Terpensynthase konnte ebenfalls eine interessante Beobachtung gemacht werden: Bei dem promiskutiven Enzym TPS4 führte die durch eine Mutation hervorgerufene Inaktivierung einer der beiden Aktivitäten (Monoterpensynthase-Aktivität bzw. Sesquiterpensynthase-Aktivität) nicht zwangsläufig auch zur Inaktivierung der anderen Aktivität. Zwar konnte durch die Mutation Y288F ein neues Monoterpensynthase-Produkt generiert werden, jedoch brachte diese Mutation eine komplette Inaktivierung der Sesquiterpensynthase-Aktivität mit sich. Dennoch zeigte keine der getesteten Mutationen eine Erhöhung der Enzymaktivität. Dies ist nicht verwunderlich, da Enzyme aufgrund der Evolution bereits stark optimiert vorliegen.

180

Literaturverzeichnis

7. Literaturverzeichnis

Adam, K. P.; Crock, J. u. Croteau, R. (1996): Partial purification and characterization of a monoterpene cyclase, limonene synthase, from the liverwort Ricciocarpos natans. Archives of Biochemistry and Biophysics 332 (2): 352–356.

Andersen-Ranberg, J.; Kongstad, K. T.; Nielsen, M. T.; Jensen, N. B.; Pateraki, I.; Bach, S. S.; Hamberger, B.; Zerbe, P.; Staerk, D.; Bohlmann, J.; Moller, B. L. u. Hamberger, B. (2016): Expanding the landscape of diterpene structural diversity through stereochemically controlled combinatorial biosynthesis. Angewandte Chemie 55 (6): 2142–2146.

Baldwin, B. G. (1992): Phylogenetic utility of the internal transcribed spacers of nuclear ribosomal DNA in plants. An example from the compositae. Molecular Phylogenetics and Evolution 1 (1): 3–16.

Barnes, E. C.; Kavanagh, A. M.; Ramu, S.; Blaskovich, M. A.; Cooper, M. A. u. Davis, R. A. (2013): Antibacterial serrulatane diterpenes from the Australian native plant Eremophila microtheca. Phytochemistry 93: 162–169.

Bertea, C. M.; Voster, A.; Verstappen, F. W. A.; Maffei, M.; Beekwilder, J. u. Bouwmeester, H. J. (2006): Isoprenoid biosynthesis in Artemisia annua. Cloning and heterologous expression of a germacrene A synthase from a glandular trichome cDNA library. Archives of Biochemistry and Biophysics 448 (1-2): 3–12.

Bicas, J. L.; Dionisio, A. P. u. Pastore, G. M. (2009): Bio-oxidation of terpenes. An approach for the flavor industry. Chemical Reviews 109 (9): 4518–4531.

Birtles, R. J. u. Raoult, D. (1996): Comparison of partial citrate synthase gene (gltA) sequences for phylogenetic analysis of Bartonella sp. International Journal of Systematic Bacteriology 46 (4): 891–897.

Blin, K.; Medema, M. H.; Kazempour, D.; Fischbach, M. A.; Breitling, R.; Takano, E. u. Weber, T. (2013): antiSMASH 2.0--a versatile platform for genome mining of secondary metabolite producers. Nucleic Acids Research 41: W204-12.

Bloom, J. D.; Meyer, M. M.; Meinhold, P.; Otey, C. R.; MacMillan, D. u. Arnold, F. H. (2005): Evolving strategies for enzyme engineering. Current Opinion in Structural Biology 15 (4): 447–452.

Bohlmann, J. u. Keeling, C. I. (2008): Terpenoid biomaterials. The Plant Journal for Cell and Molecular Biology 54 (4): 656–669.

Bohlmann, J.; Meyer-Gauen, G. u. Croteau, R. (1998): Plant terpenoid synthases. Molecular biology and phylogenetic analysis. Proceedings of the National Academy of Sciences of the United States of America 95 (8): 4126–4133.

181

Literaturverzeichnis

Bohlmann, J.; Steele, C. L. u. Croteau, R. (1997): Monoterpene synthases from grand rir (Abies grandis). cDNA isolation, characterization, and functional expression of myrcene synthase, (-)-(4S)-limonen synthase, and (-)-(1S,5S)-pinene synthase. Journal of Biological Chemistry 272 (35): 21784–21792.

Boland, W.; Hopke, J.; Donath, J.; Nüske, J. u. Bublitz, F. (1995): Jasmonsäure- und Coronatin-induzierte Duftproduktion in Pflanzen. Angewandte Chemie 107 (15): 1715–1717.

Bornscheuer, U. T. u. Kazlauskas, R. J. (2004): Catalytic promiscuity in biocatalysis. Using old enzymes to form new bonds and follow new pathways. Angewandte Chemie 43 (45): 6032– 6040.

Bornscheuer, U. T. u. Pohl, M. (2001): Improved biocatalysts by directed evolution and rational protein design. Current Opinion in Chemical Biology 5 (2): 137–143.

Borson, N. D.; Salo, W. L. u. Drewes, L. R. (1992): A lock-docking oligo(dT) primer for 5' and 3' RACE-PCR. Genome Research 2 (2): 144–148.

Bottcher, D. u. Bornscheuer, U. T. (2010): Protein engineering of microbial enzymes. Current Opinion in Microbiology 13 (3): 274–282.

Bouwmeester, H. J.; Kodde, J.; Verstappen, F. W. A.; Altug, I. G.; Kraker, J.-W. u. de Wallaart, T. E. (2002): Isolation and characterization of two germacrene A synthase cDNA clones from chicory. Plant Physiology 129 (1): 134–144.

Braese, S.; Encinas, A.; Keck, J. u. Nising, C. F. (2009): Chemistry and biology of mycotoxins and related fungal metabolites. Chemical Reviews 109 (9): 3903–3990.

Brandl, C. J. u. Deber, C. M. (1986): Hypothesis about the function of membrane-buried proline residues in transport proteins. Proceedings of the National Academy of Sciences of the United States of America 83 (4): 917–921.

Braun, M.; Teichert, O. u. Zweck, A. (2006): Biokatalyse in der industriellen Produktion. Zukünftige Technologien 57: 1-8.

Broka, C. A.; Chan, S. u. Peterson, P. (1988): Total synthesis of (-)-pseudopterosin A. Journal of Organic Chemistry 53: 1584–1586.

Brück, T.; Kourist, R. u. Loll, B. (2014): Production of macrocyclic sesqui- and diterpenes in heterologous microbial hosts. A systems approach to harness nature’s molecular diversity. ChemCatChem 46: 1142-1165.

Brück, T. B. u. Kerr, R. G. (2006): Purification and kinetic properties of elisabethatriene synthase from the coral Pseudopterogorgia elisabethae. Comparative Biochemistry and Physiology. Part B, Biochemistry & Molecular Biology 143 (3): 269–278.

182

Literaturverzeichnis

Cankar, K.; Kraigher, H.; Ravnikar, M. u. Rupnik, M. (2005): Bacterial endophytes from seeds of Norway spruce (Picea abies L. Karst). FEMS Microbiology Letters 244 (2): 341–345.

Cao, L.; Qiu, Z.; You, J.; Tan, H. u. Zhou, S. (2004): Isolation and characterization of endophytic streptomyces strains from surface-sterilized tomato (Lycopersicon esculentum) roots. Letters in Applied Microbiology 39 (5): 425–430.

Cao, R.; Zhang, Y.; Mann, F. M.; Huang, C.; Mukkamala, D.; Hudock, M. P.; Mead, M. E.; Prisic, S.; Wang, K.; Lin, F.-Y.; Chang, T.-K.; Peters, R. J. u. Oldfield, E. (2010): Diterpene cyclases and the nature of the isoprene fold. Proteins 78 (11): 2417–2432.

Castillo, U.; Harper, J. K.; Strobel, G. A.; Sears, J.; Alesi, K.; Ford, E.; Lin, J.; Hunter, M.; Maranta, M.; Ge, H.; Yaver, D.; Jensen, J. B.; Porter, H.; Robison, R.; Millar, D.; Hess, W. M.; Condron, M. u. Teplow, D. (2003): Kakadumycins, novel antibiotics from Streptomyces sp. NRRL 30566, an endophyte of Grevillea pteridifolia. FEMS Microbiology Letters 224 (2): 183– 190.

Chen, C.; Khaleel, S. S.; Huang, H. u. Wu, C. H. (2014): Software for pre-processing Illumina next-generation sequencing short read sequences. Source Code for Biology and Medicine 9: 8-11.

Chen, F.; Ro, D.-K.; Petri, J.; Gershenzon, J.; Bohlmann, J.; Pichersky, E. u. Tholl, D. (2004): Characterization of a root-specific Arabidopsis terpene synthase responsible for the formation of the volatile monoterpene 1,8-cineole. Plant Physiology 135 (4): 1956–1966.

Chen, F.; Tholl, D.; Bohlmann, J. u. Pichersky, E. (2011): The family of terpene synthases in plants. A mid-size family of genes for specialized metabolism that is highly diversified throughout the kingdom. The Plant Journal for Cell and Molecular Biology 66 (1): 212–229.

Cheng, A.-X.; Lou, Y.-G.; Mao, Y.-B.; Lu, S.; Wang, L.-Y. u. Chen, X.-Y. (2007): Plant terpenoids: biosynthesis and ecological functions. Journal of Integrative Plant Biology 49 (2): 179–186.

Chinnock, R. J. (2007): Eremophila and allied genera. Rosenberg. Dural. 672.

Chomczynski, P. u. Sacchi, N. (1987): Single-step method of RNA isolation by acid guanidinium thiocyanate-phenol-chloroform extraction. Analytical Biochemistry 162 (1): 156– 159.

Chu, Y. u. Corey, D. R. (2012): RNA sequencing. Platform selection, experimental design, and data interpretation. Nucleic Acid Therapeutics 22 (4): 271–274.

Clark, J. H.; Luque, R. u. Matharu, A. S. (2012): Green chemistry, biofuels, and biorefinery. Annual Review of Chemical and Biomolecular Engineering 3: 183–207.

183

Literaturverzeichnis

Coleman, A. W. (2015): Nuclear rRNA transcript processing versus internal transcribed spacer secondary structure. Trends in Genetics 31 (3): 157–163.

Correa, H.; Aristizabal, F.; Duque, C. u. Kerr, R. (2011): Cytotoxic and antimicrobial activity of pseudopterosins and seco-pseudopterosins isolated from the octocoral Pseudopterogorgia elisabethae of San Andres and Providencia Islands (Southwest Caribbean Sea). Marine Drugs 9 (3): 334–343.

Croft, K. D.; Ghisalberti, E. L.; Jefferies, P. R. u. Stuart, A. D. (1979): The chemistry of Eremophila spp. XI. The absolute configuration of dihydroxyserrulatic acid. Australian Journal of Chemistry 32 (9): 2079.

Croteau, R.; Alonso, W. R.; Koepp, A. E. u. Johnson, M. A. (1994): Biosynthesis of monoterpenes. Partial purification, characterization, and mechanism of action of 1,8-cineole synthase. Archives of Biochemistry and Biophysics 309 (1): 184–192.

Degenhardt, J.; Köllner, T. G. u. Gershenzon, J. (2009): Monoterpene and sesquiterpene synthases and the origin of terpene skeletal diversity in plants. Phytochemistry 70: 1621–1637.

Deligeorgopoulou, A. u. Allemann, R. K. (2003): Evidence for differential folding of farnesyl pyrophosphate in the of aristolochene synthase. A single-point mutation converts aristolochene synthase into an (E)-beta-farnesene synthase. Biochemistry 42 (25): 7741– 7747.

Dickschat, J. S. (2016): Bacterial terpene cyclases. Natural Product Reports 33 (1): 87–110.

Dickschat, J. S.; Pahirulzaman, K. A. K.; Rabe, P. u. Klapschinski, T. A. (2014): An improved technique for the rapid chemical characterisation of bacterial terpene cyclases. ChemBioChem 15 (6): 810–814.

Doroghazi, J. R.; Ju, K.-S.; Brown, D. W.; Labeda, D. P.; Deng, Z.; Metcalf, W. W.; Chen, W. u. Price, N. P. J. (2011): Genome sequences of three tunicamycin-producing streptomyces strains, S. chartreusis NRRL 12338, S. chartreusis NRRL 3882, and S. lysosuperificus ATCC 31396. Journal of Bacteriology 193 (24): 7021–7022.

Dudareva, N.; Martin, D.; Kish, C. M.; Kolosova, N.; Gorenstein, N.; Fäldt, J.; Miller, B. u. Bohlmann, J. (2003): (E)-beta-ocimene and myrcene synthase genes of floral scent biosynthesis in snapdragon. Function and expression of three terpene synthase genes of a new terpene synthase subfamily. The Plant Cell 15 (5): 1227–1241.

Dudareva, N.; Pichersky, E. u. Gershenzon, J. (2004): Biochemistry of plant volatiles. Plant Physiology 135 (4): 1893–1902.

Egan, A. N.; Schlueter, J. u. Spooner, D. M. (2012): Applications of next-generation sequencing in plant biology. American Journal of Botany 99 (2): 175–185.

184

Literaturverzeichnis

Erbeldinger, M.; Mesiano, A. J. u. Russell, A. J. (2000): Enzymatic catalysis of formation of (Z)-aspartame in ionic liquid - An alternative to enzymatic catalysis in organic solvents. Biotechnology Progress 16 (6): 1129–1131.

Fäldt, J.; Martin, D.; Miller, B.; Rawat, S. u. Bohlmann, J. (2003): Traumatic resin defense in Norway spruce (Picea abies): Methyl-jasmonate-induced terpene synthase gene expression, and cDNA cloning and functional characterization of (+)-3-carene synthase. Plant Molecular Biology 51 (1): 119–133.

Fariha, H.; Aamer, A. S.; Sundus, J. u. Abdul, H. (2010): Enzymes used in detergents: lipases. African Journal of Biotechnology 9 (31): 4836–4844.

Fedurco, M.; Romieu, A.; Williams, S.; Lawrence, I. u. Turcatti, G. (2006): BTA, a novel reagent for DNA attachment on glass and efficient generation of solid-phase amplified DNA colonies. Nucleic Acids Research 34 (3): e22-25.

Fischbach, M. A. u. Clardy, J. (2007): One pathway, many products. Nature Chemical Biology 3 (7): 353–355.

Fischbach, R. J.; Zimmer, W. u. Schnitzler, J.-P. (2001): Isolation and functional analysis of a cDNA encoding a myrcene synthase from holm oak (Quercus ilex L.). European Journal of Biochemistry 268 (21): 5633–5638.

Fiser, A. (2010): Template-based protein structure modeling. National Institutes of Health 673 (1): 189–202.

Forster, P. G.; Ghisalberti, E. L.; Jefferies, P. R.; Poletti, V. M. u. Whiteside, N. J. (1986): Serrulatane diterpenes from Eremophila spp. Phytochemistry 25: 1377–1383.

Galata, M.; Sarker, L. S. u. Mahmoud, S. S. (2014): Transcriptome profiling, and cloning and characterization of the main monoterpene synthases of Coriandrum sativum L. Phytochemistry 102: 64–73.

Ganley, R. J. u. Newcombe, G. (2006): Fungal endophytes in seeds and needles of Pinus monticola. Mycological Research 110 (Pt 3): 318–327.

Gaßmeyer, S. K. (2015): Protein-Engineering und synthetische Anwendung der Arylmalonat- Decarboxylase aus Bordetella bronchiseptica. Dissertation, Bochum.

Gaydou, E. M.; Randriamiharisoa, R. u. Bianchini, J. P. (1986): Composition of the essential oil of ylang-ylang (Cananga odorata Hook Fil. et Thomson forma genuina) from Madagascar. Journal of Agricultural and Food Chemistry 34 (3): 481–487.

Genilloud, O.; Gonzalez, I.; Salazar, O.; Martin, J.; Tormo, J. R. u. Vicente, F. (2011): Current approaches to exploit actinomycetes as a source of novel natural products. Journal of Industrial Microbiology & Biotechnology 38 (3): 375–389. 185

Literaturverzeichnis

Gerber, N. N. (1969): A volatile metabolite of actinomycetes, 2-methyl borneol. The Journal of Antibiotics 22 (10): 508–509.

Gerber, N. N. (1971): Sesquiterpenoids from actinomycetes: Cadin-4-ene-1-ol. Phytochemistry 10 (1): 185–189.

Gerber, N. N. u. Lechevalier, H. A. (1965): Geosmin, an earthy-smelling substance isolated from actinomycetes. Applied Microbiology 6 (31): 935–938.

Gershenzon, J.; McConkey, M. E. u. Croteau, R. B. (2000): Regulation of monoterpene accumulation in leaves of peppermint. Plant Physiology 122 (1): 205–214.

Ghisalberti, E. L. (1992): A tricyclic diterpene from Eremophila serrulata. Phytochemistry 31 (6): 2168–2169.

Ghisalberti, E. L. (1994): The ethnopharmacology and phytochemistry of Eremophila species (Myoporaceae). Journal of Ethnopharmacology 44 (1): 1–9.

Gopalakrishnan, M.; Menon, N.; Padmakumari, K. P.; Jayalekshmy, A. u. Narayanan, C. S. (1993): GC analysis and odor profiles of four new Indian genotypes of Piper nigrum L. Journal of Essential Oil Research 5 (3): 247–253.

Gregson, R. P. u. Mirrington, R. N. (1976): The total synthesis of (±)-α-amorphene. Australian Journal of Chemistry 29 (9): 2037-2038.

Gruchattka, E. u. Kayser, O. (2015): In vivo validation of in silico predicted metabolic engineering strategies in yeast. Disruption of alpha-ketoglutarate dehydrogenase and expression of ATP-citrate for terpenoid production. PloS one 10 (12): e0144981.

Gschloessl, B.; Beyne, E.; Audiot, P.; Bourguet, D. u. Streiff, R. (2013): De novo transcriptomic resources for two sibling species of moths. Ostrinia nubilalis and O. scapulalis. BMC Research Notes 6: 73-77.

Guo, J.; Xu, N.; Li, Z.; Zhang, S.; Wu, J.; Kim, D. H.; Sano Marma, M.; Meng, Q.; Cao, H.; Li, X.; Shi, S.; Yu, L.; Kalachikov, S.; Russo, J. J.; Turro, N. J. u. Ju, J. (2008): Four-color DNA sequencing with 3'-O-modified nucleotide reversible terminators and chemically cleavable fluorescent dideoxynucleotides. Proceedings of the National Academy of Sciences of the United States of America 105 (27): 9145–9150.

Hackel, T. (2009): Untersuchungen von hydrophoben Protein-Ligandenwechselwirkungen in wässriger Lösung mittels STD-NMR am Beispiel der Enzymreaktion der (+)-Germacren D Synthase. Dissertation, Hamburg.

Hall, B. G. (2013): Building phylogenetic trees from molecular data with MEGA. Molecular Biology and Evolution 30 (5): 1229–1235.

186

Literaturverzeichnis

Hall, D. E.; Yuen, M. M. S.; Jancsik, S.; Quesada, A. L.; Dullat, H. K.; Li, M.; Henderson, H.; Arango-Velez, A.; Liao, N. Y.; Docking, R. T.; Chan, S. K.; Cooke, J. E.; Breuil, C.; Jones, S. J.; Keeling, C. I. u. Bohlmann, J. (2013a): Transcriptome resources and functional characterization of monoterpene synthases for two host species of the mountain pine beetle, lodgepole pine (Pinus contorta) and jack pine (Pinus banksiana). BMC Plant Biology 13: 80- 85.

Hall, D. E.; Zerbe, P.; Jancsik, S.; Quesada, A. L.; Dullat, H.; Madilao, L. L.; Yuen, M. u. Bohlmann, J. (2013b): Evolution of conifer diterpene synthases. Diterpene resin acid biosynthesis in lodgepole pine and jack pine involves monofunctional and bifunctional diterpene synthases. Plant Physiology 161 (2): 600–616.

Hampel, D.; Mosandl, A. u. Wust, M. (2005): Induction of de novo volatile terpene biosynthesis via cytosolic and plastidial pathways by methyl jasmonate in foliage of Vitis vinifera L. Journal of Agricultural and Food Chemistry 53 (7): 2652–2657.

Han, X.-J.; Wang, Y.-D.; Chen, Y.-C.; Lin, L.-Y. u. Wu, Q.-K. (2013): Transcriptome sequencing and expression analysis of terpenoid biosynthesis genes in Litsea cubeba. PloS one 8 (10): e76890.

Harismendy, O.; Ng, P. C.; Strausberg, R. L.; Wang, X.; Stockwell, T. B.; Beeson, K. Y.; Schork, N. J.; Murray, S. S.; Topol, E. J.; Levy, S. u. Frazer, K. A. (2009): Evaluation of next generation sequencing platforms for population targeted sequencing studies. Genome Biology 10 (3): R32.

Harrison, R. M. u. Hester, R. E. /Hrsg. (2000): Chemistry in the marine environment, Cambridge.

Heijne, G. (1985): Signal sequences. Journal of Molecular Biology 184 (1): 99–105.

Hezari, M.; Lewis, N. G. u. Croteau, R. (1995): Purification and characterization of taxa-4(5), 11(12)-diene synthase from pacific yew (Taxus brevifolia) that catalyzes the first committed step of taxol biosynthesis. Archives of Biochemistry and Biophysics 322 (2): 437–444.

Hill, A. M.; Cane, D. E.; Mau, C. J. u. West, C. A. (1996): High level expression of ricinus communis casbene synthase in Escherichia coli and characterization of the recombinant enzyme. Archives of Biochemistry and Biophysics 336 (2): 283–289.

Holopainen, J. K. u. Gershenzon, J. (2010): Multiple stress factors and the emission of plant VOCs. Trends in Plant Science 15 (3): 176–184.

Ikeda, H.; Ishikawa, J.; Hanamoto, A.; Shinose, M.; Kikuchi, H.; Shiba, T.; Sakaki, Y.; Hattori, M. u. Omura, S. (2003): Complete genome sequence and comparative analysis of the industrial microorganism Streptomyces avermitilis. Nature Biotechnology 21 (5): 526–531.

187

Literaturverzeichnis

Inouye, S.; Kojima, M.; Shomura, T.; Iwamatsu, K.; Niwa, T.; Kondo, Y.; Niida, T.; Ogawa, Y. u. Kusama, K. (1983): Discovery,isolation and structure of novel cephamycins of Streptomyces chartreusis. The Journal of Antibiotics 36 (2): 115–124.

Irmisch, S.; Muller, A. T.; Schmidt, L.; Gunther, J.; Gershenzon, J. u. Kollner, T. G. (2015): One makes the difference. The formation of ent-kaurene and 16-alpha-hydroxy-ent- kaurane by diterpene synthases in poplar. BMC Plant Biology 15: 262-268.

Jaenson, T. G. T.; Garboui, S. u. Pålsson, K. (2006): Repellency of oils of lemon , geranium, and lavender and the mosquito repellent MyggA natural to Ixodes ricinus (AcariIxodidae) in the laboratory and field. Journal of Medical Entomology 43 (4): 731–736.

Jain, N.; Aggarwal, K. K.; Syamasundar, K. V.; Srivastava, S. K. u. Kumar, S. (2001): Essential oil composition of geranium (Pelargonium sp.) from the plains of Northern India. Flavour and Fragrance Journal 16 (1): 44–46.

Janocha, S.; Schmitz, D. u. Bernhardt, R. (2015): Terpene hydroxylation with microbial cytochrome P450 monooxygenases. Advances in Biochemical Engineering/Biotechnology 148: 215–250.

Katsuyama, K.; Iwata, N. u. Shimazu, A. (2014): Purification and primary structure of proteinous α -amylase inhibitor from Streptomyces chartreusis. Bioscience, Biotechnology, and Biochemistry 56 (12): 1949–1954.

Kayser, O. u. Averesch, N. (2015): Technische Biochemie. Die Biochemie und industrielle Nutzung von Naturstoffen, Wiesbaden: 104-119.

Keeling, C. I. u. Bohlmann, J. (2006): Genes, enzymes and chemicals of terpenoid diversity in the constitutive and induced defence of conifers against insects and pathogens. The New Phytologist 170 (4): 657–675.

Keeling, C. I.; Weisshaar, S.; Ralph, S. G.; Jancsik, S.; Hamberger, B.; Dullat, H. K. u. Bohlmann, J. (2011): Transcriptome mining, functional characterization, and phylogeny of a large terpene synthase gene family in spruce (Picea spp.). BMC Plant Biology 11: 43-47.

Kijjoa, A. u. Sawangwong, P. (2004): Drugs and cosmetics from the sea. Marine Drugs 2 (2): 73–82.

Kim, H.-J.; Chen, F.; Wang, X. u. Rajapakse, N. C. (2006): Effect of methyl jasmonate on secondary metabolites of sweet basil (Ocimum basilicum L.). Journal of Agricultural and Food Chemistry 54 (6): 2327–2332.

Kircher, M. (2006): White biotechnology. Biotechnology Journal 1 (8): 787–794.

Köllner, T. G.; Schnee, C.; Gershenzon, J. u. Degenhardt, J. (2004): The variability of sesquiterpenes emitted from two Zea mays cultivars is controlled by allelic variation of two 188

Literaturverzeichnis terpene synthase genes encoding stereoselective multiple product enzymes. The Plant Cell 16 (5): 1115–1131.

König, W. A.; Joulain, D.; Grasse, R. u. Hochmuth, D. H. (2008): MassFinder 4.0, Terpenoids and related constituents of essential oils.

Kracht, O. N.; Ammann, A.-C.; Stockmann, J.; Wibberg, D.; Kalinowski, J.; Piotrowski, M.; Kerr, R.; Bruck, T. u. Kourist, R. (2017): Transcriptome profiling of the Australian arid-land plant Eremophila serrulata (A.DC.) Druce (Scrophulariaceae) for the identification of monoterpene synthases. Phytochemistry 136: 15–22.

Kürten, C. (2014): Aufreinigung und Charakterisierung von Nicotianaminsynthasen aus Arabidopsis thaliana und Arabidopsis halleri. Masterarbeit, Bochum.

Kuzma, J. u. Fall, R. (1993): Leaf isoprene emission rate is dependent on leaf development and the level of isoprene synthase. Plant Physiology 101 (2): 435–440.

Kyte, J. u. Doolittle, R. F. (1982): A simple method for displaying the hydropathic character of a protein. Journal of Molecular Biology 157 (1): 105–132.

Laemmle, K.; Zipper, H.; Breuer, M.; Hauer, B.; Buta, C.; Brunner, H. u. Rupp, S. (2007): Identification of novel enzymes with different hydrolytic activities by metagenome expression cloning. Journal of Biotechnology 127 (4): 575–592.

Landmann, C.; Fink, B.; Festner, M.; Dregus, M.; Engel, K.-H. u. Schwab, W. (2007): Cloning and functional characterization of three terpene synthases from lavender (Lavandula angustifolia). Archives of Biochemistry and Biophysics 465 (2): 417–429.

Lassila, J. K.; Keeffe, J. R.; Kast, P. u. Mayo, S. L. (2007): Exhaustive mutagenesis of six secondary active-site residues in Escherichia coli chorismate mutase shows the importance of hydrophobic side chains and a helix N-capping position for stability and catalysis. Biochemistry 46 (23): 6883–6891.

Latch, G. C.; Potter, L. R. u. Tyler, B. F. (1987): Incidence of endophytes in seeds from collections of Lolium and Festuca spp. Annals of Applied Biology 111 (1): 59–64.

Lathrop, R. H. u. Smith, T. F. (1996): Global optimum protein threading with gapped alignment and empirical pair score functions. Journal of Molecular Biology 255 (4): 641–665.

Leach, B. E.; Calhoun, K. M.; Johnson, L. E.; Teeters, C. M. u. Jackson, W. G. (1953): Chartreusin, a new antibiotic produced by Streptomyces chartreusis, a new species. Journal of the American Chemical Society 75 (16): 4011–4012.

Leavell, M. D.; McPhee, D. J. u. Paddon, C. J. (2016): Developing fermentative terpenoid production for commercial usage. Current Opinion in Biotechnology 37: 114–119.

189

Literaturverzeichnis

Liao, S.-M.; Du, Q.-S.; Meng, J.-Z.; Pang, Z.-W. u. Huang, R.-B. (2013): The multiple roles of histidine in protein interactions. Chemistry Central Journal 7 (1): 44.

Liu, W.; Feng, X.; Zheng, Y.; Huang, C.-H.; Nakano, C.; Hoshino, T.; Bogue, S.; Ko, T.-P.; Chen, C.-C.; Cui, Y.; Li, J.; Wang, I.; Hsu, S.-T. D.; Oldfield, E. u. Guo, R.-T. (2014): Structure, function and inhibition of ent-kaurene synthase from Bradyrhizobium japonicum. Scientific reports 4: 6214-6217.

Lopez-Gallego, F.; Wawrzyn, G. T. u. Schmidt-Dannert, C. (2010): Selectivity of fungal sesquiterpene synthases. Role of the active site's H-1 alpha loop in catalysis. Applied and Environmental Microbiology 76 (23): 7723–7733.

Lottspeich, F. u. Engels, J. W. /Hrsg. (2012): Bioanalytik, Berlin, Heidelberg.

Lowry, D. B.; Rockwood, R. C. u. Willis, J. H. (2008): Ecological reproductive isolation of coast and inland races of Mimulus guttatus. Evolution; International Journal of Organic Evolution 62 (9): 2196–2214.

Lubertozzi, D. u. Keasling, J. D. (2008): Expression of a synthetic Artemesia annua amorphadiene synthase in Aspergillus nidulans yields altered product distribution. Journal of Industrial Microbiology & Biotechnology 35 (10): 1191–1198.

Lulin, H.; Xiao, Y.; Pei, S.; Wen, T. u. Shangqin, H. (2012): The first Illumina-based de novo transcriptome sequencing and analysis of safflower flowers. PloS one 7 (6): e38653.

Martin, D.; Tholl, D.; Gershenzon, J. u. Bohlmann, J. (2002): Methyl jasmonate induces traumatic resin ducts, terpenoid resin biosynthesis, and terpenoid accumulation in developing xylem of Norway spruce stems. Plant Physiology 129 (3): 1003–1018.

Martin, V. J. J.; Pitera, D. J.; Withers, S. T.; Newman, J. D. u. Keasling, J. D. (2003): Engineering a mevalonate pathway in Escherichia coli for production of terpenoids. Nature Biotechnology 21 (7): 796–802.

Matsuo, N.; Kaneko, S.; Kuno, A.; Kobayashi, H. u. Kusakabe, I. (2000): Purification, characterization and gene cloning of two α-l-arabinofuranosidases from Streptomyces chartreusis GS901. Biochemical Journal 346 (1): 9–15.

McGarvey, D. J. u. Croteau, R. (1995): Terpenoid metabolism. The Plant Cell 7 (7): 1015– 1026.

Medema, M. H.; Blin, K.; Cimermancic, P.; Jager, V. de; Zakrzewski, P.; Fischbach, M. A.; Weber, T.; Takano, E. u. Breitling, R. (2011): antiSMASH. Rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genome sequences. Nucleic Acids Research 39 (Web Server issue): W339-46.

190

Literaturverzeichnis

Mehlmer, N.; Wurzinger, B.; Stael, S.; Hofmann-Rodrigues, D.; Csaszar, E.; Pfister, B.; Bayer, R. u. Teige, M. (2010): The Ca(2+) -dependent protein kinase CPK3 is required for MAPK- independent salt-stress acclimation in Arabidopsis. The Plant Journal : for Cell and Molecular Biology 63 (3): 484–498.

Metzker, M. L. (2010): Sequencing technologies - the next generation. Nature Reviews Genetics 11 (1): 31–46.

Miao, Z.; Wang, Y.; Yu, X.; Guo, B. u. Tang, K. (2009): A new endophytic taxane production from Taxus chinensis. Applied Biochemistry and Microbiology 45 (1): 81–86.

Michot, B.; Bachellerie, J.-P. u. Raynal, F. (1983): Structure of mottse rRNA precursors. Complete sequence and potential folding of the spacer regions between 18S and 28S rRNA. Nucleic Acids Research 11 (10): 3375–3391.

Moniodis, J.; Jones, C. G.; Barbour, E. L.; Plummer, J. A.; Ghisalberti, E. L. u. Bohlmann, J. (2015): The transcriptome of sesquiterpenoid biosynthesis in heartwood xylem of Western Australian sandalwood (Santalum spicatum). Phytochemistry 113: 79–86.

Mülhardt, C. (2013): Der Experimentator Molekularbiologie/Genomics. Springer Berlin Heidelberg. Berlin, Heidelberg, s.l. 30365.

Mydlarz, L. D.; Jacobs, R. S.; Boehnlein, J. u. Kerr, R. G. (2003): Pseudopterosin Biosynthesis in Symbiodinium sp., the Dinoflagellate Symbiont of Pseudopterogorgia elisabethae. Chemistry & Biology 10 (11): 1051–1056.

Nakamura, K.; Oshima, T.; Morimoto, T.; Ikeda, S.; Yoshikawa, H.; Shiwa, Y.; Ishikawa, S.; Linak, M. C.; Hirai, A.; Takahashi, H.; Altaf-Ul-Amin, M.; Ogasawara, N. u. Kanaya, S. (2011): Sequence-specific error profile of Illumina sequencers. Nucleic Acids Research 39 (13): e90.

Nakano, C.; Kim, H.-K. u. Ohnishi, Y. (2011): Identification of the first bacterial monoterpene cyclase, a 1,8-cineole synthase, that catalyzes the direct conversion of geranyl diphosphate. ChemBioChem 12 (13): 1988–1991.

Navia-Giné, W. G.; Yuan, J. S.; Mauromoustakos, A.; Murphy, J. B.; Chen, F. u. Korth, K. L. (2009): Medicago truncatula (E)-β-ocimene synthase is induced by insect herbivory with corresponding increases in emission of volatile ocimene. Plant Physiology and Biochemistry 47 (5): 416–425.

Ndi, C. P.; Semple, S. J.; Griesser, H. J.; Pyke, S. M. u. Barton, M. D. (2007): Antimicrobial compounds from Eremophila serrulata. Phytochemistry 68 (21): 2684–2690.

191

Literaturverzeichnis

Newberger, N. C.; Ranzer, L. K.; Boehnlein, J. M. u. Kerr, R. G. (2006): Induction of terpene biosynthesis in dinoflagellate symbionts of Caribbean gorgonians. Phytochemistry 67 (19): 2133–2139.

Newman, J. D.; Marshall, J.; Chang, M.; Nowroozi, F.; Paradise, E.; Pitera, D.; Newman, K. L. u. Keasling, J. D. (2006): High-level production of amorpha-4,11-diene in a two-phase partitioning bioreactor of metabolically engineered Escherichia coli. Biotechnology and Bioengineering 95 (4): 684–691.

Nowrousian, M. (2010): Next-generation sequencing techniques for eukaryotic microorganisms. Sequencing-based solutions to biological problems. Eukaryotic Cell 9 (9): 1300–1310.

Ogura, T.; Sunairi, M. u. Nakajima, M. (2000): 2-methylisoborneol and geosmin, the main sources of soil odor, inhibit the germination of brassicaceae seeds. Soil Science and Plant Nutrition 46 (1): 217–227.

Olsen, H. S. u. Falholt, P. (1998): The role of enzymes in modern detergency. Journal of Surfactants and Detergents 1 (4): 555–567.

Paluch, G.; Grodnitzky, J.; Bartholomay, L. u. Coats, J. (2009): Quantitative structure-activity relationship of botanical sesquiterpenes. Spatial and contact repellency to the yellow fever mosquito, Aedes aegypti. Journal of Agricultural and Food Chemistry 57 (16): 7618–7625.

Patel, R. N. /Hrsg. (2016): Green biocatalysis. John Wiley & Sons Inc. Hoboken, New Jersey.

Pechous, S. W. u. Whitaker, B. D. (2004): Cloning and functional expression of an (E, E)- alpha-farnesene synthase cDNA from peel tissue of apple fruit. Planta 219 (1): 84–94.

Pennacchio, M.; Syah, Y. M.; Ghisalberti, E. L. u. Alexander, E. (1996): Cardioactive compounds from Eremophila species. Journal of Ethnopharmacology 53 (1): 21–27.

Pichersky, E. u. Gershenzon, J. (2002): The formation and function of plant volatiles. Perfumes for pollinator attraction and defense. Current Opinion in Plant Biology 5 (3): 237–243.

Pichersky, E.; Raguso, R. A.; Lewinsohn, E. u. Croteau, R. (1994): Floral scent production in clarkia (Onagraceae): Localization and developmental modulation of monoterpene emission and linalool synthase activity. Plant Physiology 106 (4): 1533–1540.

Pickel, B.; Drew, D. P.; Manczak, T.; Weitzel, C.; Simonsen, H. T. u. Ro, D.-K. (2012): Identification and characterization of a kunzeaol synthase from Thapsia garganica. Implications for the biosynthesis of the pharmaceutical thapsigargin. The Biochemical Journal 448 (2): 261–271.

Pilz, G. (2010): Biotechnologie. Anwendung, Branchenentwicklung, Investitionschancen. Oldenbourg Wissenschaftsverlag. München. 192

Literaturverzeichnis

Rabe, P. u. Dickschat, J. S. (2013): Rapid chemical characterization of bacterial terpene synthases. Angewandte Chemie 52 (6): 1810–1812.

Ralph, S.; Oddy, C.; Cooper, D.; Yueh, H.; Jancsik, S.; Kolosova, N.; Philippe, R. N.; Aeschliman, D.; White, R.; Huber, D.; Ritland, C. E.; Benoit, F.; Rigby, T.; Nantel, A.; Butterfield, Y. S. N.; Kirkpatrick, R.; Chun, E.; Liu, J.; Palmquist, D.; Wynhoven, B.; Stott, J.; Yang, G.; Barber, S.; Holt, R. A.; Siddiqui, A.; Jones, S. J. M.; Marra, M. A.; Ellis, B. E.; Douglas, C. J.; Ritland, K. u. Bohlmann, J. (2006): Genomics of hybrid poplar (Populus trichocarpa x deltoides) interacting with forest tent caterpillars (Malacosoma disstria). Normalized and full-length cDNA libraries, expressed sequence tags, and a cDNA microarray for the study of insect-induced defences in poplar. Molecular Ecology 15 (5): 1275–1297.

Richmond, G. S. u. Ghisalberti, E. L. (1994): The Australian desert shrub Eremophila (Myoporaceae): Medicinal, cultural, horticultural and phytochemical uses. Economic Botany 48 (1): 35–39.

Robertson, V.; Haltli, B.; McCauley, E. P.; Overy, D. P. u. Kerr, R. G. (2016): Highly variable bacterial communities associated with the octocoral Antillogorgia elisabethae. Microorganisms 4 (3): 1-23.

Roche /Hrsg. (2014): 5`/3`RACE Kit, 2nd Generation.

Rodriguez, I. I.; Shi, Y.-P.; Garcia, O. J.; Rodriguez, A. D.; Mayer, A. M. S.; Sanchez, J. A.; Ortega-Barria, E. u. Gonzalez, J. (2004): New pseudopterosin and seco-pseudopterosin diterpene glycosides from two Colombian isolates of Pseudopterogorgia elisabethae and their diverse biological activities. Journal of Natural Products 67 (10): 1672–1680.

Rodriguez-Saona, C.; Crafts-Brandner, S. J.; ParÉ, P. W. u. Henneberry, T. J. (2001): Exogenous methyl jasmonate induces volatile emission in cotton plants. Journal of Chemical Ecology 27 (4): 679–695.

Rohmer, M. (1999): The discovery of a mevalonate-independent pathway for isoprenoid biosynthesis in bacteria, algae and higher plants. Natural Product Reports 16 (5): 565–574.

Roux, V.; Rydkina, E.; Eremeeva, M. u. Raoult, D. (1997): Citrate synthase gene comparison, a new tool for phylogenetic analysis, and its application for the rickettsiae. International Journal of Systematic Bacteriology 47 (2): 252–261.

Sadgrove, N. J. u. Jones, G. L. (2014): Cytogeography of essential oil chemotypes of Eremophila longifolia F. Muell (Scrophulariaceae). Phytochemistry 105: 43–51.

Salleh, A. B.; Basri, M.; Taib, M.; Jasmani, H.; Rahman, R. N. Z. A.; Rahman, M. B. A. u. Razak, C. N. A. (2002): Modified enzymes for reactions in organic solvents. Applied Biochemistry and Biotechnology 102: 349–357.

193

Literaturverzeichnis

Sander, D. (2016): Klonierung, Expression und Charakterisierung von Terpensynthasen. Bachelorarbeit, Bochum.

Sansom, M. u. Weinstein, H. (2000): Hinges, swivels and switches. The role of prolines in signalling via transmembrane α-helices. Trends in Pharmacological Sciences 21 (11): 445– 451.

Schmid, A.; Dordick, J. S.; Hauer, B.; Kiener, A.; Wubbolts, M. u. Witholt, B. (2001): Industrial biocatalysis today and tomorrow. Nature 409 (6817): 258–268.

Schmid, R. u. Hammelehle, R. (2016): Taschenatlas der Biotechnologie und Gentechnik, Weinheim. 342.

Schnee, C.; Köllner, T. G.; Gershenzon, J. u. Degenhardt, J. (2002): The maize gene terpene synthase 1 encodes a sesquiterpene synthase catalyzing the formation of (E)-beta-farnesene, (E)-nerolidol, and (E,E)-farnesol after herbivore damage. Plant Physiology 130 (4): 2049– 2060.

Schoch, C. L.; Seifert, K. A.; Huhndorf, S.; Robert, V.; Spouge, J. L.; Levesque, C. A. u. Chen, W. (2012): Nuclear ribosomal internal transcribed spacer (ITS) region as a universal DNA barcode marker for fungi. Proceedings of the National Academy of Sciences of the United States of America 109 (16): 6241–6246.

Schrader, J.; Bohlmann, J. u. Alonso-Gutierrez, J. /Hrsg. (2015): Biotechnology of isoprenoids, Cham. 475.

Sharon-Asa, L.; Shalit, M.; Frydman, A.; Bar, E.; Holland, D.; Or, E.; Lavi, U.; Lewinsohn, E. u. Eyal, Y. (2003): Citrus fruit flavor and aroma biosynthesis. Isolation, functional characterization, and developmental regulation of Cstps1, a key gene in the production of the sesquiterpene aroma compound valencene. The Plant Journal : for Cell and Molecular Biology 36 (5): 664–674.

Shendure, J. u. Ji, H. (2008): Next-generation DNA sequencing. Nature Biotechnology 26 (10): 1135–1145.

Singh, B. u. Sharma, R. A. (2015): Plant terpenes. Defense responses, phylogenetic analysis, regulation and clinical applications. 3 Biotech 5 (2): 129–151.

Smith, J. E.; Tucker, D.; Watson, K. u. Jones, G. L. (2007): Identification of antibacterial constituents from the indigenous Australian medicinal plant Eremophila duttonii F. Muell. (Myoporaceae). Journal of Ethnopharmacology 112 (2): 386–393.

Soding, J.; Biegert, A. u. Lupas, A. N. (2005): The HHpred interactive server for protein homology detection and structure prediction. Nucleic Acids Research 33 (Web Server issue): W244-8.

194

Literaturverzeichnis

Soyez, K. (1990): Biotechnologie, Basel.

Stein, A.; Takasuka, T. E. u. Collings, C. K. (2010): Are nucleosome positions in vivo primarily determined by histone-DNA sequence preferences? Nucleic Acids Research 38 (3): 709–719.

Stierle, A.; Strobel, G. A. u. Stierle, D. (1993): Taxol and taxane production by Taxomyces andreanae. Science 260: 214–216.

Stockmann, J. (2016): Untersuchungen von Sequenz-Funktion-Beziehnungen in Klasse I Terpensynthasen. Masterarbeit, Bochum.

Strobel, G. A. (2003): Endophytes as sources of bioactive products. Microbes and Infection 5 (6): 535–544.

Tabanca, N.; Wang, M.; Avonto, C.; Chittiboyina, A. G.; Parcher, J. F.; Carroll, J. F.; Kramer, M. u. Khan, I. A. (2013): Bioactivity-guided investigation of geranium essential oils as natural tick repellents. Journal of Agricultural and Food Chemistry 61 (17): 4101–4107.

Taechowisan, T.; Lu, C.; Shen, Y. u. Lumyong, S. (2005): Secondary metabolites from endophytic Streptomyces aureofaciens CMUAc130 and their antifungal activity. Microbiology 151 (5): 1691–1695.

Tholl, D. (2006): Terpene synthases and the regulation, diversity and biological roles of terpene metabolism. Current Opinion in Plant Biology 9 (3): 297–304.

Tippett, L. M. u. Massy-Westropp, R. A. (1993): Serrulatane diterpenes from Eremophila duttonii. Phytochemistry 33 (2): 417–421.

Tsumoto, K.; Ejima, D.; Kumagai, I. u. Arakawa, T. (2003): Practical considerations in refolding proteins from inclusion bodies. Protein Expression and Purification 28 (1): 1–8.

Turcatti, G.; Romieu, A.; Fedurco, M. u. Tairi, A.-P. (2008): A new class of cleavable fluorescent nucleotides. Synthesis and optimization as reversible terminators for DNA sequencing by synthesis. Nucleic Acids Research 36 (4): e25.

Turner, N. J. (2009): Directed evolution drives the next generation of biocatalysts. Nature Chemical Biology 5 (8): 567–573. van den Dool, H. u. Kratz, P. (1963): A generalization of the retention index system including linear temperature programmed gas-liquid partition chromatography. Journal of Chromatography 11: 463–471. van Dijk, E. L.; Auger, H.; Jaszczyszyn, Y. u. Thermes, C. (2014): Ten years of next-generation sequencing technology. Trends in Genetics 30 (9): 418–426.

195

Literaturverzeichnis

Vardakou, M.; Salmon, M.; Faraldos, J. A. u. O'Maille, P. E. (2014): Comparative analysis and validation of the malachite green assay for the high throughput biochemical characterization of terpene synthases. MethodsX 1: 187–196.

Wang, T.; Rabe, P.; Citron, C. A. u. Dickschat, J. S. (2013): Halogenated volatiles from the fungus Geniculosporium and the actinomycete Streptomyces chartreusis. Beilstein Journal of Organic Chemistry 9: 2767–2777.

Wang, Z.; Fang, B.; Chen, J.; Zhang, X.; Luo, Z.; Huang, L.; Chen, X. u. Li, Y. (2010): De novo assembly and characterization of root transcriptome using Illumina paired-end sequencing and development of cSSR markers in sweet potato (Ipomoea batatas). BMC Genomics 11: 726.

Watson, J. D. u. Crick, F. (1953): A structure for deoxyribose nucleic acid. Nature 171: 737– 738.

Wayne, G. F. u. Connolly, G. N. (2004): Application, function, and effects of menthol in cigarettes. A survey of tobacco industry documents. Nicotine & Tobacco Research 6 (1): 43- 54.

Wei, W.; Qi, X.; Wang, L.; Zhang, Y.; Hua, W.; Li, D.; Lv, H. u. Zhang, X. (2011): Characterization of the sesame (Sesamum indicum L.) global transcriptome using Illumina paired-end sequencing and development of EST-SSR markers. BMC Genomics 12: 451-455.

Weißmann, R. u. Gilissen, C. (2014): NGS Datenanalyse und Qualitätskontrolle. Medizinische Genetik 26 (2): 239–245.

Wenping, H.; Yuan, Z.; Jie, S.; Lijun, Z. u. Zhezhi, W. (2011): De novo transcriptome sequencing in Salvia miltiorrhiza to identify genes involved in the biosynthesis of active ingredients. Genomics 98 (4): 272–279.

Wenzel, G. (2006): Molecular plant breeding. Achievements in green biotechnology and future perspectives. Applied Microbiology and Biotechnology 70 (6): 642–650.

Whittington, D. A.; Wise, M. L.; Urbansky, M.; Coates, R. M.; Croteau, R. B. u. Christianson, D. W. (2002): Bornyl diphosphate synthase. Structure and strategy for carbocation manipulation by a terpenoid cyclase. Proceedings of the National Academy of Sciences of the United States of America 99 (24): 15375–15380.

Wildung, M. u. Croteau, R. (1996): A cDNA clone for taxadiene synthase, the diterpene cyclase that catalyzes the committed step of taxol biosynthesis. Journal of Biological Chemistry 271 (16): 9201–9204.

Williams, D. C.; McGarvey, D. J.; Katahira, E. J. u. Croteau, R. (1998): Truncation of limonene synthase preprotein provides a fully active 'pseudomature' form of this monoterpene cyclase

196

Literaturverzeichnis and reveals the function of the amino-terminal arginine pair. Biochemistry 37 (35): 12213– 12220.

Williams, D. C.; Wildung, M. R.; Jin, A. Q.; Dalal, D.; Oliver, J. S.; Coates, R. M. u. Croteau, R. (2000): Heterologous expression and characterization of a "Pseudomature" form of taxadiene synthase involved in paclitaxel (taxol) biosynthesis and evaluation of a potential intermediate and inhibitors of the multistep diterpene cyclization reaction. Archives of Biochemistry and Biophysics 379 (1): 137–146.

Wink, M. (2004): Molekulare Biotechnologie. Konzepte und Methoden, Weinheim, 834.

Wise, M. L.; Savage, T. J.; Katahira, E. u. Croteau, R. (1998): Monoterpene Synthases from common sage (Salvia officinalis). cDNA isolation, characterization and functional expression of (+)-sabinene synthase, 1,8-cineole synthase and (+)-bornyl disphosphate synthase. Journal of Biological Chemistry 273 (24): 14891–14899.

Wriessnegger, T.; Augustin, P.; Engleder, M.; Leitner, E.; Muller, M.; Kaluzna, I.; Schurmann, M.; Mink, D.; Zellnig, G.; Schwab, H. u. Pichler, H. (2014): Production of the sesquiterpenoid (+)-nootkatone by metabolic engineering of Pichia pastoris. Metabolic Engineering 24: 18–29.

Wright, F. u. Bibb, M. J. (1992): Codon usage in the G+C-rich Streptomyces genome. Gene 113 (1): 55–65.

Wu, Q.; Liang, J.; Lin, S.; Zhou, X.; Bai, L.; Deng, Z. u. Wang, Z. (2011): Characterization of the biosynthesis gene cluster for the pyrrole polyether antibiotic calcimycin (A23187) in Streptomyces chartreusis NRRL 3882. Antimicrobial Agents and Chemotherapy 55 (3): 974– 982.

Xiao, M.; Zhang, Y.; Chen, X.; Lee, E.-J.; Barber, C. J. S.; Chakrabarty, R.; Desgagne-Penix, I.; Haslam, T. M.; Kim, Y.-B.; Liu, E.; MacNevin, G.; Masada-Atsumi, S.; Reed, D. W.; Stout, J. M.; Zerbe, P.; Zhang, Y.; Bohlmann, J.; Covello, P. S.; Luca, V. de; Page, J. E.; Ro, D.-K.; Martin, V. J. J.; Facchini, P. J. u. Sensen, C. W. (2013): Transcriptome analysis based on next- generation sequencing of non-model plants producing specialized metabolites of biotechnological interest. Journal of Biotechnology 166 (3): 122–134.

Yamada, Y.; Cane, D. E. u. Ikeda, H. (2012): Diversity and analysis of bacterial terpene synthases. Methods in Enzymology 515: 123–162.

Yamada, Y.; Kuzuyama, T.; Komatsu, M.; Shin-Ya, K.; Omura, S.; Cane, D. E. u. Ikeda, H. (2015): Terpene synthases are widely distributed in bacteria. Proceedings of the National Academy of Sciences of the United States of America 112 (3): 857–862.

Yesilirmak, F. u. Sayers, Z. (2009): Heterelogous expression of plant genes. International Journal of Plant Genomics 2009: e296482.

197

Literaturverzeichnis

Yi, H.; Cho, Y.-J.; Won, S.; Lee, J.-E.; Jin Yu, H.; Kim, S.; Schroth, G. P.; Luo, S. u. Chun, J. (2011): Duplex-specific nuclease efficiently removes rRNA for prokaryotic RNA-seq. Nucleic Acids Research 39 (20): e140.

Yoshikuni, Y.; Ferrin, T. E. u. Keasling, J. D. (2006): Designed divergent evolution of enzyme function. Nature 440: 1078–1082.

Yu, F.; Harada, H.; Yamasaki, K.; Okamoto, S.; Hirase, S.; Tanaka, Y.; Misawa, N. u. Utsumi, R. (2008): Isolation and functional characterization of a beta-eudesmol synthase, a new sesquiterpene synthase from Zingiber zerumbet Smith. FEBS letters 582 (5): 565–572.

Zaferanloo, B.; Virkar, A.; Mahon, P. J. u. Palombo, E. A. (2013): Endophytes from an Australian native plant are a promising source of industrially useful enzymes. World Journal of Microbiology & Biotechnology 29 (2): 335–345.

Zerbe, P.; Hamberger, B.; Yuen, M. M. S.; Chiang, A.; Sandhu, H. K.; Madilao, L. L.; Nguyen, A.; Hamberger, B.; Bach, S. S. u. Bohlmann, J. (2013): Gene discovery of modular diterpene metabolism in nonmodel systems. Plant Physiology 162 (2): 1073–1091.

Zhao, T.; Krokene, P.; Hu, J.; Christiansen, E.; Bjorklund, N.; Langstrom, B.; Solheim, H. u. Borg-Karlson, A.-K. (2011): Induced terpene accumulation in Norway spruce inhibits bark beetle colonization in a dose-dependent manner. PloS one 6 (10): e26649.

Zhou, X.; Wang, Z.; Jiang, K.; Wei, Y.; Lin, J.; Sun, X. u. Tang, K. (2007): Screening of taxol- producing endophytic fungi from Taxus chinensis var. mairei. Applied Biochemistry and Microbiology 43 (4): 439–443.

Zhu, Y.; Li, X.; Sun, B.; Song, H.; Li, E. u. Song, H. (2012): Properties of an alkaline-tolerant, thermostable xylanase from Streptomyces chartreusis L1105, suitable for xylooligosaccharide production. Journal of Food Science 77 (5): C506-511.

Zini, C. A.; Augusto, F.; Christensen, E.; Caramão, E. B. u. Pawliszyn, J. (2002): SPME applied to the study of volatile organic compounds emitted by three species of Eucalyptus in situ. Solid- phase micro extraction. Journal of Agricultural and Food Chemistry 50 (25): 7199–7205.

198

Anhang

8. Anhang

8.1. Assemblierungsfehler

Die Abbildung lässt eindeutig erkennen, dass die potentielle Aminosäuresequenz sehr viele Wiederholungen von Threoninen (rot markiert) aufweist. Dies wird in den natürlichen Sequenzen pflanzlicher TPS eigentlich nicht beobachtet und lässt auf Assemblierungs- Artefakte schließen.

S. 1: Potentielles ORF des Gens jk 3. Es fällt auf, dass die assemblierte Sequenz eine hohe Anzahl an repetitiven Threoninen (rot) aufzeigt, was auf Assemblierungs-Artefakte schließen lässt.

8.2. Aminosäuresequenzen der Enzyme

Potentielle Startcodons sind in fett markiert.

>OK 1a LPGKKGEEKEEQMTMASIMMRMPISNKAINHLSASKPHHHGTAAALATARKPSCFVFRCSAAVPCEANRRSGNY PSVWDFDFIQSLDTNSNKGERYLTRASMLREQVKLLLEQQRLNPVDQLDLIDDLYRLGISYHFDGQIEQILTRIYEQ NYGTNYVPKERDLYSTALEFRLLRQHGFNVPQDVFDRFNDEMGDFNAILGVDTKGLLQLYEASFMLTEGENTLER ARDFATPILQKYLNDHHGYGSGGDENLSLLVSHALDLPLHWTCQRPYASWFIYAYEKRPDMNPVVLELAKLDFNI VQEVHREELKHVSRWWKQTGLSEVMPFARDRIVECYFWNSGGRFEPQYGYSRIVSTKVNILITVMDDIFDVYGTF EELHVFNKAIQRWDVEGIHELPKYMQMTFLALNNFITDVAYDVLREHGVPIIHLRKTWGDLFKSYVPEVTWYSTEY TPKLGEYIGNAWITVGGPIMLTHNFFGVKSPMEMEAVLRLYEYRNNDLVRWAATILRLTNDQGTSPDEMKRGDVP KAIQCYVHENGASREEAQEHIRLLIQEAWKKLNTERAANSTFPESFIRSAIELGRMGHCMYLRGDGLGVQNNHIND LISKLIFEPIV*

199

Anhang

>OK 1b LPGKKGEEKEEQMTMASIMMRMPISNKAINHLSASKPHHHGTAAALATARKPSCFVFRCSAAAVPCEANRRSGN YKPSVWDFDFIQSLDTNSNKGERYLTRASMLREQVKLLLEQQRLNPVDQQLDLIDDLYRLGISYHFDGQIEQILTRI YEQNYGTNYVPKERDLYSTALEFRLLRQHGFNVPQDVFDRFNDEMGDFNAILGVDTKGLLQLYEASFMLTEGENT LERARDFATPILQKYLNEHHGYGSGGDENLSLLVSHALDLPLHWTCQRPYASWFIYAYEKRPVMNPVVLELAKLD FNIVQEIHREELKDVSRWWKQTGLSEVMPFARDRIVECYFWNSAGRFEPQYGYSRIVSTKVNILITVMDDIFDVYG TFEELHVFSKAIQRWDVEGIHELPKYMQMSFLALNNFITDVAYDVLRDHGVPIIHHLRKTWGDLFKSYVPEVTWYS TEYTPKLGEYIGNAWITVGGPIMLTHNFFGVKSPMEMEAVQRLYEYRNNDLVRWAATILRLTNDQGTSADEMKRG DVPKAIQCYMHENGASREEAQEHIRLLIQEAWKKLNTERAANSTFPESFIRSAIELGRMGHCMYLRGDGLGVQNN HINDLISKLIFEPIV*

>OK 3_lang GQTQLCSNLAMSLQFSINSTLFRHRRSWGVSRSSNPSFTRVSASLDTRVSGVASADTASLCFEETKERIAKLVHR TELSVSTYDTAWVAMVPSPHSSQEPCFPDCVNWLLENQCRDGSWARPHHHSLLTKDVLSSTLACVLALGKWGV GEEHINRGLRFIEMNFASATDRDQISPMGFEIIFPGMIESARDLSLNLNLDKTTLNDVIYERNLELQRCYQGHSPGS EAYLAYVAEGMGRTCDWESVLKYQRKNGSLFNSPSTTSAAFIHLQNAGCLNYLNLTLKKFGNAVPAVYPLNINPK LCMVDTLEKLGISRYFKMEIQSLLDEVYRCWMQGDEEIFMDASTCALAFRVLRMSGYDVISDSITKLLQEESFSSS SSGNMKDIQTTLELYKASELIICPDESDMEEQTSRLKHLLEQELSSGLIYSRQLGRNIDKEVNHVLQNPFYATLKRIA NRRNIEQYDSHDTRILKTSYCSPNFGNKDLLFLSVADFNKCQAAHREELKALERWVVENRLDELKFARSKSAYCY FSAAATIFSPELSDARMAWAKNGVLTTVVDDFFDVGGSIEELKNLIHLIEAWDLDVTTVCASQNVQIIFSALKGTICEI GDKAFIRQGRSVTSHIIQIWLDLLNSMMKETEWARDSYLPTMDEYMSNAYVSFALGPIVLPALYLVGPKLSDEMVH HSEYHNLFKLMSTCGRLLNDTRTCERELKEGKLNAVPLHMIHSSGGMTKEDAIVEIKRLIDRRRRELLGLVLDGKS SVIPRACKDLFWHMSTVVHLFYSKDDGFTSQDLIQVVNQIIHEPIVLNEL*

>OK 4a *IHPTHNNSYRRERLVIKFTKMAAMVTTSLLIPSKLAVHDICTFKHDRKGSLCTSSPVYSNAIITRPCSSLSSTPERSC VQQDAPIAVRRSGNFKPPLWDFDYIESLNSPYKEERYLRRASELKLQVEMLIEEAILNEPVIKQLELIDDMQRLGIAD HFENQITRILNNIYNKKYGKNYEDDDKPCERDLYSTALEFRLLRQHGFRVSQDVFDCFRNEEGEFMKASTLAEDTK GLLQLYESSFLSTQGESTLDQAREFATIYLRRNLDDQGLIIDEYLSFLVGCALKLPYHWSIPRFRARTFIGAYERKSD AITTMLEFAKLDFNIFQATNQEELKNVTRLWKSTGVADKLHFARVELVTSYVWAFGLVQPRECGYARMEMATLLN LIFAVDDIFDVYGTPEELQLYNDAIQRWDTESINQLPYYMQIHYLAQFNFVNGVAYNFLKEQGSVVIPHLRKSLFDF LCSQLQEAKWFHKGQKPSLEEYMKNGWISAGGPMLLSYIYFLLQNTVKKEAIRGLHEYHNVLRLPSVVVRLTNDL KTAKAEMERGDAPKAMECYMNDTGASEKKAREHILSLNQETWMKLNGEAADAESLFSRTFITCCVNFGRFGHYL YQADDGLGEPNLTLEDQINGLLFEPIL*

>OK 4b IHPTHNNSYRRERLVIMFTKMTAMVTTSLLIPSKLAVHDICTFKHDRKGSLCTSSPVYSNAIITRPCSSLSSTPERSC VQQDAPIAVRRSGNFKPPLWDFDYIESLNSPYKEERYLRRASKLKLQVEMLIEEAILNEPVIKQLELIDDMQRLGIAD HFENQITRILNNIYNKKYGKNYEDDDKPCERDLYSTALEFRLLRQHGFRVSQDVFDCFRNEEGEFMKASTLADDT KGLLQLYESSFLSTQGESTLDQAREFATISLRRNLDDQGLIIDEYLSFLVGCALKLPYHWSIPRFRARTFIGAYERKS DAITTMLEFAKLDFNIFQATNQEELKNVTRLWKSTGVADKLHFARVELVTSYVWAFGLVQPREYGYARMEMATLL NLIFAVDDIFDVYGTPEELQLYNDAIQRWDTESINQLPYYMQIHYLAQFNFVNGVAYNFLKEQGSVVIPHLRKSLFD FLCSQLQEAKWFHKGQKPSLEEYMKNGWISAGGPMLLSYIYFLLQNTVKKEAIRGLYEYHNVLRLPSVVVRLTND LKTAKAEMERGDAPKAMECYMNDTGASVKKAREHILSLNQETWMKLNGEAADAESLFSRTFITCCVNFGRFGHY LYQADDGLGEPNLTLEDQINGLLFEPIL* 200

Anhang

>OK 6 TKVSSSIYITEIEMR*KERLS*LNNYQKMVDTVTHVNGQYLDFPKDVRPPMESFTPSLWTDTFTSFSLDPQVQETYA NAIEALMDEARTMLVAEENTSRDRLVLINTLERLGVAYHFEEEIEDQLRKIYKYYSKDDDTKDFDLFTTALQFRLLR QHRYHVSCSAFDRFKGKDNKFKETLSNDAKGLLSLYEAAHLRIHGDDILEEAIAFTTHHLKRLVDQLDSPLQDQVK RALEQTPHRGIPRMETRHFISFYEKEDSKNEKLLRLAKLDYNYLQNIYKKELCELMRWWNEFDLKSKLPHSRDRM VECYLWGLAVHFEPEYSFFRVATGKSLQLATLMDDTYDNYATLEEAELFTEVLQRWDRNEIHRLPEYMKIVYNFVL TTYEEFEREAAELGKSFVVPYAKEAVKQLGRAFNKELNWFMGRQMPSFEDYFANAVITSCIYKVFTAGFQGTKSV SKEVMDWLSSQPTMLVATAKMGRYVQDLGSHEREEKGGEMLTAVDCYMKQHSMSKEETLLKFVELAEDGWKD VNTELLKVTSIPEDVVMCFLNYVRAAEVTYKNGKDGYTHPEEFLAPQIAALFVDPIVI*

>JK 7 RVSMSTFFFFFRGLCHRVPMAAATTGDLSKNILRDMKGGHRQSLWTDTPLSFDAEGQERHAGAVQPLKEVRRTI TATHSKPKDKMMLIDTLERLGIAHYFEQEIEEQIEQIFKFHAGDGLTEVIFITTALYFRLFRQHGYDIPSNVFDKFMDK DNKFSKNLINDIEGLLSLYEASYLRYHGEDILDEAMAFTKHHLTQAKPQLASCLREKVSWALDQPIHRVTEFLEARY YISIYENEGSKNEQLLKLAKLNFNILQSSYKKELADLFKWWNEFNIASKLPYVRERLVGCYFWAVGIAFEPQHSSSR LAVAKSIAMMMVINDTYDSYAPLEELFLFTETVKGWNVKEIEKLPEYMKVAYSFLLHAYEDQDREVSKQGRPYAVS YATEAMKQLAVGYLTKAKWYKGQEMPRFEDHIANAVIVGGCDAILSACYMGMESASEEAFDWLKTEPKIVAASNN LVRFMNDIGSYEREQRTGQFPTPVDCYMVENGASKQETLNKFLEFAEDAWKTVNKEWVANACAPKPLMKAALNF SRCVHVTYGGSLDGFTNSEKGLGPYIAALLVDPIDI*

>Strep_01776 MTQPFELPHFYMPHPARLNPHVDEARAHSSEWAREMGMLEGSGVWEQADLDAHDYGLLCAYTHPDCDGPALS LITDWYVWVFFFDDHFLEMYKRSQDRVAGKAHLDRLPLFMPLDLSTPVPEPENPVEAGLADLWARTVPRMSQD WRRRFAVATEHLLNESLWELSNINEGRIANPVEYIEMRRKVGGAPWSAGLVEYATAEVPASVAESRPLRVLMETF SDAVHLRNDLFSYQREVEDEGENSNGVLVLETFFGCTTQEAADTVNDVLTSRLHQFEHTAFTEVPAVALEKGLTP DEVAAVAAYTKGLQDWQSGGHEWHLRSSRYMNENARGSKPWPGCSGMGTSAADVRALLATAGAERLRAYTHV PYQKVGPSQIPDIRMPFPLELSPHLDNARRSLRDWVDRMGILAEGVWDEDKLRAYDLPLCSAGLDPDATPEALDL SAQWLAWGTYGDDYYPLVYGHRRDLAAARLTTARLSDCMPVAGEAPLAPANAMERGLVDLWLRTTAEMTPEAR RTLKDAINVMTESWVWELSNQLQNRVPDPVDYLEMRRATFGSDLTLSLCRMGHGPAIPPEVYRSGPVRSLENAA MDFACLLNDVFSYQKEIEYEGEIHNAILVVQSFFGCDYPTGLGIVHDLMSQRMRQFEHVVEHELPILYEDFRLTDE GRAAMQQYVADLRNWMAGILNWHREVDRYKADWLASRAHGFLPDRPPAVPVPALG*

>Strep_02673

MHALSHGTTSTPTTIAVPPSLSLPVIEAAFPRQLHPYWPKCQEKTRAWLLEKRLMPADKVEEYADGLCYTDLMAG YYIGASDEVMQAIADYSAWFFVWDDRHDRDIVHGRPVAWRRLRDRLHSALDSPGEHLHHEDPLVAGFADSVLRL YAFLPGTWNLRFARHFHAVIDAYDREFYNRTHGIVPSVEEYLLLRRLTFAHWIWTDLLEPAAGCELPATVRKHPAY RRAALLSQEFAAWYNDLCSLPKEIAGDEVHNLGISLITHEGLTLEQAVVEVRRRVEKCITEFLDVEQEALRFADALA DGTVRGKELSAAVRACLSNMRNWFSSVYWFHHESGRYMVDSWDDRSTPPYVNNEAAGEK*

>Strep_07544

MPQDVRFDLPFDTPVSEHLEYARARHLRWVWEMRLVRSRDGFEEYKSWDLPQAAARTYPHASADDMVVLMNW FSLAFLFDDQFDASRPDRADRIAEVARELIVTPLRPAGSPPRVACPITLAWAEVWKYLSHGMSLTWQTRFAASWG RFLVAHCEEVDLAARGLEGTLGLDEYAEFRRRTVGIHHSIDAGERSRGFEVPAQAMGHPVMERMRDLAADTIGF

201

Anhang

MNDIHSFEREKRRGDGHNLIAVLRRERGCSWQQATDEAYRMTIACLDEYLELQERVPQMCDELRLDEAERDRVR MGVEAIQHWINGNYEWALTSGRYAAAKEGPVATAELAGRGSVDDLLTV*

>Strep_06147

MAATTVDTPPFYCPIEPAVHPQAEEAERRALAWVHRSGLCRSDAERARFAGTRSADFYARFAPHADLERLWITAC WVYWGFAFDDARCDEGPFATDPAAFASMAFSVQRALEVPGPLHCADPYAAALHEIGELFRASAGPVQNRRFHH AHRAWLTGVQWQIGNRATGHMPDLDDYLTMRLHSAGGEPTYAMLEIANGLDVPDREMDSPAVCALTEMAILVAA LDNDRHSHAREISRRQTGQNIISVLMAHHHYSLPQAIEEAIALRDAVLERFLSLRDLITPRASAPLRHYLTDLGHGIR GNIEWGLHVPRYLTRSDPGPAPRYRIPAQTATSLWTDTPRTSRQDPRHLPSIAWWWKDPGF*

>Strep_07041

MSATHEEITLAAQDGIPVVDLRELIDANLYMPFPFQRNPHASEAAAGVDEWLSTWGLTDDPAVAAMISRTRPAELA ACNSPTMDPGLLQIMADQIAYQFIFDDRAEDVGRHTPGRLLPMLCESIAILRDGQPPTTPLGAALADLHRQVRERC TPAQAARWAWNSREYVHGLLYEAVAQTDAVPVGSGLCRSIRSLIAGVEPFYPLCEAAQPCELTPKEIHHPVMRRL SRLSADAAVWIPDLFSAVKEQRAGGVINLALAYQRSHRCTLPVAVTLATWHINSTIREFEELYGELRPELTPSGVG YVEGMAGWIRGCYYWSRTVPRYADAMAAPSVP*

202

CURRICULUM VITAE OCTAVIA NATASCHA KRACHT

Persönliche Daten

Geburtstag 2. November 1987 Geburtsort Unna, Deutschland Nationalität Deutsch

Ausbildung

Seit 05/2014 Doktorandin in der Nachwuchsgruppe „Mikrobielle Biotechnologie“

unter Leitung von Jun.-Prof. Dr. Robert Kourist an der

Ruhr-Universität Bochum

„Biokatalytische Diversität der Terpenbildung in Pflanzen und Bakterien”

10/2011-02/2014 M.Sc.-Studiengang der „Chemischen Biologie“ an der

Technischen Universität Dortmund

Masterarbeit am Lehrstuhl für chemische Biotechnologie unter

Leitung von Prof. Andreas Schmid

„Mutagenesis and analysis of Pseudomonas sp. strain VLB120“

10/2007-10/2011 B. Sc.-Studiengang der „Chemischen Biologie“ an der

Technischen Universität Dortmund

06/2007 Abitur am Pestalozzi-Gymnasium Unna

203

Internationale Erfahrung

09/2014-12/2014 Gastwissenschaftlerin am Lehrstuhl von Prof. Russell Kerr

Stipendium über die RUB Research School plus

University of Prince Edward Island, Kanada

03/2013-06/2013 ERASMUS-Student am Lehrstuhl von Prof. Andreas Plückthun,

Universität Zürich, Schweiz

Arbeitserfahrung

01/2012-06/2012 Wissenschaftliche Hilfskraft am Lehrstuhl von Prof. Daniel Rauh

Lehrstuhl für medizinische Chemie, TU Dortmund

12/2009-12/2010 Studentische Hilfskraft in der Arbeitsgruppe von Dr. Daniel Rauh,

Chemical Genomics Centre der Max-Planck-Gesellschaft,

Dortmund

Publikationen

Kracht O. N.; Ammann, A. C.; Stockmann, J.; Wibberg, D.; Kalinowski, J.; Piotrowski, M.; Kerr, R.; Brück, T.; Kourist, R. (2017). Transcriptome profiling of the Australian arid-land plant Eremophila serrulata (A.DC.) Druce (Scrophulariaceae) for the identification of monoterpene synthases. Phytochemistry, Vol. 136.

Schmutzler, K.; Kracht, O. N.; Schmid, A.; Bühler, K. (2016). Trophic regulation of autoaggregation in Pseudomonas taiwanesis VLB120. Applied Microbiology and Biotechnology, Vol. 100(1).

Kourist, R.; Bracharz, F.; Lorenzen, J.; Kracht, O. N.; Chovatia, M.; Daum, C.; Deshpande, S.; Lipzen, A.; Nolan, M.; Ohm, R. A.; Grigoriev, I. V.; Sun, S.; Heitman, J.; Brück, T.; Nowrousian, M. (2015). Genomics and transcriptomics analysis of the oil-accumulating basidiomycete yeast Trichosporon oleaginosus: Insights into substrate utilization and alternative evolutionary trajectories of fungal mating systems, mBio, Vol. 6(4).

204

Konferenzbeiträge

Juli 2015 Posterpräsentation auf dem Annual Meeting der American Society for Pharmacognosy, Copper Mountain, Colorado, USA

September 2015 Posterpräsentation auf der 2nd European Conference on Natural Products, Dechema, Frankfurt am Main, Deutschland Stipendium zur Frauenförderung der Fakultät für Biologie der Ruhr- Universität Bochum

205