A Comparative Genomics Study of the Genes Involved in the Catabolic Pathways of Naphthalene”
Total Page:16
File Type:pdf, Size:1020Kb
Título del Trabajo Final “Bacterial degradation of petroleum hydrocarbons; a comparative genomics study of the genes involved in the catabolic pathways of naphthalene” Nombre Estudiante: Athanasía Varsaki Plan de Estudios del Estudiante: Bioinformática Área del trabajo final: Microbiología, biotecnología y biología molecular Nombre Consultor/a: Paloma Pizarro Tobías Nombre Profesor/a responsable de la asignatura: Paloma Pizarro Tobías Fecha Entrega: 02/01/2018 Esta obra está sujeta a una licencia de Reconocimiento-NoComercial- SinObraDerivada 3.0 España de Creative Commons Licencias alternativas (elegir alguna de las siguientes y sustituir la de la página anterior) A) Creative Commons: Esta obra está sujeta a una licencia de Reconocimiento-NoComercial- SinObraDerivada 3.0 España de Creative Commons Esta obra está sujeta a una licencia de Reconocimiento-NoComercial-CompartirIgual 3.0 España de Creative Commons Esta obra está sujeta a una licencia de Reconocimiento-NoComercial 3.0 España de Creative Commons Esta obra está sujeta a una licencia de Reconocimiento-SinObraDerivada 3.0 España de Creative Commons Esta obra está sujeta a una licencia de Reconocimiento-CompartirIgual 3.0 España de Creative Commons Esta obra está sujeta a una licencia de Reconocimiento 3.0 España de Creative Commons B) GNU Free Documentation License (GNU FDL) Copyright © AÑO TU-NOMBRE. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.3 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back- Cover Texts. A copy of the license is included in the section entitled "GNU Free Documentation License". C) Copyright © (el autor/a) Reservados todos los derechos. Está prohibido la reproducción total o parcial de esta obra por cualquier medio o procedimiento, comprendidos la impresión, la reprografía, el microfilme, el tratamiento informático o cualquier otro sistema, así como la distribución de ejemplares mediante alquiler y préstamo, sin la autorización escrita del autor o de los límites que autorice la Ley de Propiedad Intelectual. FICHA DEL TRABAJO FINAL Bacterial degradation of petroleum hydrocarbons; a comparative genomics Título del trabajo: study of the genes involved in the catabolic pathways of naphthalene Nombre del autor: Athanasia Varsaki Nombre del consultor/a: Paloma Pizarro Tobías Nombre del PRA: Paloma Pizarro Tobías Fecha de entrega (mm/aaaa): 01/2018 Titulación:: Bioinformática Microbiología, biotecnología y biología Área del Trabajo Final: molecular Idioma del trabajo: Ingles Bioremediation; biodegradation; catabolic Palabras clave genes Resumen del Trabajo (máximo 250 palabras): Los compuestos aromáticos se encuentran entre los contaminantes más prevalentes y persistentes en el medio ambiente. El suelo y los sedimentos contaminados con petróleo suelen contener una mezcla de hidrocarburos aromáticos policíclicos (PAHs) y heterocíclicos. La información sobre el catabolismo de compuestos aromáticos xenobióticos naturales por bacterias ha aumentado considerablemente en los ultimos años. Los estudios detallados más recientes incluyen en general pocas rutas metabólicas, en un rango relativamente limitado de bacterias, en su mayoría del género Pseudomonas, y no hay estudios disponibles con respecto a la genómica comparativa de estas i bacterias. En este trabajo proponemos un estudio genético comparativo de los genes involucrados en la ruta catabólica del naftaleno. Usando la enzima naftaleno 1,2-dioxigenasa ferrodoxin-NAD(P)+ reductasa (NahAa, Acc. Number: AAS79488.1) de Pseudomonas putida como marcador filogenético, intentamos identificar las proteínas homólogas presentes en las bases de datos de NCBI. Por genómica comparativa, pretendemos identificar los posibles grupos de las vías catabólicas del naftaleno y la estructura de los operones. Los resultados de este estudio indican que las bacterias degradan naftaleno principalmente a través de la vía "clásica" de naftaleno, descrita para el género Pseudomonas o a través de la ruta alternativa del gentisato-salicilato. Abstract (in English, 250 words or less): Aromatic compounds are among the most prevalent and persistent pollutants in the environment. Petroleum-contaminated soil and sediment commonly contain a mixture of polycyclic aromatic hydrocarbons (PAHs) and heterocyclic aromatics. In recent years there has been a quantum leap in the information published about the catabolism of natural xenobiotic aromatic compounds by bacteria. At present the most detailed studies have been carried out on relatively few metabolic pathways, in a rather limited range of bacteria, mostly of the genus Pseudomonas, but there is no study available regarding the comparative genomics of these bacteria. Here we propose a comparative genetics study of the genes involved in the catabolic pathway of naphthalene, using the naphthalene 1,2-dioxygenase system ferredoxin-NAD(P)+ reductase enzyme (NahAa, Acc. Number: AAS79488.1) from Pseudomonas putida as a phylogenetic marker. By that way we intent to identify the homologous proteins present in the NCBI databases and through the proteins make conclusions about possible groups of the catabolic pathways of naphthalene and their operon structure. Results of this study indicate that bacteria mainly degrade naphthalene through either the “classic” nah pathway described for Pseudomonas genus or the alternative gentisate-salicylate pathway. ii Index 1. Introducción .................................................................................................... 1 1.1 Contexto y justificación del Trabajo ........................................................... 1 1.2 Objetivos del Trabajo ................................................................................. 4 1.3 Enfoque y método seguido ........................................................................ 4 1.4 Planificación del Trabajo ........................................................................... 7 1.5 Breve sumario de los productos obtenidos ................................................ 8 1.6 Breve descripción de los otros capítulos de la memoria............................ 8 2. Resultados y Discusión .................................................................................. 9 2.1 Construction of the dataset ........................................................................ 9 2.2 Construction of protein profiles, alignments and phylogenetic trees ........ 10 2.3 Localization of the genes/operons ........................................................... 17 2.3.1 Putative nah catabolising operons composed by 12 genes .................. 17 2.3.2 Putative nah catabolising operons composed by 11 genes .................. 22 2.3.3 Putative nah catabolising operons composed by 9 genes .................... 25 2.3.4 Putative nah catabolising operons composed by 7 genes .................... 28 2.3.5 Putative nah catabolising operons composed by 6 genes .................... 34 2.3.6 Putative nah catabolising operons composed by 4 genes .................... 37 2.3.7 Putative nah catabolising operons composed by 3 genes .................... 39 3. Conclusions and general discussion. ........................................................... 40 4. Glosario ........................................................................................................ 44 5. Bibliografía ................................................................................................... 45 6. Anexos ......................................................................................................... 50 iii Lista de figuras Figure 1: Proposed bacterial catabolic pathway of naphthalene Figure 2: Chronogram of this study Figure 3: Reaction catalyzed by the three-component naphthalene dioxygenase (NDO) system. Figure 4: A representative alignment (it is shown only 15 protein from the 224 used) of the proteins retrieved from the PSI-BLAST. Conserved amino acids are shown with an asterisk. Figure 5: The maximum-likelihood (ML) phylogenetic tree was built with the 224 NahAa homologues present in NCBI database un to October 2017. Bootstrap values are indicated at the corresponding nodes of the ML tree. The cut-off value for the condensed tree was chosen at bootstrap value=50%. The NahAa from P. putida SG1 is indicated with a red circle. Proteins from plasmids are indicated with a blue circle. Figure 6: Genome-to-genome comparison of the nah operon from P. putida strain BS202 with the putative operon from Polaromonas sp. JS666. Analysis was performed with EasyFig2.2.2. Figure 7: Genetic organization of the putative nah operon from Polaromonas sp. JS666. Color code: genes reported as involved in naphthalene degradation are shown in light blue color, genes reported as involved in degradation of other aromatic compounds are shown in light orange colour, genes of other metabolic pathways are shown in black. Figure 8: Proposed model for the conversion of salicylate to gentisate. Figure 9: Genome-to-genome comparison of the nah operon from P. putida strain BS202 with the putative operon from B. multivorans strain DDS 15A-1. Figure 10: Genetic organization of the putative nah operon from B. multivorans strain DDS 15A-1. Color code: light blue: genes reported as involved in naphthalene degradation; orange: genes reported as involved in other degradation routes; black: genes of other metabolic pathways. iv Figure 11: Genetic organization of the putative nah