Insight Into Intracellular Bacterial Genome Repertoire Using Comparative Genomics
Total Page:16
File Type:pdf, Size:1020Kb
Aix-Marseille Université Faculté de Médecine de Marseille Ecole Doctorale des Sciences de la Vie et de la Santé THESE DE DOCTORAT présentée et soutenue le 18 Décembre 2013 par Mano Joseph MATHEW En vue de l'obtention du grade de docteur de l'Université Aix-Marseille Spécialité : Pathologie humaine et Maladies Infectieuses ______________________________________________________________________________ Insight into intracellular bacterial genome repertoire using comparative genomics ______________________________________________________________________________ Composition du jury : M. le Professeur Jérôme ETIENNE Rapporteur M. le Professeur Max MAURIN Rapporteur M. le Professeur Jean-Louis MEGE Président du Jury M. le Professeur Didier RAOULT Directeur de Thèse Unité de Recherche sur les Maladies Infectieuses Tropicales et Emergentes (URMITE), UM 63 CNRS 7278 IRD 198 INSERM 1095 1 2 To my Lord, precious family and friends… 3 4 Preamble Le format de présentation de cette thèse correspond à une recommandation de la spécialité Maladies Infectieuses et Microbiologie, à l'intérieur du Master de Sciences de la Vie et de la Santé qui dépend de l'Ecole Doctorale des Sciences de la Vie de Marseille. Le candidat est amené à respecter des règles qui lui sont imposées et qui comportent un format de thèse utilisé dans le Nord de l'Europe permettant un meilleur rangement que les thèses traditionnelles. Par ailleurs, la partie introduction et bibliographie est remplacée par une revue envoyée dans un journal an de permettre une évaluation extérieure de la qualité de la revue et de permettre à l'étudiant de le commencer le plus tôt possible une bibliographie exhaustive sur le domaine de cette thèse. La thèse est présentée sur article publié, accepté ou soumis associé d'un bref commentaire donnant le sens général du travail. Cette forme de présentation a paru plus en adéquation avec les exigences de la compétition internationale et permet de se concentrer sur des travaux qui bénéficieront d'une diffusion internationale. Professeur Didier RAOULT 5 Abstract Prokaryotic microorganisms are prevalent in all the environments on Earth. Given their ecological ubiquity, it is not surprising to find many prokaryotic species in close relationships with members of many eukaryotic taxa, often establishing a persistent association, which is known as symbiosis. Conforming to the fitness effects on the members of the symbiotic relationship, associations can be referred to as parasitism, mutualism or commensalism and, depending on the location of the symbiont with respect to host cells, as ectosymbiosis or endosymbiosis. Genome sequencing, especially using Next Generation Sequencing (NGS) has changed radically the face of microbiology and has helped to discern how the diverse group of intracellular bacteria evolved to survive and replicate in host cells. Therefore, the initial purpose of my thesis is to understand with the help of comparative genomics, genomic variations based on coexistence, by examining data on the ancient existence of intracellular bacteria, their host adaptation and the differences between sympatry and allopatry. The first part of my thesis is a review giving insight into intracellular bacterial genome repertoire and symbionts. The goal of this review is to explore how intracellular microbes acquire their specific lifestyle. Due to their different evolutionary trajectories, these bacteria have different genomic compositions. We reviewed data on the ancient existence of intracellular bacteria, their host adaptation and the differences between sympatry and allopatry. Furthermore, we elaborate on the genomic repertoire to understand the phenomenon of gene loss in intracellular bacteria. To understand the genomic repertoire and its composition in intracellular bacteria, it is essential to understand specialization in bacteria with respect to their niches. A comparison of the genomic contents of bacteria with certain lifestyles revealed the bacterial capacity to exchange genes to different extents, 6 depending on the ecosystem. Moreover, genomics has provided important clues to the mechanisms driving the genome-reduction process, the functions that are retained when a species becomes intracellular, and the role of the host in molding the genomic composition of intracellular bacteria. The second part of my thesis present about the genome sequence of Diplorickettsia massiliensis strain 20B which is an obligate intracellular, gram negative bacterium isolated from Ixodes ricinus ticks collected from Slovak. In the third part, we investigated the genome repertoire of Diplorickettsia massiliensis compared to closely related bacteria according to its niche, revealing its allopatric lifestyle. In this study, we compared the genomic features of Diplorickettsia massiliensis with twenty-nine sequenced Gammaproteobacteria species (Legionella strains, Coxiella burnetii strains, Francisella tularensis strains and Rickettsiella grylli) using multi-genus pangenomic approach. This thesis work provides original data and sheds light on intracellular bacterial diversity. Keywords : Intracellular bacteria, Diplorickettsia massiliensis, genome repertoire, allopatry, sympatry, pangenome, gammaprotebacteria 7 Résumé Les microorganismes sont présents dans presque tous les habitats de la planète. Compte tenu de leur ubiquité écologique, il n'est pas surprenant de trouver de nombreuses espèces procaryotes en relations étroites avec des membres de nombreux taxons eucaryotes, établissant souvent une association persistante appelée symbiose. En fonction des interactions entre les partenaires au sein de cette relation symbiotique, celle ci peut être considérée comme du parasitisme, du mutualisme ou du commensalisme. Et selon l'emplacement du symbiote par rapport aux cellules de l'hôte, comme de l'ectosymbiose ou de l'endosymbiose. Le séquençage des génomes, en particulier le séquençage à haut débit (NGS), a oet alio ote ophesio de lolutio des différents groupes de bactéries intracellulaires et de leur survie au sein des cellules hôtes. Lojetif de ette thse est do de comprendre, avec l'aide de la génomique comparative, les variations génomiques liées à la coexistence, en examinant les données concernant l'existence ancienne de bactéries intracellulaires, leur adaptation à leur hôte et les différences entre sympatrie et allopatrie. La première partie de ma thèse est une revue donnant un aperçu du répertoire génomique des bactéries intracellulaires et de leurs symbiotes. L'objectif de cette étude est d'explorer le processus permettant aux bactéries intracellulaires d'acquérir leur mode de vie spécifique. En raison de leurs différentes voies évolutives, ces bactéries ont des compositions génomiques différentes. Nous avons commencé par examiner les données à propos de l'existence ancienne de bactéries intracellulaires, leur adaptation à leur hôte et les différences entre sympatrie et allopatrie. En outre, nous avons exploré le répertoire génomique de ces bactéries pour comprendre le phénomène de perte de gènes chez les bactéries intracellulaires. Pour comprendre le répertoire génomique et sa composition chez 8 bactéries intracellulaires, il est nécessaire de comprendre la spécialisation de ces bactéries par rapport à leurs niches. Une comparaison du contenu génomique de plusieurs bactéries avec différents modes de vie a révélé la capacité des bactéries à échanger des gènes à des degrés différents, en fonction de l'écosystème. Dailleus, la goiue a foui dipotats indices sur, les mécanismes causant le processus de réduction des génomes, les fonctions qui sont conservés losuue espèce devient itaellulaie et lifluee ue l'hôte peut aoi su la opositio génomique des bactéries intracellulaires. La deuxième partie de ma thèse porte sur la séquence du génome de la souche Diplorickettsia massiliensis 20B qui est une bactérie intracellulaire obligatoire à Gram négatif isolée à partir des tiques de Slovaquie Ixodes ricinus. Dans ma troisième et dernière partie, nous exploré le répertoire du génome de Diplorickettsia massiliensis en le comparant aux génomes de bactéries phylogénétiquement très proches de Diplorickettsia massiliensis, issues de différentes niches. Ceci a permis de révélé son mode de vie allopatrique. Dans cette étude, nous avons comparé les caractéristiques du génome de Diplorickettsia massiliensis avec vingt-neuf espèces séquencées de Gammaproteobacteria (Legionella, Coxiella burnetii, Francisella tularensis et Rickettsiella grylli) en utilisant l'approche pangénomique multi-genre. Ce travail de thèse fournit des données oigiales et peet dappote plus de luie su la diesit des bactéries intracellulaires. Mots clés : Bactéries intracellulaires, Diplorickettsia massiliensis, répertoire génomique, sympatrie, allopatrie, pangénom, Gammaproteobacteria 9 10 Contents Preamble 5 Abstract 6 Résumé 8 Contents 11 1 Chapter One : Introduction 13 2 Chapter Two: Review 17 2.1 Review: Genome repertoire of intracellular bacteria and symbionts 3 Chapter Three: Genome sequencing of intracellular bacteria 63 3.1 Article 1: Genome Sequence of Diplorickettsia massiliensis, an Emerging Ixodes ricinus-Associated Human Pathogen 4 Chapter Four: Comparative genomics 73 4.1 Article 2: The genomic repertoire of Diplorickettsia massiliensis reveals its allopatric lifestyle 5 Chapter Five: Conclusions 119 5.1 Conclusions and perspectives 5.2 Future perspective Bibliography 125 Acknowledgements 143 11 12 Chapter 1 Introduction The following section introduces the reader about the studies on intracellular