N° d’ordre 04 ISAL 007 Année 2004

THESE

Caractérisation et phylogénie des bactéries symbiotiques intracellulaires des charançons de la famille des Dryophthoridae

présentée devant L’INSTITUT NATIONAL DES SCIENCES APPLIQUEES DE LYON

pour obtenir le grade de docteur

Ecole doctorale : Evolution, Ecosystèmes, Microbiologie et Modélisation Specialité : Analyse et Modélisation des Systèmes Biologiques

par

Cédric LEFEVRE

soutenue le 10 février 2004 devant la Commission d’examen

Jury :

E.J.P. DOUZERY Rapporteur A. LATORRE Rapporteur J.C. SIMON Rapporteur W. NASSER Président A. HEDDI Directeur H. CHARLES Co-Directeur

Laboratoire de Biologie Fonctionelle, Insectes et Interactions UMR INRA/INSA de Lyon Bât L. Pasteur, 20 Avenue A. Einstein 69621 Villeurbanne Cedex France

Novembre 2003 INSTITUT NATIONAL DES SCIENCES APPLIQUEES DE LYON

Directeur : STORCK A.

Professeurs : AMGHAR Y. LIRIS AUDISIO S. PHYSICOCHIMIE INDUSTRIELLE BABOT D. CONT. NON DESTR. PAR RAYONNEMENTS IONISANTS BABOUX J.C. GEMPPM*** BALLAND B. PHYSIQUE DE LA MATIERE BAPTISTE P. PRODUCTIQUE ET INFORMATIQUE DES SYSTEMES MANUFACTURIERS BARBIER D. PHYSIQUE DE LA MATIERE BASKURT A. LIRIS BASTIDE J.P. LAEPSI**** BAYADA G. MECANIQUE DES CONTACTS BENADDA B. LAEPSI**** BETEMPS M. AUTOMATIQUE INDUSTRIELLE BIENNIER F. PRODUCTIQUE ET INFORMATIQUE DES SYSTEMES MANUFACTURIERS BLANCHARD J.M. LAEPSI**** BOISSE P. LAMCOS BOISSON C. VIBRATIONS-ACOUSTIQUE BOIVIN M. (Prof. émérite) MECANIQUE DES SOLIDES BOTTA H. UNITE DE RECHERCHE EN GENIE CIVIL - Développement Urbain BOTTA-ZIMMERMANN M. (Mme) UNITE DE RECHERCHE EN GENIE CIVIL - Développement Urbain BOULAYE G. (Prof. émérite) INFORMATIQUE BOYER J.C. MECANIQUE DES SOLIDES BRAU J. CENTRE DE THERMIQUE DE LYON - Thermique du bâtiment BREMOND G. PHYSIQUE DE LA MATIERE BRISSAUD M. GENIE ELECTRIQUE ET FERROELECTRICITE BRUNET M. MECANIQUE DES SOLIDES BRUNIE L. INGENIERIE DES SYSTEMES D’INFORMATION BUFFIERE J-Y. GEMPPM*** BUREAU J.C. CEGELY* CAMPAGNE J-P. PRISMA CAVAILLE J.Y. GEMPPM*** CHAMPAGNE J-Y. LMFA CHANTE J.P. CEGELY*- Composants de puissance et applications CHOCAT B. UNITE DE RECHERCHE EN GENIE CIVIL - Hydrologie urbaine COMBESCURE A. MECANIQUE DES CONTACTS COURBON GEMPPM COUSIN M. UNITE DE RECHERCHE EN GENIE CIVIL - Structures DAUMAS F. (Mme) CENTRE DE THERMIQUE DE LYON - Energétique et Thermique DJERAN-MAIGRE I. UNITE DE RECHERCHE EN GENIE CIVIL DOUTHEAU A. CHIMIE ORGANIQUE DUBUY-MASSARD N. ESCHIL DUFOUR R. MECANIQUE DES STRUCTURES DUPUY J.C. PHYSIQUE DE LA MATIERE EMPTOZ H. RECONNAISSANCE DE FORMES ET VISION ESNOUF C. GEMPPM*** EYRAUD L. (Prof. émérite) GENIE ELECTRIQUE ET FERROELECTRICITE FANTOZZI G. GEMPPM*** FAVREL J. PRODUCTIQUE ET INFORMATIQUE DES SYSTEMES MANUFACTURIERS FAYARD J.M. BIOLOGIE FONCTIONNELLE, INSECTES ET INTERACTIONS FAYET M. MECANIQUE DES SOLIDES FAZEKAS A. GEMPPM FERRARIS-BESSO G. MECANIQUE DES STRUCTURES FLAMAND L. MECANIQUE DES CONTACTS FLEURY E. CITI FLORY A. INGENIERIE DES SYSTEMES D’INFORMATIONS FOUGERES R. GEMPPM*** FOUQUET F. GEMPPM*** FRECON L. REGROUPEMENT DES ENSEIGNANTS CHERCHEURS ISOLES GERARD J.F. INGENIERIE DES MATERIAUX POLYMERES GERMAIN P. LAEPSI**** GIMENEZ G. CREATIS** GOBIN P.F. (Prof. émérite) GEMPPM*** GONNARD P. GENIE ELECTRIQUE ET FERROELECTRICITE GONTRAND M. PHYSIQUE DE LA MATIERE GOUTTE R. (Prof. émérite) CREATIS** GOUJON L. GEMPPM*** GOURDON R. LAEPSI****. GRANGE G. GENIE ELECTRIQUE ET FERROELECTRICITE GUENIN G. GEMPPM*** GUICHARDANT M. BIOCHIMIE ET PHARMACOLOGIE

2 GUILLOT G. PHYSIQUE DE LA MATIERE GUINET A. PRODUCTIQUE ET INFORMATIQUE DES SYSTEMES MANUFACTURIERS

GUYADER J.L. VIBRATIONS-ACOUSTIQUE GUYOMAR D. GENIE ELECTRIQUE ET FERROELECTRICITE HEIBIG A. MATHEMATIQUE APPLIQUEES DE LYON JACQUET-RICHARDET G. MECANIQUE DES STRUCTURES JAYET Y. GEMPPM*** JOLION J.M. RECONNAISSANCE DE FORMES ET VISION

Novembre 2003

JULLIEN J.F. UNITE DE RECHERCHE EN GENIE CIVIL - Structures JUTARD A. (Prof. émérite) AUTOMATIQUE INDUSTRIELLE KASTNER R. UNITE DE RECHERCHE EN GENIE CIVIL - Géotechnique KOULOUMDJIAN J. INGENIERIE DES SYSTEMES D’INFORMATION LAGARDE M. BIOCHIMIE ET PHARMACOLOGIE LALANNE M. (Prof. émérite) MECANIQUE DES STRUCTURES LALLEMAND A. CENTRE DE THERMIQUE DE LYON - Energétique et thermique LALLEMAND M. (Mme) CENTRE DE THERMIQUE DE LYON - Energétique et thermique LAUGIER A. PHYSIQUE DE LA MATIERE LAUGIER C. BIOCHIMIE ET PHARMACOLOGIE LAURINI R. INFORMATIQUE EN IMAGE ET SYSTEMES D’INFORMATION LEJEUNE P. UNITE MICROBIOLOGIE ET GENETIQUE LUBRECHT A. MECANIQUE DES CONTACTS MASSARD N. INTERACTION COLLABORATIVE TELEFORMATION TELEACTIVITE MAZILLE H. PHYSICOCHIMIE INDUSTRIELLE MERLE P. GEMPPM*** MERLIN J. GEMPPM*** MIGNOTTE A. (Mle) INGENIERIE, INFORMATIQUE INDUSTRIELLE MILLET J.P. PHYSICOCHIMIE INDUSTRIELLE MIRAMOND M. UNITE DE RECHERCHE EN GENIE CIVIL - Hydrologie urbaine MOREL R. MECANIQUE DES FLUIDES ET D’ACOUSTIQUES MOSZKOWICZ P. LAEPSI**** NARDON P. (Prof. émérite) BIOLOGIE FONCTIONNELLE, INSECTES ET INTERACTIONS NELIAS D. LAMCOS NIEL E. AUTOMATIQUE INDUSTRIELLE NORMAND B. GEMPPM NORTIER P. DREP ODET C. CREATIS** OTTERBEIN M. (Prof. émérite) LAEPSI**** PARIZET E. VIBRATIONS-ACOUSTIQUE PASCAULT J.P. INGENIERIE DES MATERIAUX POLYMERES PAVIC G. VIBRATIONS-ACOUSTIQUE PECORARO S. GEMPPM PELLETIER J.M. GEMPPM*** PERA J. UNITE DE RECHERCHE EN GENIE CIVIL - Matériaux PERRIAT P. GEMPPM*** PERRIN J. INTERACTION COLLABORATIVE TELEFORMATION TELEACTIVITE

PINARD P. (Prof. émérite) PHYSIQUE DE LA MATIERE PINON J.M. INGENIERIE DES SYSTEMES D’INFORMATION PONCET A. PHYSIQUE DE LA MATIERE POUSIN J. MODELISATION MATHEMATIQUE ET CALCUL SCIENTIFIQUE PREVOT P. INTERACTION COLLABORATIVE TELEFORMATION TELEACTIVITE PROST R. CREATIS** RAYNAUD M. CENTRE DE THERMIQUE DE LYON - Transferts Interfaces et Matériaux REDARCE H. AUTOMATIQUE INDUSTRIELLE RETIF J-M. CEGELY* REYNOUARD J.M. UNITE DE RECHERCHE EN GENIE CIVIL - Structures RICHARD C. LGEF RIGAL J.F. MECANIQUE DES SOLIDES RIEUTORD E. (Prof. émérite) MECANIQUE DES FLUIDES ROBERT-BAUDOUY J. (Mme) (Prof. émérite) GENETIQUE MOLECULAIRE DES MICROORGANISMES ROUBY D. GEMPPM*** ROUX J.J. CENTRE DE THERMIQUE DE LYON – Thermique de l’Habitat RUBEL P. INGENIERIE DES SYSTEMES D’INFORMATION SACADURA J.F. CENTRE DE THERMIQUE DE LYON - Transferts Interfaces et Matériaux SAUTEREAU H. INGENIERIE DES MATERIAUX POLYMERES SCAVARDA S. AUTOMATIQUE INDUSTRIELLE SOUIFI A. PHYSIQUE DE LA MATIERE SOUROUILLE J.L. INGENIERIE INFORMATIQUE INDUSTRIELLE THOMASSET D. AUTOMATIQUE INDUSTRIELLE THUDEROZ C. ESCHIL – Equipe Sciences Humaines de l’Insa de Lyon UBEDA S. CENTRE D’INNOV. EN TELECOM ET INTEGRATION DE SERVICES VELEX P. MECANIQUE DES CONTACTS

3 VIGIER G. GEMPPM*** VINCENT A. GEMPPM*** VRAY D. CREATIS** VUILLERMOZ P.L. (Prof. émérite) PHYSIQUE DE LA MATIERE

Directeurs de recherche C.N.R.S. : BERTHIER Y. MECANIQUE DES CONTACTS CONDEMINE G. UNITE MICROBIOLOGIE ET GENETIQUE COTTE-PATAT N. (Mme) UNITE MICROBIOLOGIE ET GENETIQUE ESCUDIE D. (Mme) CENTRE DE THERMIQUE DE LYON FRANCIOSI P. GEMPPM*** MANDRAND M.A. (Mme) UNITE MICROBIOLOGIE ET GENETIQUE POUSIN G. BIOLOGIE ET PHARMACOLOGIE ROCHE A. INGENIERIE DES MATERIAUX POLYMERES SEGUELA A. GEMPPM*** VERGNE P. LaMcos

Directeurs de recherche I.N.R.A. : FEBVAY G. BIOLOGIE FONCTIONNELLE, INSECTES ET INTERACTIONS GRENIER S. BIOLOGIE FONCTIONNELLE, INSECTES ET INTERACTIONS RAHBE Y. BIOLOGIE FONCTIONNELLE, INSECTES ET INTERACTIONS

Directeurs de recherche I.N.S.E.R.M. : KOBAYASHI T. PLM PRIGENT A.F. (Mme) BIOLOGIE ET PHARMACOLOGIE MAGNIN I. (Mme) CREATIS**

* CEGELY CENTRE DE GENIE ELECTRIQUE DE LYON ** CREATIS CENTRE DE RECHERCHE ET D’APPLICATIONS EN TRAITEMENT DE L’IMAGE ET DU SIGNAL ***GEMPPM GROUPE D'ETUDE METALLURGIE PHYSIQUE ET PHYSIQUE DES MATERIAUX ****LAEPSI LABORATOIRE D’ANALYSE ENVIRONNEMENTALE DES PROCEDES ET SYSTEMES INDUSTRIELS

4 5 L'Envie, Mathieu Robin, Bénédicte Moreau, Paul Nardon, Marion Vergès, L'Encore, Katia Bioteau, Hubert Charles, Le Petit Prince, Gabrielle Duport, Mathieu Dumont, Annick Burlion, La Passion, Théodore Monod, Willow Lefèvre, Amparo Latorre, Yvan Rahbe, Marjolaine Rey, Le Plaisir, Maud Guenfoud, Jean-François Lefèvre, Jacqueline Joly, Florence Forissier, Le Jamais, Frédéric Gressent, Lionel Razy, Catherine Delbé, Dominique Desjardins, Pierre Lambert, Le Facteur, Nancie Reymond, Michel Burlion, Franck Voisin, Fédérica Calevro, L'Impossible, Coralie Fievet, Jean-Michel Fayard, Marie Troquereau Le Tellement, Catherine Garcia, Sophie Lefèvre, Helene Ametepe, Isabelle Petit, Bernard Pintureau, Rosa Daunois, , Elizabeth Pouyet, William Nasser, Martine Lambert, Isabelle Rahioui, Olivier Specty, Emmanuel Douzery, L'Echec, Christelle Vallerie, L'Accouchement, Josette Guillaud, Chaqué Khatchadourian, Nicolas Sauvion, Jacques Lefèvre, Michel Carrière, Le Temps, Françis Durand, Léon les Charançons, Bernard Delobel, Olivier Colin, Heidi Eppe, Olivier Perru, Le Si, Stéphane Pereira, Carole Vincent- Monegat, Sandrine Louis, Le Chocolat, Murielle Raoult, Bernard Lemelle, Sarah Tardieu, Le Toujours, Abdelaziz Heddi, Michel Desjardins, Stéphanie Photo, Sandie Carol Dongnac, Nicolas Rossi, Marie Benedetto, Luca Sighinolfi, Cédric Tailfer, Jean-Christophe Simon, Le Sipeu, Patrice Bolland, Dominique Sampiero, Agnès Vallier, Florence Voisin, Le Pourquoi, Geneviève Lambert, Simon Grenier, Françoise Roly-Daunois, Sophie Robichon, Max Lambert, La Patience, Amélie les Bactéries, Anne-Marie Lefèvre, Alain Clavel, Catherine Lambert, L'Amour, Maria Petit, Gérard Febvay, Edith Durand, Céline Deraison, Christine Lambert, Berangère Fagot, Caroline Anselme, Frédéric Tardieu, L'Après…

Merci…1

1 Les plaintes ainsi que les réclamations sont à déposer à l'adresse suivante : [email protected]., merci de votre compréhension.

6

INTRODUCTION...... 10

EVOLUTION, PHYLOGENIE ET SYMBIOSE...... 13

I. L'ESPECE ...... 14 I.1. La notion d'individu ...... 14 I.2. Le problème de l'espèce ...... 14 I.2.1. Historique...... 15 I.2.2. L'espèce biologique : un concept admis ...... 15 I.2.3. Problèmes posés par le concept d'espèce biologique...... 16 I.2.4. Signification évolutive de l'espèce ...... 17 II. ISOLEMENT ET SPECIATION...... 18 II.1. Géographie de l'isolement et modes de spéciation ...... 18 II.1.1. La spéciation allopatrique vicariante et spéciation allopatrique par effet fondateur...... 19 II.1.2. La spéciation sympatrique ...... 19 II.1.3. La spéciation parapatrique ...... 20 III. CLASSIFICATION ET PHYLOGENIE...... 21 III.1. Données de la systématique...... 22 III.2. La reconstruction phylogénétique ...... 22 III.2.1. La phénétique ...... 23 III.2.2. Le cladisme...... 23 III.2.3. Phylogénie moléculaire ...... 24 III.2.4. Séquences et alignements ...... 24 III.3. Modèle en phylogénie moléculaire...... 25 III.3.1. Evolution markovienne d’une séquence ...... 25 III.3.2. Modèles basés sur les distances évolutives...... 26 III.3.3. Modèle de maximum de vraisemblance...... 26 IV. LA SYMBIOSE...... 27 IV.1. Définition générale et historique ...... 27 IV.2. Les définitions de la symbiose : les différentes classifications ...... 28 IV.3. Symbiose et propriétés émergentes...... 29 IV.4. Impact physiologique de la symbiose...... 30 IV.5. Symbiose et évolution...... 32 IV.5.1. La cellule eucaryote...... 32 IV.5.1.1. La théorie d'endocytobioses successives ou SET (Serial Endosymbiotic Theory)...... 33 IV.5.1.2. Les hypothèses syntrophiques...... 33 IV.5.1.3. LUCA, la cellule eucaryote et les problèmes de phylogénie ...... 34 IV.5.2. Impacts évolutifs de la symbiose sur l’hôte...... 36 IV.5.2.1. Manipulation de la reproduction de l'hôte ...... 36 IV.5.2.1.1. Impacts sur la speciation...... 37 IV.5.2.1.2. Impacts sur l'extinction des espèces...... 38 IV.5.2.2. Symbiose et adaptation des insectes...... 38 IV.5.3. Impacts sur les symbiotes: évolution des génomes...... 39 IV.5.3.1. Biais mutationel, dérive génétique et vitesse d’évolution ...... 39 IV.5.3.2. Taille des génomes des endocytobiotes...... 40 IV.5.4. Impact sur l’entité symbiotique ...... 41 IV.5.5. Origine des symbiotes et symbiogenèse ...... 42 IV.6. Les Dryophthoridae : un modèle pour l'étude de la symbiose...... 43 IV.6.1. Les insectes et l'homme : une cohabitation parfois difficile ...... 43 IV.6.2. Les Dryophthoridae : classification, répartition et écologie ...... 43 IV.6.3. La symbiose chez les Sitophilus ...... 45 IV.6.3.1. Symbiose et développement de l’insecte...... 45 IV.6.3.2. Les endocytobiotes...... 46 MATERIEL ET METHODES...... 48

I. CHARANÇONS : ELEVAGE ET COLLECTE ...... 49 I.1. élevage ...... 49 I.2. collecte ...... 49 I.3. Préparation de bactéries symbiotiques à partir de bactériomes disséqués...... 50 II. TECHNIQUES HISTOLOGIQUES...... 50 II.1. Histologie (microscopie optique)...... 51 II.1.1. Fixation des échantillons...... 51

7 II.1.2. Inclusion et coupe ...... 51 II.1.3. Coloration ...... 51 II.1.4. Squaches ...... 51 II.2. Fluorescence In Situ Hybridation (F.I.S.H)...... 52 II.2.1. Procédure sur coupes histologiques ...... 52 II.2.2. Technique FISH sur bactéries en suspention ...... 52 II.3. Microscopie électronique à transmission ...... 53 II.3.1. Fixation des bactériomes...... 53 II.3.2. Inclusion des bactériomes ...... 53 III. TECHNIQUE DE BIOLOGIE MOLECULAIRE...... 53 III.1. Préparation de l'ADN total...... 53 III.1.1. Extraction d'ADN total à partir de l'insecte ...... 53 III.1.2. Extraction d’ADN à partir des coupes histologiques...... 54 III.2. Amplification par PCR de fragments du gène ribosomal 16S, clonage et séquençage ...... 54 III.2.1. Amplification de fragments d’ADN par PCR...... 54 III.2.2. Electrophorèse sur gel d’agarose ...... 55 III.2.3. Purification des fragments d’ADN amplifiés...... 56 III.2.4. Clonage des produits PCR purifiés...... 56 III.2.4.1. Ligation des fragments d’ADN dans le plasmide pMosBlue...... 56 III.2.4.2. Microdialyse des plasmides...... 56 III.2.4.3. Préparation des cellules compétentes ...... 56 III.2.4.4. Transformation des cellules par électroporation...... 57 III.2.5. Préparation de l’ADN plasmidique (minipréparation) et analyse des clones...... 57 III.2.6. Séquençage...... 58 III.3. Southern Blot...... 58 III.3.1. Préparation des sondes radioactives...... 58 III.3.2. Hybridation...... 59 III.4. Electrophorèse en champs pulsés (PFGE) ...... 59 III.4.1. Préparation des échantillons ...... 59 III.4.2. Digestion enzymatique ...... 60 III.4.3. Electrophorèse et coloration des gels...... 60 III.5. Macroarrays...... 60 III.5.1. Préparation de l’ADN de SOPE...... 60 III.5.2. Hybridation de L’ADN de SOPE à la puce d’E. coli...... 60 III.5.3. Puces et analyses statistiques...... 61 IV. TECHNIQUE D’ANALYSE DE SEQUENCES ET PHYLOGENIE...... 61 IV.1. Analyse des séquences ...... 61 IV.2. Alignement et phylogénie...... 61 IV.2.1. Le logiciel NHML...... 62 IV.3. Tester statistiquement les topologies ...... 63 IV.3.1. Puissance du test...... 63 IV.4. Test des taux de substitutions relatifs ...... 64 RESULTATS...... 65

I. CARACTERISATION DES BACTERIOMES ET DES BACTERIOCYTES CHEZ LES INSECTES HOTES...... 66 I.1. Espèces non symbiotiques ...... 66 I.2. Espèces symbiotiques ...... 66 II. CARACTERISATION DES ENDOCYTOBIOTES DE DRYOPHTHORIDAE ...... 69 II.1. Détection de Wolbachia chez les Dryophthoridae...... 69 II.2. Caractérisation histologique des endocytobiotes de Dryophthoridae ...... 69 II.2.1. Caractérisation des membranes vacuolaires des endocytobiotes...... 70 II.3. Caractérisation moléculaire des endocytobiotes de Dryophthoridae...... 72 II.3.1. Détection de plurisymbioses chez les Dryophthoridae...... 75 III. RECONSTRUCTION DE L’HISTOIRE EVOLUTIVE DE LA SYMBIOSE CHEZ LES DRYOPHTHORIDAE ...... 76 III.1. Choix de l'échantillon de bactéries...... 76 III.2. Analyse phylogénétique des endocytobiotes de Dryophthoridae...... 77 III.2.1 Prise en compte du biais GC...... 79 III.2.2. Prise en compte des vitesses d'évolution ...... 80 III.2.3. Contourner les biais de compositions et de vitesse d'évolution ...... 81 III.2.4. Prise en compte des taux de GC et vitesses d'évolution hétérogènes...... 81 III.2.4.1. Détermination d’une topologie de bactéries libres...... 81 III.2.4.2. Méthode d'exploration...... 82 III.2.4.3. Positionnement indépendant des 3 clades d'endocytobiotes...... 84 III.2.4.4. Positionnement relatif des 3 clades d'endocytobiotes...... 85

8 III.2.4.4.1. Hypothèse de monophylie pour les séquences de Dryophthoridae...... 85 III.2.4.4.2. Hypothèse de polyphylie...... 85 III.2.4.5. Positionnement relatif des autres endocytobiotes d'insectes...... 86 III.2.4.6. Influence de l'échantillon de bactéries libres...... 89 III.2.4.7. Taux d'évolutions relatifs ...... 89 IV. COMPARAISON DES GENOMES SYMBIOTIQUES DES ENDOCYTOBIOTES DE SITOPHILUS ORYZAE (SOPE) ET DE GLOSSINA PALLIDIPES (SODALIS GLOSSINIDIUS) ...... 90 IV.1. Architecture des deux génomes symbiotiques...... 90 IV.2. Divergence génétique entre SOPE et Sodalis glossinidius ...... 91 IV.3. Capacités métaboliques ...... 92 IV.4. Analyse comparée des génomes microbiens aux styles de vie différents ...... 93 V. TAILLE DE GENOME DE M. HEMIPTERUS ...... 94 VI. PROPOSITION DE NOM DE GENRE « CANDIDATUS » NARDONNELLA POUR LES ENDOCYTOBIOTES DU CLADE R ...... 96 DISCUSSION ...... 97

I. CARACTERISATION DE LA SYMBIOSE CHEZ LES DRYOPHTHORIDAE ...... 98 II. HISTOIRE EVOLUTIVE DE LA SYMBIOSE CHEZ LES DRYOPHTHORIDAE ...... 100 III. ANALYSE DE GENOMIQUE COMPARATIVE ENTRE LES ENDOCYTOBIOTES DES CHARANÇONS SITOPHILUS (SOPE) ET CEUX DES GLOSSINES (SODALIS GLOSSINIDIUS) ...... 103 IV. LA SYMBIOSE ET L’ECOLOGIE DES DRYOPHTHORIDAE...... 105 CONCLUSION : UNE PETITE HISTOIRE DE LA SYMBIOSE...... 108

REFERENCES BIBLIOGRAPHIQUES...... 111

9 INTRODUCTION

10 "Après huit ans de vie commune, elle est partie enfin. Enfin, me voilà seul! Je le souhaitais depuis longtemps. Je vais donc enfin vivre seul! Et, déjà, je me demande avec qui." Sacha Guitry (Elle et toi, les femmes et l’amour)

Bien curieuse façon d'introduire la symbiose, me direz-vous. Mais sous ses accents provocateurs cette citation recèle des éléments tout à fait intéressants sur "l'étude de la vie en commun d'organismes différents", ou sur l'étude de la symbiose comme la définissait De Bary en 1879. Cette phrase pointe l'importance de la vie à deux, ou de manière plus générale de la vie en commun. Elle traduit sous un trait d’humour l'interdépendance des partenaires, qui éprouvent néanmoins, à certains moments de leur histoire, des désirs opposés à l'union qui les lient. Ces trois éléments que sont l'universalité, l'interdépendance des partenaires ainsi que leur égoïsme, ou de façon plus nuancée, leurs relations conflictuelles, me semble assez bien définir ce que nous savons aujourd'hui de la symbiose. Pour rester dans cet univers ; la symbiose c'est un peu comme un vieux couple, qui sans cesse se dispute, mais qui jamais ne peut se séparer. La symbiose est omniprésente dans le monde vivant. Pour s’en convaincre, prenons l’exemple de l’Homo sapiens. Si nous sommes constitués d’environ 1013 cellules eucaryotes, à la surface de nos muqueuses et de notre peau nous hébergeons à peu près le même nombre de bactéries alors que notre tube digestif héberge 10 fois plus de cellules bactériennes (1014 bactéries) appartenant à plus de 300 espèces différentes (Ducluzeau et Raibaud, 1979). De façon plus générale, aucun organisme pluricellulaire ne peut être considéré comme asymbiotique, c'est à dire dépourvu de toute symbiose, puisque d'après Margulis (1993) les eucaryotes peuvent être considérés comme le résultat d'un assemblage plus ou moins complexe d'organismes différents. Selon cette vision, seules les bactéries seraient de véritables individus. Cependant, même dans le cas des organismes procaryotiques, des symbioses intracellulaires ont été identifiées (von Dohlen et al., 2001). De très nombreuses relations symbiotiques entraînent une dépendance mutuelle des partenaires, c'est à dire que la rupture de leur relation entraine une chute de leur fitness, voire leur mort. De façon surprenante, cette interdépendance qui est souvent associée au terme « harmonie » dans le langage courant, devrait plutôt être associée au terme « conflit », d’apparence antagoniste (dans une vision évolutioniste). Chaque organisme demeure égoïste, dans la mesure où tout ce qui peut augmenter sa reproduction est par définition sélectionné. Mais ce contexte égoïste ne s’oppose pas du tout à l’association qui peut être sélectionnée, même si l’avantage respectif tiré de cette union est très difficile à apprécier pour chaque partenaire (Rispe et Moran, 2000). Bien que le rôle de la symbiose dans l’évolution ait été souligné par l’école Russe dès le début du siècle dernier (Mereschkowski, 1920), les symbiologistes furent très longtemps considérés comme des spécialistes travaillant sur de drôles de plantes ou de petites bêtes. Néanmoins, la symbiose est à ce jour considérée comme l'un des moteurs de l'évolution (Maynard Smith, 1989). En effet, à bien des égards, la symbiose peut être perçue comme un phénomène parasexuel (Margulis, 1993) où il y a mise en commun de génomes différents, ou bien encore interprétée comme un mécanisme sophistiqué d'acquisition de nouveaux gènes (Nardon et Grenier, 1993). De très nombreux insectes, présents au sein de presque tous les ordres, entretiennent avec des microorganismes (essentiellement des bactéries, et des champignons) des relations symbiotiques intracellulaires plus ou moins "intimes" (on parle alors d’endocytobiotes). Lorsque la symbiose est dite intégrée, c’est à dire que l’entité formée est indissociable, ou que la rupture de cette relation affecte négativement les fitness des partenaires, on observe que les endocytobiotes sont transmis à la descendance par hérédité cytoplasmique maternelle (avec

11 ou sans recontamination de la lignée germinale) et induisent au cours du développement embryonnaire de l'insecte, la différenciation de cellules spécifiques, les bactériocytes, qui les hébergent. Ces bactériocytes gisent librement dans le cytoplasme, comme c’est le cas chez les pucerons, où ils peuvent s’assembler en un organe, le bactériome, comme chez de nombreux coléoptères (Nardon et Charles, 2001). Les bactéries symbiotiques améliorent les traits physiologiques ainsi que la fitness de leurs hôtes par l'intermédiaire de complémentations métaboliques. On observe ainsi que la plupart des insectes qui se développent sur des milieux nutritionnellement pauvres ou tout au moins déséquilibrés hébergent des bactéries symbiotiques intracellulaires (Buchner, 1965 ; Douglas, 1994). Les symbioses intracellulaires étudiées chez les insectes qui se développent sur de tels milieux révèlent très souvent une cospéciation des deux partenaires ainsi qu'une lignée bactérienne symbiotique monophylétique. Ces modèles sont le plus souvent inféodés à un type unique de milieu, comme les pucerons et les psylles se nourissant de la sève, les glossines et les poux du sang. Le but de cette étude est de comprendre l'évolution hôte-symbiotes chez des insectes montrant un spectre écologique beaucoup plus étendu. A ce titre, les charançons de la famille des Dryophthoridae, un groupe de coléoptères phytophages essentiellement répartis dans les zones tropicales, sont tout à fait intéressants. En effet, la majorité de ces insectes se nourrissent de différentes parties des plantes monocotylédones (tiges, stipes ou racines) mais également de dicotylédones, où certains groupes semblent avoir subits une diversification alimentaire puisqu'ils se nourissent de graines ou de bois mort. Outre son intérêt écologique, cette famille possède un intérêt agricole et économique indéniable puisque plusieurs de ces insectes comptent parmi les plus grandes ravageurs et s'attaquent à de nombreuses cultures (riz, blé, mais, bananier, canne à sucre…) (Zimmerman, 1993). Dans ce travail, nous nous sommes d’abord attachés à caractériser d’un point de vue histologique et moléculaire les endocytobiotes chez un certain nombre d’espèces du groupe des Dryophthopridae collectées dans différentes régions du globe. Une analyse phylogénétique nous a ensuite permis de dater l’installation de la symbiose dans ce groupe et de comprendre son rôle dans la diversification et l'adaptation des insectes à leurs milieux. Enfin nous avons tenté, grâce à une démarche de génomique comparative, de comprendre les contraintes évolutives et environementales qui gouvernent et façonnent les génomes des bactéries intracellulaires d'insectes.

12 Evolution, Phylogénie et Symbiose

13 I. L'Espèce

Ce travail sur la symbiose et l’évolution d’un petit groupe de charançons (famille des Dryophthoridae) nécessite, outre une introduction à la symbiose, de s’intéresser au vaste domaine de l’évolution et en particulier aux problèmes posés par les entités que sont l’individu et l’espèce avant de s’intéresser aux mécanismes de formation de celles-ci et aux méthodes de reconstruction de leur histoire évolutive. Ces notions, abordées de façon synthétique, sont importantes pour comprendre ce travail. Ce sont des problématiques classiquement débattues en évolution, néanmoins, nous verrons qu’elles peuvent très significativement être modifiées si l’on intègre, au sein des mécanismes évolutifs, les phénomènes et les forces évolutives de la symbiose, très souvent relégués au second plan de la discussion dans la littérature.

I.1. La notion d'individu

Le mot individu est issu du latin individuum "corps indivisible". Sa définition biologique est celle-ci : corps organisé dont l'ensemble de ses constituants (cellules), possède une homogénéité génétique (qui ne peut être parfaite en raison des mutations) vivant d'une existence propre et qui ne saurait être divisé sans être détruit. Mise à part peut-être les unicellulaires et quelques pluricellualires procaryotiques, aucun organisme ne peut répondre à cette définition. L'individu constitue bien plus un concept aisé pour la biologie théorique qu'une réalité, la notion d’individu apparaît donc tout à fait relative. D'ailleurs Margulis (1993) considère que seules les bactéries méritent le terme d’individu, les autres formes étant des assemblages plus ou moins sophistiqués d’organismes différents. L'individu fonde tous les regroupements hiérarchiques supérieurs jusqu'à l'espèce (individu, population, espèce) qui est la dernière entité supérieure à nous intéresser en relation avec la symbiose. Ces catégories sont donc affaiblies par l'existence indéniable de la symbiose parmi la quasi totalité des organismes qui composent notre écosystème.

I.2. Le problème de l'espèce

Paradoxalement, la notion d'espèce semble tout à fait évidente aux yeux des néophytes. Elle semble même préexister aux raisonnements scientifiques modernes. De nombreux biologistes ont été frappés de constater que même dans les régions éloignées de toute civilisation et à l’abri de la science établie, les hommes utilisaient des noms d’espèces et distinguaient celles-ci à peu près aussi bien que les biologistes ne pouvaient le faire. Cette notion semble donc transculturelle. Quelles sont les caractéristiques scientifiques qui peuvent donner corps à cette intuition partagée par tous ? Deux préoccupations majeures intéressent la définition de l'espèce, une préoccupation tout à fait pratique de classification et d'organisation du monde vivant, ainsi qu'une préoccupation théorique qui tente de rendre compte d'une certaine réalité biologique et évolutive. Peut-on concilier ces deux aspects dans une définition unifiée ?

14 I.2.1. Historique

L’idée que le monde vivant est le résultat d'une évolution est relativement nouvelle. L'idée traditionnelle (judéo-chrétienne) est plutôt que le monde est le résultat d'une création divine, l'espèce étant l'unité de cette création. Les membres d'une espèce possèdent la même essence divine. Platon, dans son "Allégorie", évoque pour la première fois la notion d'espèce comme étant un "type" permanent, réel et universel dont le nombre est limité. Cette philosophie, l'essentialisme, parcourt les siècles et entretient des relations étroites avec un autre courant de pensée, le fixisme, qui appréhende le monde dans une vision purement statique. Linné dans son ouvrage "Systema naturae" jette les bases du système de classification hiérarchique qui persiste encore de nos jours. Ce système de classification, bien que conçu dans l'idée qu'il n'existe pas d'évolution, correspond assez bien aux interprétations actuelles des relations évolutives entre espèces. L'espèce est alors définie sur des bases de caractères morphologiques ou phénétiques. Un "type" morphologique définit une espèce, la variabilité intraspécifique correspond alors à des imperfections par rapport au "type" idéal. Cette définition typologique de l'espèce correspond aujourd'hui, dans un contexte évolutionniste, à l'espèce phénétique. Celle-ci correspond à un ensemble d'organismes qui diffèrent phénétiquement (statistiquement) moins entre eux qu'entre organismes appartenant à d'autres espèces. Même si cette définition se veut actuellement purement pratique pour le biologiste ou le paléontologue, elle soulève de nombreux problèmes. Le nombre de caractères fiables et discriminants, sont relativement faibles d'autant plus si l'on admet que les espèces ont évolué à partir d'un ancêtre commun (sans véritable discontinuité). Selon les caractères pris en compte et leur nombre, la séparation de groupes (espèces) peut être plus ou moins aisée, voire différente. Cette définition marque une réelle inefficacité face aux espèces dites « jumelles » de plus en plus décrites chez les insectes notamment. La réalité biologique et évolutive est totalement absente de cette définition.

I.2.2. L'espèce biologique : un concept admis

Face à ces problèmes théoriques, la notion d'interfécondité, qui représente une réalité biologique, est proposée pour définir l'espèce. Buffon avait déjà pressenti cette conception, mais elle fut réellement mise en forme par Ernest Mayr (1974) qui propose la définition biologique de l'espèce comme un "groupement de populations naturelles réellement ou potentiellement interfécondes et isolées de tout autre groupement analogue". Cette conception de l'espèce populationnelle intègre une réalité biologique fondamentale, la notion de population contrairement au concept typologique qui ignore cette structure et ne considère que l'individu. Pour Mayr (1974), l'espèce est une communauté reproductive, une unité écologique et génétique, "un pool de gènes protégés" par des mécanismes d'isolement intrinsèques. Étant donné que l'espèce coïncide plus ou moins avec l'idée d'un pool génique, cela implique une cohérence phénétique de ses membres. Le concept d'espèce phénétique est une conséquence de la réalité biologique de l'espèce. De cette façon, des caractères phénétiques ne définissent plus une espèce, mais peuvent dans certain cas la diagnostiquer. La définition de l’espèce biologique est donc relative au caractère mixologique et donc à des mécanismes d’isolements entre espèces. Les espèces existent par défaut d’interfécondité entre certains groupes. D’autres auteurs appréhendent le concept de l’espèce biologique d’une façon légèrement différente, en ce sens qu’ils préconisent, à l’instar de Paterson (1993), de définir une espèce comme un ensemble d’organismes qui partagent un système de reconnaissance sexuelle. L’espèce n’existe donc plus au travers d’un défaut de reconnaissance sexuelle, mais au contraire au travers d’une reconnaissance positive. Selon ces auteurs, cette nuance semble

15 avoir d’importantes influences sur la reconnaissance pratique des espèces via des dispositifs de reconnaissance observables ainsi que sur la compréhension des mécanismes de spéciation. D’après Paterson (1993), lors de la spéciation, le système de reconnaissance apparaît comme un processus causal alors que l’isolement en serait plutôt une conséquence. Cette conception ne remet pas en cause l’idée que l’espèce est associée à une communauté reproductrice.

I.2.3. Problèmes posés par le concept d'espèce biologique

La définition de l’espèce biologique théoriquement très satisfaisante souffre de quelques problèmes lorsque l’on se penche sur les populations naturelles. En effet, il apparaît tout d’abord que cette définition ne concerne que les organismes à reproduction biparentale. Pour la plupart des catégories à reproduction uniparentale, et pour le monde bactérien en particulier, il semble exister un vaste continuum « rendant toute classification difficile, voire impossible » (Génermont, 1980). Néanmoins, la sélection naturelle a vraisemblablement causé des discontinuités (Mayr, 1974 ; Moreno, 1997). Génermont précise que cela est plutôt vrai pour les organismes parasites ou les organismes libres spécialisés. C’est également le cas pour les bactéries chez lesquelles on peut reconnaître divers modes d’évolution plus ou moins réticulés (Figure 1). Type Clonale Réticulée Mixte d’évolution ons i Relat phylogénétiques

Temps Ancêtre

Figure 1 : Trois modes alternatifs d'évolution pour les bactéries : une évolution strictement clonale à l'exemple des Rickettsiae, une évolution réticulée (échanges génétiques) et une évolution mixte entre les deux précédentes à l'exemple de la famille des Enterobacteriaceae et des Rhizobiaceae, d'après Moreno (1997). Les points symbolisent les échanges génétiques.

Un cas particulier, notamment rencontré chez les insectes, est représenté par les formes asexuées qui dérivent directement d’espèces sexuées, et pour lesquelles Génermont (1980) préconise de créer une catégorie taxonomique supraspécifique renfermant l’espèce sexuée et les formes parthénogénétiques qui en dérivent. Pour assigner ou non le rang d’espèce à des populations, il faut donc en pratique tenter de déterminer si elles sont isolées reproductivemment. Les mécanismes d’isolement, s’ils existent, devront être intrinsèques (liés à l’espèce elle-même et non à des conditions extérieures à celle-ci), d’où toute la complexité de la tâche. Ainsi, pour Mayr (1974), « plus la distance entre deux populations est grande dans l’espace et dans le temps, plus il devient difficile d’évaluer leur statut d’espèce l’une par rapport à l’autre, mais cela devient biologiquement inutile » étant donné que les pools géniques sont indépendants (ou peuvent êtres considérés comme tels). En d’autres termes, la définition de l’espèce biologique ne prend tout son intérêt que pour les populations sympatriques.

16 La définition de l’espèce biologique rencontre d’autres sérieuses difficultés. Ainsi, il existe de nombreux cas d’espèces à vaste territoire annulaire où les populations contiguës sont interfertiles, mais où les populations trouvées aux extrémités du territoire ne se croisent pas (Mayr, 1974). En fait, même si les populations extrêmes ne se croisent pas, elles sont susceptibles de s’échanger des allèles via l’anneau formé par les autres populations. Le concept d’espèce biologique se heurte également aux particularités du monde végétal où les flux géniques sont très importants même entre genres différents. L’importance de l’hybridation dans la nature est également une manifestation de l’imperfection de la définition, qui, selon Delsol et al. (1995), a permis une meilleure compréhension de la spéciation et en particulier de la nature graduelle de ce processus. Ainsi, l’existence et la découverte récente de très nombreuses espèces jumelles (non différenciées morphologiquement), notamment chez les insectes, est révélateur d’un phénomène lent et graduel pour la différenciation de ces espèces. De notre point de vue, il semble qu’au contraire, cela soit plutôt le révélateur d’une spéciation rapide, lors de laquelle la différenciation morphologique n’a pas eu le temps de s’accomplir au point de produire des espèces discernables à l’observation.

À la vue de ces difficultés à définir une « bonne espèce », Templeton (1989) étend le concept trop rigide de l’espèce à des populations qui maintiennent une cohésion et une identité génétique au fils des générations, en dépit d’éventuels flux géniques avec d’autres populations analogues. Cette définition semble tout aussi difficile à appliquer, car comment apprécier dans les populations naturelles le degré de cohésion qui justifierait leur statut d’espèce ? La spéciation est un processus qui s’inscrit dans le temps, dès lors, l’espèce doit trouver une extension dans le temps de son concept. Car, comme le font remarquer Mahé et Devillers (1983), l’interfécondité postule la comptemporanité, ce qui les conduit à proposer une conception chrono-dynamique de l’espèce au travers de la chrono-espèce. Elle se caractérise par l’ensemble des organismes dont le pool génétique est continu dans le temps et qui est délimité par deux évènements de spéciation.

I.2.4. Signification évolutive de l'espèce

«L’isolement reproductif constitue un moyen protecteur contre la disparition d’un système génétique coadapté » (Mayr, 1974). L’environnement est hétérogène dans l’espace et dans le temps, ce qui nécessite pour une adaptation correcte un isolement des groupes d’organismes adaptés à des environnements différents. La communauté de procréation entre organismes adaptés est favorisée par la sélection, étant donné qu’une espèce sexuée ne peut produire un assortiment de formes adaptées au spectre des ressources disponibles (Ridley, 1997). La diversité physicochimique initiale génère une diversité organique spécifique, qui elle même, s’auto influence positivement et génère une nouvelle diversité environnementale. Cette conception milite en faveur de l’espèce écologique qui associe plus ou moins strictement une espèce à une niche écologique. L’espèce est une entité plus ou moins bien caractérisée, qui selon le type d’organisme et le domaine d’étude réclamera des approches conceptuelles parfois différentes. Il n’en reste pas moins que le concept d’espèce, même s’il souffre d’exceptions, est indispensable à la compréhension du monde vivant. La cohésion de l’espèce est assurée par des mécanismes d’isolement génétique, qui lui permet une adaptation à son environnement.

17 II. Isolement et speciation

L'isolement reproducteur est l'évènement majeur qui fonde la formation d'une nouvelle espèce. Les mécanismes qui soutendent l'apparition d'un isolement reproducteur sont extrêmement variés, le tableau 1 suivant permet d'en avoir une vue d'ensemble.

Tableau 1 : Classification des mécanismes d'isolement reproductif d'après Dobzansky (1970). Mécanismes précopulatoires ou prézygotiques qui préviennent la formation de zygotes hybrides Isolement écologique ou d'habitat Dans une même région géographique, les populations occupent des habitats différents Isolement saisonnier ou temporel La copulation ou la floraison ont lieu à des moments différents Isolement sexuel ou éthologique L'attraction sexuelle entre membres d'espèces différentes est faible ou nulle Isolement mécanique Une incompatibilité anatomique entre organes génitaux ou floraux empêche la fécondation ou la pollinisation Isolement gamétique Chez les organismes à fécondation externe, les gamètes mâles et femelles d'espèces différentes peuvent ne pas s'attirer les uns les autres. Chez les organismes à fécondation interne, les gamètes ou les gamétophytes d'une espèce peuvent êtres inaptes à survivre dans les conduits génitaux ou dans les styles d'une autre espèce Mécanismes postcopulatoires ou postzygotiques qui réduisent la viabilité ou la fertilité des zygotes hybrides Létalité des hybrides. La viabilité des zygotes hybrides est réduite ou nulle. Stérilité des hybrides. Les hybrides F1 d'un sexe, ou des deux, sont incapables de produire des gamètes fonctionnels. Dégénérescence des hybrides. La viabilité ou la fertilité des hybrides de deuxième génération (F2) ou de rétrocroisements (backcross) est réduite.

D'après la définition de l'espèce biologique, toute bonne espèce est isolée des autres par un mécanisme de type prézygotique lui garantissant pleinement l'intégrité de son pool génique. Les mécanismes postzygotiques révèlent, quant à eux, l'imperfection de l'isolement et l'état transitoire dans lequel peut se trouver un groupe d'organismes en voie d'isolement et de spéciation. Le passage sélectionné des mécanismes postzygotiques à des mécanismes prézygotiques (économie sexuelle de gamètes et de temps à produire des hybrides d'aptitudes inférieures aux non hybrides) s’appelle le renforcement. Il est encore le sujet de nombreuses interrogations théoriques. Le niveau de complexité assez élevé de ces mécanismes laisse présager d’un contrôle polygénique de ces caractères. Il est important de noter ici que la symbiose peut être impliquée dans des mécanismes d’isolement postzygotique (pour plus d’informations cf § IV.5.2.1).

II.1. Géographie de l'isolement et modes de spéciation

Dans quelles circonstances géographiques, les mécanismes d'isolement peuvent-ils naître ? Les relations géographiques entre les espèces en voie de formation peuvent être de trois grands types. Allopatrique, les populations occupent des aires différentes et ne sont pas en contact direct. Sympatrique, les populations se côtoient sur une même aire de répartition. Parapatrique, les populations entretiennent une zone de contact en dépit d’aires de distribution différentes. Dans le cas de notre étude, ce sont les mécanismes de spéciations sympatriques, dans lesquels la symbiose peut jouer un rôle prépondérant, qui seront plus longuement abordés.

18 II.1.1. La spéciation allopatrique vicariante et spéciation allopatrique par effet fondateur

Schématiquement, deux situations extrêmes peuvent se produirent : soit l’espèce ancestrale est scindée par un facteur externe (émergence d’une montagne, d’une faille, d’un cours d’eau…) en deux groupes de populations de tailles équivalentes, il s’agit d’un phénomène de vicariance ; soit elle se scinde de façon dissymétrique (par colonisation d’un site vide favorable d’un petit groupe d’individus) laissant une population de taille beaucoup plus petite que l’autre, c’est l’effet fondateur. Le résultat immédiat dans les deux situations est la rupture des flux de gènes entre ces populations. Cette absence de lien génétique permet l’accumulation indépendante de mutations. La dérive génétique favorise la différenciation des pools génétiques d’autant plus rapidement que la population ancestrale était petite et que les populations scindées le sont également. Cette action est mineure dans les populations d’effectif important, c’est donc dans la deuxième configuration que l’effet de la dérive génétique sera le plus important. La sélection accroît cette différenciation, pourvu que les milieux sélectifs des populations isolées soient différents. En raison des nombreuses relations épistatiques entre les gènes, l’effet de fondation (conduisant à la modification drastique des fréquences alléliques) est favorable, selon Mayr (1974), à la réorganisation d’une partie du pool, impliqué dans ces relations. C’est ce qu’il nomme la révolution génique. La différenciation peut aboutir à des mécanismes d’isolement reproductif qui se concrétiseront lors de la remise en contact de ces populations. Cet isolement peut être total, ou donner lieu à un renforcement. De très nombreuses expérimentations ont tenté de vérifier que l’isolement de populations pouvait entraîner un isolement reproducteur. D’après la revue de Rice et Hostert (1993), 11 des 14 expériences recensées ont été concluantes. Les mécanismes d’isolement naissent, comme l’imaginait déjà Darwin de façon tout à fait accessoire et ne sont pas directement sélectionnés. Ce mode de spéciation ne connaît pas de réelles difficultés théoriques. Il est admis par la communauté scientifique comme étant le plus commun. D’une façon générale, l’existence de la spéciation allopatrique n’est pas contestée, et la symbiose n'y est vraisemblablement pas directement impliquée. Mayr (1974) pense que « la spéciation géographique est le mode de spéciation presque exclusif chez les animaux ».

II.1.2. La spéciation sympatrique

La spéciation sympatrique peut être définie d’après Mayr (1974) comme l’origine des mécanismes d’isolement à l’intérieur de l’aire de dispersion des descendants d’une population. Ce concept admet qu’une espèce peut en donner deux nouvelles sans barrière géographique, à la suite de l’adaptation de deux entités à deux micro environnements différents grâce à une sélection désavantageant les hybrides (sélection disruptive ou diversifiante) (Pintureau, 1987). C’est à ce titre que la symbiose, via l’acquisition de nouvelles capacités métaboliques favorables à l’exploration de nouveaux milieux, pourrait conduire à des spéciations sympatriques (cf § IV.5.2.2.). Ce concept qui remonte à l’époque prédarwinienne ne s’est réellement développé que dans les années soixante grâce à la modélisation mathématique dont Maynard-Smith (1966) fut l’un des initiateurs. De récentes modélisations sur la spéciation sympatrique (Dieckmann et Doebeli, 1999 ; Kondrashov et Kondrashov, 1999 ; Higashi et al., 1999 ; Gavrilets et Waxman, 2002) s’accordent sur la vraisemblance théorique du concept. Les modèles de Dieckmann et de Kondrashov (1999), sont axés sur la sélection disruptive, qui selon leurs conclusions, est capable de favoriser l’assortiment reproductif apte à créer l’isolement nécessaire à la spéciation. Ces modèles gagnent en réalisme, en considérant des loci pour l’aptitude écologique ainsi que des loci pour

19 la reconnaissance sexuelle, contrairement aux nombreux modèles antérieurs, considérant un seul loci (ou 2 loci étroitement liés). Ils diffèrent fondamentalement sur la dynamique du processus en fonction du nombre de loci intervenant (Tregenza et Bultin, 1999). Les modèles de Higashi et Gavrilets diffèrent de ces deux modèles, en ce sens qu’en l’absence de sélection disruptive, la sélection sexuelle est apte à produire une spéciation. Contrairement à la spéciation allopatrique, où la dérive joue un rôle majeur, la spéciation sympatrique est essentiellement un processus sélectionné.

Qu’en est-il dans les populations naturelles ? Ce type de spéciation est principalement invoqué pour des groupes d’animaux particuliers comme les phytophages, les parasites et parasitoïdes (Bush, 1975). La scission d’une espèce se fait alors par changement d’hôte. De ce point de vue, David (1977) estime que le comportement alimentaire et le comportement de ponte devraient jouer un rôle majeur chez les insectes dans ce processus. L’existence d’espèces sympatriques proches phylogénétiquement et exploitant des niches écologiques différentes plaide en faveur d’un tel mode de spéciation. Ainsi, l’on reconnaît, chez la mouche Rhagoletis pomonella qui ne s’attaquait initialement qu’à l’aubépine, avant 1864, plusieurs races, inféodées à l’aubépine, mais aussi aux pommes et aux cerises (Bush, 1975). Un tel exemple de formation rapide en sympatrie de race d’hôte où l’on a pu montrer par ailleurs l’existence d’un assortiment reproducteur, suggère la possibilité d’une véritable spéciation sympatrique à terme. La diversification d’un grand nombre d’insectes, en particulier des coléoptères, semble avoir accompagné la diversification des Angiospermes (Farrell, 1998). Des processus de coévolution semblent expliquer la diversification successive, des plantes, en l’absence d’exploitation grâce à des mécanismes de défenses (insecticides), et des insectes, grâce à l’acquisition de résistance face à ces mécanismes, par des changements de plantes hôtes (Ehrlich et Raven, 1964 ; Farrell et al., 1992). Outre la spéciation sympatrique par assortiment reproducteur, Combes (1995) propose la spéciation sympatrique par assortiment de survies pour les parasites. L’assortiment reproducteur est forcé par la survie de certains types à un hôte particulier. Wilson (1992) estime que la spéciation sympatrique « peut avoir aisément créé en grand nombre des insectes connus pour leur spécialisation ; elle peut avoir aussi assuré la prolifération des espèces parasites… ». Ces considérations sur ce mode de spéciation restent encore aujourd’hui soumises à de vives critiques. La spéciation sympatrique peut aussi se réaliser instantanément par des mécanismes génétiques très particuliers. Depuis peu, on reconnaît l’existence de spéciations par hybridation chez les insectes et en particulier chez les phasmes (Bullini et Nascetti, 1990). Ces espèces hybrides ont des modes de reproduction parthénogénétique. Leur statut d’espèce est donc ambigu. La polyploïdisation est un autre phénomène qui est assez fréquemment à l’origine de nouvelles formes parthénogénétiques (Mayr, 1974). Ces deux derniers phénomènes intéressent plus particulièrement les plantes, chez lesquelles le déterminisme du sexe n’est pas dépendant, comme chez la plupart des animaux, d’un équilibre entre autosomes et chromosomes sexuels.

II.1.3. La spéciation parapatrique

En quelque sorte intermédiaire entre spéciation allopatrique et sympatrique, elle concerne des populations contiguës. La divergence de ces populations serait causée par un fort contraste écologique entre deux zones sur lesquelles une seule forme est adaptée. Les hybrides sont contre sélectionnés. Cette situation se caractérise à la frontière des deux milieux écologiques par l’existence d’une zone hybride.

20 White (1978) développe un autre modèle basé sur des remaniements chromosomiques. Ces remaniements, désavantageux à l’état hétérozygote, mais avantageux à l’état homozygote, favoriseraient l’isolement reproductif. L’une des critiques les plus sérieuses apportée à cette hypothèse est que bien souvent de tels phénomènes peuvent s’expliquer en allopatrie ultérieurement suivie par une introgression.

III. Classification et phylogénie

Classer n’est pas simplement une manie de scientifique. Nous classons très souvent de façon inconsciente, et cela nous permet de résumer, de simplifier des informations complexes et donc, de comprendre. Comprendre car la classification possède également un pouvoir prédictif puisque, sur la base de l’appartenance d’un élément à un groupe, je peux déduire, ou plutôt, prévoir les caractéristiques de cet élément. Cette dernière propriété est à la base de la notion de modèle biologique. D’ailleurs nommer les choses tient également de la classification. Car aucun crayon ni aucun chêne pédonculé (Quercus pedunculata) n’est parfaitement identique à un autre et pourtant le même mot est employé et regroupe un ensemble de choses très similaires qui partagent des traits communs les distinguant des autres ensembles. Connaître cet ensemble de traits communs qui caractérise par exemple un insecte est bien plus important et plus commode que de connaître tous les insectes (plus d'un million d'espèces d’insectes répertoriées). La diversité du vivant est depuis très longtemps l’objet d’étude par l’homme qui cherche ainsi à la comprendre et à la domestiquer. Les plantes sont parmi les premiers organismes à être rigoureusement classées, et l’on compte de nombreux botanistes parmi les premiers scientifiques à s’être investi dans les tâches de classification. Aristote (385-322 av. J-C.) et son successeur Théophraste (372-287 av. J-C.), qui rédige l’Histoire des plantes, dénombraient déjà près de 1000 espèces animales et végétales. Ces classifications, ou systématiques en biologie, sont alors le reflet d’un plan divin de la nature qu’il convient de retranscrire. Trois grands courants philosophiques irrigent alors les fondements même de ces classifications : l’anthropocentrisme, l’essentialisme et le finalisme. Ceux-ci conduisent à organiser et classer les organismes selon une échelle naturelle (Scala Naturae) de perfectionnement, depuis la « simple plante » jusqu’au bijoux de la création, l’homme bien entendu. Cette idée persiste malheureusement toujours dans nos sociétés et l’on n’y substitue au perfectionnement, l’idée d’évolution. L’homme serait le plus évolué des organismes. Or tous les organismes sont aussi évolués, ils ont vécu le même temps évolutif depuis l'apparition de la vie, il y a environ trois millions d'années. Dans cet univers de pensée statique, l’unité de la création divine est l’espèce, chaque être de la même espèces possède la même essence divine (essentialisme). Même Linné dans son ouvrage « Systema naturae » qui jette les bases de la classification hiérarchique qui persiste encore de nos jours, est fidèle à ces courants de pensées. Mais indépendamment de toutes notions d’évolution, cette classification est en accord avec l’histoire évolutive des espèces. Ceci tient au fait que cette classification dite phénétique, c’est à dire qui regroupe les espèces sur des critères de ressemblance, regroupe plus ou moins rigoureusement du même coups les espèces proches, qui dérivent les unes des autres. Il faut néanmoins noter que cette ressemblance entre espèces proches est le résulat combiné de l'homologie (identité par descendance) et de l'homoplasie (identité par convergence, indépendament de la descendance).

21 III.1. Données de la systématique

Pour aboutir à une classification, il faut comparer des éléments précis, que l’on nomme en systématique des caractères. Ces caractères doivent être comparables ou homologues. La notion d’homologie remonte au 19ème sciècle avec Owen qui décrit des structures homologues lorsque, comparées dans plusieurs organismes de même plan d’organisation, ces structures entretiennent les mêmes connexions avec les structures voisines, et ce, quelles que soient leurs formes et leur fonctions. Plus précisément et de façon complémentaire, l’homologie de descendance parle de structures homologues lorsque celles-ci sont héritées d’un ancêtre commun. Le caractère est l’élément de base qui est comparé et qui représente tous les attributs observables des organismes pour lesquels on peut poser l’hypothèse d’homologie.

III.2. La reconstruction phylogénétique

La reconstruction phylogénétique est née dans le contexte évolutionniste de la fin 19ème avec les grands biologistes de l’évolution comme Lamarck, Darwin et Haeckel, pour lesquels la phylogénie représentait l’enchainement des espèces au cours du temps, et venait suplanter le terme de généalogie. La phylogénie est une classification particulière qui a pour but d’établir les liens de parenté qui décrivent l’histoire évolutive entre les différentes classes , unités évolutives ou taxons. Le support de cette histoire évolutive est l’arbre phylogénétique qui a bénéficié du formalisme hérité des mathématiques et de l’informatique (Figure 2). De nombreuses informations sont disponibles à ce sujet dans la thèse de Galtier (1997).

Te mps

A A B

B Te mps 1. raci ne 2. C

noeud C D D

feuille s Figure 2 : (1.) arbre non raciné, (2.) arbre raciné à partir de l’arbre (1.) où l’on positionne l’origine du temps.

Un arbre non raciné est un graphe connexe acyclique, c’est à dire un ensemble de sommets (ou nœuds) dont certains sont reliés par des arêtes (ou branches) tel qu’il existe un chemin et un seul entre deux sommets quelconques. Les sommets terminaux (ou feuilles) ne sont reliés aux nœuds internes que par une seule branche. Un arbre est dit totalement résolu lorsque chaque nœud est le point de rencontre de 3 branches. L’arbre raciné possède une contrainte supplémentaire qui nait de l’orientation par rapport au temps qui s’écoule depuis la racine jusqu’aux feuilles. Le nombre d’arbres non racinés possibles avec n feuilles (Cavalli- Sforza et Edwards, 1967) est de : (2n – 5)! / 2n-3.(n – 2)!

22 n= n-1 dans cette formule pour le nombre d’arbres racinés possibles.

Historiquement, la phénétique s’est opposée à la cladistique et ces deux conceptions ont donné naissance à des techniques d’analyses particulières. Ces techniques qui se sont développées en intégrant les mécanismes de l’évolution sont maintenant indépendantes de leurs principes initiaux. De ce fait, la phénétique et le cladisme ne sont présentés ici que dans une perspective historique.

III.2.1. La phénétique

Cette méthode est basée sur la quantification de la ressemblance globale entre chaque paire d’unités évolutives (UE), organismes ou groupe d’organismes dont on souhaite établir l'histoire évolutive. Plus la ressemblance globale entre organismes est importante, plus leurs liens de parenté sont étroits. Ce courant phénétique prend son origine dans la taxonomie numérique conçue à la fin des années 1950 et dont les principaux concepts sont discutés dans l’ouvrage « Numerical taxonomy » rédigé en 1973 par Sneath et Sokal (1973). Les relations étudiées sont des relations phénétiques et non phylogénétiques, c’est à dire que les caractères étudiés, qui peuvent être des caractères morphologiques, des fréquences alléliques, des données immunologiques ou d’hybridation d’ADN etc…, ont a priori le même poids et ne sont pas soumis à une interprétation évolutive. L’arbre obtenu à partir de la matrice de distance entre chaque paire de taxon s’appelle le phénogramme. Il décrit les relations phénétiques entre taxons. La méthode d’UPGMA (Unweighted Pair Group Method with Arithmetic mean) associée à la taxonomie numérique est la plus simple des techniques pour construire cet arbre (Sneath et Sokal, 1973). Cette technique est basée sur l’agglomération successive des taxons des plus proches aux plus éloignés. Il s’agit bien d’une technique de classification et non de phylogénie. Cependant, les méthodes phénétiques ont aujourd’hui une nature phylétique lorsque sont introduites des hypothèses évolutives extrinsèques, par exemple, dans le calcul des distances entre taxon. Les hypothèses évolutives quant à l’évolution des caractères morphologiques sont très spéculatives. Par contre, depuis quelques décennies, l’étude massive des séquences nucléiques à permis de mieux comprendre les forces évolutives qui s’appliquent sur ces séquences. Ainsi, de très nombreux modèles permettent aujourd’hui d’estimer, à partir des distances observées entre séquences nucléiques ou protéiques, des distances évolutives, qui sont censées intégrer les événements de substitutions cachés à la simple observation et de reconstituer ainsi l’histoire évolutive de ces séquences.

III.2.2. Le cladisme

L’analyse cladistique vise à reconstruire la phylogénie d’un taxon par identification des caractères qui se trouvent à l’état dérivé (apomorphes), et qui seuls contiennent une information phylogénétique, de ceux qui se trouvent à l’état primitif (plésiomorphes) et qui sont de ce fait partagés par l’ensemble du taxon. Au sein d’un taxon, seuls les états de caractères qui sont dérivés et partagés (synapomorphies) traduisent une parenté phylogénétique. Sur la base de ces caractères dérivés partagés, on définit un groupe synapomorphe (pour une ou plusieurs synapomorphies) ou monophylétique. Ce groupe peut également se définir comme un clade ; un taxon comprenant l’ancêtre (le nœud ancêtre) et tous les descendants qui en sont issus. Par opposition un groupe est dit paraphylétique s’il comprend l’ancêtre mais seulement une partie des descendants. Enfin un groupe est dit polyphylétique s’il ne comprend aucun ancêtre commun à tous les membres du groupe. Lorsque les caractères étudiés sont moléculaires, l’ensemble des états ancestraux sont

23 envisagés, l’arbre retenu est celui qui minimise le nombre de changements nécessaires pour expliquer la répartition des états de caractères observée chez les taxons. C’est la méthode de la parcimonie maximale qui implique indirectement le respect des hypothèses d'homogénéité et de stationarité (cf III.3.1.). Hormis cette hypothèse sous jacente et néanmoins très forte, la parcimonie n’est basée sur aucune autre hypothèse d’évolution ce qui pour certains auteurs est très positif alors que pour d’autres, cela révèle le caractère inconsistant de la méthode (Galtier, 1997). La méthode de parcimonie est issue de la systématique traditionnelle non- moléculaire, elle a été adaptée ensuite aux données moléculaires.

III.2.3. Phylogénie moléculaire

L’élément de base de toute classification ou phylogénie est le caractère. Plus le nombre de caractères comparés est important, plus l’analyse phylogénétique est fiable (sous les conditions du modèle phylogénétique). De ce point de vue, les séquences nucléiques et protéiques offrent un potentiel d’analyse incomparable, tant par le nombre de caractères que par le nombre séquences homologues disponibles. Depuis quelques décennies, la multiplication des données moléculaires ainsi que l’avènement de l’informatique ont permis le développement de la phylogénie moléculaire au travers des statistiques et de la modélisation. C’est la combinaison de l’histoire évolutive caractérisée par l’ordre des branchements des lignées (la phylogénie ou pattern) et des caractéristiques quantitatives et qualitatives du processus de l’évolution dans ces lignées (le process) qui conduit à l’état des caractères observés. Refuser de prendre en compte les processus d’évolution lorsqu’on recherche la phylogénie est pénalisant. La modélisation est alors toute légitime et nécessaire (Galtier, 1997).

III.2.4. Séquences et alignements

L’hypothèse première qui doit être vérifiée, quelle que soit la méthode phylogénétique utilisée, est l’hypothèse d’homologie des séquences étudiées ainsi que celle des sites comparés. Mais cette hypothèse n’est pas suffisante, car deux phénomènes évolutifs sont susceptibles de conduire à des phylogénies de gènes différant de celles des organismes portant ces gènes. La spéciation est alors confondue, soit avec des évenements de duplication de gènes, soit avec des évènements de mutation au sein des populations naturelles (polymorphisme spécifique). Des branchements phylogénétiques correspondant à la duplication d’un gène peuvent être interprétés comme des événements de spéciations, si certaines copies (ou allèles) du gène en question ne sont pas connues et intégrées à l’analyse. Il faut donc pour reconstituer la phylogénie des espèces étudier des gènes qui soient issus de phénomène de spéciation (orthologues) et non de duplication (paralogues). Enfin, des branchements phylogénétiques correspondant à l’apparition d’un polymorphisme précédant la spéciation, peuvent être interprétés comme des événements de spéciation, si le polymorphisme est maintenu après l’évènement de spéciation. Après avoir choisi des gènes orthologues, il faut ensuite faire correspondre les sites homologues des différentes séquences : c’est l’étape d’alignement. En effet de nombreux changements évolutifs interviennent dans les séquences ; des évenements de substitutions (remplacement d’un nucléotide par un autre), et d’insertion-délétion (introduction ou élimination d’un nucléotide ou d’un petit groupe de nucléotides). L’alignement correspond donc à la recherche de l’homologie la plus élémentaire. Enfin, certaines régions géniques qui ont très fortement évolué (multiples événements de substitution, et d’insertion-délétion) sont inalignables. Des sites homologues ne peuvent être déterminés de façon fiable. Ces régions sont alors éliminées des analyses phylogénétiques.

24 A partir des distances évolutives estimées entre taxon, plusieurs algorithmes de reconstruction d’arbres ont été proposés. Le plus simple d’entre eux est la méthode d’UPGMA précédemment citée. Mais cette méthode n’est pratiquement plus utilisée car beaucoup trop sensible aux biais sur les hypothèses de stationarité et d’homogénéité, (cf § III.3.1.), elle suppose la validité de l'horloge moléculaire (la quantité d'évolution est la même dans toutes les branches de l'arbre). D’autres algorithmes exhaustifs consistent à ajuster pour chaque topologie candidate, les longueurs de branches aux distances estimées selon les moindres carrés ou encore en minimisant la somme totale des longueurs de branches de l’arbre. Ces algorithmes se heurtent au grand nombre de topologies possibles et des heuristiques les approximant ont dû être développées. La méthode du neighbor-joining (Saitou et Nei, 1987) est majoritairement employée. L’optimisation concerne la longueur totale de l’arbre après ajustement des longueurs de branches aux moindres carrés. Elle est conceptuellement proche de l’idée d’évolution parcimonieuse au sens où elle minimise la quantité totale d’évolution.

III.3. Modèles en phylogénie moléculaire

Cinq critères de choix sont utilisés pour choisir le modèle phylogénétique adéqua : - la rapidité de la méthode ou efficacité, - la fiabilité de la méthode (reconstruction d'un arbre phylogénétique exacte) - la puissance (pour un résultat fiable, plus une méthode est dite puissante, moins celle- ci nécessite de données), - la consistance (avec suffisamment de données, une méthode consistante converge vers le bon arbre) - la robustesse (elle est éprouvée si de petites violations des hypothèses de départ n'affectent pas l'estimation de la phylogénie).

Les modèles moléculaires reposent sur la représentation de l’évolution d’une séquence le long d’une branche puis sur la généralisation de ce processus évolutif le long d’un arbre. L’évolution d’une séquence est classiquement vue selon un processus dit de Markov.

III.3.1. Evolution markovienne d’une séquence

L’évolution d’une séquence est modélisée selon un processus stochastique. Cette évolution est décrite par les probabilités de passage au nœud père d’un état initial I (I=A, C, G ou T) à l’état final J au nœud fils, pour chaque site. Ce processus satisfait plusieurs hypothèses : - Les séquences évoluent exclusivement par mutation ou substitution nucléotidique. - Les sites évoluent indépendamment et suivent un processus identique et constant au cours du temps. Cette modélisation impose deux conséquences ; (1) l’évolution d’une séquence est assimilable aux réalisations d’une unique variable aléatoire, (2) l’état futur d’un site (ou d’une séquence) est fonction uniquement de son état présent et non de son état passé (c'est "l'absence de mémoire" qui définit un processus de Markov). Afin de simplifier les modèles une autre hypothèse qui concerne l’évolution des séquences le long d’un arbre est ajoutée : - Le mode évolutif est identique dans toutes les branches (hypothèse de stationarité) - La composition en bases est constante en tout point de l’arbre (hypothèse d’homogénéité).

25 III.3.2. Modèles basés sur les distances évolutives

De nombreux modèles évolutifs utilisent les processus de Markov pour estimer, à partir d’une matrice de taux instantanés de substitution, les distances évolutives entre les différentes séquences de l’arbre. Ces distances (nombre de substitutions par site) ajustées deux-à-deux d’après le modèle utilisé estiment le nombre de substitutions produites au cours de l’évolution entre toutes les paires de séquences de l’arbre. Plusieurs matrices de taux de substitutions peuvent être utilisées. La matrice la plus simple indique que les 12 probablitités de substitutions sont identiques : c’est le modèle de Jukes et Cantor (1969). La matrice la plus classiquement utilisée est celle tirée du modèle de Kimura à 2 paramètres (Kimura, 1980). Elle distingue un taux de transition (passage d’une base purine à une autre base purine ; A→G, G→A ou d’une pyrimidine à une autre pyrimidine ; C→T, T→C) et un taux de transversion (passage d’une base purine à une base pyrimidine ou inversement ; A/G → T/C, T/C → A/G).

III.3.3. Modèles de maximum de vraisemblance

La méthode du maximum de vraisemblance en phylogénie moléculaire fut initialement appliquée par Cavalli-Sforza et Edwards (1967) puis développée par Felsenstein (1981). Cette méthode statistique consiste à ajuster les valeurs des paramètres numériques du modèle (matrice de substitutions, longueurs des branches…) aux données (l’alignement de séquences), pour chaque topologie candidate. C'est à dire estimer les valeurs des paramètres ayant la plus forte probabilité de conduire aux séquences observées sachant le modèle évolutif. Une vraisemblance est calculée pour chaque topologie candidate, et la topologie qui maximise cette vraisemblance est finalement choisie. Cette méthode à l’énorme avantage d’utiliser toute l’information contenue dans les séquences pour déduire une topologie d’arbre contrairement aux modèles basés sur les distances évolutives qui réduisent l’information contenue dans les séquences à des estimations de distances évolutives. Cet avantage est contre balancé par le nombre très important d’estimations nécessaires et donc par des temps de calcul plus lourds que pour les méthodes de distances. Toutes les méthodes décrites jusqu’à présent sont basées sur les deux hypothèses d’homogénéité et de stationnarité. Or ces deux hypothèses sont violées dans la majorité des jeux de données utilisés pour réaliser les phylogénies, ce qui conduit inévitablement à des biais de reconstruction : attraction des branches longues, groupement des séquences aux taux de GC similaires (cf § IV.5.1.3). Un certain nombre de travaux ont été consacrés à la prise en compte de ces deux hypothèses dans les modèles d’évolution, des modèles de distance alternatifs aux précédents (Lockhart et al., 1994 ; Galtier et Gouy, 1995 ; Tourasse et Gouy, 1997) ainsi que des modèles de maximum de vraisemblance (Yang et Roberts, 1995).

Le modèle de maximun de vraisemblance développé par Galtier et Gouy (1998) est un modèle d'évolution de l'ADN non homogène prenant en compte la variabilité des taux de substitutions entre les sites et des taux de GC entre les séquences. L’originalité de ce modèle est qu’il peut gérer un nombre relativement important de séquences (>10) alors que le précédent modèle de Yang and Robert (1995) ne permettait pas la gestion de plus de 5 séquences tant le modèle était richement parametré (Galtier et Gouy, 1998). Confortés par la validation du modèle appliqué à la phylogénie bactérienne (Galtier et al., 1999), nous avons utilisé ce modèle pour notre étude phylogénétique portant sur les bactéries symbiotiques intracellulaires. Car, comme il a été précédement explicité, les jeux de données comportant des séquences de bactéries libres et d’endocytobiotes ne respectent pas

26 du tout les hypothèses d’homogénéité et de stationnarité (vitesse d’évolution et taux de bases AT plus importants chez les endocytobiotes que chez les bactéries libres).

IV. La symbiose

IV.1. Définition générale et historique

D'un strict point de vue étymologique le mot symbiose provient du grec sym (avec) et biose (vie) d'où sa définition générale très large : vie avec ou vie en commun. Ce mot existait déjà dans le grec tardif où il désignait la vie en commun des compagnons. Dans un manuscrit latin d'Althussius datant de 1603, le mot est également employé à propos des formes naturelles de la vie politique (Perru, 2002a). Mais le terme désignant des associations biologiques ne sera utilisée pour la première fois qu'en 1877 par Franck pour caractériser des lichens. Le concept sera développé et explicité par le botaniste allemand De Bary en 1879 (De Bary, 1879) selon lequel la symbiose est l'association de deux organismes spécifiquement distincts, qui vivent ensemble. Il précise que l'association concerne des espèces d'organismes différents. Autrement dit, les organismes impliqués dans une relation symbiotique sont généralement phylogénétiquement très éloignés. De Bary apporte un concept nouveau, au sens où, à partir des phénomènes de coopération entre espèces, il crée un nouvel organisme et donc une nouvelle unité vitale composite (Perru, 2002b). Aujourd'hui pour décrire cette unité composite en interaction, on parle de symbiocosme (Nardon, 1995). La symbiologie a initialement fait son apparition pour caractériser des associations particulières chez certains organismes vivants mais très rapidement la symbiose sera l'occasion d'étudier la cellule et les organites qui la composent. A la fin du 19 ème, Le biologiste russe Andréî Serguîevitch Famintsyn pensait déjà que les chloroplastes étaient des entités autonomes vivant dans la cellule (Perru, 2002a). La définition de la symbiose est très simple, trop peut être, car ses contours et ses limites sont extrêmement floues. Ainsi, cette définition englobe toutes les relations depuis le mutualisme jusqu'au parasitisme. Margulis (1981) précise que la symbiose implique un réel contact physique entre les partenaires ainsi qu'une durée significative dans l'histoire de leur vie commune. Au delà même de cette définition, le concept de symbiose met l'accent sur de nombreux problèmes théoriques actuels, comme celui de l'individu ou bien celui de l'espèce. Le terme de symbiose est très utilisé dans le langage courant où il est plus ou moins synonyme de vie harmonieuse. On pourait également le définir comme étant : la vie commune de partenaires en étroite relation de bénéfices mutuels. Autrement dit la symbiose est ici une idéalisation de l'association. Ce terme usité est l'expression d'une volonté de reconnaître dans la nature un état harmonieux et paisible d'association. Cette acception est semble-t-il contemporaine d'un courant philosophique, et spirituel qui véhicule une pensée qui englobe l'homme et la nature dans un système ou l'interdépendance est la règle. Il semble également que le courant politique écologique participe à cette acception, voulant dépeindre une nature apaisée, idéalement organisée. Il s'ensuit que même chez les scientifiques, le terme de symbiose renvoie aisément au terme de bénéfice mutuel. Or rien dans la définition initiale, ni dans les données actuelles, ne justifie une telle acception.

27 IV.2. Les définitions de la symbiose : les différentes classifications

Tout d'abord il ne faut pas oublier que la symbiose n'est pas une curiosité biologique, inventée par quelques scientifiques pour se divertir, non, la symbiose est un état d'association pourrait-on dire universel. L'association symbiotique peut s’interpréter comme la « manifestation d’une propriété fondamentale de la matière vivante » (Nardon, 1995). Toutes les formes de vie, des plantes aux animaux, sont le résultat de ce type d'association. A quelques très rares exceptions près, comme pour les bactéries par exemple, tout organisme est symbiotique (Tout au moins pour les organismes chez lesquels une recherche de symbiose a été ménée). Pour donner un exemple, citons le cas de l'homme, ou bien d'une vache, qui hébergent dans leurs tubes digestifs respectifs plus de bactéries que leurs corps ne contiennent de cellules. On perçoit immédiatement les problèmes théoriques que peut soulever la symbiose, sur la définition de l'individu par exemple (Heddi et al., 2001). L’homme ou la vache sont-ils avant tout une comunauté bactérienne, avec une diversité génétique importante, ou une communauté de cellules eucaryotes, génétiquement identiques (aux mutation près) ? Très récemment, une symbiose inattendue a été découverte chez les aleurodes, où une γ- Protéobactérie est hébergée à l’intérieur d’une β-Protéobactérie, elle même symbiote intracellulaire de son hôte (von Dohlen et al., 2001). Cette découverte illustre tout à fait cette tendance à l'association intime, même chez les procaryotes. La symbiose peut structurellement prendre des formes très diverses. Elle peut être simple (monosymbiose), n'impliquant que deux partenaires ou multiple (plurisymbiose) impliquant plus de deux partenaires. Elle peut intéresser des partenaires qui demeurent extérieurs l'un à l'autre, on parle alors d'ectosymbiose, ou au contraire elle concerne des partenaires dont l'un (l'hôte) héberge le second (le symbiote) on parle alors d'endosymbiose. Parmi les endosymbioses on distingue la symbiose de type extracellulaire, où les symbiotes demeurent à l'extérieur des cellules de l'hôtes comme cela est le cas pour les symbioses du tube digestif des animaux, ou des organes bioluminescents de certains poissons, par exemple. On distingue également les symbioses de type intracellulaire où les symbiotes vivent et se développent à l'intérieur des cellules de l'hôte. C'est ce dernier type de symbiose plus précisement appelé endocytobiose qui sera l'objet de la présente étude. On pourra noter que le terme d'endocytobiose n'est presque jamais employé dans la littérature américaine où seul le terme générique "endosymbiosis" est utilisé.

La symbiose recouvre toutes les formes d’associations depuis le parasitisme jusqu’au mutualisme. Neanmoins, les cas de parasitismes où l'un des partenaires fini par tuer l'autre sont généralement exclus du champs de la symbiose (Nardon et Grenier, 1993). La façon la plus évidente pour définir la symbiose est dans un premier temps de s’attacher à décrire morphologiquement ses manifestations. Mais il est possible de se placer à d’autres niveaux d’analyse. Ainsi, on peut tenter de la définir d’un point de vue physiologique. Dans ce cas, le concept de dépendance est employé. Selon Cheng (1991) la dépendance physiologique est unilatérale dans le cas du parasitisme et bilatérale dans le cas du mutualisme. Comme le suggère Smith (1990), le concept de bénéfice mutuel doit être évité pour définir la symbiose et remplacé par le concept de dépendance mutuelle, car les bénéfices sont généralement très difficiles à apprécier. De plus, il semble que bien souvent la symbiose se caractérise par une interdépendance mutuelle avec un effet bénéfique unilatéral, ce qui rapprocherait le terme de symbiose de celui de parasitisme comme cela était le cas lors de la naissance de la symbiologie (Perru, 2002b). D’un point de vue génétique, Combes (1995) suggère que, si les arrêts d’expression des gènes « double emploi » (qui ont la même fonction chez les deux partenaires) se font

28 systématiquement d’un seul côté, il y a parasitisme, s’ils se font alternativement des deux côtés, il y a mutualisme. La symbiose peut aisément être perçue comme un mécanisme sophistiqué de prédation génique de la part de l'hôte, qui "d'un seul coup" acquière un nouveau kit de gène (le symbiote) avec toutes les nouveautés et potentialités métaboliques et évolutives qui vont avec. Finalement, on peut concevoir l’endocytobiose comme l’interaction entre deux ou plusieurs génomes associés, qui constituent une nouvelle entité biologique, le symbiocosme (Nardon et Grenier, 1993).

Nardon et Grenier (1993) définissent 5 niveaux d'associations symbiotiques définis sur les modalités d'interaction et de transmission des symbiotes et qui selon les auteurs correspondent assez probablement aux degrés d'évolution de l'association : - Degré 1 : la symbiose antagoniste ou parasitisme, tous les individus d'une population ne sont pas nécessairement affectés. Le symbiote qui diminue la fitness de l'hôte est généralement transmis horizontalement. - Degré 2 : la symbiose primaire ou facultative, La principale différence par rapport au parasitisme est qu'ici la fitness de l'hôte est peu affectée par la présence du symbiote. Celui-ci peut néanmoins avoir de grandes conséquences sur l'évolution de l'hôte, en particulier sur sa reproduction (symbiose à Wolbachia, richettsies cf § IV.5.2.1.). - Degré 3 : la symbiose secondaire, l'ensemble d'une population, voire de l'espèce, est affectée par le symbiote qui améliore substentiellement la fitness de l'hôte qui l'héberge dans des structures particulières. La transmission se fait par contamination à partir du milieux. (ectosymbioses, symbioses racinaires des légumineuses, endosymbioses du tube digestif). - Degré 4 : l'endocytobiose intégrée, toute l'espèce est symbiotique et héberge des symbiotes intracellulaires dans des cellules très spécialisées, les bactériocytes (cas des bactéries) ou mycétocytes (cas des levures), qui se différencient sous la présence des symbiotes. La symbiose est généralement obligatoire et améliore la fitness de l'hôte. La transmission des symbiotes est verticale. Ce type de symbiose fait l'objet de ce travail. - Degré 5 : la symbiose organogénétique, le symbiote est devenu un organite cytoplasmique et de nombreux transferts de gènes vers le noyau de la cellule hôte sont réalisés (mitochondries, chloroplastes).

Même si, comme les auteurs le suggèrent, cette classification reflète une symbiogénèse schématique, il ne faut pas y voir le chemin tracé de l’évolution obligée de toute symbiose. Cette classification permet simplement un recensemment des différents types de symbioses en fonction de leur intégration et de l’interdépendance des partenaires associés. Cette association durable de plusieurs génomes va engendrer l’émergence de propriétés nouvelles, au travers de mécanismes d'interactions et de régulations métaboliques complexes entre l'hôte et ses endocytobiotes.

IV.3. Symbiose et propriétés émergentes

Penser la complexité en biologie est essentiel, car on sait depuis fort longtemps qu’un organisme vivant peut être décomposé puis reconstruit à partir de ses éléments les plus simples, car le tout (ici l’organisme vivant) est supérieur à la somme de ses parties. L’approche cartésienne s’en voit bouleversée. Ceci découle directement du principe des propriétés émergentes dont les conséquences sont gigantesques. Ce principe stipule qu’à la

29 suite de l’agrégation d’éléments simples, dans un système où les éléments interagissent entre eux, il peut émerger des propriétés nouvelles pour ce système. Ces propriétés apparaissent à la suite de la complexification d’éléments simples. Le sociologue Edgard Morin, qui a propagé la théorie générale des systèmes où la notion de complexité est essentielle, perçoit la vie comme une propriété émergente de la matière organique (Morin, 1980). Le cas de la matière dans l’univers est à ce sujet tout à fait instructif. La tendance générale, tirée des lois de l'entropie, indique que le « désordre » ne cesse d'augmenter. Or la vie est pourrait on dire « une force » qui lutte en permanence contre ce désordre en maintenant un déséquilibre énergétique constant entre le milieu intérieur et le milieu extérieur, mais dans le même temps, la vie ne cesse de bénéficier de celui-ci pour ce complexifier et évoluer. Ainsi, dans les premiers instants qui suivirent le Big-Bang, l'univers était parfaitement homogène, composé des mêmes éléments, tous semblables dans une immense soupe lisse. Progressivement, le désordre ou l'entropie a créé des associations d'éléments simples qui réunies possèdent des propriétés originales que les éléments simples ne possédaient pas. Ainsi deux atomes d’hydrogène et 1'atome d’oxygène isolés n’ont pas du tout les mêmes propriétés physico-chimiques que l’eau, constituée pourtant des mêmes atomes. Il en est de même des propriétés d'une molécule d'eau et de l'océan. La complexification ne naît pas de la transformation progressive de la matière mais de l'association d'éléments simples identiques puis d'éléments différents. L'émergence de propriétés nouvelles, générées par la complexification de la matière, est également applicable à la matière vivante. L'association est en quelque sorte la gravité du vivant, universelle et permanente. Cette tendance est indéniable, elle a été et demeure l'un des moteurs les plus puissant de l'évolution biologique qui procède bien plus du bricolage (Jacob, 1981) et de la connexion d’organismes biologiques existants que de la création "par erreur" (par mutation).

D’après la théorie des systèmes appliquée à la biologie, les propriétés nouvelles sont d'autant plus novatrices ou « intéressantes » selon Jacquard (2003) que l'association satisfait à trois critères : - Les éléments (les organismes ou partenaires) qui s'associent sont très différents; - L'échange entre les partenaires se réalise dans les deux sens; - L'échange entre les partenaires est intime.

Or, il est frappant de constater que dans les nombreux cas de symbiose, ces trois critères soient parfaitement remplis. Ainsi, les organismes associés sont très souvent phylogénétiquement éloignés donc potentiellement différents ; les échanges ne sont, a fortiori dans les cas de symbioses intégrées, jamais unidirectionnels et les échanges sont très intimes et souvent même obligatoires pour les partenaires qui sont interdépendants.

L’association d’organismes vivants via les associations symbiotiques tente donc d’augmenter la complexité de l’association résultante et d’en faire émerger des propriétés nouvelles. Vue sous cet angle, la complexité pose une fois de plus le problème de l'individualité. Quelles sont ces propriétés nouvelles qui vont résulter de l’association symbiotique ?

IV.4. Impact physiologique de la symbiose

La mise en place d'une relation d'endocytobiose durable passe nécessairement par l'établissement de mécanismes d'interactions et de régulations métaboliques complexes entre l'hôte et ses endocytobiotes. La régulation de la respiration aérobie (par les mitochondries) ou

30 de la photosynthèse (par les chloroplastes) chez les eucaryotes offre un magnifique exemple d'une intégration réussie, il y a environ deux milliards d'années pour les mitochondries et un milliard d'années pour les chloroplastes (cf IV.5.1.) (Doolittle, 1997). En ce qui concerne les modèles d'endocytobioses plus récents, la comparaison d'individus aposymbiotiques (lorsqu'ils sont viables) et symbiotiques, a permis de mettre en évidence sur de nombreux modèles les apports métaboliques des endocytobiotes.

Les mollusques bivalves des sources hydrothermales profondes ont recours à la chimiosynthèse effectuée par des bactéries symbiotiques intracellulaires localisées dans les branchies de l' (Fiala-Médioni et Le Pennec, 1988). Dans le règne végétal également, la symbiose joue un rôle extrêmement important. Ainsi, certaines bactéries (Rhizobium, Bradyrhizobium) possèdent la capacité d'induire chez les légumineuses des nodosités responsables de la fixation de l'azote atmosphérique et du nitrate (Masterson et al., 1982). Ces endocytobiotes permettent aux légumineuses de se développer sur des sols relativement pauvres en azote. Ils sont donc impliqués dans la colonisation des milieux pauvres ou déséquilibrés en certaines substances essentielles. La plante fournit aux symbiotes les substrats carbonés issus de la photosynthèse. Un grand nombre d’insectes, se développant sur des milieux déséquilibrés du point de vue nutritionnel, vivent en symbiose intégrée avec des microorganismes intracellulaires (Buchner, 1965). La sève phloémienne (pauvre en acides aminés libres et en protéines) dont se nourrit le puceron, les graines (déficientes en certaines vitamines) dont se nourrissent les charançons, et le bois (riche en cellulose et déficient en acides aminés) dont se nourrissent les termites, sont tous des aliments qui ne sont pas adaptés aux besoins de ces insectes. Dans ce cas, le symbiote représente un véritable « kit de gènes » avec lequel l’insecte compense ces déficiences nutritionnelles et métaboliques (Nardon et Grenier, 1993). Chez les insectes, la fourniture de vitamines hydrosolubles comme la vitamine C, le pantothénate, la riboflavine, la biotine ou la pyridoxine, semble être un phénomène assez courant (Wicker, 1983 ; Douglas, 1994). Ainsi, l’endocytobiote du charançon Sitophilus oryzae fournit des vitamines (riboflavine, acide pantothénique, biotine, et en plus faible quantité de l’acide folique, de la pyridoxine et de l'acide nicotinique) (Wicker, 1983) indispensables au métabolisme et particulièrement aux voies énergétiques mitochondriales productrices d’ATP (Heddi et al., 1993 ; Heddi et al., 1999). Heddi (1990 ; 1993) a montré, chez Sitophilus oryzae, que les activités spécifiques d'au moins six enzymes mitochondriales de la chaîne respiratoire sont plus importantes chez les individus symbiotiques que chez les aposymbiotiques. La fourniture d'acides aminés par les endocytobiotes a également été démontrée expérimentalement soit par l'utilisation de milieux nutritifs carencés, soit par l'incorporation de traceurs radioactifs. Ainsi, les endocytobiotes de la blatte Blattella (Henry et Block, 1961) synthétisent et fournissent à l'hôte au moins huit acides aminés (tyrosine, phénylalanine, isoleucine, arginine, thréonine, valine, méthionine et cystéine). Les endocytobiotes chez Sitophilus oryzae sont impliqués dans le métabolisme de la méthionine. En l’absence de symbiotes, l’excès de cet acide aminé dans le blé est générateur de pertes énergétiques par sa transformation en sarcosine (Gasnier-Fauchet et Nardon, 1986). Buchnera, l’endocytobiote d’Acyrthosiphon pisum synthétise des acides aminés essentiels comme la thréonine, la lysine et l’isoleucine (Febvay et al., 1995). Les données génomiques confirment actuellement le rôle de Buchnera dans la synthèse de ces acides aminés (Shigenobu et al., 2000).

Ainsi, les symbiotes peuvent interférer directement avec les voies métaboliques de l’insecte, ce qui se traduit par de grandes modifications au niveau des traits physiologiques. La symbiose agit de cette façon sur la fitness de l’hôte. La comparaison de souches de

31 S. oryzae symbiotiques et aposymbiotiques révèle que la bactérie est responsable de la diminution de la durée du développement des larves (environ 25%) et de l’augmentation de la fertilité des adultes (environ 30%) (Nardon et Wicker, 1981 ; Grenier et al., 1986). Des cas similaires existent chez d’autres insectes comme les Glossines et les Blattes. Le cas extrême est celui du puceron, où les populations d'insectes ne survivent pas à l’élimination de ses symbiotes (stérilisation des individus). Outre cette action sur la fitness, le symbiote agit également sur les capacités colonisatrices des populations d’insectes. Ainsi, les charançons aposymbiotiques sont totalement ou partiellement incapables de voler (Grenier et al., 1994). Ces résultats sont à corréler à la déficience mitochondriale précédemment décrite.

Pour conclure, nous noterons que les seuls organismes qui aient réussi à coloniser toutes les niches écologiques sont les bactéries. En effet, même les déserts les plus arides ou les sources hydrothermales les plus chaudes et les plus profondes sont contaminés par ces microorganismes. Il n'est donc pas surprenant que l'adaptation à des substrats à la fois pauvres et variables d'un certain nombre d'animaux supérieurs, et notamment d'insectes ravageurs, soient liée à la présence de bactéries symbiotiques (Nardon et Charles, 2001).

IV.5. Symbiose et évolution

Le plus bel exemple de l’implication de la symbiose dans l’évolution et des propriétés nouvelles qui en émergent est sans aucun doute l’origine symbiotique de la cellule eucaryote.

IV.5.1. La cellule eucaryote

Il est maintenant admis que la symbiose a joué un rôle prépondérant dans la formation et l’évolution de la cellule eucaryote. Bien que ces considérations dépassent le strict cadre de la spéciation, elles illustrent bien le rôle moteur de la symbiose, non pas dans la spéciation, mais d’une façon plus globale dans la diversité biologique. Ainsi, de plus en plus d’arguments plaident en faveur de l’origine symbiotique des mitochondries, descendant des α-protéobactéries, et des plastes, descendants des cyanobactéries (Palmer et Delwiche, 1996 ; Bui et al., 1996 ; Doolittle, 1997 ; Tomitani et al., 1999). D’une façon générale, la plupart des travaux de phylogénie ont jusqu’à aujourd’hui révélé qu’il existait une plus forte parenté des protéines et des ARN des organites cellulaires avec leurs homologues bactériens qu’avec leurs homologues eucaryotes (De Duve, 1990). On reconnaît plus classiquement que les caractères de semi-autonomie vis-à-vis de la croissance et de la division des organites à l’intérieur du cytoplasme ainsi que l’existence d’un véritable système génétique plaident en faveur d’une origine bactérienne pour ces organites. De même, l’existence chez certain organisme primitif amitochondriaux (comme les Trichomonades) de séquences de gènes nucléaires très apparentées à des séquences de microorganismes promitochondriaux indique, d’une part, la perte secondaire de cet organite et conforte d’autre part, l’origine symbiotique des mitochondries (Sogin, 1991 ; Palmer, 1997). Pour le reste, et en particulier pour les modalités et les causes de l’établissement de ces symbioses, un vaste débat reste ouvert.

32 IV.5.1.1. La théorie d'endocytobioses successives ou SET (Serial Endosymbiotic Theory)

C’est en 1967 que Margulis expose cette théorie pour expliquer l’origine endosymbiotique, des mitochondries et des chloroplastes, ce qui avait déjà été proposé antérieurement (Mereschkowski, 1920), mais également des undulipodia pour expliquer l’origine de la mobilité cellulaire. Selon l’auteur, l’acquisition de la mobilité est un évènement capital pour la future cellule eucaryote (Margulis, 1993). D’après cette théorie, une archaebactérie proche des Termoplasma actuelle, possédant des protéines de type histone, subit l’aggression de bactéries virulentes apparentées aux spirochètes. Consécutivement à cette pénétration, le système membranaire prolifère initiant la formation ultérieure de l’enveloppe nucléaire. L’association Termoplasma-spirochète coévolue en une entité (protiste mastigote) douée de mobilité, qui est à son tour attaquée par des bactéries Gram-négative appartenant au genre des Paracoques (Bdellovibrio) actuelles. Ces dernières donneront les mitochondries qui permettent dès lors à la nouvelle entité d’évoluer dans un milieu aérobie. Cette nouvelle acquisition permet le développement de la phagotrophie. Selon Margulis, ce nouveau moyen autorise la dernière endosymbiose de bactéries photosynthétiques telles que les Prochlorons proches des cyanobactéries. Même si cette théorie mérite d’être confortée et appuyée par de plus amples données, l’idée générale d’une filiation symbiotique demeure séduisante, et rallie de plus en plus de théories voisines. Ainsi, Cavalier-Smith (1987) considère plutôt, tout en acceptant le schéma général proposé par Margulis, une acquisition simultanée des ancêtres des mitochondries et des chloroplastes, invoquant alors l’importance du succès évolutif de la cellule hôte. D’autres auteurs vont même jusqu’à proposer, comme De Duve (1990), une origine symbiotique pour les microcorpuscules (péroxysomes, glyoxysomes et glycosomes), s’appuyant sur le mode de croissance de ces organites ainsi que sur la nature de leur membrane limitante. Le noyau des cellules eucaryotes est aussi un candidat qui a été proposé pour avoir une telle origine, mais cette hypothèse est controversée par des analyses phylogénétiques très récentes (Forterre et Philippe, 1999). Enfin, la découverte d’un chromosome de grande taille associé au corpuscule basal chez Chlamydomonas (Hall et al., 1989) milite en faveur d’une origine symbiotique également pour les cils et les flagelles des eucaryotes. Quel que soit le scénario proposé pour l’établissement de la cellule eucaryote, il ne s’agit que d’un schéma général, car la nature exacte de l’hôte « accueillant les symbiotes » ainsi que les modalités sont loin d’être établies.

IV.5.1.2. Les hypothèses syntrophiques

Deux nouvelles hypothèses symbiotiques ont été proposées pour expliquer l’origine de la première cellule eucaryote. Elles suggèrent que l’eucaryote primitif est né d’une association métabolique symbiotique entre une eubactérie (le symbiote) et une archaebactérie (l’hôte) à la suite d’une dépendance physiologique entre les deux partenaires. Doolittle (1998) fait à ce sujet remarquer que les récentes données (biochimiques et séquences moléculaires) publiées ces dernières années sont plus en accord avec ces deux récentes hypothèses, qu’avec la SET. « L’hypothèse d’hydrogène » est proposée par Martin et Müller (1998). Le symbiote libre serait une α-protéobactérie anaérobie facultative, capable de respirer en conditions aérobies. Il assure une synthèse d’ATP quelles que soient les conditions et rejette dans le milieu de l’hydrogène. L’hôte est une archaebactérie anaérobie et autotrophe, qui est dépendante en particulier de l’hydrogène. Il est producteur de méthane comme les bactéries méthanogènes actuelles qui sont du reste les seuls procaryotes à posséder de véritables histones. Les auteurs suggèrent qu’une pénurie en hydrogène minéral pourrait engendrer une

33 pression de sélection en faveur du rapprochement physique des deux partenaires et à terme pour la réalisation de la symbiose. Le symbiote serait alors l’ancêtre de nos mitochondries actuelles. « L’hypothèse de syntrophie » proposée par Moreira et Lopez-Garcia la même année (1998), ne diffère pas fondamentalement de la précédente, dans la mesure où elle s’appuie sur les mêmes considérations métaboliques. L’étude de l’écologie des communautés bactériennes actuelles les fait se tourner vers une hypothèse qui requière deux évènements de symbiose. À l’instar du modèle de Martin et Muller, les mitochondries seraient issues des α- protéobactéries. Lopez-Garcia et Moreira (1998) font très justement remarquer qu’il est bien difficile de choisir parmi l’une de ces deux dernières hypothèses, celle qui est la plus en adéquation avec la réalité supposée des phénomènes qui ont présidé à la formation de la cellule eucaryote. Ces deux modèles très récents représentent une fabuleuse occasion de nouvelles recherches qui devront éclaircir et confirmer l’histoire évolutive de la cellule eucaryote. Par ailleurs, il existe d’autres hypothèses qui ne sont pas strictement symbiotiques, mais qui évoquent néanmoins la tendance à l’association, pour expliquer la cellule eucaryote originelle. Une hypothèse de fusion cellulaire proposée par Zillig (1991) ou bien encore des hypothèses d’engloutissement proposées par Lake et Rivera (1994). Même si celles-ci semblent expliquer la distribution de certains gènes parmi les partenaires, elles posent de véritables problèmes mécaniques (Lopez-Garcia et Moreira, 1999).

IV.5.1.3. LUCA, la cellule eucaryote et les problèmes de phylogénie

Sans remettre en cause les théories symbiotiques précédentes, et en particulier l’origine bactérienne de la mitochondrie, quelques scientifiques dont P. Forterre (1999) militent pour une idée originale sur l’arbre universel de la vie et les relations entre les trois grands groupes d'êtres vivants que sont : les bactéries, les archéobactéries et les eucaryotes. Classiquement, on imagine la première vie sous la forme très simple d’une protéobactérie (bactérie primitive) qui donnera ensuite naissance aux bactéries actuelles ainsi qu’aux eucaryotes et archéobactéries (Figure 3).

34 Bactéries

Protéobactéries Eucaryote s A

Arc héo bac tér ies

Euca r yote s

LUCA Bactéries B

Arc héo bac tér ies

Figure 3 : Organisation de l’arbre universel. A : schéma classique de l’arbre universel tiré de la molécule d’ADNr 16S. B : schéma alternatif à l’arbre universel avec LUCA (Last Universal Cellular Ancestor) comme ancêtre commun dont les eucaryotes actuels dérivent. Les flèches représentent des associations symbiotiques.

Dans ce scénario, les bactéries subissent une complexification au cours de leur évolution mais elles demeurent des formes de vie plus primitives (et les moins complexes) que les eucaryotes. Or de nombreuses données semblent contredire cette vision de l’évolution. Il est tout d’abord assez surprenant de constater que les eucaryotes contiennent plus de gènes d’origine bactérienne que de gènes dérivant des archéobactéries et que les archéobactéries possèdent elles-mêmes plus de gènes (gènes orthologues) dérivant des bactéries que des eucaryotes. De nombreuses études phylogénétiques rapportées par Forterre & Philippe (1999) portant sur les protéines semblent contredire la vision communément admise alors qu’un grand nombre de phylogénies réalisées jusqu’alors et appuyant l’hypothèse classique sont fortement biaisées. Le phénomène qui est principalement pointé ici est le phénomène d’attraction des branches longues qui résulte de l’utilisation de modèles phylogénétiques qui ne peuvent gérer correctement les vitesses d’évolution hétérogènes entre les molécules analysées. Ainsi, si l’on considère que l’arbre B (Figure 3) est l’arbre vrai, le fait que les séquences bactériennes évoluent plus vite que les séquences eucaryotes a pour conséquence que la plupart des modèles utilisés en phylogénie (distance et parcimonie) vont de façon artéfactuelle sortir les bactéries à l’extérieur de l’arbre et donc conduire à un arbre de type A (Figure 3). Le test de taux d’évolution relatif devrait donc être préalablement utilisé sur les séquences choisies afin de sélectionner pour les études phylogénétiques des molécules qui évoluent sensiblement à la même vitesse. Or, même cette détermination est biaisée car elle est soumise au phénomène de saturation, conséquence logique de la vitesse d’évolution importante chez les bactéries. Ne disposant pas "d’outgroup" lorsque l’on s’intéresse à l’arbre universel, le seul moyen de raciner un tel arbre est d’utiliser des molécules paralogues qui se sont dupliquées avant les divergences des trois groupes. Or la paralogie des jeux de données de molécules utilisés pour raciner l’arbre universel est souvent douteuse; de plus, la plupart du temps, les paralogues (lorsqu’ils le sont réellement) révèlent des taux d’évolution

35 hétérogènes. Forterre & Philippe (1999) ont pu montrer de plus que pour les 6 jeux de données utilisés jusqu’alors pour raciner l’arbre universel la plupart des sites étaient saturés. C’est ainsi que Forterre et collaborateurs ont pu proposer l’alternative à l’arbre A (Figure 3) où l’organisme ancêtre LUCA est une forme primitive d’eucaryote et non de procaryote. Dans cette perspective, les bactéries ne sont plus des êtres primitifs mais au contraire des organismes qui ont vraisemblablement subi une simplification globale au cours de l’évolution. Ce scénario est séduisant, mais il pose un sérieux problème. Certes, l’évolution « régressive » par simplification du nombre de gène par exemple est bien décrite en particulier chez les endocytobiotes. Mais c’est l’apparition d’une forme complexe qui est théoriquement plus problématique à concevoir. Quel que soit le scénario évolutif, la symbiose est impliquée dans l’histoire des cellules eucaryotes contemporaines. Elle est responsable de la bifurcation majeure entre le règne animal et le règne végétal via l’acquisition des plastes. La symbiose apparaît donc comme un puissant moteur de la diversité biologique puisque, de surcroît, impliquée dans l’évolution de la pluricellularité qui représente une étape capitale dans la diversification des formes de vie. De même, l’évolution des métazoaires a été et est encore fortement influencée par les relations symbiotiques. Il est juste besoin pour s’en convaincre de rappeler que, tous les animaux, à de très rares exceptions près, possèdent une flore digestive bactérienne indispensable et que, toutes les plantes exploitent un milieu transformé par les bactéries quand bien même elles ne sont pas en étroite relation avec celles-ci.

IV.5.2. Impacts évolutifs de la symbiose sur l’hôte

Les Wolbachia pourraient infecter 20% des espèces d’insectes (Werren et Windsor, 2000) voire même beaucoup plus (Jeyaprakash et Hoy, 2000). Elles sont présentes dans d’autres groupes, comme les crustacés (isopodes) (Rousset et al., 1992), les acariens (Werren, 1997a) ou bien encore chez les nématodes (Sironi et al., 1995). Une espèce infectée peut ne l’être que partiellement. Ainsi, parmi 23 souches étudiées du genre Sitophilus seules 9 d’entre elles étaient infectées totalement, et quatre souches hébergeaient la bactérie partiellement (Heddi et al., 1999). Il est bien établi désormais qu’outre des transferts verticaux, des transmissions horizontales de Wolbachia entre espèces d’arthropodes se produisent au cours de l’évolution. Ainsi, la phylogénie des Wolbachia établie à partir des séquences du gène bactérien ftsZ chez des Coléoptères, des Lépidoptères et des Hyménoptères révèle que ces bactéries ont divergé, il y a environ 1,6 millions d’années (Werren et al., 1995). Or, la divergence des hôtes respectifs est estimée à approximativement 200 millions d’années. De plus, la transmission horizontale de Wolbachia est appuyée par l’absence de congruence des phylogénies hôtes/symbiotes. De tels transferts sont susceptibles de se réaliser par le biais des relations de type proie/prédateur ou compétiteurs associés. Il est à noter également que des transferts horizontaux ont pu être réalisés en conditions de laboratoire (Grenier et al., 1998). Les modifications de la reproduction induite par la présence de la bactérie Wolbachia ont un impact évolutif important sur l'insecte hôte.

IV.5.2.1. Manipulation de la reproduction de l'hôte

Chez les insectes, et plus généralement chez les arthropodes, la présence d’une bactérie intracellulaire facultative du genre Wolbachia est susceptible de modifier la reproduction de son hôte en causant quatre phénomènes majeurs : (1) l’incompatibilité cytoplasmique (Breeuwers et Werren, 1990), qui peut être unidirectionnelle lorsque l'isolement postzygotique se produit lors d'un croisement entre un male infecté avec une femelle non infectée, ou bidirectionnelle, lorsque l'isolement

36 postzygotique se produit lors d'un croisement entre individus infectés par des Wolbachia différentes. (2) la parthénogenèse thélythoque (Stouthamer et al., 1999) qui désigne la production d’une descendance femelle (diploïde, 2n) sans le recours à la reproduction sexuée (mâles haploïdes, n). Des cas de thélytoquies symbiotiques (à Wolbachia), causées par une diploïdisation lors de la première division mitotique, sont maintenant bien décrits (Stouthamer et Kazmer, 1994). De pareils cas de parthénogénèse ont été observés chez des Ptérygoides et des Aphelinides (Pintureau et Grenier, 1996). (3) la féminisation des mâles génétiques bien décrite chez les cloportes (Rigaud et al., 1991) (4) le male-killing (Jiggins et al., 2000) qui entraine la mort des mâles infectés. Ces modifications de la reproduction se traduisent par une augmentation de la transmission bactérienne (par voie transovarienne chez les femelles). En effet, les Wolbachia qui contaminent la lignée germinale sont transmises verticalement par hérédité maternelle uniquement.

IV.5.2.1.1. Impacts sur la speciation

En 1967, Laven a été le premier à développer l’idée que l’incompatibilité cytoplasmique, qu’il mit en évidence chez Culex pipiens, pouvait être un facteur directement impliqué dans la spéciation sympatrique (sans isolement géographique). Deux situations vont dans ce sens : (1) l’incompatibilité cytoplasmique bidirectionnelle peut être la cause première d’un isolement reproducteur entre des populations ayant des Wolbachia différentes, et (2) l’incompatibilité cytoplasmique, uni ou bidirectionnelle, pourrait être un facteur renforçant l’isolement de populations en voie de divergence. En théorie, l’acquisition et la fixation par deux populations allopatriques, initialement identiques du point de vue de la Wolbachia hébergée, de deux types de Wolbachia différentes est possible. Cela est d’autant plus probable dans les populations périphériques (de faibles effectifs) ou lors d’un évènement de fondation (Perrot- Minnot et al., 1996), la dérive étant accentuée. D’après Werren (1997b), cette succession d’évènements est beaucoup plus improbable en situation de sympatrie. Par ailleurs, Wolbachia pourrait être impliquée dans la spéciation grâce à des changements évolutifs causés dans le génome de l’hôte, indépendamment de l’incompatibilité qu’elle produit. Ainsi l’action de Wolbachia pourrait favoriser la sélection de changements génétiques compensatoires chez l’hôte, susceptibles de causer une barrière reproductive postcopulatoire (Turelli, 1994). D’une autre façon, par un phénomène d’autostop entre un type mitochondrial responsable d’une incompatibilité noyau/mitochondrie et une Wolbachia qui se répand. Cette possibilité est suggérée par la présence, chez Nasonia vitripennis, de gènes nucléaires incompatibles avec des gènes cytoplasmiques (présumés mitochondriaux) de Nasonia giraulti (Breeuwer et Werren, 1995). La possibilité que ces événements supposés actifs dans la spéciation puissent se produire est soumise à des contraintes. Tout d’abord vis-à-vis de la dynamique des Wolbachia, qui est influencée par le taux de survie et de fécondité des femelles infectées par rapport aux femelles non infectées, par leur taux de transmission ainsi que par le niveau de l’incompatibilité cytoplasmique qu’elles procurent (Werren, 1997b). Enfin, il faut que l’incompatibilité cytoplasmique soit d’un niveau tel, qu’elle permette de lutter suffisamment contre le flux génique pour pouvoir favoriser la divergence des populations. Car l’incompatibilité est très souvent partielle ce qui amène certains scientifiques (Stouthamer et al., 2001) à estimer que dans ces situations où des flux de gènes persistent, l’incompatibilité n’est pas suffisante pour expliquer la divergence entre populations. Cependant, de nombreux exemples vont dans le sens d’un rôle important des Wolbachia dans l’histoire évolutive des insectes. Wolbachia a certainement dû influencer la spéciation de

37 quelques représentants du genre Gryllus en affectant le degré d’hybridation entre ces espèces (Giordano et al., 1997). À la lumière des éléments qui viennent d’être apportés, ces bactéries sont vraisemblablement responsables d’une façon plus ou moins directe de phénomènes de spéciation (Stouthamer et al., 1993 ; Werren, 1997b ; Bordenstein et al., 2001; Stouthamer et al., 2001 ; Hurst et Randerson, 2002).

Outre les avantages évidents en dynamique des populations de la parthénogénèse, notamment lors de la colonisation de nouveaux territoires, elle semble être potentiellement d’une grande importance vis-à-vis de certains types de spéciation instantanée. Ainsi, la thélytoquie peut être à l’origine de nouvelles formes asexuées issues d’espèces sexuées. La thélytoquie, et en particulier la thélytoquie améïotique (où l’absence d’appariements chromosomiques fait qu’il n’existe aucune barrière mécanique à l’établissement d’irrégularités chromosomiques) est vraisemblablement requise pour générer des espèces polyploïdes chez les animaux (Suommalainen, 1950). Dans tous les grands groupes d’animaux à parthénogenèse, des polyploïdes existent et semblent stabiliser des formes (Retnakaran et Percy, 1985). Il est raisonnable d’imaginer que des symbiotes, tels les Wolbachia soient à l’origine de ces types de phénomènes. Nous pouvons à ce sujet proposer un scénario pour expliquer la formation d’espèces hybrides normalement polyploïdes (allopolyploïdes). Wolbachia est présente chez une espèce sans induire de modification de sa reproduction. Cette espèce s’hybride avec une autre espèce. Puisque l’on sait que l’effet de Wolbachia est fonction du génotype, chez cet hybride formé, dans ce nouveau contexte génétique, la bactérie induit la thélytoquie favorable à la diploïdisation nécessaire à la formation de la nouvelle espèce. Cependant, l’implication d’endocytobiotes dans de tels processus reste purement hypothétique et mérite d’être explorée.

IV.5.2.1.2. Impacts sur l'extinction des espèces

Enfin, la présence de Wolbachia pourrait faciliter l'extinction de certaines espèces où l'équilibre des sexes est complétement bouleversé. Ainsi chez Acraea encedon, un papillon africain, 90% des femelles portent la bactérie Wolbachia alors que les mâles infectés sont extrêmement rares en réponse au phénomène de male-killing (Jiggins et al., 2000).

IV.5.2.2. Symbiose et adaptation des insectes

Le rôle de la symbiose intracellulaire dans le pouvoir adaptatif des insectes vis-à-vis d’environnements très différents a longtemps été ignoré ou sous estimé. Les recherches actuelles en physiologie et en biologie moléculaire ont permis de lever une partie du voile sur les symbiocosmes d’insectes et ont montré qu’il s’agit d’entités indissociables formées de trois composantes principales : l’eucaryote, représenté par le noyau, l’ancien procaryote présumé, qui est la mitochondrie et le récent procaryote intégré qui est le symbiote principal (Heddi et al., 1999). Ces trois composantes sont en constantes interactions physiologiques et moléculaires pour établir ce que l’on appelle « Insecte ». L’endocytobiose a permis à de nombreux insectes d’exploiter des milieux pauvres et inhospitaliers. L’acquisition d’un endocytobiote représente une forme très particulière, et non strictement Darwinienne, de macromutations. La symbiose apparaît ainsi comme un mécanisme sophistiqué de prédation génique (Nardon et Grenier, 1993). Les nouvelles capacités métaboliques et écologiques ainsi héritées du génome bactérien, isolent écologiquement les groupes qui les possèdent de ceux qui en sont dépourvus. Cet isolement écologique serait favorable à la divergence des populations. La symbiose intracellulaire pourrait alors représenter une barrière écologique favorable à la spéciation sympatrique. Les

38 formes représentées actuellement par les symbiocosmes, en l’absence de la symbiose, n’auraient probablement pas vu le jour, ou tout au moins, pas aussi rapidement. Ainsi, il est remarquable que chez les Phylloxeridae (lignée primitive de pucerons) qui se nourrissent de phloème, de xylème et de contenus cellulaire, aucun endocytobiote n’est présent (Buchner, 1965). Alors qu’au contraire, les pucerons strictement phloémophages sont symbiotiques. L’adaptation des pucerons au phloème, un milieu très déséquilibré et très pauvre en métabolites secondaires, semble ainsi être liée à l’acquisition des symbiotes. Les bactéries symbiotiques ont donc manifestement contribué à la diversification des formes d’exploitation du milieu et à l’extrême diversité des espèces en particulier chez les insectes.

IV.5.3. Impacts sur les symbiotes : évolution des génomes

IV.5.3.1. Biais mutationel, dérive génétique et vitesse d’évolution

La vie intracellulaire favorise une évolution originale des populations bactériennes à un niveau génétique. En effet, l’évolution des génomes symbiotiques (et des parasites intracellulaires) est caractérisée par un manque de recombinaison génétique, un taux de mutations et un biais mutationel élevé ainsi que par la fixation importante de mutations délétères par dérive génétique (Wernegreen, 2002). Le manque de recombinaisons génétiques dans les populations de bactéries intracellulaires ou leur caractère strictement asexué résulte d’une part de la séquestration des bactéries dans les cellules hôtes et d’autre part de la perte possible de différents éléments impliqués indirectement dans la recombinaison (comme les phages, les séquences répétées et les transposons) ainsi que la perte de gènes impliqués directement dans la recombinaison et la réparation de l’ADN. Ainsi les gènes recA et recF sont absents chez l'endocytobiote du puceron Buchnera Ap (Tamas et al., 2002). Le mode de transmission influence le taux de recombinaisons mais également l’efficacité de la dérive génétique. En effet, ne sont transmises à la descendance, via l’infection des ovocytes, qu’un très petit nombre de bactéries. Les phénomènes successifs de goulots d’étranglement subit par les populations bactériennes ont pour conséquences de diminuer drastiquement l’effectif efficace de la population et d’accélérer les effets de la dérive génétique en favorisant la fixation de mutations délétères. C’est le phénomène de « Muller ratchet » (Moran, 1996). Les manques de recombinaisons conjugués à l’augmentation de la dérive favorisent l’augmentation de la vitesse d’évolution chez les bactéries intracellulaires. En effet, on observe dans les génomes symbiotiques une augmentation du taux de substitutions synonymes et non synonymes ainsi qu’une augmentation du rapport entre substitutions synonymes et non synonymes comparé aux entérobactéries libres (rapport 4 fois plus élevé chez l'endocytobiote Buchnera que chez les entérobactéries) (Clark et al., 1999). Il s’ensuit une augmentation de la vitesse d’évolution protéique. Parallèlement à l’augmentation de la vitesse d’évolution, les génomes symbiotiques semblent avoir subi une accumulation de base A et T très importante, que ce soit dans les régions codantes ou non codantes. Pour tester cette hypothèse et vérifier que les bactéries intracellulaires ne provenaient pas simplement de groupes bactériens libres à faibles taux de GC, Heddi et al. (1998) ont mis en évidence que les bactéries intracellulaires provenaient phylogénétiquement de groupes aux taux de GC hétérogènes et qu’à chaque fois le taux de GC moyen des bactéries intracellulaires était inférieur à celui des bactéries libres parentes. L'accumulation de base A et T est également un phénomène observé dans les mitochondries d’insectes (Crozier et Crozier, 1993). Cette pression de mutation directionnelle en faveur des bases A et T est donc une caractéristique du milieu intracellulaire, de nombreux parasites

39 intracellulaires révèlent également un tel biais (Heddi et al., 1998). L’origine de ce biais et les pressions sélectives qui le maintiennent ne sont pas encore complétement élucidées, des hypothèses ont cependant été formulées. L’une de ces hypothèses développée par Bernardi (1988 ; 1989) stipule que l’ADN suit une composition en base optimale en fonction des conditions environnementales. Il est vrai que la composition en C+G de l'ADN bactérien est relativement constante pour un même organisme alors qu’elle varie grandement entre les différentes espèces adaptées à des conditions environnementales très diverses. Les taux de C+G s'étalent de 25 % chez Mycoplasma capricolum jusqu'à 75 % chez Micrococcus luteus (Normore et Brown, 1970). Cependant l’auteur indique que ces conditions environnementales pourraient être représentées par la température, qui influence grandement la stabilité de la molécule d’ADN. Cette hypothèse d'une part, ne permet pas d'interpréter le biais mutationel des bactéries intracellulaires et d'autre part, est fortement remise en cause par l’existence de bactéries thermophiles, montrant de très faible taux de GC, découvertes dans des sources chaudes (Galtier et al., 1999). Une deuxième hypothèse stiplule qu'à la suite d’erreurs de réplications ou de la désamination de C en U (liée à la dégénérescence des génomes intracellulaires, dégradation ou perte des gènes impliqués), des bases U peuvent s’incorporer à l’ADN. Une troisième hypothèse s’appuie sur la déficience ou l’absence d’enzyme capable de corriger de telles erreurs (Wernegreen, 2002). Enfin une dernière hypothèse développée par Tamas (2002) permet d'expliquer l'intensification du biais en faisant intervenir "le dérapage" de la polymérase sur des régions de l'ADN "polyA", ce qui a pour conséquence l'ajout de base A et T dans des régions déjà très riches en ces deux bases.

IV.5.3.2. Taille des génomes des endocytobiotes

Les génomes bactériens ont une grande variabilité de taille. Herdman (1985) a montré qu'elle peut varier de 184 kb chez la cyanelle de Cyanophora paradoxa à plus de 13 Mb chez une souche de cyanobactérie, pour une moyenne globale d'environ 5 Mb. Dans le cas de populations à faible effectif efficace, montrant des taux de mutations élevés et des faibles taux de recombinaisons, on peut légitimement s'attendre à ce qu'un grand nombre de gènes soient dégradés. Mais pourquoi les génomes symbiotiques, qui connaissent ces conditions d'évolutions, possèdent, de plus, des tailles de génomes très petites comparées à celles des groupes bactériens dont ils sont issus (Andersson et Kurland, 1998) ? En d'autres termes pourquoi chez les bactéries intracellulaires la dégradation génique est associée à la perte d'un grand nombre de gènes et à la diminution drastique de la taille des génomes ? D'une façon générale les procaryotes, contrairement aux eucaryotes, possèdent très peu d'ADN non codant. Il semble donc exister une pression sélective en faveur de la diminution de la taille des génomes. Cette pression serait accrue dans le cas des populations d'endocytobiotes en réponse à leurs conditions de vie intracellulaires. Plus le génome diminue de taille, plus il peut se répliquer rapidement et être de ce fait sélectionné dans un environnement stabilisé où il y a relâchement des pressions de sélection (Maniloff, 1996) Néanmoins cette hypothèse n'est pas très satisfaisante puisque les populations d'endocytobiotes sont supposées à division lente. De plus, certaines espèces d'endocytobiotes présentent plus de pseudogènes que les espèces bactériennes libres (Frank et al., 2002). Des mécanismes de délétions massifs et de réarrangements chromosomiques ont été proposés pour tenter d'expliquer la diminution de la taille des génomes des endocytobiotes (Andersson et Andersson, 1999 ; Ochman et Moran, 2001). Chez Buchnera aphidicola, un scénario de la dégradation du génome a été proposé avec la délétion de pans entiers de génomes favorisée par la présence de séquences répétées notamment (Silva et al., 2001 ; Moran et Mira, 2001). Le phénomène s'atténuerait au cours de l'évolution avec la disparition de ces éléments répétés et l'augmentation de la pression de sélection sur le faible nombre de gènes restant dans l'organisme.

40 Il est par ailleurs intéressant de constater qu'il existe une corrélation entre la taille des génomes et leurs taux de GC et ce, indépendamment du fait que les bactéries soient ou ne soient pas symbiotiques. C'est à dire que plus le génome est petit, plus celui-ci est riche en base A et T (Charles et al., 1997). A une échelle plus petite, il a également été montré que les gènes procaryotiques les plus petits étaient également les plus riches en base A et T (Oliver et Marin, 1996). Il semble bien qu'au cours de l'évolution la taille du génome aisni que le taux de GC de celui-ci soient étroitement mêlés, mais le lien qui unient ces deux phénomènes reste encore mal compris.

IV.5.4. Impact sur l’entité symbiotique

La dépendance mutuelle des deux partenaires illustre le fait que l’association hôte/symbiote est une véritable entité coadaptée. Ainsi, les bactéries intégrées ont généralement perdu leur autonomie, elles ne sont plus capables de se diviser en l’absence de l’hôte. En effet, toutes les tentatives de cultures in vitro de bactéries symbiotiques intégrées se sont soldées jusqu’à maintenant par un échec. De façon parallèle, l’hôte, quand il survit à l’absence de ses symbiotes, voit sa fitness grandement diminuée. Cet état de coadaptation est souvent le résultat d’une longue coévolution entre les cogénomes participant à l’entité mosaïque. De plus, Nardon (1998) a montré chez le charançon Sitophilus oryzae, que l'insecte contrôle à la fois le nombre et la localisation de ses endocytobiotes. Des rétrocroisements successifs entre femelles aposymbiotiques et mâles symbiotiques (permettant le transfert du génome symbiotique dans un individu aposymbiotique) aboutissent, en quelques générations, à une baisse drastique de la fertilité et à un allongement de la durée de développement des individus. Ces résultats montrent que le génome nucléaire des insectes symbiotiques ne peut pas fonctionner sans ses bactéries et donnent ainsi la preuve de l'existence d'interactions génétiques entre l'hôte et ses endocytobiotes. Il est important de noter que, chez de nombreux insectes, la différenciation des bactériocytes en cellules géantes et polyploïdes est directement induite par la présence des endocytobiotes (Mansour, 1934 ; Nardon, 1971 ; Nardon et Grenier, 1988). Des phylogénies moléculaires basées sur l’ADNr 16S indiquent que les endocytobiotes des pucerons (Munson et al., 1991 ; Moran et al., 1993), des fourmis du genre Camponotus (Schröder et al., 1996) ou bien encore de la mouche tsétsé (Aksoy, 1995) sont monophylétiques. De plus, les arbres phylogénétiques des hôtes montrent une nette congruence avec les arbres des endocytobiotes correspondant, montrant une évolution et une diversification parallèles des deux partenaires. L’estimation de la date d’établissement de la symbiose révèle que cette dernière est très ancienne dans ces trois groupes et qu’elle est vraisemblablement antérieure à la diversification aboutissant aux insectes actuels. L’acquisition des symbiotes par les pucerons est estimée à environ 200 millions d’années (Munson et al., 1991 ; Moran et al., 1993). Les termites auraient acquis leur symbiote il y a 135 à 300 millions d’années (Bandi et al., 1995). La vitesse d’évolution accrue des génomes symbiotiques pourrait participer à la génération d’une grande variabilité individuelle qui sera le support potentiel d’une diversification et d’une adaptation. Chez les endocytobiotes du puceron, des transferts de gènes depuis le chromosome bactérien jusqu’à des plasmides ont été mis en évidence. Ainsi, Buchnera a intégré au sein de plasmides les voies de synthèse des acides aminés tryptophane et leucine (Lai et al., 1994 ; Bracho et al., 1995), contournant ainsi la régulation feed-back négative bactérienne. L’insecte dispose ainsi de ces deux acides aminés en quantité suffisante. De la même façon le génotype de l’insecte à évolué en présence des symbiotes qui lui sont devenus nécessaires. Ainsi, lorsque l’on transfère le génome d’une souche aposymbiotique de

41 S. oryzae dans celui d’une souche symbiotique, des problèmes de stérilités apparaissent (Nardon, 1988).

IV.5.5. Origine des symbiotes et symbiogenèse

L’univers des bactéries est d’une diversité sans égal sur la terre. Tous les milieux ont été colonisés par ces organismes et depuis fort longtemps, bien avant l’apparition des organismes pluricellulaires eucaryotes. On comprend dès lors que ces organismes omniprésents dans l’environnement aient des relations physiques privilégiées avec quasiment toutes les cellules eucaryotes. Ces relations physiques aboutissent inévitablement à des relations plus intimes qui peuvent être de nature pathogénique ou symbiotique. Ces interactions bactériennes différentes sont-elles le reflet d’une origine phylogénétique différente ou bien d’une capacité de transition de vie possible entre une vie parasitaire et une vie symbiotique ? Une étude phylogénétique de nombreuses bactéries pathogènes et symbiotiques (Moran et Wernegreen, 2000) a révélé que la plupart des clades formés étaient des clades soit symbiotiques, soit parasitiques. En d’autres termes, il semble exister une origine spécifique pour chaqu’un des types de bactéries. Il semble que la transition depuis un mode de vie parasitaire obligatoire vers un mode de vie symbiotique soit théoriquement difficile à concevoir. L’orientation et l’évolution génomique différente dans les deux situations est souvent irréversible. Comme nous l’avons déjà rapporté, la vie intracellulaire a pour conséquence la réduction de la taille des génomes. Or cette perte progressive de gènes n’affecte pas les mêmes gènes fonctionnels pour les bactéries parasites obligatoires et symbiotiques. Il semble cependant exister une convergence dans la perte de certains gènes impliqués dans des fonctions de réparation et de recombinaison de l’ADN (Andersson et Kurland, 1998 ; Moran et Wernegreen, 2000), ce qui a pour conséquence d’accélérer l’évolution de ces génomes et de rendre leur évolution irréversible au sens ou ces génomes ne sont plus capables d’intégrer des gènes étrangers, comme cela est communément le cas des bactéries libres. Dans un environnement cellulaire, les bactéries parasites ont tendance à perdre les gènes impliqués dans le métabolisme intermédiaire et la biosynthèse des acides aminés (Andersson et Kurland, 1998). Or la plupart des modèles symbiotiques étudiés sont des modèles de types métaboliques c’est à dire où l’hôte qui vit sur un milieu nutritionnellement déficient ou déséquilibré bénéficie de la part de la bactérie de l’apport des métabolites manquants. C’est le cas de Buchnera chez le puceron et de SOPE chez le charançon notamment. Dans ces situations, les gènes perdus par les bactéries parasites sont ici conservés par les bactéries symbiotiques. On voit bien dès lors, qu’une bactérie parasite obligatoire ne peut évoluer vers un mode de vie symbiotique tel qu’on le connaît actuellement ne possédant plus, ni les gènes nécessaires, ni la capacité de les obtenir par d’autres bactéries. Le concept de la "taille minimale" pour qu'un génome symbiotique soit viable (Maniloff, 1996) indique qu'un certain nombre de gènes doivent être présents pour assumer des fonctions minimales de base. Ce génome doit comporter les gènes de base impliqués dans les processus de croissance et de division cellulaire, ainsi que les gènes responsables de la réplication, de la transcription, de la traduction et du métabolisme énergétique. La taille d'environ 500 kb déterminée pour le génome symbiotique de Buchnera CTU (Gil et al., 2002) semble être relativement proche de cette taille minimale théorique. Néanmoins, de très nombreux modèles décrivent l’évolution de la symbiose à partir du parasitisme. Mais le parasitisme dont il est question ici, n’est pas un parasitisme obligatoire. Il s’agit plutôt d’une relation de type parasitique où l’un des partenaires possède un pouvoir infectieux (ou pathogène). L’exemple le plus frappant est celui de l’amibe Amoeba proteus que Jeon (1983) cultiva par mégarde avec une bactérie pathogène. Certains individus

42 survécurent à l’infection bactérienne et au bout de 200 générations, il est apparu pour ces amibes que les bactéries n’étaient plus pathogènes, mais qu’elles étaient devenues obligatoires pour leur multiplication. Il est tentant de voir dans ces processus de symbiose l’illustration de ce qui a pu se produire lors de l’acquisition des organites intracellulaires actuels : diminution d’une certaine virulence, transmission qui devient progressivement verticale, intégration plus intime du symbiote avec possibilité de transfert de gènes vers le noyau, indissociabilité des partenaires… Il est clair que le contact physique entre l’hôte et les bactéries symbiotiques potentielles doit être suffisamment intime (facilité par un pouvoir infectieux ou pathogène par exemple) pour aboutir à l’établissement d’une relation durable.

IV.6. Les Dryophthoridae : un modèle pour l'étude de la symbiose

IV.6.1. Les insectes et l'homme : une cohabitation parfois difficile

Le monde des insectes à toujours suscité l’intérêt et le dégoût à la fois. Qui ne s'est jamais surpris en train d'admirer l'organisation minutieuse d'une colonne de fourmis en plein travail et dans le même temps s'est vu profondément irrité par la ronde saccadée d'un pauvre moustique ? Les insectes représentent le groupe d'organismes le plus diversifié sur terre puisque l'on dénombre actuellement plus de 1,4 million d'espèces d'insectes qui représentent environ 80% de la biodiversité totale décrite (Erwin, 1997). Il est d'ailleurs intéressant de noter que le second groupe le plus diversifié est représenté par les microorganismes. Ce recensement est de toute évidence très sous-estimé. Erwin (1997) estime qu'il pourrait exister de 30 à 50 millions d'espèces d'insectes sur terre. Le nombre important d'organismes encore inconnus (10 à 100 millions d'espèces au total, (Thomas, 1997)) est vraisemblablement en majorité à compter parmi les insectes qui ont colonisé toute la terre et pratiquement tous les milieux de vie possible (à l’exception des océans où leurs cousins crustacées ont cependant bien réussi). Cette présence importante des insectes alliée à leur adaptation étonnante (en particulier leur reproduction très efficace et importante) fait de ce groupe d'organismes un facteur potentiel de nuisance pour l'homme. Vecteurs des maladies les plus terribles comme le paludisme, qui chaque année tue entre 700 000 et 2,7 milions de personnes (75 % des victimes sont des enfants africains, selon le National Institut of Health, USA), ils peuvent être aussi de sérieux concurrents pour les ressources alimentaires. La concentration des denrées en culture puis en stockage est une aubaine pour certains insectes qui se sont adaptés aux pratiques agraires et aux plantes cultivées par l'homme. Les pertes mondiales totales dues aux ravageurs, maladie et "mauvaises herbes" atteignent en moyenne 20 à 40 % du rendement des cultures avant récolte et 10 à 20 % de celui des denrées stokées (Riba et Silvy, 1989). L'impact estimé des insectes est bien sûr extrêmement variable dans le temps et dans l'espace mais pour avoir un simple point de repère on peut dire qu'on estime environ à 30% les pertes dues aux ravageurs dont la grande majorité sont des insectes. Parmi les cultures les plus touchées et les plus vitales pour la majorité de la population humaine, les céréales représentent un cas particulier qui met en jeu un petit nombre d'insectes dont les charançons sont parmi les principaux ravageurs.

IV.6.2. Les Dryophthoridae : classification, répartition et écologie

Les charançons ou superfamille des Curculionoidea représente le plus vaste groupe d'insectes parmi les coléoptères dont l'une des familles, les Dryophthoridae, est l'objet de cette étude. D'après la récente remise à jour de la classification (Alonso-Zarazaga et Lyal, 1999),

43 les Dryophthoridae comportent les espèces de l'ancienne famille des Rhynchophoridae auxquelles s'adjoignent d'autres genres proches comme le genre Dryophthorus considéré comme l'un des plus primitifs de la nouvelle famille, à laquelle il donne son nom. Les Dryophthoridae comptent plus de 140 genres et 500 espèces différentes. La grande majorité de ces insectes vivent dans les zones tropicales et subtropicales mais quelques espèces cosmopolites, d'une grande importance économique, sont trouvées sous les zones tempérées. Les Dryophthoridae se développent principalement aux dépens des monocotylédones (Aracacae, Bromeliadae, Zingiberales, Iiliales, Poales …) où l'adulte et la larve se nourissent de divers tissus, tantôt du stipe, des racines ou des tiges. De par la grande diversité des niches écologiques occupées, les Dryophthoridae sont également d'un intérêt écologique certain. Ainsi certaine espèces, Sipalinus gigas, Trigonotarsus rugosus, Dryophthorus sp. se développent dans le bois mort d'Angiosperme ou de Gymnosperme. Enfin, un petit groupe d'insectes appartenant au genre Sitophilus est capable de se développer dans les graines de divers monocotylédones et dicotylédones. C'est essentiellement au travers de ces trois espèces : Sitophilus oryzae, S. zeamais et S. granarius qui ravagent les graines de céréales entreposées partout dans le monde que les Dryophthoridae sont connus (Figure 4). Mais cette grande famille compte d'autres ravageurs importants, Cosmopolites sordidus, Metamasius sp., Rhynchophorus palmarum, qui attaquent respectivement les stipes de bananiers (Figure 4), les tiges de canne à sucre, les stipes des palmiers.

B

Figure 4 : Dryophthoridae ravageurs de cultures. (A) Grains de maïs attaqués par des Sitophilus, (B) Dessin d'une coupe d'un stipe de bananier attaqué par Cosmopolites sordidus.

Certaines espèces sont également vectrices de maladies. Rhynchophorus palmarum, Metamasius hemipterus et Dynamis borassi peuvent transmettre aux palmiers le nématode Bursaphelenchus cocophilus qui peut en quelques mois entrainer la fanaison puis la mort des palmiers (Giblin-Davis et al., 1996). On peut noter qu'inféodées à de nombreuses plantes cultivées et ornementales, les introductions accidentelles de nouvelles espèces de Dryophthoridae sont de plus en plus fréquentes (Frank et Thomas, 1994 ; Esteban-Duran et al., 1998, 1998b). La répartition actuelle des Dryophthoridae laisse présager que le foyer de diversification de la famille se situe en Afrique et dans la région Indo-Pacifique, l'Amérique tropicale serait un foyer secondaire (Zimmerman, 1993).

44 Quelques cas de symbiose intracellulaire sont déjà connus dans la famille chez quatre genres différents : Sitophilus oryzae (L.) (Pierantoni, 1927 ; Nardon et Grenier, 1988), Sitophilus granarius (L.) (Mansour, 1930), Sitophilus zeamais (Mot.) (Musgrave et Homan, 1962), Cosmopolites sordidus (Germar), Metamasius hemipterus (L.) (Nardon et al., 1985) et Rhynchophorus ferrugineus (Buchner, 1965).

IV.6.3. La symbiose chez les Sitophilus

Le genre Sitophilus a été particulièrement étudié au laboratoire, et notamment les trois espèces inféodées aux céréales : Sitophilus oryzae, Sitophilus granarius et Sitophilus zeamais en raison de leur extraordinaire potentiel de destruction des céréales entreposées. Sitophilus oryzae et Sitophilus zeamais sont rencontrés sous toutes les latitudes, l'espèce Sitophilus granarius est par contre plus septentrional.

IV.6.3.1. Symbiose et développement de l’insecte

Les trois espèces de Sitophilus céréalières présentent des cycles de développement similaires : les femelles pondent leurs oeufs à l'intérieur des grains de blé dans un trou perforé par le rostre. Ce trou est ensuite rebouché par une sécrétion mucilagineuse de l'oviducte qui durcit rapidement à l'air (Nardon, 1963). Le développement de la larve (quatre stades larvaires et un stade nymphal) jusqu'au stade adulte, se déroule à l'intérieur du grain en 31 jours environ à 27,5°C pour les souches symbiotiques. Le grain de céréale apporte à l'insecte à la fois sa nourriture et sa protection. Après la mue imaginale, l'adulte reste un à deux jours dans le grain avant l'émergence. Chez la larve, on trouve des endocytobiotes dans des cellules spécialisées (bactériocytes), elles-mêmes regroupées en un organe appelé bactériome (Pierantoni, 1927 ; Mansour, 1930 ; Musgrave, 1964 ; Nardon, 1971), (Figure 5). Cet organe en forme de collier bilobé est localisé à la jonction du stomodeum et du mésentéron, mais ne possède pas de connexion avec le tube digestif. Au cours des quatre stades larvaires, la taille du bactériome augmente. Nardon (1978) a estimé à environ 3.106 le nombre de bactéries par bactériome chez les larves de quatrième stade de Sitophilus oryzae. Pendant la nymphose, à partir du moment où la larve cesse de s'alimenter, le bactériome se désintègre et libère les bactériocytes dont une partie va dégénérer et l'autre va s'insinuer entre l'intestin imaginal en cours de formation et sa tunique musculaire (Nardon et Wicker, 1981). Ainsi, chez l'adulte, les endocytobiotes sont présents à l'apex des caeca mésentériques (Figure 5). Très abondants chez les jeunes imagos, ils disparaissent chez les individus plus agés (Mansour, 1930 ; Nardon et Wicker, 1981). A partir de la troisième semaine, les endocytobiotes ne sont présents que dans les cellules de la lignée germinale des femelles qui les transmettent ainsi à leur descendance. Ils sont localisés dans des bactériomes à l'apex des ovarioles (Figure 5), mais sont également présents dans les ovocytes et dans les trophocytes.

45 larve

Figure 5 : La symbiose chez les Dryophthoridae : localisation des tissus symbiotiques.

Dans les oeufs, ils gisent librement dans le cytoplasme et sont particulièrement nombreux au pôle postérieur en contact avec l'oosome (Nardon, 1971 ; Nardon et al., 1985 ; Nardon et Grenier, 1988). Les endocytobiotes n’ont jamais été identifiés dans les testicules des adultes. Ils sont éliminés de la lignée germinale mâle selon des modalités pour le moment encore inconnues (Nardon et Wicker, 1981). Il est important de souligner que la transmission des endocytobiotes se fait donc par un processus d'hérédité cytoplasmique, au même titre que celle des mitochondries, et ne requiert aucun mécanisme particulier de recontamination des descendants.

IV.6.3.2. Les endocytobiotes

C’est Pierantoni, en 1927, qui a le premier décrit le bactériome larvaire dans le genre Sitophilus. Chez Sitophilus oryzae, les travaux de Mansour (1930, 1934, 1935), Scheinert (1933), Musgrave et Homan (1962), Murray et Tiegs (1935), Musgrave et Miller (1953) et Nardon (1978) sont consacrés à l’étude de ces bactéries symbiotiques. Ce sont des bactéries bacilliformes plus ou moins flexueuses de 5 à 30 µm de longueur qui peuvent se présenter aussi sous forme de chaînettes. Les endocytobiotes n’ont pas de flagelle, mais ils présentent des mouvements de torsion plus ou moins rapides et très visibles au microscope à contraste de phase. Cette caractéristique permet d’estimer facilement la viabilité de ces microorganismes en milieu de culture. Le nombre d'endocytobiotes est hautement variable chez S. oryzae, il dépend de multiples facteurs biologiques comme l'alimentation (Delobel et Grenier, 1993), et les facteurs génétiques (Nardon et al., 1998). De plus, chez S. oryzae dans les mêmes conditions environementales et d'alimentation sur blé, on peut dénombrer pour une souche appelée GV 75 500 ± 5 900 endocytobiotes par ovaire alors que pour la souche W seul 24 600 ± 2 100 endocytobiotes sont dénombrés. Enfin, il faut noter que ces bactéries ont été observées sans la présence de vacuole, gisant librement dans le cytoplasme de l’hôte. Ce caractère, absence de membrane vacuolaire (M3), a été classiquement utilisé chez les Sitophilus pour argumenter l’ancienneté de la symbiose. Les bactéries auraient perdu leur membrane vacuolaire ce qui s’interprétait comme un signe d’une intime intégration à l’hôte.

46 L’enveloppe bactérienne est constituée d’une membrane plasmique tri-lamellée (M1) et d’une membrane externe également tri-lamellée (M2) et riche en lipopolysaccharides, ce qui confère à ces endocytobiotes une structure de bactérie Gram-négative (Nardon, 1971) (Figure 6).

Porine Lipoproteine de Braun Chaînes latérales O

Lipopolysaccharide

Membrane externe (M2)

Espace périplasmique et peptidoglycane

Membrane plasmique (M1) Phospholipide Peptidoglycane Protéine intrinsèque Figure 6 : Structure de l'enveloppe des bactéries Gram-négatives.

Chez Sitophilus zeamais, les symbiotes sont par contre nettement spiralés et il existe vraisemblablement deux populations d'endocytobiotes (Dash et al., 1984 ; Campbell et al., 1992). La culture des endocytobiotes de Sitophilus oryzae a été tentée par plusieurs auteurs (Musgrave et McDermott, 1961 ; Nardon, 1978), mais aucun résultat fiable n'a pu être obtenu à ce jour. La taxonomie de cette bactérie Gram-négative non ciliée et non sporulante a été clarifiée par les analyses phylogénétiques (ADNr 16S). Celles-ci les positionnent parmi les γ3-Protéobactéries. La difficulté de culture des endocytobiotes n'est pas propre au modèle Sitophilus, puisque jusqu'à présent aucune bactérie symbiotique intracellulaire n'a pu être cultivée de façon certaine en laboratoire exceptés Sodalis glossinidius les endocytobiotes secondaires des Glossines qui possède un cycle de vie non intégralement intracellulaire (Dale et al, 2001). Enfin, la plupart des souches de Sitophilus oryzae du laboratoire possèdent une autre bactérie intracellulaire apparentée au groupe des Wolbachia (Heddi et al., 1999). Ces bactéries sont localisées dans l'ensemble des tissus de l'insecte y compris dans les bactériomes larvaires et ovariens. L'intervention des Wolbachia dans le métabolisme de l'hôte est encore très mal connu même sur les autres modèles de symbiose à Wolbachia. Des résultats préliminaires montrent que leur élimination entraîne peu de modifications physiologiques sur l'insecte (poids et temps de développement). Par contre, il apparaît que ces bactéries peuvent modifier la fertilité des individus contaminés. Cette bactérie est en outre responsable chez un certain nombre d’arthropodes de modification importante de la reproduction suceptible d’agir directement sur la divergence et l’évolution des espèces (Stouthamer et al., 2001 ; Bordenstein et al., 2001) (cf § IV.5.2.1.).

47 Matériel et Méthodes

48 I. Charançons : élevage et collecte

I.1. élevage

Les charançons élevés au laboratoire appartiennent au genre Sitophilus (S. oryzae, S. zeamais, S. granarius, S. linearis et S. rugicollis). Ils sont tous exclusivement granivores et à l’exception de S. rugicollis qui à été récolté en Inde sur graine d’Eugenia jambolana (Myrtaceae ) et de S. lineraris aposymbiotique récolté en Afrique et qui se développe sur graine de Tamarin (Tamarindus indica). Les autres Sitophilus élevés sont céréaliers (grains et dérivés). Ils accomplissent leur 3 stades de développement (larvaire, nymphal et imaginal) au laboratoire dans les grains de blé. S. rugicollis a pu être acclimaté en quelques générations sur grains de maïs (ce point sera repris dans la partie discussion). Les charançons sont élevés sur leurs grains dans une étuve ventilée à la température de 27,5 °C et 75% d’humidité relative, selon la méthode décrite par Laviolette et Nardon (Laviolette et Nardon, 1963).

I.2. collecte

Un grand nombre d’espèces ont été collectées à travers le monde entier par nos soins ou bien par des entomologistes de terrain avec lesquels nous collaborons. Le tableau 2 liste l’ensemble des espèces étudiées avec leur provenance.

49 Tableau 2: Espèces de Dryophthoridae étudiées avec leur plante hôte et leur provenance. Espèces Plante hôte (tissu) Origine géographique Cosmopolites sordidus Musa (racine, tige) Guadeloupe (1) Diathetes morio Pandanus (fruit) Australie (2) frumenti Arecaceae (tige) Australie (2) Dynamis borassi Arecaceae (tige) Brésil (3) Metamasius callizona Bromeliaceae (tige) USA (4) Metamasius hemipterus Musacea, Arecaceae, (tige) Guadeloupe (1) Paramasius distortus Arecaceae (tige) Costa Rica Phacecorynes sommeri Zamiaceae (tige) Afrique du Sud (2) Phacecorynes variegatus Zamiaceae (tige) Afrique du Sud (2) Rhabdoscelus lineaticollis Arecaceae (tige) Taiwan (5) Rhodobaenus cf. nawradii Asteraceae (tige) Costa Rica (6) Rhodobaenus nigrofasciatus Asteraceae (tige) Costa Rica (6) Rhynchophorus ferrugineus Arecaceae (tige) Costa Rica (6) Rhynchophorus palmarum Arecaceae (tige) Guadeloupe (1) Scyphophorus acupunctatus Liliaceae (tige) Mexique (7) Scyphophorus yuccae Liliaceae (tige) USA (8) Sipalinus gigas Polymorphique (bois mort) Australie (2) Sitophilus granarius Poaceae (graine) France (1) Sitophilus linearis Tamarindus indica (graine) Sénégal (9) Sitophilus oryzae Poaceae (graine) France (1) Sitophilus rugicollis Myrtaceae (graine) Inde (1) Sitophilus vateriae Dipterocarpaceae (graine) Inde (10) Sitophilus zeamais Poaceae (graine) France (1) Sphenophorus abbreviata Cyperaceae (racine) France (1) Sphenophorus striatopunctata Cyperaceae (racine) France (11) Trigonotarsus rugosus Xanthorrhoeaceae (tronc) Australie (2) Yuccaborus frontalis Agavaceae (tige) Mexique (8) Quand l’espèce n’est pas inféodée à une seule espèce hôte, c’est le genre ou la famille des plantes hôtes qui est reporté. Collecte : (1) Laboratoire, (2) R. Oberprieler, (3) G. Couturier, (4) H. Frank, (5) , (6) J. Prena, (7) R. Jones & B. Rodriguez, (8) B. Farrell, (9) A. Delobel, (10) G. Matthew, (11) R. Allemand.

I.3. Préparation de bactéries symbiotiques à partir de bactériomes disséqués

Ce protocole a été utilisé sur les espèces suivantes : Sitophilus zeamais, S. oryzae, S. rugicollis, S. granarius, Cosmopolites sordidus et Metamasius hemipterus. Les larves de quatrième stade sont récoltées des graines ou des stipes et maintenues à une température de 4°C. Après décapitation des insectes, les bactériomes sont disséqués dans un tampon isoosmotique A (25 mM KCl, 10 mM MgCl2, 250 mM sucrose, 35 mM Tris-HCl, pH 7.5) sous la loupe binoculaire. Les bactériomes sont alors broyés au potter dans le tampon A. Le broyat est centrifugé (300 g, 5 min, 4°C) afin que les noyaux et les gros débris cellulaires sédimentent. Le surnageant contenant les endocytobiotes est récupéré puis centrifugé (7 000 g, 15 min, 4°C) afin d’obtenir le culot de bactéries symbiotiques.

II. Techniques histologiques

La présence de bactéries symbiotiques dans les bactériocytes peut être détectée par histologie classique de 3 façons différentes selon le type de matériel disponible (selon le stade des insectes, larves ou adultes, et selon leur état vivant ou non) :

50 - recherches histologiques des bactériocytes larvaires, sur coupes transversales de larves à la jonsction des intestins anterieur et moyen. - recherches histologiques des bactériocytes sur coupes d’adultes à l’apex des caeca mésentériques. - recherches sur du matériel vivant après dissection dans le tampon A et squashes, de bactériomes larvaires, de bactériomes à l’apex des caeca mésentériques chez les imagos mâles ou femelles, et enfin de bactériomes ovariens chez les individus femelles adultes. Les bactériocytes ainsi que la structure membranaire des endocytobiotes, ont été également étudiés par microscopie électronique sur quelques espèces.

II.1. Histologie (microscopie optique)

II.1.1. Fixation des échantillons

Lorsque l’on ne peut disposer directement d’insectes vivants au laboratoire, les spécimens collectés sont fixés vivants sur le terrain dans une solution alcoolique de Bouin dont la formule a été modifiée par Paul Nardon au laboratoire (20 ml d’acide picrique 1,5% dans une solution d’éthanol 80°, 5 ml d’une solution de formol neutre à 40% (addition de CaCO3 au formol commercial), 2 ml d’acide acétique glacial et H2O qsp 50 ml). Afin de faciliter la pénétration du fixateur, les grosses larves sont préalablement piquées en quelques endroits voire coupées en deux pour les très grosses. Les adultes sont immergés dans le fixateur sans leurs pattes, rostres et élytres, et pour les très gros spécimens leurs corps est coupé en deux entre le torax et l’abdomen.

II.1.2. Inclusion et coupe

Après la fixation, les larves (ou les adultes) sont lavées dans 2 bains successifs d’éthanol 70° avant d’être déhydratées dans l’éthanol 95° puis 100°(1 minute/bain). Les larves sont ensuite immergées dans 2 bains de butanol-1 durant plusieurs semaines. La cuticule et les tissus sont ainsi ramollis facilitant les coupes ultérieures. Les insectes sont emparaffinés à la sortie du dernier bain de butanol-1. Des sections de 5 µm sont réalisées sur les pièces de paraffine à l’aide d’un microtome et fixées sur des lames poly-L-lysines posées sur une plaque chauffante à 60 °C. Les coupes paraffinées peuvent être ainsi conservées durant plusieurs mois. Avant la coloration, les lames sont déparaffinées dans le xylène (2 bains de 5 à 20 minutes), les coupes sont ensuite déshydratées dans l’éthanol 70°, 95° puis 100° (1 minute/bain).

II.1.3. Coloration

Plusieurs colorations classiques en histologie et microbiologie ont été utilisées pour révéler la présence des bactéries symbiotiques : Gram (les bactéries sont de type Gram+ ou Gram-), bleu de toluidine (1% w/v, pH= 5.4) (présence ou non d’acides nucléiques) ainsi que Feulgen (présence ou non d’ADN).

II.1.4. Squaches

Les squashes sont réalisés sur des petits organes disséqués (ovaires ou bactériomes) dans le tampon A, ou sur de très petites larves entières. L’organe disséqué est déposé sur une lame

51 poly-L-lysine et à l’aide d’une seconde lame recouvrant la première, les tissus sont écrasés doucement. Les lames sont ensuite séchées quelques minutes sur une plaque chauffante à 60°C pour la fixation des tissus. Une coloration peut être ensuite réalisée après avoir plongé la lame dans le toluène afin d’éliminer les gouttelettes lipidiques.

II.2. Fluorescence In Situ Hybridation (F.I.S.H)

La FISH est une technique d’hybridation in situ ADN/ARN (sonde/cible). Cette technique permet de révéler sur des coupes histologiques ou sur des tissus en suspension la présence d’une séquence (ARN cible) spécifique d’un type bactérien avec laquelle la sonde s’est hybridée. Trois sondes spécifiques ont été définies après alignement des séquences d’ADNr 16S des endocytobiotes de Dryophthoridae obtenues. Ces sondes ont été sythétisées par la société Eurogentec et marquées en 5' à la rhodamine : - Sonde (S) : 5’-TAC-CCC-CCC-TCT-ACG-AGA-CTC-3’ spécifique des séquences symbiotiques apparentées au clade S. - Sonde (N) : 5’-ATC-TAA-TGG-CAT-AAG-GTT-3’ spécifique des séquences symbiotiques apparentées au clade R. - Sonde (D) : 5’-TAC-CTT-CCT-CTA-CAG-TAC-TC-3’ spécifique des séquences symbiotiques apparentées au clade D.

II.2.1. Procédure sur coupes histologiques

La première étape consiste à perméabiliser les membranes des tissus à l’aide d’une goutte d’acide acétique déposée sur les coupes déparaffinées. Après que celle-ci ait séchée, la lame est rincée à température ambiante 5 min dans une solution de PBS 1X. Après une étape de déshydratation les coupes subissent une seconde étape de déprotéinisation (10 min, 37°C), dans une solution de pepsine (100 µg/µl de pepsine dans HCl 0,01M). Les coupes sont à nouveau lavées (PBS 1X), et après une préhybridation de 30 min dans le tampon H (0,9 M NaCl, 20 mM Tris-HCl, 5 mM EDTA, 0,1% SDS, Denhardt 10X), les lames sont hybridées dans le même tampon complété de 50 ng de chaque sonde marquée. Les lames sont recouvertes d’une lamelle et incubées en chambre noire humide durant 3 heures à Tm-5. Les lames sont alors lavées 2 fois dans la solution H sous agitation à l’obscurité 15 min à Tm, avant d’être montées entre lame et lamelle dans le Vectashield contenant du DAPI (4'-6- diamidino-2-phenylindole). L’observation est réalisée sous un microscope à épifluorescence. Les sondes marquées à la rhodamine montrent une fluorecense rouge et toute les structures contenant de l’ADN montrent une fluoresence bleu grâce au DAPI.

II.2.2. Technique FISH sur bactéries en suspention

La FISH sur des bactéries en suspension reprend les mêmes principes que ceux suivis pour les coupes histologiques. Durant l’homogénéisation des bactériomes au potter, les endocytobiotes sont fixés dans une solution de PBS contenant 4% de paraformaldéhyde. La fixation se poursuit 30 min à 20 °C. Après l’élimination de la solution de fixation, les endocytobiotes sont lavés par centrifugation dans le PBS (7000 g, 5 min). La préhybridation dans le tampon H puis l’hybridation (tampon H + sondes) se déroulent dans un eppendorf à l’abri de la lumière durant 4 heures à (Tm-5)°C. Puis, les bactéries sont lavées 2 fois dans le tampon H à Tm par centrifugation. Le culot bactérien est repris dans leVectashield contenant du DAPI et monté entre lame et lamelle.

52 II.3. Microscopie électronique à transmission

II.3.1. Fixation des bactériomes

Les bactériomes sont disséqués dans le tampon A puis directement plongés 2h à 4°C dans la solution de fixation (Glutaraldéhyde 3% ; cacodylate de sodium 0,1M). Le surnageant est éliminé puis remplacé par la première solution de lavage (cacodylate de sodium 0,1M ; sucrose 0,2M), 3 fois 10 min à 4°C. La solution de lavage est ensuite remplacée par la solution de post-fixation (OsTO4 1% ; cacodylate de sodium 0,1M), 1h à 4°C, puis 3 lavages successifs de 10 min à 4°C dans une solution de cacodylate de sodium 0,1M sont réalisés. Les échantillons sont alors fixés. Ils peuvent être conservés plusieurs jours à 4°C dans la dernière solution de lavage.

II.3.2. Inclusion des bactériomes

A température ambiante les échantillons fixés sont déshydratés 15 min dans chaque bain d’éthanol 30%, 50%, 70%, 80%, 95% et 100 %, puis 3 fois 20 min dans l’oxyde de propylène. l’oxyde de propylène est progressivement substitué par la résine epon (1h dans 2/3 d’oxyde de propylène et 1/3 de résine epon ; 1h15min dans 1/2 d’oxyde de propylène et 1/2 de résine epon ; 1h15 min dans 1/3 d’oxyde de propylène et 2/3 de résine epon ; 1 nuit puis 3h dans la résine Epon pure). Par polymérisation de la résine à 56°C (72h) les bactériomes sont inclus dans l’epon. Les coupes fines réalisées avec un ultramicrotome sont déposées sur des grilles fines et contrastées 10 minutes à l’obscurité dans une solution d’acétate d’uranyle à saturation (7%) dans l’alcool méthylique absolu. Les coupes sont ensuite contrastées dans une solution de citrate de plomb à l’abri du CO2 atmosphérique. L’observation est effectuée sous un microscope électronique à transmission (Centre de microscopie électronique de l’UCBL).

III. Technique de biologie moléculaire

III.1. Préparation de l'ADN total

Lorsque l'on dispose d'insectes vivants, l’extraction d’ADN peut être réalisée sur des dissections de bactériomes larvaires ou des ovaires de femelles adultes. Lorsque les conditions d’une telle dissection ne sont pas réalisées (en particulier lorsque l’on ne possède que des mâles adultes), l’extraction d’ADN est réalisée sur les insectes entiers. Concernant les larves conservées dans le Bouin alcoolique, nous avons mis au point une technique d’extraction d’ADN à partir de bactériomes récoltés sous la loupe binoculaire sur des coupes histologiques. Cette méthode permet de sélectionner histologiquement l’ADN sur lequel le travail d’amplification va suivre.

III.1.1. Extraction d'ADN total à partir de l'insecte

Lorsque l’extraction de l’ADN est réalisée à partir d'insectes adultes, les parties coriaces sont enlevées, à savoir les élytres, les pattes et le rostre. Lorsqu’elle est réalisée sur de très grosses larves, seule la partie antérieure est extraite. Les tissus de l'insecte sont homogénéisés dans 500µl d'une solution STE (100mM NaCl, 1mM Na2 EDTA pH 8, 10mM Tris-HCl pH 8). La lyse cellulaire est assurée par un

53 traitement au SDS 0,5 % (p/v) et à la protéinase K (120 ng/µl) , durant 2h à 55°C. Les ARN sont ensuite dégradés par la RNAse A (10mg/ml) à 37°C pendant une heure. Les protéines sont précipitées par une extraction au phénol/chloroforme (500µl). Après une centrifugation de 2 minutes à 12000 g, la phase aqueuse supérieure est récupérée, l'ADN est précipité à - 20°C dans l'éthanol 100 % (1ml en présence de 44µl d'acétate de sodium 3M). Le culot d'ADN obtenu après une centrifugation 15 minutes à 12000 g est lavé par 1ml d'éthanol 70 % puis séché sous vide pendant quelques minutes (speed vac, Savant). L'ADN est solubilisé dans 50µl d'eau distillée stérile.

III.1.2. Extraction d’ADN à partir des coupes histologiques

Afin de prélever spécifiquement le bactériome, les lames déparaffinées sont réhydratées progressivement dans des bains d’alcool (100°, 100°, 95°, 70°) pendant 1 minute chacun. Enfin, après un passage dans l’eau distillée, les lames sont colorées au bleu de toluidine. Le bactériome et particulièrement l’enveloppe basophile qui le limite fixent de façon très importante le colorant et se détachent des autres structures. Le bactériome bien reconnaissable apparaît comme une structure très compacte à la périphérie du tube digestif. À l’aide d’une seringue et d’une aiguille stérile, la région du bactériome est prélevée puis déposée dans 50µl d’eau distillée stérile (cela facilite le décollage des coupes de l’aiguille). Les coupes ainsi prélevées sont sédimentées par centrifugation puis séchées sous vide (speed vac, Savant). L’ADN contenu dans le culot est extrait avec le kit Nucleon HT (Amersham LIFE SCIENCE). Brièvement, la lyse cellulaire est réalisée dans un tampon contenant du SDS additionné de protéinase K. La précipitation des protéines est effectuée au perchlorate de sodium, l’extraction d’ADN, au chloroforme. L’ADN est finalement précipité à l’éthanol 70% et resolubilisé dans l’eau.

III.2. Amplification par PCR de fragments du gène ribosomal 16S, clonage et séquençage

III.2.1. Amplification de fragments d’ADN par PCR.

La PCR (Polymerase Chain Reaction) consiste à amplifier sélectivement une séquence particulière d’ADN par action cyclique d’une ADN polymérase thermostable. L’amplification s’effectue sur un fragment d’ADN à partir de deux amorces oligonucléotidiques s’appariant spécifiquement aux extrémités des deux brins complémentaires qui délimitent la partie d’ADN à amplifier.

Le marqueur moléculaire choisi dans cette étude phylogénétique est le gène ribosomal 16S. Très représenté dans les banques de données, ce marqueur nous permettra d’affilier une séquence à un groupe d’organismes connus. Cette démarche par recherche de similitude entre séquences sera traitée au paragraphe IV. De plus, le gène ribosomal 16S à un taux d’évolution relativement faible compatible avec l’échelle de temps présumée qui intéresse notre étude. Pour ne négliger aucune séquence susceptible d’appartenir à un symbiote, dont on ne lui connaît a priori aucune origine phylogénétique, des amorces dites “ universelles” des eubactéries sont utilisées : - 008 For : 5’-AGA-GTT-TGA-TCM-TGG-CTC-AG-3’ - 1390 Rev : 5’-GAC-GGG-CGG-TGT-GTA-CAA-3’ Ces amorces générent un fragment de 1382 pb du gène ribosomal 16S des eubactéries.

54 Des amorces complémentaires ont été déterminées afin d’identifier directement par PCR la présence d’un type particulier d’endocytobiote (cf résultat) : - Dioc Rev : 5’-GAC-CCT-TTC-TCA-TTA-CCG-A-3’ - Meta For : 5’-TTA-AAT-TAA-GTA-GGG-GAT-T-3’ - Sito Rev : 5’-ACG-AGA-CTC-TAG-CCT-GCC-3’

Les Wolbachia sont susceptibles d’êtres présents dans les insectes étudiés et en particulier dans leurs bactériomes. Afin de lever toutes confusions possibles entre les symbiotes qui nous intéressent et les Wolbachia, une recherche préliminaire des Wolbachia chez les insectes étudiés sera réalisée par PCR à l’aide d’amorces spécifiques : - 16SW For : 5’-CGG-GGG-AAA-AAT- TTA-TTG-CT-3’ - 16SW Rev : 5’-AGC-TGT-AAT-ACA-GAA-AGT-AAA-3’ Cette paire d’amorce génère un fragment de 589 pb spécifique du gène ribosomal 16S des Wolbachia.

Dans le cadre de ce travail, le thermocycleur Gene Amp 2400 (Perkin Elmer) a été utilisé pour les réactions PCR (Figure 7) dans un volume réactionnel de 50µl sur des quantités de matrices variables selon la quantité et la qualité de l’ADN extrait.

A 35 cycles Conditions PCR

94 °C ADN matrice: 100, 10 ou 1 ng 5’ 30’’ amorces For: 15 pmol amorces Rev: 15 pmol 72 °C tampon 10X: 5 µl 45’’ 7’ Taq polymerase: 1,25 U 53 °C dNTP: 2,5 mM 45’’ H2O qsp 50 µl

B 4 cycles 31 cycles

94 °C 94 °C 5’ 30’’ 30’’ 72 °C 72 °C 45’’ 45’’ 7’ 51* °C 53 °C 45’’ 45’’

Figure 7 : Cycles de réaction PCR. A : avec les amorces Wolbachia spécifiques 16SW For et 16SW Rev. B : avec les amorces universelles eubacteriennes 008 For et 1390 Rev. *: incrémentation de + 0,5 °C par cycle.

III.2.2. Electrophorèse sur gel d’agarose

Pour s’assurer de la qualité et de la spécificité de l’amplification, une électrophorèse des produits de PCR est effectuée sur un gel d’agarose-TEA (Tris-HCl 1,6 mM ; acétate de sodium 1,6 mM ; EDTA 0,04 mM (pH 8) ; agarose 1 % (p/v), bromure d’éthydium (BET, 0,5µg/ml). Les produits PCR additionnés de 1/10 d’une solution de dépôt (bleu de

55 bromophénol 0,25% (p/v) ; xylène cyanol-0,25% (p/v) ; EDTA 25mM ; glycérol 50% (v/v)) sont chargés sur le gel. La migration se fait dans un tampon TAE, sous une tension constante de 80V. L’électrophorèse est suivie grâce aux colorants contenus dans la solution de dépôt. L’étalonnage du gel est effectué grâce au dépôt dans un puit d’un marqueur de poids moléculaire (ladder) allant de 500pb à 12kb (Gibco BRL). Le gel est ensuite photographié sur une table UV. L’intensité des bandes fluorescentes permet d’estimer la quantité d’ADN contenue dans cette bande en référence aux bandes de l'échelle de poids moléculaire.

III.2.3. Purification des fragments d’ADN amplifiés

La purification des produits PCR est effectuée à l’aide du kit QIAquick Gel Extraction (Qiagen). La totalité d’une réaction PCR préalablement contrôlée est déposée sur gel d’agarose puis une électrophorèse est réalisée selon le protocole décrit plus haut. La bande de gel contenant l’ADN d’intérêt est découpée sous UV. L’agarose dissous contenant les fragments d’ADN est déposé sur une colonne fixant l’ADN. Après centrifugation l’agarose traverse la colonne, puis, après 2 rinçage à l’éthanol 70 %, l’ADN est élué dans 50µl d’eau distillée stérile.

III.2.4. Clonage des produits PCR purifiés

Le clonage des produits PCR se fait en deux étapes. Une ligation des fragments d’ADN à un vecteur plasmide (pMOSBlue) puis une transformation de bactéries compétentes avec ce vecteur.

III.2.4.1. Ligation des fragments d’ADN dans le plasmide pMosBlue

La ligation s’effectue avec le kit pMOSBlue blunt (Amersham). Dans un premier temps, les fragments PCR purifiés sont mis en présence d’une ADN kinase afin de préparer des « bouts francs ». Ensuite la ligation est réalisée grâce à la ligase du phage T4. Dans le milieu réactionnel sont ajoutés 0,1 volume de tampon ligase 10X, 4 unités weiss de la T4 DNA ligase, l’ADN vecteur linéarisé et l’ADN insert dans les proportions adéquates (afin d’avoir un rapport de 2,5 molarité de vecteur pour 1 molarité de fragments PCR). La réaction incube une nuit à 11°C.

III.2.4.2. Microdialyse des plasmides

La solution de ligation subit une microdialyse afin d’éliminer toute trace de sels qui pourrait diminuer la résistance électrique du milieu et limiter l'efficacité de l’électroporation qui suit. La solution contenant les plasmides est déposée sur une membrane de dialyse (Milipore, diamètre des pores = 0,05µm) flottant à la surface de l’eau distillée dans une boîte de pétri. Vingt minutes plus tard, les sels ayant diffusé dans l’eau, la solution plamidique est récupérée. La membrane est rincée avec 10µl d’eau PCR qui sont rajoutés à la solution de plasmides.

III.2.4.3. Préparation des cellules compétentes

La cellule bactérienne utilisée est Escherichia coli. Un clone de la souche NM 522 est mis en culture une nuit sous agitation à 37°C dans 2,5 ml de milieu de culture de Luria

56 Bertoni (LB) (NaCl 10g/l, bactotryptone 10g/l, extrait de levure 5g/l, pH= 7). 50ml de LB sont ensemencésau 1/100 à partir de cette culture puis incubés sous agitation à 37°C jusqu’à l’obtention d’une DO (600 nm) comprise entre 0,5 et 1 (6 à 8 heures d’incubation). Cette culture est alors refroidie pendant 15 minutes à 4°C. Une série de 4 centrifugations (6000g, 15 min, 4°C) permet un lavage des cellules dans 40ml de glycérol 10% (v/v). Après ce dernier lavage, les cellules sont reprises dans 400µl de glycérol 10% (v/v). Celles-ci sont alors utilisées immédiatement ou aliquotées par 50µl et conservées à –80°C.

III.2.4.4. Transformation des cellules par électroporation

L’électroporation est une technique de transformation qui permet l’introduction d’ADN, en l’occurrence le vecteur pMOSBlue et son insert, dans une cellule bactérienne hôte soumise à un choc électrique. Les plasmides pénètrent dans les cellules après à un choc électrique très bref mais à très haute tension (appareil Biorad, résistance de 400 Ohms, capacité de 25µFd, différence de potentiel de 12 500 volts/cm). L’électroporation s’effectue en soumettant à une décharge électrique 50µl de cellules compétentes (4.108 bactéries) en présence de 1 ou 2 µl de solution de ligation (50 à 100 ng de plasmides). Après l’impulsion électrique, 950µl de milieu LB sont ajoutés et le tout est incubé une heure à 37°C afin de permettre l’expression des gènes de résistance aux antibiotiques portés par le plasmide. Les cultures sont étalées sur milieu sélectif sur lequel, seules les bactéries transformées (possédant un plasmide) se développent (LB gélosé + ampicilline 50µg/ml + Xgalactose (Xgal) 12µM + IsoPropylThio- β-galactoside (IPTG) 200mM). Après une nuit à 37°C les boîtes sont mises à 4°C pendant quelques heures afin de différentier les clones transformés recombinants (clones blancs). Le vecteur pMOSBlue utilisé dans ce travail possède un fragment du gène lacZ codant la portion de l’enzyme β-galactosidase, enzyme qui dégrade le chromogène Xgal en un produit bleu. Au sein de ce gène se trouve la région de clonage (polylinker) qui n’altère pas l’expression du gène quand le plasmide est vide. Par contre, lorsqu’un insert est présent, la protéine n'est plus fonctionnelle, la cellule est donc lac-. La caractérisation des cellules lac- et lac+ (sans insert) est possible grâce à la présence dans le milieu de culture, d’IPTG, un inducteur de la β- galactosidase et du chromogène Xgal. Seules les colonies lac- susceptibles de contenir un insert dans le plasmide forment des colonies blanches.

III.2.5. Préparation de l’ADN plasmidique (minipréparation) et analyse des clones

L’extraction de l’ADN plasmidique se fait par lyse alcaline. Brièvement, cette technique est basée sur une dénaturation différentielle entre l’ADN plasmidique et l’ADN chromosomique. Le culot de bactéries est suspendu dans un tampon isoosmotique (glucose 0,1M, Tris-HCl 0,025M, pH 8). Puis l’ajout au lysat cellulaire d’une solution de soude et de SDS (NaOH 0,2N, SDS 1 %) entraîne la dénaturation de l’ADN chromosomique. Enfin, à pH acide dans une solution saline (acétate de sodium 3M, pH 5), l’ADN chromosomique se réassocie sous forme insoluble et précipite avec le complexe SDS-protéine alors que l’ADN plasmidique, superenroulé au départ, reprend sa forme soluble native. L’ADN génomique est éliminé par centrifugation. Une extraction des protéines au phénol/chloroforme est pratiquée pour permettre une meilleure purification. L’ADN plasmidique est précipité puis lavé à l’alcool. L’ADN obtenu est analysé par électrophorèse en gel d’agarose, après digestion par des endonucléases appropriées.

57 III.2.6. Séquençage

Le séquençage peut être réalisé directement sur les produits issus de la PCR lorsque l’ADN matrice utilisé lors de la PCR provient d’un organe disséqué (bactériome, ovaire) ou de coupes histologiques (bactériome) susceptibles de ne contenir que des bactéries intracellulaires. Ces séquençages directs peuvent également être réalisés à partir de produits PCR dont la matrice est issue de bactériomes prélevés sur coupes histologiques. Cependant, nous avons souvent recourt au clonage des produits PCR et au séquençage à partir de l’ADN plasmidique purifié afin de garantir l'unicité des produits séquencés. La technique de séquençage utilisée est adaptée de celle décrite par Sanger et al. (Sanger et al., 1977). La réaction de séquençage est effectuée par l’entreprise Génome Express (Grenoble) selon le protocole Applied Biosystems sur séquençeur automatique. Quatre réactions de PCR sont menées parallèlement en présence d’une des quatre bases marquées par un fluorochrome spécifique sous forme de di-désoxyribonucléoside triphosphate en très faible concentration et d’un seul primer qui va déterminer le sens du séquençage. Lorsque le séquençage est réalisé à partir des produits PCR, la réaction se fait avec l’une des amorces utilisées lors de la réaction initiale de PCR, lorsqu’il est réalisé à partir de plasmides transformés la réaction se fait avec l’une des amorces universelles qui bordent le site de clonage du plasmide pMOSBlue (T7 ou U19).

III.3. Southern Blot

Après coupure par des enzymes de restriction et migration des fragments sur gel d'agarose, le transfert d'ADN se fait sur une membrane de nylon Hybond N+ (Amersham). Le gel est placé 30 minutes dans un bain d'HCl 0,25 N, puis dénaturé 30 minutes dans un bain [NaOH 0,4 N ; NaCl 1 M]. Il est enfin rééquilibré 30 minutes dans un dernier bain [Tris-HCl 0,5 M (pH = 7,5) ; NaCl 1,5 M]. Le transfert est réalisé pendant une nuit dans un tampon SSC 20X [NaCl 3 M ; citrate de sodium 0,3 M] selon le montage décrit ci-dessous. Les membranes sont finalement chauffées deux heures à 80°C pour fixer l'ADN.

Poids de 500 g

Papier essui main Papier Whatman 3MM (10 feuilles) Membrane de nylon Gel d’agarose (contenant de l’ADN) Papier Whatman 3MM (1 feuille) SSC 20X

Figure 8 : Transfert de l'ADN sur membrane de nylon par capillarité en milieu salin.

III.3.1. Préparation des sondes radioactives

Le fragment d'ADN sonde à marquer est obtenu après PCR avec les amorces 16S universelles (008F et 1390R). Le marquage se fait par amorçage aléatoire (random priming),

58 avec le kit Prime-a-Gene Labeling system (Promega). La sonde (25 ng d'ADN) est dénaturée 10 minutes à 95°C, puis refroidie brusquement dans la glace. Un mélange d'hexanucléotides à séquence aléatoire s'hybrident en différentes régions de l'ADN sonde. Ces hexanucléotides sont allongés par une DNA polymérase I, en présence des quatre nucléotides dont l’un est radioactif (dCTP α32P). Les nucléotides non incorporés sont éliminés grâce à une résine Sephadex G-50 capable de fixer l'ADN.

III.3.2. Hybridation

Avant l'hybridation proprement dite, la membrane est saturée avec un ADN non spécifique ne donnant pas d'hybridation avec la sonde : c'est la préhybridation. La membrane est préhybridée à 42°C pendant 12 heures dans un tampon P [NaCl 0,75 M ; Citrate de sodium 75 mM ; Ficoll 1 % (p/v) ; BSA 1 % (p/v) ; polyvinylpyrolidone 1 % (p/v) ; formamide 50 % (v/v) ; SDS 0,2 % (p/v) ; ADN de sperme de saumon dénaturé (95°C, 15 minutes) 0,4 mg/ml ; ADN de sperme de hareng dénaturé (95°C, 15 minutes) 0,4 mg/ml]. L'hybridation (12 heures, 42°C) se fait dans un tampon P additionné de la sonde, préalablement chauffée à 95°C (3 min) puis refroidie dans la glace. Les membranes sont ensuite lavées avec des solutions de forces ioniques différentes (2X SSC à 0,5X SSC) en fonction des degrés d'homologie de la sonde avec le fragment à marquer. Le rapport bruit de fond sur signal est contrôlé au compteur Geiger et permet de décider de l'arrêt ou de la poursuite du lavage. Pour une sonde ayant 100 % de similitude trois lavages successifs (10 min) à 55°C dans du SSC 1X, 1X et 0,5X sont généralement réalisés. Après avoir été emballée dans un film plastique, la membrane est placée contre un écran dans une cassette pour autoradiographie pendant deux heures à une semaine à - 80°C (en fonction de l'intensité du signal).

III.4. Electrophorèse en champs pulsés (PFGE)

Cette technique d'électrophorèse en gel d'agarose permet de séparer de longs fragments d'ADN génomique. Le principe consiste à faire migrer l'ADN suivant deux champs électriques alternatifs et ayant des directions formant un angle de 120°C (Electrophorèse en champs croisés). Selon ce procédé, pour avancer dans le gel, les molécules devront tout d'abord pivoter dans le sens du champ. Ces réorientations étant d'autant plus lentes que les fragments sont grands, il est ainsi possible de séparer des fragments de 50 kb à plusieurs mégabases.

III.4.1. Préparation des échantillons

Les endocytobiotes sont préparés selon la procédure décrite précédemment. Ils sont ensuite repris dans un tampon A à la concentration de 109 cellules par ml. La concentration en endocytobiotes est estimée par comptage en cellule de Thoma. Des petits blocs d'agarose ultra purs (InsertTM, FMC) sont préparés selon le protocole décrit par Smith et al. (1988) en mélangeant 500 µl de la solution d'endocytobiotes à 500 µl d'agarose fondu (1 % p/v). Après solidification les blocs sont immergés dans la solution de lyse EC (Tris-Hcl, pH 7,6 ; 6 mM ; EDTA 100 mM ; NaCl 1M ; Brij-58 0,5% ; Déoxycholate 0,2% ; N-lauroylsarcosine 0,5% ; lysozyme 1 mg/ml ; Rnase 20 µg/ml) et incubés sous agitation douce 1 nuit à 37°C. Les blocs subissent ensuite une digestion protéique dans la solution ESP contenant de la Protéinase K (EDTA 0,5 M, pH 8 ; N-lauroylsarcosine 1% ; Protéinase K 1 mg/ml), une nuit renouvelée

59 12h à 50°C. Les blocs peuvent être conservés plusieurs mois à 4°C dans cette dernière solution ESP. Les plugs sont rincés à 37°C dans une solution de TE (Tris-HCl 10 mM, pH = 7,5; EDTA 1 mM) contenant 1 mM de phénylméthylsulfonyl fluoride (PMSF) 2h, renouvelé la nuit. Les blocs sont finalement lavés 3 fois 30 minutes dans au moins dix volumes de TE.

III.4.2. Digestion enzymatique

Des portions de blocs d'environ 50 µl sont découpées à l’aide de lamelles de verre et incubées en présence de 100 µg/ml d'albumine bovine (BSA), 15 µl de tampon de digestion et 80 µl d'eau stérile. Vingt unités enzymatiques par blocs ont été utilisées pour les enzymes Xba I et Spe I (incubation 5 heures à 37°C) et Swa I (incubation 5 heures à température ambiante). Deux unités enzymatiques par blocs sont nécessaires pour la digestion avec l'endonucléase I- Ceu I (incubation trois heures à 37°C).

III.4.3. Electrophorèse et coloration des gels

Les fragments d'ADN sont séparés dans un gel d'agarose à 1 % avec comme tampon d'électrophorèse un tampon TBE modifié (Tris-HCl 0,1 M ; acide borique 0,1 M ; EDTA 0,2 mM). L'électrophorèse (appareil Pulsaphor, Pharmacia) est conduite à 10 V/cm d'agarose pendant 12 heures à 3 jours avec une période d'alternance de champ ("pulse") variant de 5 secondes à quelques minutes en fonction de la taille des fragments à analyser. Un marqueur de taille constitué par des concatémaires de phage λ (de taille multiple de 48,5 kb) est déposé à côté des échantillons. Après électrophorèse, l'ADN est révélé par coloration du gel 15 minutes dans une solution de bromure d'éthidium (BET) à 0,5 mg/ml puis rincé 20 minutes dans de l'eau. La solution de BET est ensuite filtrée sur du charbon actif, pour piéger et éliminer le BET.

III.5. Macroarrays

Ce travail a été réalisé en collaboration avec le laboratoire Epidemiology and Public Health, Section of Vector Biology, Yale University of Medecine, New Haven, Connecticut 06510. Nous avons effectué le travail de purification et de préparation de l’ADN bactérien des endocytobiotes de S. oryzae ainsi qu’une partie de l’analyse des résultats. Le travail technique d’hybridation ainsi que les analyses statistiques ont été réalisées par l’équipe conjointe (Rio et al., 2003).

III.5.1. Préparation de l’ADN de SOPE

L’ADN est obtenu selon la méthode décrite au paragraphe III.1.1.

III.5.2. Hybridation de L’ADN de SOPE à la puce d’E. coli

Pour l’étude comparative des génomes de SOPE avec celui de Sodalis glossinidius, 4290 ORFs (open reading frames) obtenue par PCR et identifiés dans le génome sequencé d’E. coli (Blattner et al., 1997) sont spottées sur une membrane de nylon (Panorama macroarrays, Genosys Biotechnologies Inc.). Chaque ORF est spottée en double sur trois panels différents

60 pour le contrôle. L’ADN symbiotique est marqué à la radioactivité avec ATP [α-33P] (ICN, La Jolla, CA) à l’aide du kit Gibco PolI/DNase I nick translation. La puce est hybridée dans le tampon d’hybridation (formamide 45%, Denhardt 5x, SSC 5x, SDS 0.5%) à 42°C comme cela est décrit par Akman et al (2001). Les puces sont lavées à 42°C pendant 30 minutes dans les tampons sucessifs : SSC 2X; SDS 0.1%; SSC 0.1X; SDS 0.1% et SSC 0.1X, SDS 0.5%. Les puces sont ensuites exposées à un film à très haute résolution (BMR; Eastman Kodak Company) et les signaux sont notés sur la base de l’intensité d’hybridation qui peut être forte, moyenne ou faible selon Akman et al. (2001). Une hybridation avec l’ADN de Wolbachia à été pratiquée sous les mêmes conditions pour évaluer la contribution de l’ADN de Wolbachia dans l’hybridation avec l’ADN de SOPE.

III.5.3. Puces et analyses statistiques

Les ORFs sont identifiées selon le plan de dépot de la puce et recensées dans un tableau (Microsoft Excel). Des Macros basées sur 2 séries indépendantes de recherche sont créées afin d’identifier les gènes uniques entre Sodalis glossinidius et SOPE (gènes présents chez E. coli et chez un symbiote et absents de l’autre symbiote). Les gènes sont classés selon différentes catégories : les gènes dits "fonctionels" sont répartis d’après le logiciel « Genosys » (catégories de gènes fonctionelles impliqués dans : le métabolisme des acides aminés, le métabolisme central intermédiaire, la biosythèse des cofacteurs, le métabolisme energétique, le catabolisme carboné, le métabolisme des acides gras, la régulation, les processus cellulaires, le transport, la réplication, la traduction, la transcription, les structures cellulaires, les acides nucléiques, les membranes) et les arrangements de gènes métaboliques sont déduits de la base Kegg (Kyoto Encyclopedia of Genes) et le site web Genomes (www.genome.ad.jp/kegg/). Le test de Fisher est utilisé grâce au système SAS pour windows (Littell et al., 1996), pour comparer les fréquences des gènes fonctionnels conservés dans les deux types d’endocytobiotes. Les différences sont relevées au seuil de 5 %.

IV. Technique d’analyse de séquences et phylogenie

IV.1. Analyse des séquences

A quel type bactérien faut-il affilier les séquences obtenues après PCR puis séquençage ? Peut-on les considérer comme appartenant aux bactéries symbiotiques que l’on cherche à caractériser ? Pour résoudre en partie ces problèmes, une recherche par similitude (BLAST) dans les banques de séquences est réalisée avant de recourir à l’analyse phylogénétique proprement dite. Cette première étape permet d’exclure a priori les séquences issues de bactéries extracellulaires (bactéries de la flore digestive par exemple). Cette recherche est effectuée à l’aide du programme BLASTn (Altschul et al., 1990) disponible sur le serveur pbil de l’Université Claude Bernard de Lyon.

IV.2. Alignement et phylogénie

Les alignements de séquences sont réalisés grâce au logiciel CLUSTAL W (Thompson et al., 1994) et sont systématiquement corrigés manuellement avec le logiciel seaview (Galtier et al., 1996). Les zones où les alignements se sont révélés ambigus ont été éliminées des

61 données. Les arbres phylogénétiques ont été établie à l’aide du logiciel phylo_win (Galtier et al., 1996) et NHLM (Galtier et Gouy, 1998). L’ensemble de ces logiciels fonctionnent sous plate-forme Unix.

IV.2.1. Le logiciel NHML

NHML est un logiciel de reconstruction basé sur un modèle d'évolution de l'ADN non homogène (Galtier et Gouy, 1998), prenant en compte la variabilité des taux de substitutions entre les sites et des taux de GC entre les séquences. Les arbres obtenus sont estimés par la méthode du maximum de vraisemblance. Le logiciel NHML utilisé lors des analyses phylogénétiques comporte deux programmes que nous avons utilisés : eval_nh Calcule le logarithme de la vraisemblance d'une topologie d'arbre associé à un alignement donné. Trois fichiers sont requis à l’entrée : un fichier comportant le ou les alignements, un fichier comportant la ou les topologies racinées à estimer ainsi qu’un fichier d’options. Le fichier d’options indique quels sont les paramètres qui doivent être évalués et optimisés (longueur de branches, taux de GC à l’équilibre, taux de GC ancestral, taux de transition/transversion, forme de la loi gamma) et les valeurs initiales à attribuer à ceux-ci. Les valeurs initiales des paramètres à optimiser sont redéfinies à la suite d’une première execution de la procédure eval_nh (les valeurs des paramètres estimés, données en sortie, sont rentrées en tant que valeur initiales). En sortie, 2 fichiers incluant l’arbre optimisé sont créés. Un premier fichier comprend l’arbre optimisé (longueurs de branches estimées) avec des valeurs de « pseudo-bootstrap » qui représentent l’estimation des taux de GC à l’équilibre pour chaque nœud ainsi que pour les feuilles. Le second fichier comprend l’arbre optimisé avec des valeurs de « pseudo- bootstrap » (excepté pour la racine) représentant les taux de GC aux nœuds ainsi qu’aux feuilles, estimés sous le modèle. Plus les différences entre les taux de GC estimés aux feuilles sous le modèle et les taux de GC réels des séquences sont faibles, plus le modèle s’ajuste aux données. Une option permet d’avoir accès d’une part au logarithme de la vraisemblance de l’arbre évalué et d’autre part aux paramètres estimés qui lui sont associés. shake_nh Calcule à partir d’un arbre initial et d’un alignement (fichiers d’entrées) la topologie de l’arbre la plus vraisemblable selon l’algorithme du « pruning/regrafting » (Felsenstein, 1993). Les trois fichiers d’entrées sont identiques à ceux utilisés par la procédure eval si ce n’est que des paramètres supplémentaires dans le fichier d’options, utilisés par l’algorithme de construction de l’arbre, en particulier pour limiter les réarrangements, sont pris en compte. Ces paramètres sont le nombre de branches internes qui peuvent être réarrangées, la longueur maximale des branches qui peuvent être réarrangées ainsi que la valeur maximale des bootstrap dont les branches peuvent êtres réarrangées. La procédure shake construit un premier arbre grâce à une heuristique proche du Neighbour Joining, puis sa vraisemblance est calculée. Chaque branche est alors déplacée successivement et la vraisemblance est recalculée. Lorsqu’un arbre de vraisemblance plus importante est obtenu, il est conservé et la procédure est reprise. Cette méthode de « pruning/regrafting » est extrêmement coûteuse en temps de calcul, même lorsque des paramètres destinés à limiter les réarrangements des branches sont introduits. Ce modèle contraint donc à n’introduire dans l’analyse phylogénétique qu’un nombre très limité de séquences. Pour notre jeu de séquence qui comporte 34 séquences et 1079 sites complets, le

62 temps de calcul est supérieur à 30 jours ! Ce modèle étant a fortiori trop coûteux en temps de calcul pour permettre un calcul de bootstraps, nous proposons dans ce travail, une démarche d'exploration des topologies vraisemblables utilisant la procédure eval.

IV.3. Tester statistiquement les topologies

Nous décidons qu'une topologie est "meilleure" qu'une autre si le logarithme de la vraisemblance associée à cette topologie est plus élévé que celui associé à l’autre topologie et ceci quelque soit la différence observée. Cependant il n'existe pas de bons moyens statistiques pour tester la différence entre ces topologies. De nombreux tests existent et sont, soient inapplicables pour des raisons de temps de calculs soient, incompatibles car développés sur la base d’autres modèles d’évolution. Pour tester plusieurs topologies entre elles, il faut disposer pour chaqu'une, d'une estimation de la variabilité de la vraisemblance. La technique la plus classique consiste à réechantillonner avec remise l’échantillon des sites analysés. Il est de toute évidence impossible d’envisager cette technique pour évaluer la robustesse de chacun des nœuds de la topologie. Néanmoins, nous utiliserons cette technique pour comparer un nombre limité de topologies correspondant à deux hypothèses évolutives que nous souhaitons tester.

A partir d'un alignement donné (qui comporte x sites), le logiciel Seqboot dans le package PHYLIP (Felsenstein, 1993) génère par bootstrapp y alignements (comportant x sites tirés au hasard avec remise parmi les x sites de l'alignement initial). Disposant ainsi de y (500) alignements bootstrappés, il est possible d'estimer à l'aide de la procédure eval_nh, pour chaque topologie que l'on souhaite tester, les vraisemblances associées à chaque alignement. Pour chaque topologie on obtient donc y logarithmes de vraisemblance. Un test T pour échantillons appariés est réalisé sur ces valeurs et permet de se prononcer statistiquement sur les différences de vraisemblance observées.

IV.3.1. Puissance du test

Un test statistique comporte deux risques d’erreur. Si l’on rejette l’hypothèse Ho alors qu’elle doit être acceptée, on commet une erreur de type α (appelée également erreur de première espèce). A l’inverse, si l’on accepte l’hypothèse Ho alors qu’elle doit être rejetée (H1 vraie), on commet une erreur de type β (appelée également erreur de seconde espèce). Le terme 1-β determine la puissance du test. Plus l'erreur β est petite, plus le test sera puissant et apte à identifier des petites différences dans l’échantillonage des vraissemblances. Dans ce cas simple de comparaison de vraisemblances, l'erreur β peut être calculée à partir des données obtenues (Figure 9) et pour différentes valeurs d'écart de vraisemblance entre les moyennes (hypothèse H1) sachant que l'écart observée est de 55 unités (cf Résultats § III.2.4.4.2.).

63 0,5

0,45

0,4

0,35

0,3 n = 500 0,25 n = 100 0,2

0,15

0,1

0,05

0 0 102030405060 Delta de vraisemblance (H1)

Figure 9 : Estimation de l'erreur β en fonction de la différence vraie (hypothèse H1) entre les deux topologies comparées sachant l'écart observé. n est le nombre d'alignements différents générés par bootstrap.

Même pour des différences vraies très importantes (50 unités de vraisemblance), la probabilité d'obtenir par hasard la différence observée n'est pas significative (p-value= 2.10-3), la puissance du test reste grande pour un nombre de réplicat de 500 alignements.

IV.4. Test des taux de substitutions relatifs

Les taux de substitutions relatifs n’ont pas été calculés et comparés, entre les clades symbiotiques et différentes bactéries libres représentatives sur la base du modèle de Galtier et Gouy (1998) pour des raisons techniques (test non implanté dans le logiciel NHML disponible sur le web). Nous avons utilisé le logiciel RRTree développé par Robionson- Rechavik et Huchon (2000), qui utilise les distances de Kimura à 2 paramètres et les estimations de covariance d’après Li et Bousquet (1992), pour réaliser les tests. La séquence d’ADNr 16S de la bactérie Aeromonas haywardensis (AF015258) a été utilisée comme outgroup (0). L’hypothèse nulle Ho est vérifiée lorsque le taux de substitution (K1-0) du clade de séquences testé (1) est identique au taux de substitution (K2-0) du clade de référence (2), (K1-0 – K2-0 = 0).

64 Résultats

65 I. Caractérisation des bactériomes et des bactériocytes chez les insectes hôtes.

I.1. Espèces non symbiotiques

Chez Sitophilus linearis aucune structure bactériocytaire ni aucun bactériome n’a pu être détecté sur les squashes d’ovaires et du tube digestif. De même, l’observation minutieuse de coupes transversales de larves de 4ème stade n’a jamais révelé la présence de bactériome à la jonction de l’intestin antérieur et moyen. Nous pouvons donc conclure à l’absence de bactéries symbiotiques intégrées comme les endocytobiotes primaires présents chez Sitophilus oryzae (SOPE) (Heddi et al., 1999). Des observations similaires avaient déjà antérieurement conduit à considérer Sitophilus linearis comme une espèce asymbiotique (Nardon et Grenier, 1993).

I.2. Espèces symbiotiques

Les investigations cytologiques sur les larves ont permis de mettre en évidence des bactériocytes chez Diocalandra frumenti, Trigonotarsus rugosus, Dynamis borrasi, Sipalinus gigas et Rhynchophorus palmarum. Les squashes ovariens ont quant à eux révélé la présence de bactéries chez Sitophilus rugicollis et Sphenophorus striatopunctata. Concernant Sitophilus vateriae, nous avons recherché la présence de bactéries à l’apex des caeca mésenteriques antérieurs (nous ne disposions que d’adultes morts conservés dans l’alcool ou dans le fixateur de Bouin). Les caeca sont bien colonisés par des cellules de diamètre d’environ 10 µm qui pourraient être interprétées comme des figures de bactéries en cours de dégradation. Mais une confirmation s’avère indispensable, et le statut symbiotique de cette espèce devra être déterminé sur la larve.

Caractéristiques du bactériome

Chez l’ensemble des Dryophthoridae étudiés, le bactériome est un organe compact unique, toujours situé dans la partie antérieure de la larve, juste derrière la capsule céphalique, entre le tissu adipeux et le tube digestif. Ce bactériome est toujours en contact étroit avec le tube digestif à la jonction de l’intestin antérieur et moyen, ventralement chez D. frumenti et S. oryzae (Nardon, 1973) ou dorsalement comme chez C. sordidus (Nardon et al., 1985). Il est important de noter qu’il n’y a jamais de contact direct entre la lumière du tube digestif et le bactériome qui peut aisément être séparé. Le bactériome présente une forme de U chez S. oryzae (Figure 10-D), S. granarius, S. zeamais, S. rugicollis et D. frumenti. Chez les autres espèces qui possèdent des larves plus imposantes, on peut observer la formation de bactériome en cordon (Figure 10-C). Chaque cordon étant constitué par des chapelets de bactériocytes. Le bactériome larvaire est délimité par une fine enveloppe cellulaire avec de petits noyaux adipeux. Il semble que les cellules de cette enveloppe puissent pénétrer au sein du bactériome, entre les bactériocytes et former le tissu interstitiel dont l’importance est variable d’une espèce à l’autre. Le rôle de ce tissu reste par ailleurs très peu connu. Cet organe est très richement irrigué par le système trachéal (Figure 10-D).

66 Les bactériomes sont toujours formés de bactériocytes très similaires d'une espèce à l'autre. Ces bactériocytes sont des cellules géantes (Figure 10-B) dont la dimention peut varier selon l'espèce, 40 µm pour l'espèce Diocalandra frumenti et Dynamis borassi, et 300 µm chez Trigonotarsus rugosus. Les noyaux des bactériocytes sont très gros, ils font de 10 µm chez D. frumenti à 50 µm chez T. rugosus (Figure 10-A) et la chromatine apparaît compactée. L'existence de ces cellules géantes aux noyaux très développés suggère des phénomènes de ploïdisation. Ce phénomène a déjà été confirmé chez S. oryzae grâce à l'incorporation d'3H dans les bactériocytes (Nardon, 1978). La ploïdisation est un processus courant chez les insectes qui hébergent des symbiotes intracellulaires, elle à déjà été remarqué chez l'Homoptère Pseudococcus maritimus (Louis, 1967), chez les blattes (Richards et Brooks, 1958) ainsi que chez le Coléoptères Oryzaephilus surinamensis (Nardon et Grenier, 1989). Les bactériocytes montrent à l'intérieur du cytoplasme une importante quantité d'ARN révélée par les traitements à la ribonucléase. Cette présence de grande quantité d'ARN ainsi que l'existence d'un système trachéal très développé autour du bactériome (Figure 10-D) tent à prouver qu'au sein de ce tissu symbiotique un important métabolisme aérobie se déroule.

Pour résumer, l'élément le plus frappant est la grande homologie quant à la forme, la structure et la localisation du bactériome quelle que soit l'espèce de Dryophthoridae étudiée. Tous les bactériomes étudiés montrent des caractéristiques communes : - le bactériome est toujours situé entre le corps adipeux et l'intestin, ancré à la limite stomodeum/proctodeum, sans toutefois posséder de connexion directe avec celui-ci ; - le bactériome est plus ou moins compact, il peut former des cordons de bactériocytes ; - le bactériome est délimité par une fine enveloppe à petits noyaux plats qui peut s'insinuer entre les bactériocytes pour former le tissu interstitiel ; - le bactériome bénéficie d'un important système trachéen ; - les bactériocytes sont toujours des cellules de très grande taille, d'autant plus grandes que l'insecte est lui aussi de grande taille. Ils sont très riches en ARN et vraisemblablement polyploïdes.

67 A B

b ba e

td td

C D

tr ba b

td tr

E F e

e

G H

e

e

ba ba

Figure 10 : Histologie de la symbiose chez les Dryophthoridae. (A) Bactériome larvaire de T. rugosus. (B) Endocytobiotes de M. hemipterus à l'intérieur d'un bactériocyte larvaire. (C) Bactériome larvaire en colier de M. hemipterus. (D) Bactériome entier de S. oryzae. (E) Endocytobiotes spiralés de S. zeamais. (F) Endocytobiotes de S. rugicollis. FISH sur les endocytobiotes de M. hemipterus: (G) Controle avec le DAPI, (H) Hybridation spécifique avec la sonde Nardonella (N).(b) bactériome, (ba) bactériocyte, (e) endocytobiotes, (td) lumière du tube digestif, (tr) trachée. Echelle (A), (B), (G) et (H) 50 µm, pour (C), (D) 100 µm, (E) et (F) 10 µm.

68 II. Caractérisation des endocytobiotes de Dryophthoridae

II.1. Détection de Wolbachia chez les Dryophthoridae

Les bactéries du genre Wolbachia sont susceptibles d’être hébergées par les insectes étudiés. Aussi, une recherche préliminaire par PCR a été effectuée afin d’éliminer toute ambiguïté lors de la mise en évidence moléculaire des autres bactéries symbiotiques recherchées. La détection par PCR a été réalisée avec la paire d’amorces spécifiques 16S For-W et 16S Rev-W qui amplifie un fragment de 589 pb à l’intérieur du gène ribosomal 16S des Wolbachia. Seule l’espèce Sphenophorus abbreviata montre l’amplification d'un fragment à la taille attendue et semble donc héberger des Wolbachia. Il faut néanmoins noter que les Wolbachia n’infectent pas forcément toutes les populations d’une même espèce, ni même tous les individus d’une même population (Werren, 1997a). Des travaux antérieurs avaient déjà montré la présence de bactéries Wolbachia parmi les espèces Sitophilus oryzae, S. zeamais et S. granarius. Seules certaines souches des trois espèces accueillaient ces bactéries (Heddi et al., 1999). De plus, parmi les souches qui abritaient ces bactéries, certaines n'étaient que partiellement infectées. La présence / absence des Wolbachia détectées par PCR ne peut être en aucun cas une façon définitive de diagnostiquer la symbiose et de l'étendre au niveau de l'espèce concernée, surtout quand cette analyse est réalisée à partir d’un échantillon très limité d’individus comme c'est notre cas chez les Dryophthoridae.

II.2. Caractérisation histologique des endocytobiotes de Dryophthoridae

Les endocytobiotes provenant des larves ou des ovaires sont Gram-négatifs et ne produisent pas d'endospore. Cette caractéristique avait été initialement décrite chez S. oryzae (Nardon, 1971). Les bactéries observées en microscopie à contraste de phase montrent des mouvements saccadés et convulsifs, alors qu'aucun système de flagelle n'a pu être observé en microscopie optique, et électronique. De la même façon, aucune capsule n'a pu être décelée bien qu'un halo entourant les endocytobiotes soit souvent identifié. Ce halo correspond probablement à la présence de mucus entourant la bactérie.

A l'intérieur du cytoplasme, la localisation des endocytobiotes est assez variable, même si des figures identiques où les bactéries qui semblent être en contact directe avec le noyau du bactériocyte sont trouvées chez différentes espèces : C. sordidus, S. oryzae et S. zeamais. Ces dernières figures pourraient indiquer qu'il existe des interactions directes entre le noyau et les endocytobiotes.

69 Tableau 3: variabilité morphologique interspécifique des endocytobiotes de Dryophthoridae. Espèce hôte Forme des Tailles Type d'alimentation endocytobiotes Sitophilus granarius Flexueux Diamètre : 0,3-0,6 µm Graines de céréales (blé) Longueur : 25 µm Sitophilus zeamais Flexueux et spiralés (2 Diamètre : 0,3-0,6 µm Graines de céréales (blé) formes *) Longueur : variable selon les stades et les souches, formes spiralées > 20 µm Sitophilus oryzae Flexueux Diamètre : 0,3-0,5 µm Graines de céréales (blé) Longueur variable selon les stades et les souches étudiées : 1-60 µm Sitophilus rugicollis Flexueux Diamètre <1 µm Graines d'Eugenia Longueur : 8-20 µm jambolana aclimaté sur maïs au laboratoire Cosmopolites sordidus Très flexueux, spiralés Stipe de canne à sucre aglomérés en colonie Metamasius hemipterus Flexueux Diamètre : 1 µm Stipe de canne à sucre Longueur stade larvaire : 5-15 µm Longueur metampophose : 100-200 µm Longueur stade adulte :2-20 µm Trigonotarsus rugosus Filamenteux Diamètre : 1-2 µm Sur tronc de Xanthorrhea Longueur : 10-25 µm sp. Sphenophorus striatopunctata Filamenteux Diamètre :1 µm Racine de Sirpus lacustris Longueur : 2-10 µm * La présence de deux formes morphologiques n’a pour le moment pas été confirmée.

Une question intéressante était de savoir s’il était possible de corréler la variabilité morphologique des endocytobiotes avec la diversité d’alimentation des espèces d’hôte. Mais comme le montre le tableau 3, les symbiotes ont des morphologies très variables. Il n'existe pas de relation simple entre le type d'alimentation et la forme des symbiotes. En effet, C. sordidus et M. hemipterus ou encore S. zeamais et S. oryzae qui vivent dans les mêmes niches écologiques et sont phylogénétiquement très proches, hébergent pourtant des bactéries de forme et de taille extrêmement différentes. De plus, il apparaît qu'au sein même d'une espèce une grande variabilité existe entre les différents stades de développement et les souches étudiées. Cette variabilité observée entre espèces hôtes différentes est également visible entre souches d'une même espèce hôte (Nardon et al., 2003). Cette variabilité peut être liée au stade de développement de l'insecte. Ainsi chez S. oryzae, les bactéries issues des ovocytes (1-60 µm de longueur) sont plus longues que celle issues des stades larvaires ultérieurs (1-20 µm de longueur). De même, les endocytobiotes des larves agées sont plus longs que ceux trouvés chez les larves plus jeunes.

II.2.1. Caractérisation des membranes vacuolaires des endocytobiotes

Des images récentes obtenues à partir des bactériomes de M. hemipterus, C. sordidus, S. zeamais et S. rugicollis apportent des éléments nouveaux quant à l'origine des systèmes membranaires observés. Comme il a été précédemment décrit chez S. oryzae, M. hemipterus et C. sordidus et à l’instar de ce qui est observé chez S. rugicollis, deux membranes entourent les endocytobiotes des Dryophthoridae (Figure 11-A, 11-E) contrairement à ce qui est observé chez Buchnera où trois membranes, M1 et M2, caractéristiques des bactéries Gram-négatives et M3, membrane vacuolaire, sont observées (Griffiths et Beck, 1973), (Figure 11-F). On peut à ce sujet noter une différence entre S. oryzae et S. rugicollis d’une part et M. hemipterus, C. sordidus d’autre part. Les endocytobiotes hébergés des premières espèces possèdent, la plupart du temps, une forte cohésion entre les deux membranes (dont le diamètre moyen est d’environ 40 nm) alors qu’un espace intermembranaire ou périplasmique est communément observé chez les autres types d’endocytobiotes. Cet espace périplasmique est comparable à ceux observés pour les mitochondries (de 0 à 20 nm) puisque les deux

70 membranes se retrouvent cohésives en certains endroits (Figure 11-A). Ces nombreux points de contact sont, à l’instar de la mitochondrie, vraisemblablement la signature de processus de transport (cf. discussion). On peut également observer sur quelques coupes des zones granuleuses de densité très importantes où l’espace périplasmique est fortement dilaté, formant une sorte de vésicule d’environ 200 nm de diamètre (Figure 11-D). La figure 11-C montre d’un côté une vésicule dont l’invagination semble indiquer une endocytose et de l’autre côté une figure suggérant une exocytose du contenu dense de la vésicule dans le cytoplasme bactériocytaire. Enfin, chez les endocytobiotes de C. sordidus, on peut observer une membrane lâche entourant plusieurs formes bactériennes ne possédant qu'une seule membrane (Figure 11-B).

71 A B

e

m

C D m e m e e

e e

e

E F e e

e

Figure 11 : Images d'endocytobiotes obtenues en microscopie éléctronique à transmission. (A), (C) et (D) endocytobiotes de M. hemipterus; (B) endocytobiotes de C. sordidus; (E) endocytobiotes de S. rugicollis; (F) endocytobiotes de A. pisum. (m) mitochondrie, (e) endocytobiote.

II.3. Caractérisation moléculaire des endocytobiotes de Dryophthoridae

Les amorces eubactériennes universelles 008F et 1390R ont été utilisées pour amplifier un fragment de 1382 pb de l’ADNr 16S des endocytobiotes de Dryophthoridae. Les réactions de PCR sont effectuées sur de l’ADN extrait soit d’individus entiers, soit de bactériomes ou

72 d’ovaires disséqués sur des individus vivants, soit encore sur des fragments de bactériomes larvaires prélevés sur des coupes histologiques. Dans une première étape, des recherches par similitude sont effectuées sur les séquences obtenues afin d'éliminer les bactéries contaminantes commensales, en particulier les bactéries du tube digestif.

Trois groupes bien distincts de séquences ont pu être amplifiés et atribués aux bactéries symbiotiques précédemment identifiées en histologie.

- Le groupe de séquences symbiotiques appartenant aux Sitophilus (groupe S) : Les séquences d’ADNr 16S de S. rugicollis et S. granarius ont été amplifiées à partir d’ADN extrait de bactériomes larvaires disséqués. La localisation tissulaire des bactéries correspondant à ces séquences à pu être confirmée par FISH avec la sonde (S). Ces deux séquences additionnées de celle de S. zeamais et S. oryzae forment un groupe très homogène (94 % de similitude moyenne) et révèle une homologie forte avec les endocytobiotes des Glossines mais également avec des entérobactéries phytopathogènes comme les bacteries du genre Erwinia.

- Le groupe de séquences symbiotiques de type Rhynchophorus (groupe R) : Chez les espèces Rhynchophorus palmarum, Cosmopolites sordidus, Metamasius hemipterus, M. callizona, Sphenophorus abbreviata, l’ADN est extrait à partir de tissus hébergeant spécifiquement les endocytobiotes (bactériomes et ovaires), l’identification des séquences symbiotiques est donc aisée, elle a été de plus confirmée par FISH avec la sonde (R). Pour Yuccaborus frontalis et Scyphophorus yuccae, l’ADN a été extrait à partir d’adultes conservés dans l’alcool. Les produits PCR ont été directement séquencés. Aucun mélange de séquences n’a été décelé, et ainsi deux séquences très similaires aux quatre précédentes ont été obtenues. Les 6 séquences symbiotiques obtenues dans le groupe sont très similaires aux endocytobiotes d’autres insectes, comme les psylles et les pucerons, et sont caractérisées par un très faible taux de bases GC (le taux de GC moyen est de 40,5 %).

- Le groupe de séquences symbiotiques de type Diocalandra (groupe D) Pour Diocalandra frumenti l’ADN a été extrait de deux manières différentes : (1) à partir d’individus adultes et (2) à partir de coupes histologiques de larves. (1) Le produit de PCR issu de l’ADN d’insecte entier à été cloné. Une analyse des clones obtenus a été réalisée par digestion enzymatique (RFLP). Deux familles de clones ont pu êtres affiliés à des α-Protéobactéries, et une famille de clones montre une forte similitide avec le groupe bactérien Haemophilus/Pasteurella. (2) Le produit de PCR issu de l’ADN extrait à partir du bactériome prélevé sur coupe histologique a été directement séquencé. Une identité de 100 % est retrouvée avec la séquence issue de D. frumenti très similaire à Haemophilus/Pasteurellla, confirmant notre première analyse. La FISH réalisée sur des coupes histologiques de larve de D. frumenti avec la sonde spécifique (D), n’a néanmoins pas été concluante. Une absence notable de spécificité de la sonde a été observée, le signal fluorescent étant aussi important par exemple pour les endocytobiotes de Sitophilus que pour ceux de D. frumenti. L’origine symbiotique de cette séquence est fortement appuyée par la découverte chez une autre espèce, Trigonotarsus rugosus, de bactéries très similaires ainsi que les résultats partiels obtenus pour les espèces Paramasius distortus et Dynamis borassi. En effet, chez T. rugosus le produit de PCR issu de l’ADN extrait à partir de coupes histologiques (bactériome larvaire) a été directement séquencé. Une

73 identité > 96 % est retrouvée avec la séquence de D. frumenti. Les tentatives de FISH n’ont ici également pas été concluantes. Néanmoins le fait d’amplifier à trois reprises sur des tissus différents et chez deux espèces, deux séquences de très fortes similitudes (mais non identiques), est un élément qui nous a semblé suffisamment important pour conclure au statut symbiotique des bactéries dont sont issues ces deux séquences.

Pour Sitophilus vateriae, seuls des adultes conservés dans l’alcool étaient disponibles. Des représentants de chaque famille de clones obtenus ont été séquencés. Une recherche par similitude dans la banque de données Genbank a affilié les 7 séquences obtenues à la famille des Rickettsia. Les individus analysés n’hébergent vraisemblablement pas de bactéries appartenant aux γ-Protéobactéries, ni au genre Wolbachia. Les Rickettsies sont des bactéries parasites de vertébrés véhiculées par les arthropodes. Nous pouvons noter qu’une Rickettsie à également été trouvée chez l’espèce proche S. granarius (S. Chaudier, données non publiées). Il semblerait donc que S. vateriae n’héberge pas de symbiotes intégrés. Néanmoins, ces résultats ont été obtenus à partir d’ADN d’insectes adultes. Or, on sait, du moins chez S. oryzae et S. zeamais, que le nombre de bactéries symbiotiques décroît fortement avec l’âge des adultes. Ainsi, il est possible que les endocytobiotes soient présents de façon très minoritaire par rapport aux Rickettsies à ce stade de développement chez S. vateriae. Afin de confirmer pleinement le statut non symbiotique de S. vateriae, il serait souhaitable de disposer de larves pour recourir à des analyses histologiques (présence de bactériome larvaire) puis à des analyses moléculaires (PCR, FISH). En ce qui concerne Paramasius distortus (adultes conservés dans l’alcool), trois familles de clones ont été caractérisées, deux d’entre elles sont affiliées vraisemblablement aux entérobactéries du tube digestif (E. coli, Salmonella), mais la troisième révèle une homologie avec le groupe Haemophilus/Pasteurella. Ce résultat conforte bien l’idée d’un clade symbiotiques de bactéries proches des bactéries parasites Haemophilus et Pasteurella. Mais comme précédemment, ce résultat nécessite une confirmation par la technique FISH sur des larves qu'il n'a pas été possible de se procurer. Chez D. borassi, il est à noter que le séquençage des produits de PCR obtenus à partir de fragments de bactériomes prélevés sur coupes histologiques indique un mélange de séquences (coexistence de plusieurs endosymbiotes génétiquement différents). Les produits PCR ont donc été clonés, mais pour le moment un seul type de séquence, un petit fragment de l'ADNr 16S, a été obtenue et affiliée au groupe Haemophilus/Pasteurella. Chez cette espèce également une étude menée sur des larves devrait permettre de caractériser les endocytobiotes de façon plus fiable.

Au total, 13 séquences symbiotiques ont ainsi été identifiées et déposées dans Genbank (Lefèvre et al., 2004), (Tableau 4).

74 Tableau 4 : Séquences d'ADNr 16S des endocytobiotes de Dryophthoridae Insectes hôtes Origine de L'ADN Taille du fragment N° Accession utilisé pour la PCR d'ADNr 16S (pb) Genbank Sitophilus granarius BL, BO 1589 AY126638 Sitophilus oryzae BL, BO 1501 AF005235 Sitophilus zeamais BL, BO 1495 M85269 Sitophilus rugicollis BL, BO 1329 AY126639 Yuccaborus frontalis BL 1464 AY262022 Sphenophorus abbreviata BO 1384 AY126640 Cosmopolites sordidus BL, BO 1383 AY126632 Trigonotarsus rugosus BL 1387 AY126641 Rhynchophorus palmarum BL, BO 1425 AY126636 Metamasius hemipterus BL, BO 1462 AY126635 Metamasius callizona BL, BO 1373 AY126634 Diocalandra frumenti BL 1528 AY126633 Scyphophorus yuccae BO 1400 AY126637 BL : bactériome larvaire, BO : bactériome ovarien

II.3.1. Détection de plurisymbioses chez les Dryophthoridae

Les Dryophthoridae étudiés dans ce travail hébergent-ils un seul type de bactéries symbiotiques intracellulaires à l’intérieur de leurs bactériomes ? Comme il a été suggéré par les résultats moléculaires, et comme il sera plus clairement démontré par l’analyse phylogénétique suivante (cf § III), les séquences symbiotiques obtenues se répartissent en trois groupes bien distincts que nous avons appellés clades S, R et D. Nous pouvons préalablement noter que les séquençages des produits PCR obtenus sur de l’ADN de bactériome ou d’ovaires n’ont jamais révélé la présence de mélanges de séquences. Néanmoins, il se peut qu’une séquence potentiellement symbiotique et présente en très faible quantité ne soit pas amplifiée au cours des premiers cycles PCR, d’où sa présence indétectable dans le produit final. Une recherche plus approfondie des trois types de symbiotes à donc été menée sur les insectes disponibles afin de vérifier qu’un insecte initialement porteur d’un type de symbiote n’héberge pas également un des deux autres types.

Tableau 5 : Couples d'amorces PCR utilisées pour détecter la présence des endocytobiotes des trois types « R », « S » et « D ». Type d’endocytobiote recherché Paire d’amorces utilisée Taille des fragments attendus Type « R » Meta For et 1390 Rev 1241 pb Type « S » 008 For et Sito Rev 570 pb Type « D » 008 For et Dioc Rev 767 pb

Des amorces PCR spécifiques des trois types d’endocytobiotes identifiés ont été déterminées à partir de l’alignement des séquences d’ADNr 16S des Dryophthoridae. Les paires d’amorces choisies définissent trois tailles de fragments distincts (Tableau 5), qu’il est aisé de reconnaître sur un même gel d’électrophorèse facilitant ainsi la recherche systématique des endocytobiotes. Les recherches n’ont donné aucun résultat positif pour les insectes où les endocytobiotes des clades S et D ont été initialement identifiés. Cependant, pour R. palmarum, M. hemipterus, S. abbreviata et C. sordidus la PCR réalisée avec la paire d’amorce 008 For et Dioc Rev a été positive donnant des produits à la taille attendu. Le séquençage de ces produits PCR a effectivement révélé que ces fragments étaient bien des fragments de symbiotes de type « D ». Néanmoins une suspicion (contamination avec l’ADN témoin de D. frumenti) très forte demeure sur l’origine de ces séquences car elles révèlent entres-elles et avec la séquence

75 16S de D. frumenti une identité > 99 %. Malgrés plusieurs répétitions de ces expériences cette incertitude n'a pas pu être levée et ces données n'ont pour le moment pas été publiées.

III. Reconstruction de l’histoire évolutive de la symbiose chez les Dryophthoridae

Une première analyse phylogénétique a été réalisée sur le jeu de données formé par les 13 séquences d’ADNr 16S obtenues dans ce travail. Quel que soit le modèle et les méthodes utilisés (Kimura à 2 paramètres, Parcimonie, Maximum de vraisemblance) les trois clades de symbiotes R, S et D décrits précédemment sont systématiquement retrouvés (Figure 12).

T. rugosus S. granarius D. frumenti 100 S. oryzae Clade S S. zeamais S. rugicollis 91 100

100 Clade D

100

89 50 100 Y. frontalis M. cal lizona M. hemipterus 100 100 Clade R

S. yuccae S. abbreviata R. pal marum C. sordidus

0.1 Figure 12 : Arbre phylogénétique des 13 endocytobiotes des Dryophthoridae basé sur le gène codant l'ADNr 16S donné par la méthode du neighbour-joining utilisant la distance de Kimura à 2 paramètres. Trois clades, R, S et D sont définis.

III.1. Choix de l'échantillon de bactéries

Pour retracer l’histoire évolutive de ce groupe de bactéries, il faut bien sûr rechercher les relations phylogénétiques des endocytobiotes entre eux, mais il faut également tenter de placer les endocytobiotes dans une phylogénie intégrant des bactéries libres. Les analyses de similitude (BLAST) effectuées précédement, nous indiquent que les endocytobiotes de Dryophthoridae étudiés sont affiliés aux γ-Protéobactéries. Un échantillon représentatif des genres bactériens connus chez les γ-Protéobactéries a donc été constitué (Ahmad et al., 1990). Les espèces qui ont été choisies entretiennent des relations étroites avec les insectes et/ou les plantes (pathogènes, phytopathogènes, associées aux tubes digestifs des insectes). Cet échantillon à été constitué dans l’espoir d’identifier parmi ces bactéries, des

76 bactéries libres descendant d’ancêtres des endocytobiotes actuels. Les séquences des bactéries présentées dans le tableau 6 ont donc été choisies. Néanmoins des organismes plus commensaux ont également été retenus pour chacun des genres.

Tableau 6: Echantillons des bactéries libres et d'endocytobiotes choisis pour les analyses phylogénétiques γ-Protéobactéries libres, phytopathogènes ou γ-Protéobactéries libres commensales associées aux tubes digestifs des insectes Pseudomonas fluorescens (AF094729) Pseudomonas fluorescens (AF094729) Aeromonas haywardensis (AF015258) Aeromonas hydrophila (AF099022) Pasteurella multocida (AY079000) Pasteurella multocida (AY079000) Haemophilus inluenzae (AF224306) Haemophilus inluenzae (AF224306) Citrobacter freundii (AF025365) Citrobacter freundii (AF025365) Klebsiella oxytoca (AB004754) Klebsiella pneumoniae (AB005743) Enterobacter agglomerans (AF1300913) Enterobacter agglomerans (AF1300913) Escherichia coli (J01859) Escherichia coli (J01859) Salmonella bareilly (U92196) Salmonella enteritidis (U90318) Serratia liquefaciens (AB004752) Serratia marcesens (AB061685) Erwinia carotovora (U80197) Erwinia chrysanthemi (Z96093) Kluyvera ascorbata (AF310219) Kluyvera ascorbata (AF008579) Edwarsiella ictaluri (AF310622) Edwarsiella tarda (AF015259) Yersinia pestis (AJ232238) Yersinia enterocolitica (AF366378) Hafnia alvei (M59155) Hafnia alvei (M59155) Providencia stuartii (AF008581) Providencia alcalifaciens (AJ301684) Proteus mirabilis (AF008582) Proteus vulgaris (AJ233425) Endocytobiotes d’insectes Endocytobiotes secondaire de Glossina pallidipes (M99060) Endocytobiotes primaire de Candidatus camponotii (X92549) Endocytobiotes primaire de Schizaphis graminum (Z19056)

Des analyses sur les deux jeux de données ont été réalisées afin de tester l’influence de l’échantillon de bactéries libres sur les branchements phylogénétiques des endocytobiotes des Dryophthoridae. La bactérie externe, Paracoccus sp. (AF376134), permettant d’enraciner l’arbre a été choisi dans le groupe des α-Protéobactéries, groupe proche des γ-Protéobactéries afin de maximiser le nombre de sites informatifs.

III.2. Analyse phylogénétique des endocytobiotes de Dryophthoridae

Le positionnement phylogénétique des bactéries symbiotiques intracellulaires est un problème relativement complexe puisque deux caractéristiques majeures liées à l’évolution moléculaire de ces bactéries doivent être prises en compte sous peine de biaiser l'analyse : la vitesse d’évolution et le taux de GC. Dans une première approche nous avons utilisé deux modèles (maximum de parcimonie et distance de Kimura à 2 paramètres) qui ne prennent pas en compte les deux précédentes caractéristiques moléculaires. Conformement à nos attentes, ces modèles sont trop sensibles aux variabilités de taux d’évolution et de taux de GC. Ainsi, les deux phylogénies obtenues sont contradictoires. Le modèle du maximum de parcimonie regroupe toutes les séquences d’endocytobiotes à l’intérieur des entérobactéries, dont la structure est bouleversée (Figure 12).

77 Paracoccus sp.

Pseudomonas fluorescens

Aeromonas haywardensis

Haemophilus influenzae

Pasteurella multocida

Trigonotarsus rugosus (endocytobiote)

Diocalandra frumenti (endocytobiote)

Edwardsiella ictaluri

Erwinia carotovora

Hafnia alvei

Yersinia pestis

Proteus mirabilis

Providencia stuartii

Glossina pallidipes (endocytobiote)

Sitophilus granarius (endocytobiote)

Sitophilus oryzae (endocytobiote)

Sitophilus zeamais (endocytobiote)

Sitophilus rugicolis (endocytobiote)

Camponotus floridanus (endocytobiote)

Schizaphis graminum (endocytobiote) Yuccaborus frontalis (endocytobiote)

Scyphophorus yuccae (endocytobiote)

Sphenophorus abbreviata (endocytobiote)

Metamasius hemipterus (endocytobiote)

Metamasius callizona (endocytobiote)

Rhynchophorus palmarum (endocytobiote)

Cosmopolites sordidus (endocytobiote)

Enterobacter agglomerans

Kluyvera ascorbata

Citrobacter freundii

Klebsiella oxytoca

Serratia liquefaciens

Salmonella bareilly Escherichia coli Figure 13 : Arbre phylogénétique basé sur le gène codant l'ADNr 16S donné par le modèle de maximum de parcimonie. Les séquences des endocytobiotes de Dryophthoridae sont en gras.

Le modèle de Kimura éclate les séquences d’endocytobiotes en deux groupes, un groupe composé des séquences d’endocytobiotes riches en bases A et T à l’extrémité de branches longues qui est porté à l’extérieur des entérobactéries, et un second groupe composé des séquences d’endocytobiotes riches en bases G et C à l’intérieur des entérobactéries (Figure 14). La prise en compte de ces deux facteurs (vitesse d’évolution et taux de GC) apparaît donc indispensable.

78 Paracoccus sp.

Pseudomonas fluorescens

Aeromonas haywardensis Pasteurella multocida

Haemophilus influenzae

Diocalandra frumenti (endocytobiote) 100 100 Trigonotarsus rugosus (endocytobiote) Schizaphis graminum (endocytobiote)

93 Camponotus floridanus (endocytobiote)

92 Yuccaborus frontalis (endocytobiote)

62 Cosmopolites sordidus (endocytobiote) 100 100 Rhynchophorus palmarum (endocytobiote) 60 Metamasius callizona (endocytobiote) 100 97 Metamasius hemipterus (endocytobiote)

Sphenophorus abbreviata (endocytobiote) 83 100 Scyphophorus yuccae (endocytobiote)

Providencia stuartii

Proteus mirabilis

Edwardsiella ictaluri

Enterobacter agglomerans

74 Sitophilus rugicolis (endocytobiote) Glossina pallidipes (endocytobiote) 81 Sitophilus granarius (endocytobiote) 91 50 Sitophilus zeamais (endocytobiote)

76 Sitophilus oryzae (endocytobiote) Serratia liquefaciens 50 Kluyvera ascorbata 71 Citrobacter freundii 73 56 Klebsiella oxytoca Escherichia coli

100 Salmonella bareilly

Erwinia carotovora

Yersinia pestis

98 Hafnia alvei 0.1 Figure 14 : Arbre phylogénétique basé sur le gène codant l'ADNr 16S donné par la méthode du neighbour joining utilisant la distance de Kimura à 2 paramètres. Les séquences des endocytobiotes de Dryophthoridae sont en gras

Notre démarche d’analyse a été la suivante : nous avons d’abord pris en compte séparement les biais liés au taux de GC et aux vitesses d’évolution à l’aide de modèles adéquats, ensuite nous avons tenté de contourner artificiellement ces deux biais en intégrant dans l’analyse les sites les plus conservés. Enfin, devant l’échec de ces approches, nous avons développé une démarche d’exploration des topologies à l’aide d’un modèle d’évolution de l’ADN non homogène (Galtier et Gouy, 1998) intégrant à la fois la variabilité des taux de substitution entre les sites et des taux de GC entre les séquences.

III.2.1 Prise en compte du biais GC

L’hétérogénéité des taux de GC des séquences présentes dans l’analyse sera prise en compte en utilisant la distance de Galtier et Gouy (1995). Cette distance n’impose pas, contrairement aux modèles classiques, que l’équilibre en bases GC soit identique dans les différentes lignées, ce qui autorise des taux de GC hétérogènes entre les séquences. Cette méthode appliquée à notre jeu de séquences génère un arbre dont la topologie des bactéries libres est satisfaisante (Figure 15).

79 Paracoccus sp. Pseudomonas fluorescens

Aeromonas haywardensis

Schizaphis graminum (endocytobiote) 97 100 Pasteurella multocida Haemophilus influenzae 70 Diocalandra frumenti (endocytobiote) 100 59 Trigonotarsus rugosus (endocytobiote)

Yuccaborus frontalis (endocytobiote)

Cosmopolites sordidus (endocytobiote) 100 55 Rhynchophorus palmarum (endocytobiote)

Metamasius callizona (endocytobiote) 53 71 Metamasius hemipterus (endocytobiote)

73 Sphenophorus abbreviata (endocytobiote)

66 93 Scyphophorus yuccae (endocytobiote)

Camponotus floridanus (endocytobiote)

Sitophilus granarius (endocytobiote)

Sitophilus oryzae (endocytobiote) 62 Glossina pallidipes (endocytobiote) 71 Sitophilus zeamais (endocytobiote)

Sitophilus rugicolis (endocytobiote)

Hafnia alvei

Kluyvera ascorbata

Erwinia carotovora

Citrobacter freundii 80 Klebsiella oxytoca

Serratia liquefaciens

94 Escherichia coli

100 Salmonella bareilly

Yersinia pestis

Enterobacter agglomerans

Edwardsiella ictaluri Providencia stuartii

56 Proteus mirabilis 0.1 Figure 15 : Arbre phylogénétique basé sur le gène codant l'ADNr 16S donné par la methode du neighbour joining utilisant la distance de Galtier et Gouy (1995). Les séquences des endocytobiotes de Dryophthoridae sont en gras

On retrouve bien le groupe Haemophilus/Pasteurella à proximité de Pseudomonas, ainsi que la structure attendue des trois clades (E1/E2 et E3) des entérobactéries. Néanmoins, les valeurs très faibles de bootstrap montrent une topologie assez peu soutenue. On observe en outre la formation des trois clades symbiotiques précédement identifiés : le clade R et S exclus des entérobactéries, et le Clade D branché sur le groupe Haemophilus/Pasteurella. Il est à noter que dans cette analyse les symbiotes des psylles situés aux extrémités de longues branches ont dû être éliminés du jeu de séquences, leur présence induisaient de fortes distorsions de l’arbre. Ce qui indique que cette méthode reste très sensible aux vitesses d’évolution différentes.

III.2.2. Prise en compte des vitesses d'évolution

De la même façon, nous pouvons prendre en considération les vitesses d’évolution inégales entre les différentes lignées, en particulier entre les lignées des bactéries libres et les lignées des bactéries intracellulaires. Pour cela le modèle de Tourasse et Gouy (1997) a été utilisé. Ce modèle prend en compte les taux de substitutions inégaux entre les sites d’une même séquence. Ainsi, les problèmes de saturation, liés à certaines séquences qui évoluent vite et causant habituellement des sous-estimations de distances évolutives, sont gérés par le modèle. La mise en application de ce modèle sur nos données modifie (Figure 15) la topologie générale de l’arbre phylogénétique obtenue par la méthode précédente. La topologie des bactéries libres reste également peu soutenue (les entérobactéries libres sont situées sur un râteau, bootstrap < 30). La prise en compte des taux de substitutions inégaux entre les sites

80 intègre le clade R riche en bases A et T dans les entérobactéries et les place à l’extrémités de branches très longues car un grand nombre de substitutions multiples a été pris en compte par le modèle. Le clade S est également intégré aux entérobactéries avec ce modèle. La prise en compte d’un seul facteur à la fois conduit à deux phylogenies qui apportent une information contradictoire sur le positionnment relatif des endocytobiotes par rapport aux entérobactéries. Ceci laisse fortement penser que les deux facteurs doivent être pris en compte dans la même analyse.

III.2.3. Contourner les biais de compositions et de vitesse d'évolution

Avant de prendre en compte simultanément la vitesse d’évolution et les taux de GC hétérogènes entre les séquences, nous avons tenté « d’éliminer » artificiellement ces hétérogénéités. En effet, il est possible de limiter artificiellement le biais AT et les vitesses d'évolution différentes entre les séquences de notre jeu de données en ne prenant en compte dans l'analyse phylogénétique, que les sites très conservés (identité de 95, 90, 80, 70, 60 et 50 %). Ces sites sont soumis à des pressions de sélection évolutives importantes, ils correspondent très souvent aux premières et deuxièmes positions de codon. Plus l'ensemble des sites impliqués dans l'analyse est conservé, plus les taux de GC et plus les vitesses d'évolution sont homogènes. Les modèles classiques de reconstruction phylogénétiques sont donc tout à fait indiqués. La distance de Kimura à 2 paramètres ainsi que la distance de Galtier et Gouy (1995) ont été utilisés sur des sélections de sites allant de 5% de variabilité par site à 50%. Il apparaît très rapidement que la variabilité de la molécule d'ADNr 16S est peu adéquate pour ce genre d’étude. Les sites très conservés, trop peu nombreux, ne permettent par d’obtenir une information phylogénétique suffisante pour obtenir des arbres pleinement résolus. En effet dès que la variabilité par site est en dessous de 40%, de nombreux noeuds disparaissent de l’analyse. Les seuls arbres pleinement résolus correspondent à des variabilités supérieures à cette valeur, alors que les biais de composition et de vitesse d'évolution sont trop élevés pour que l'application de ces méthodes soit justifiée.

III.2.4. Prise en compte des taux de GC et vitesses d'évolution hétérogènes

Afin d'améliorer l’analyse phylogénétique en prenant en considération à la fois la variabilité des taux de substitution entre les sites et des taux de GC entre les séquences, le modèle d'évolution de l'ADN non homogène développé par Galtier et Gouy (1998) a été utilisé. Nous proposons dans ce travail, à partir du logiciel NHML, une démarche d'exploration des topologies vraisemblables. Cette démarche permet, d'une part, d'estimer la fiabilité de la topologie la plus vraisemblable tout en conservant l'information des topologies sous-optimales et, d'autre part, de tester des hypothèses phylogénétiques particulières.

III.2.4.1. Détermination d’une topologie de bactéries libres.

Afin de réduire l'exploration de l'espace des topologies d'arbres, une structure de l'arbre des bactéries libres est fixée a priori au début de l'analyse. Cette topologie fixée concerne plus particulièrement le groupe des entérobactéries. Elle est basée sur le travail de Ahmad et al. (1990) où la phylogénie est basée sur des fusions de gènes impliqués dans la biosythèse des acides aminés aromatiques. Dans un premier temps, seuls les nœuds correspondant aux fusions ont été conservés. Ainsi, nous avons fixé trois enteroclusters E1, E2, E3. L'enterocluster E1 comprend les séquences des genres Citrobacter, Klebsiella, Enterobacter, Escherichia, Salmonella. E2 comprend les séquences des genres Serratia et Erwinia enfin E3

81 comprend les séquences des genres Kluyvera, Ewardsiella, Yersinia, Hafnia, Providencia et Proteus. Dans un second temps, la procédure shake de "pruning/regrafting" du logiciel NHML a été utilisée pour redéfinir en deux étapes (E3 puis E1/E2) les structures internes des nœuds des trois entéroclusters. La topologie de référence est représentée par la figure 16.

Paracoccus

1 Pseudomonas

3 Aeromonas

6 Pasteurella 5 7 2 Haemophilus

11 Providencia 10 12 Proteus 4 9 14 Kluyvera E3 13 16 Ewardsiella 15 18 Hafnia 17 8 19 Yersinia

22 Serratia 21 E2 23 Erwinia 20 25 Citrobacter

24 27 Klebsiella

26 29 Enterobacter E1 28 31 Escherichia 30 32 Salmonella

Figure 16 : Topologie de référence des bactéries libres utilisée dans ce travail. E1, E2 et E3 : Enterocluster 1, 2 et 3, les n° des branches ont été fixés arbitrairement pour faciliter la discussion et les représentations graphiques ultérieures.

III.2.4.2. Méthode d'exploration.

Puisque toutes les topologies ne peuvent être estimées, une nouvelle séquence (ou groupe de séquences) est fixée successivement sur toutes les branches (1 à 32) indiquées sur la topologie de référence (Figure 16). Pour chaque nouvelle position de la séquence le logarithme de la vraisemblance de la nouvelle topologie d'arbre est estimé. On peut représenter graphiquement le résultat de cette exploration en indiquant en abscisse la position de la séquence et en ordonnée la vraisemblance associée a cette position. Cette vraisemblance est exprimée en différence par rapport à la vraisemblance maximale calculée. La position la plus vraisemblable (le Log de la vraisemblance maximale) pour la séquence correspond au branchement phylogénétique pour lequel la valeur de l’ordonnée vaut 0

82 Log de vraisemblance des 32 topologies d'arbre pour les endocytobiotes de D. frumenti et M. hemipterus

0 1 3 5 7 9 -10 11 13 15 17 19 21 23 25 27 29 31

-20

-30

-40

-50

-60

-70

-80 Position des séquences sur l'arbre de réferenc

D. frumenti M. hemipterus

Log de vraisemblance relatif des 32 topologies d'arbres pour les B endocytobiotes du clade S

0 1 3 5 7 9

-20 11 13 15 17 19 21 23 25 27 29 31 -40 -60 -80 -100 -120 -140 -160 -180 -200 Position du clade S sur l'arbre de réference

Clade S

Figure 17 : Représentation graphique d'une exploration des vraisemblances (portées en ordonnées) associées aux positions d'une ou de plusieurs séquences occupées sucessivement sur la topologie de référence (en abscisse), Figure 16. A: Résultat d'exploration avec une séquence, D. frumenti et M. hemipterus B: Résultat d'exploration avec un groupe de séquences, le clade S (structure donnée par la Figure 12).

A titre d’exemple, la position phylogénétique la plus vraisemblable pour la séquence associée à D. frumenti (Figure 17-A) est la position 5 branchée sur Haemophilus/Pasteurella. Pour la séquence associée à M. hemipterus (Figure 17-A) la position phylogénétique la plus vraisemblable est la position 8 branchée à l'extérieur des entérobactéries. Une démarche exploratoire similaire peut être menée sur un groupe entier de séquences. L'exemple présenté porte sur le clade S (Figure 17-B). La position 8 est également la position la plus vraisemblable pour ce clade. L'information phylogénétique délivrée par un modèle classique se résume à un seul arbre. Or notre démarche et cette représentation graphique permettent, outre de visualiser la position la plus vraisemblable, de connaître les positions phylogénétiques sous maximales, et de disposer ainsi d'une idée sur la robustesse des branchements. Nous pouvons remarquer, concernant la qualité (la représentativité) de l'échantillonnage des séquences (ici des bactéries libres) utilisé pour établir l'arbre de référence que toutes les courbes obtenues (Figure 17) montrent un important décrochement aux positions 6 et 7 qui correspondent respectivement aux branchements sur Pasteurella et Haemophilus (Figure 16). La rupture du clade Haemophilus/Pasteurella entraîne donc une chute brutale de la vraisemblance de l'arbre associé et ce, même avec la séquence symbiotique de D. frumenti

83 pourtant très proche de ce dernier clade (Figure 17-A). Les séquences Haemophilus et Pasteurella sont en effet très similaires. Or, pour obtenir une bonne représentativité des γ- Protéobactéries tout en minimisant les temps de calcul (donc le nombre de séquences), il faut minimiser ces cas de figures. Il est ici satisfaisant qu’aucune figure extrême de ce type n'a pu être retrouvé à l'intérieur des entérobactéries, ce qui semble indiquer que l'échantillonnage était plutôt correct.

III.2.4.3. Positionnement indépendant des trois clades d'endocytobiotes.

Avant d’essayer de positionner les trois clades R,S et D d’endocytobiotes, il fallait préalablement vérifier que la prise en compte simultanée des vitesses d’évolution et des taux de GC conservait la topologie des trios clades. Pour cela nous avons réalisé sur les 13 séquences d’endocytobiotes de Dryophthoridae une analyse en « pruning-regrafting » utilisant le modèle hétérogène de maximum de vraisemblance de Galtier et Gouy. Cette analyse a confirmé l’existence des trois clades. En conservant la structure interne de chaque clade donnée par l’analyse précédente (Figure 12), les trois groupes de séquences symbiotiques sont introduits successivement dans la topologie de référence (Figure 18).

Pseudomonas

Heamophilus Pasteurella Clade R E3

8 E2

E1

Pseudomonas

Heamophilus Pasteurella Clade S E3

8 E2

E1

Pseudomonas Clade D Heamophilus 5 Pasteurella

E3

E2

E1

Figure 18 : Résultat du positionement indépendant des 3 clades d'endocytobiotes R, S et D sur la topologie de référence. Cette figure montre trois arbres simplifiés sur lesquels sont pointés les positions les plus vraisemblables pour les 3 clades. Les numéros correspondent aux positions reportées sur la topologie de référence (Figure 16). E1, E2 et E3: entéroclusters 1, 2 et 3.

84 Concernant le clade D, avec un écart de plus de 14 unités avec les vraisemblances sous- maximales, la vraisemblance maximale situe le clade en position 5, extérieure aux entérobactéries et branché sur le groupe Haemophilus/Pasteurella (Figure 18). Concernant le clade R, avec un écart de plus de 6 unités avec les vraisemblances sous- maximales, la vraisemblance maximale situe le clade en position 8, extérieure aux entérobactéries (Figure 18). Enfin concernant le clade S, la vraisemblance maximale situe ce clade en position 8 extérieur aux entérobactéries. Cependant, deux autres pics sont observés en position 29 (sur Enterobacter) et en position 10 (sur Proteus/Providencia), (Figure 16, Figure 17-B), la vraisemblance ne chute que de 2,4 et 2,6 unités respectivement. Ces trois branchements correspondent aux branchements phylogénétiques observés avec les modèles classiques (modèles de maximum de parcimonie, modèles de distances).

III.2.4.4. Positionnement relatif des 3 clades d'endocytobiotes

III.2.4.4.1. Hypothèse de monophylie pour les séquences de Dryophthoridae

Les trois possibilités d’arrangement des trois groupes de bactéries symbiotiques : S(D,R); D(R,S) et R(D,S) sont explorées. L’ensemble des bactéries symbiotiques réunies en un seul clade est déplacé sur la topologie de référence. Les profils des trois arrangements sont tout à fait identiques. Le Log de vraisemblance maximale est de -7389,4, il est observé pour la position 8 avec le clade symbiotique S(D,R), ce qui situe le groupe à l'extérieur des entérobactéries (Figure 16, Figure 19).

Pseudomonas

Heamophilus Pasteurella

Clade S

Clade R

Clade D

E3

E2

E1 Figure 19: Résultat de l'exploration associée à l'hypothèse de monophylie. L'arbre simplifié montre la position la plus vraisemblable, à l'extérieur des trois entéroclusters E1, E2 et E3, pour le clade symbiotique S,(D,R).

III.2.4.4.2. Hypothèse de polyphylie

Avec trois clades, l’ensemble des cas de polyphylie (32*33*34-32=35872 configurations), ne peut raisonnablement être exploré. Aussi, deux clades d’endocytobiotes sont fixés sur la topologie des bactéries libres, le troisième se déplace sur cette nouvelle topologie. Les clades sont fixés à la position même ou la vraisemblance maximale à été trouvée lors de l’analyse précédente. Les clades S ou R sont fixés en position 8 quant au clade D, il est fixé en position 5. Les trois configurations initiales ont donné le même résultat. Le

85 clade D est situé en position 5, les deux autres sont groupés en position 8. Le Log de vraisemblance de cette topologie d'arbre est de -7342,1. Si le clade S n’est plus fixé initialement en position 8 mais en position 29, le clade D se branche toujours en position 5, mais le clade R se branche sur le clade S en position 29 avec un écart de plus de 10 valeurs par rapport au Log de vraisemblance obtenu en position 8. De même, si le clade S est fixé en position 10, le clade D se branche toujours en position 5, et le clade R se branche sur le clade S toujours avec un écart de plus de 10 valeur par rapport au Log de vraisemblance obtenu en position 8. L'attraction des clades R et S, ayant des taux de GC pourtant très différents, semble révéler une origine phylogénétique commune. Cela nous incite à tester les topologies suivantes : le clade D est fixé en position 5 et un deuxième clade constitué des clades S et R, et déplacé sur la topologie ainsi fixée.

Pseudomonas

Heamophilus Pasteurella

Clade D

Clade R

Clade S

E3

E2

E1 Figure 20 : Résultat de l'exploration associée à l'hypothèse de polyphylie. L'arbre simplifié montre la position la plus vraisemblable pour les trois clades symbiotiques R, S,et D. Le clade D est branché sur le groupe Heamophilus/Pasteurella et les clades R et S sont branchés à l'extérieur des 3 entéroclusters E1, E2 et E3.

La topologie la plus vraisemblable déterminée par cette exploration représente l’hypothèse de polyphylie (Figure 20), elle est comparée à la topologie associée à l’hypothèse de monophylie. Les deux topologies sont comparées par bootstrap du jeu de donnée (cf. Matériel et Méthode § IV.3. Tester statistiquement les topologies). L'hypothèse de polyphylie (Log de vraisemblance associé à la topologie : -7342,1) qui est plus vraisemblable que l'hypothèse de monophylie (Log de vraisemblance associé à la topologie : -7389,4) et qui est en outre associée à une topologie statistiquement différente de l'hypothèse de monophylie (d'après le test de bootstrap, la probabilité que ces deux topologies soient identiques est inférieure à 0,001), est retenue. Ainsi, deux clades peuvent êtres définis , le premier est le clade D branché en position 5 sur le groupe Haemophilus/Pasteurella, le second est formé des 2 autres clades S et R. Le positionnement le plus vraisemblable pour ce dernier clade est en position 8 extérieur aux entérobactéries.

III.2.4.5. Positionnement relatif des autres endocytobiotes d'insectes

Nous avons choisi trois séquences d’ADNr 16S d’endocytobiotes d’autres d’insectes (appartenant à trois ordres différents). Les symbiotes choisis se sont révélés au cours de l’analyse par similitude (BLAST) très similaires aux endocytobiotes des Dryophthoridae. Ils ont été choisis afin de maximiser le nombre de sites pour l’analyse phylogénétique. C’est

86 ainsi que les endocytobiotes secondaires de Glossina pallidipes, les endocytobiotes de Candidatus camponotii et de Schizaphis graminum sont introduits dans l'analyse phylogénétique. La topologie de l'arbre initial est redéfinie en intégrant le positionnement des 3 clades d'endocytobiotes de Dryophthoridae définis lors de l'analyse précédente. La première séquence introduite est celle des endocytobiotes de Glossina palpalis, la vraisemblance maximale est obtenue lorsqu'elle se trouve à l'intérieur du clade Sitophilus. La topologie initiale est alors redéfinie en ce sens. C’est à dire qu’une nouvelle topologie, comprenant les séquences des bactéries libres, des endocytobiotes des Dryophthoridae et des endocytobiotes secondaire de Glossina pallidipes (séquence que l’on a positionnée) est fixée. C’est sur cette ossature d’arbre que les séquences suivantes vont être déplacées à leur tour. Les séquences des endocytobiotes de Candidatus camponotii et Schizaphis graminum sont alors sucessivement introduites dans l'analyse en suivant à chaque nouvelle introduction la même procédure. Enfin trois procédures "shake" indépendantes sont réalisées pour tester les structures internes premièrement, du clade S comprenant la séquence des symbiotes de Glossina pallidipes, deuxièmement, du clade R et enfin des trois branchements comprenant les autres symbiotes d'insectes. Seuls ces derniers branchements ont été modifiés. La topologie finale de l'arbre obtenu est ici présentée avec les distances évolutives correspondantes (Figure 21). Les endocytobiotes de Dryophthoridae se répartissent en deux groupes : un premier clade est fixé sur le groupe Haemophilus/Pasteurella et le deuxième groupe est constitué des séquences du clade S et R. Ce dernier groupe d'endocytobiotes de Dryophthoridae rassemble des endocytobiotes d'autres insectes.

87

Paracoccus sp. AF376134 Pseudomonas fluorescens AF094729 Aeromonas haywardensis AF015258 Haemophilus influenzae AF224306 Pasteurella multocida AY079000 Trigonotarsus rugosus (Endosymbiont) AY126641 D-clade Diocalandra frumenti(Endosymbiont) AY126633 53.4% GC Yuccaborus frontalis (Endosymbiont) AY262022 Rhynchophorus palmarum (Endosymbiont) AY126636 Cosmopolites sordidus (Endosymbiont) AY126632 Metamasius hemipterus (Endosymbiont) AY126635 R-clade 40.5% GC Metamasius callizona (Endosymbiont) AY126634 Sphenophorus abbreviata (Endosymbiont) AY126640 8 Scyphophorus yuccae (Endosymbiont) AY126637 Schizaphis graminum (P-endosymbiont) Z19056 Camponotus floridanus (Endosymbiont) X92549 Sitophilus zeamais (Endosymbiont) M85269 Sitophilus oryzae (Endosymbiont) AF005235 Sitophilus granarius (Endosymbiont) AY126638 S-clade 53.8% GC Glossina pallidipes (S-endosymbiont) M99060 Sitophilus rugicollis (Endosymbiont) AY126639 Proteus mirabilis AF008582 Providencia stuartii AF008581 Kluyvera ascorbata AF310219 E2 Edwarsiella ictaluri AF310622 Hafnia alvei M59155 Yersinia pestis AJ232238 Serratia liquefaciens AB004752 E3 Erwinia carotovora U80197 0.1 Citrobacter freundii AF025365 Klebsiella oxytoca AB004754 Enterobacter agglomerans AF1300913 E1 Salmonella bareilly U92196 Escherichia coli J01859 Figure 21 : Arbre phylogénétique optimal des endocytobiotes de Dryophthoridae. Modèle de Galtier et Gouy (1998) prenant en compte les hétérogénéités de taux de GC et de vitesse d'évolution entre les séquences.

88 III.2.4.6. Influence de l'échantillon de bactéries libres.

Des séquences d'autres espèces de bactéries libres, dont le branchement phylogénétique est connu, sont introduites successivement dans la topologie de référence. Nous avons ainsi vérifié que la vraisemblance maximale obtenue pour une séquence donnée correspond bien à la position phylogénétique connue pour celle-ci. Si l'on prend dans l'échantillon de bactéries libres les séquences données par Ahmad et al. (1990), des résultats tout à fait similaires sont obtenus. Les clades S et R révèlent néanmoins une attirance plus importante à l'intérieur même des entérobactéries, branchés sur Erwinia chrysanthemi. La vraisemblance maximale qui porte l'ensemble des endocytobiotes à l'extérieur des entérobactéries est toujours obtenue à la même position (8).

III.2.4.7. Taux d'évolutions relatifs

L'ADNr 16S de Buchnera avait déjà été décrite par Moran (1996) comme une séquence qui évolue beaucoup plus vite que les séquence 16S des bactéries libres apparentées (entérobactéries). Nous avons voulu savoir s’il en était de même pour les séquences des endocytobiotes de Dryophthoridae. Aussi, nous avons comparé les taux de subtitutions des endocytobiotes de Dryophthoridae avec les séquences (ou groupe de séquences) des entérobactéries ou avec les séquences des autres endocytobiotes d’insectes et ce, par rapport à la séquence de la bactérie libre externe Aeromonas haywardensis (AF015258). Ce test de comparaison a été efféctué grâce au logiciel RRTree développé par Robionson-Rechavik et Huchon (2000). L’hypothèse nulle Ho est vérifiée lorsque le taux de substitution (K1-0) du clade de séquences testé (1) est identique au taux de substitution (K2-0) du clade de référence(2), (K1-0 – K2-0 = 0). Les séquences d'ADNr 16S issus du clade R montrent des taux des substitutions plus élevés que ceux observés pour les entérobactéries, le clade S et le clade D (Tableau 7). Les taux de substitutions relatifs correspondant aux séquences 16S du clade D et du clade S ne sont pas significativement différents de ceux déterminés pour les entérobactéries.

Tableau 7 : Taux de substitutions des séquences d'ADNr 16S des trois clades d'endocytobiotes de Dryophthoridae relatif à d'autres clades appartenant aux γ-Protéobactérie avec comme outgroup Aeromonas (0). clade testé groupe de référence K1-0 K2-0 P-value (1) (2) clade D Pasteurella/Haemophilus 0.117 0.140 0.01 clade D Enterobacteriaceae 0.116 0.100 0.20 clade D Clade S 0.116 0.108 0.45 clade S Enterobacteriaceae 0.112 0.106 0.29 clade S Glossina pallidipes (endocytobiotes) 0,109 0.101 0,06 clade R Enterobacteriaceae 0.233 0.102 10-7 clade R Clade S 0.233 0.106 10-7 clade R Clade D 0.234 0.117 10-7 clade R Schizaphis graminum (endocytobiotes) 0.234 0.142 10-7 clade R Camponotus floridanus (endocytobiotes) 0.227 0.135 10-7 P-value correspond à la probabilité de Ho : K1-0 = K2-0

89 IV. Comparaison des génomes symbiotiques des endocytobiotes de Sitophilus oryzae (SOPE) et de Glossina pallidipes (Sodalis glossinidius)

Comme le fait apparaître l'étude phylogénétique, les endocytobiotes secondaires de la mouche tsé-tsé Glossina pallidipes (Sodalis glossinidius) sont fortement apparentés aux endocytobiotes des charançons Sitophilus (SOPE). En effet, quelle que soit la méthode phylogénique employée, la séquence de Sodalis glossinidius vient s'insérer à l'intérieur du clade S, entre les endocytobiotes de S. rugicollis et S. granarius. Ce résultat ne semble pas résulter d’un artéfact méthodologique. Les endocytobiotes de S. rugicollis et Glossina pallidipes possèdent donc un ancêtre commun. Cependant, il est important de rappeler que Sodalis glossinidius est un symbiote dit secondaire, qui a la possibilité d’être cultivé in-vitro alors que SOPE, symbiote dit primaire, demeure aujourd’hui incultivable malgré les très nombreuses tentatives. De même, les modes de transmissions sont différents, alors que SOPE connaît une transmission verticale transovarienne, Sodalis glossinidius est à l’opposé absent des tissus reproductifs même si la bactérie est transmise verticalement via une contamination intra-utérine des larves (Cheng et Aksoy, 1999). Comment dans ces contextes symbiotique et écologique différents, les génomes initialement identiques de Sodalis glossinidius, qui est hébergée par un hôte hématophage et de SOPE, qui est hébergé par un hôte inféodé aux graines de céréale ont-ils évolué ? Quels sont les gènes conservés et quels sont les gènes perdus ? Dans l’espoir de comprendre comment l’écologie de l’hôte influence la sélection et l’adaptation des génomes bactériens et comment la réduction initiale des génomes peut conduire à un mode de vie symbiotique, une analyse de génomique comparative a été réalisée en collaboration avec l’équipe américaine de Serap Aksoy, spécialisée sur le modèle de la mouche tsé-tsé (Yale University School of Medecine).

IV.1. Architecture des deux génomes symbiotiques

Afin d’inférer la composition génétique des deux endocytobiotes, une approche par hybridation hétérologue à l’aide d’une macro-puce E. coli a été menée. C’est une étude préliminaire à l’étude plus précise qui devrait être réalisée à partir des génomes complets bientôt séquencés. La macro-puce E. coli contient 4290 ORF dont la fonction génétique est déterminée pour 1962 d’entre eux. Au total, 2084 gènes orthologues sont détectés pour le génome de SOPE soit environ 70% du génome complet si l'on considère une taille de 3Mb (Charles et al., 1997) et si l’on suppose une moyenne de 1kb par gène. Sur ces 2084 orthologues détectés, 1450 ont un rôle connu chez E. coli, les 634 ORF restant n’ont que des fonctions hypothétiques. Par une étude similaire, le génome de Sodalis glossinidius d’une taille de 2Mb s’est hybridé à 1812 orthologues de E. coli (soit environ 90% du génome complet) qui inclut 1316 ORF aux fonctions connues (Tableau 8).

90 Tableau 8 : Catégories fonctionnelles et ORF détectées pour Sodalis glossinidius et SOPE. Données de Sodalis glossinidius (Akman et al, 2001) et de E. coli (Blattner et al., 1997) Nombre d'ORF (ou de gènes) détéctées Communes entre Sodalis Sodalis glossinidius et Fonctions et implications des gènes glossinidius SOPE E. coli SOPE Biosynthèse des Acides aminés 101 95 131 82 Métabolisme Central intermédiaire 126 123 188 104 Biosynthèse des cofacteurs 76 78 103 65 Métabolisme énergétique 166 193* 243 157 Catabolisme du Carbone 59 91* 130 52 Métabolisme des acides gras 28 39* 48 28 Fonctions de régulation 33 34 45 30 Processus cellulaire 116 104 188 92 Transport 188 231* 281 183 Réplication 75 78 115 63 Traduction 157 160 182 147 Transcription 37 40 55 31 Structure cellulaire 97 123* 182 82 Acides nucléiques 51 50 58 47 Membrane 6 11 13 6 Total (fonctionnels) 1316 (73%) 1450 (70%) 1962 (46%) 1169 Total (hypothétiques) 496 (27%) 634 (30%) 2328 (54%) 356 Total (détectés) 1812 2084 4290 1525 *Différence significative (p<0,05, test de Fisher) entre la proportion d’ORF codant pour une fonction donnée entre SOPE et Sodalis glossinidius.

IV.2. Divergence génétique entre SOPE et Sodalis glossinidius

L’étude comparative des ORF pour les deux symbiotes révèle que 1525 ORF sont communs aux deux organismes. Parmi ceux-ci 1169 possèdent une fonction connue chez E. coli (Tableau 8). Pour comprendre comment des différences biologique et écologique ont pu influencer la perte respective des gènes chez SOPE et Sodalis glossinidius, une analyse comparative des ORF détectées dans chaque catégorie a été menée. Une différence significative (test de Fisher) a été trouvée entre les deux génomes symbiotiques, quant au contenu génétique (proportions) alloué aux fonctions suivantes (Tableau 8) : - Métabolisme énergétique (p=0,0071) - Catabolisme du Carbone (p=0,00009) - Métabolisme des acides gras (p=0,0253) - Transport (p=0,00004) - Structure cellulaire (p=0,0073)

Il pourrait paraître abusif de comparer des proportions de gènes allouées à des fonctions entre deux organismes de tailles très différentes. En effet, pour assurer une fonction biologique, ce n'est pas tant le pourcentage de gènes alloués qui est important, mais plutôt le nombre absolu de gènes impliqués dans la fonction. Or dans notre cas d'étude, nous pouvons considérer des proportions, dans la mesure où celles-ci sont directement corrélées aux nombres d’ORF en raison du nombre de gènes fonctionnels détectés très voisins pour Sodalis glossinidius et SOPE (1316 et 1450 respectivement). Néanmoins la proportion d’ORF fonctionnelles détectées pour ces deux symbiotes (66 % pour Sodalis, 48 % pour SOPE) est une limitation quant aux conclusions à apporter, une part importante du génome de ces symbiotes n’étant jamais considérée dans l'analyse.

91

Chacun des deux génomes symbiotiques possède des gènes uniques « ancestraux », non communs aux deux génomes et fonctionnels chez E. coli. Pour Sodalis glossinidius, 11% des gènes fonctionnels sont uniques, il s’agit essentiellement de gènes impliqués dans : - les processus cellulaires (16% de ces gènes uniques) - le métabolisme central intermédiaire (15%) - la biosynthèse et le métabolisme des acides aminé (13%) Pour SOPE, 19% des gènes fonctionnels sont uniques, ils représentent essentiellement des gènes impliqués dans : - le transport (17%) - le catabolisme du carbone (14%) - la structure cellulaire (14%) - le métabolisme énergétique (13%) Par ailleurs, les gènes codants les facteurs de régulations σ 24 (rpoE), σ 54 (rpoN), σ 32 (rpoH), et σ 70 (rpoD) ont été détectés par hybridation dans les deux génomes symbiotiques, ce qui indique que ces deux bactéries pourraient répondre aux stimuli environnementaux.

IV.3. Capacités métaboliques

Les deux symbiotes semblent capables de synthétiser tous les d’acides aminés à l'exception de l’histidine chez SOPE, un acide aminé essentiel (hisGCFHI est absent), alors que le transporteur associé (gène hisP) est détecté, suggérant que l’histidine puisse être obtenue de l’insecte hôte et/ou via les grains de céréales. Sodalis glossinidius contrairement à SOPE ne révèle pas cette déficience, ce qui est attesté par la présence d'hisABCDFGHI et du transporteur associé à l’histidine (gène hisP). Ces résultats suggèrent chez SOPE un relâchement de la pression de sélection sur le gène hisGCFHI au cours de l’évolution ce qui à pu conduire à son inactivation et à son élimination. SOPE et Sodalis glossinidius se révèlent incapables de synthétiser l’acide glutamique alors que ses transporteurs (gltK, gltL et gltP) sont conservés. Même si cet acide aminé n’est pas essentiel, il est indispensable pour la production de l'Arginine, de la Proline et de la Glutamine. Les symbiotes doivent donc utiliser les transporteurs pour acquérir depuis le milieu extérieur les précurseurs nécessaires à cette biosynthèse. Il est à ce sujet intéressant de noter que 40 % des acides aminés totaux des grains de blé sont représentés par l’acide glutamique. La biosynthèse des nucléotides ainsi que leur métabolisme est possible pour ces deux symbiotes. De même pour la biosynthèse des acides gras initiée par l’acétyl CoA. La capacité des deux symbiotes se trouve déficiente pour la synthèse de la thiamine (B1) du folate et de la nicotinamide alors qu’elle est effective pour la production de la riboflavine, de la pyridoxine, de l’acide lipoïdique et du protohème. Concernant le métabolisme des sucres, les symbiotes ont conservé les gènes codant pour les isomérases (i.e. pgm, galE, araA) et les enzymes impliquées dans le métabolisme des sucres simple comme le glucose (i.e. glgC, galU, ptsG, malX, crr, pgi, prkB et mrsA). L’α- tréhalose, le sucre le plus abondant dans l’hémolymphe des insectes hôtes, peut également être synthétisé par les deux symbiotes. Sodalis glossinidius a perdu plusieurs gènes codant des enzymes impliquées dans le métabolisme intermédiaire des sucres et dans le métabolisme des sucres végétaux. À l’opposé, SOPE a conservé la majorité des gènes impliqués dans le catabolisme des sucres végétaux (β-D-glucosides) et ce symbiote est le seul à pouvoir hydrolyser les molécules comme la cellulobiose et les salicines. Sodalis glossinidius et SOPE possèdent l’activateur du glycolate (glcC), un produit de la respiration végétale, mais seul

92 SOPE peut convertir le glycolate et le phosphate en phosphoglucolate. De plus, SOPE a conservé la plupart des glycolates oxydases (glcCDB) alors que Sodalis glossinidius n’a conservé que glcC.

IV.4. Analyse comparée des génomes microbiens aux styles de vie différents

Afin de comprendre l’impact de différentes relations symbiotiques sur les fonctions associées aux génomes, les gènes orthologues sont regroupés en différentes catégories fonctionnelles et comparés aux actuelles séquences annotées d’une bactérie libre, E. coli (Blattner et al., 1997), d’endocytobiotes obligatoires, Wigglesworthia (Akman et al., 2002) et Buchnera (Shigenobu et al., 2000) et de la bactérie parasite Rickettsia (Figure 22).

Acides nuclˇiques, biosynth¸se et mˇtabolisme

Structures cellulaires

Transcription

Traduction

Replication Rickettsia Transport Buchnera Wigglesworthia Processus cellulaires SOPE Fonctions de rˇgulations Sodalis E. coli Mˇtabolisme des acides gras

Mˇtabolisme ˇnergˇtique

Biosyth¸se des cofacteurs

Mˇtabolisme central intermˇdiaire

Acides aminˇs, biosynth¸se et mˇtabolisme

0 5 10 15 20 25 30 % du Gˇnome dˇvouˇ chaque catˇgorie fonctionelle

Figure 22 : Analyse comparative des proportions du génome consacrées à chaque classe fonctionnelle chez la bactérie parasite Rickettsia, les endocytobiotes obligatoire Buchnera et Wigglesworthia, Sodalis glossinidius, SOPE, et l’enterobactérie libre E. coli.

Un fort pourcentage des génomes de SOPE et de Sodalis glossinidius est dédié à la biosynthèse et au métabolisme des acides aminés, au métabolisme énergétique et à la biosynthèse des cofacteurs comparée à l’allocation de ces fonctions pour la bactérie parasite Rickettsia dépendante de son hôte pour la plupart de ces fonctions. De plus, une faible part du génome de SOPE et de Sodalis glossinidius est dédié, comparé à l’entérobactérie libre E. coli, au métabolisme central intermédiaire (8% et 6% respectivement comparés à 9,7%), aux structures cellulaires (8% et 5% respectivement comparés à 9,4%) et aux processus cellulaires (7% et 6% respectivement comparés à 9,7%).

93 V. Taille de génome de M. hemipterus

L'analyse moléculaire des séquences des bactéries du clade R montre que celles-ci sont fortement AT riches (40,5 % GC pour l'ADNr16S contre 53,8 % pour les bactéries du clade S), plus riches en base A et T que la bactérie Buchnera (48,7 % GC pour le même gène). L'analyse phylogénétique montre de plus que ce clade pourrait être le clade de bactéries ancestrales (ce point sera abordé dans la discussion suivante). Si l'on considère qu'au cours de l'évolution intracellulaire des bactéries symbiotiques, celles-ci accumulent des bases A et T en même temps que leur génome se réduit, il est légitime de s'attendre à trouver une taille de génome minimale pour les bactéries du clade R. La comparaison avec les bactéries issues du clade S, dont la proximité phylogénétique a été établie, pourrait être très informative sur la chronologie du processus évolutif suivie par les endocytobiotes (puisque l'on suppose que les bactéries du clade S se sont associées aux Dryophthoridae plus récemment que les bactéries du clade R, cf discussion). La préparation des bactéries symbiotiques à partir des bactériomes doit se faire sur du matériel vivant. Or la plupart des endocytobiotes du clade R sont hébergés par des insectes tropicaux. Seules quelques espèces du genre Sphenophorus vivent en France, mais leur collecte n’est pas envisageable (la concentration de ces insectes est beaucoup trop faible). Une collecte de 200 larves de M. hemipterus et C. sordidus à donc été effectuée en Guadeloupe sur des stipes de bananier. Ces stipes avaient été coupés quelques mois auparavant afin de permettre le processus de décomposition favorable à la ponte et au développement des larves de ces insectes. Après la dissection des bactériomes et la purification des bactéries, huit blocs d'agarose pour chaque espèces contenant les endocytobiotes ont pu être obtenus.

Basées sur les travaux antérieurs de Charles et Ishikawa (1999) et Gil et al (2002) sur Buchnera plusieurs enzymes de restriction possédant un site de coupure GC riche (ApaI, RsrII, SmaI, I Ceu I) minimisant le nombre de coupures dans nos génomes AT riches ont été utilisées. Aucune digestion enzymatique correcte n’a pu être obtenue. Sous UV les gels révèlent cependant la présence de quantité importante d’ADN dans les puits contenant l’ADN symbiotique de M. hemipterus et des légères trainées au niveau de ces pistes. Ces observations pourraient indiquer que : (1) L’ADN bactérien est relativement inaccessible au travail des enzymes (présence de protéines associées); (2) L’ADN bactérien est en quantité insuffisante et les contaminations nucléaires de l'hôte sont importantes; (3) Aucun site de restriction des trois enzymes (RsrII, SmaI et I Ceu I) n'est présent dans les génomes des deux endocytobiotes, indiquant une taille de génome très réduite. Cependant ApaI possède un site de restriction à l'intérieur de l'ADNr 16S des deux endocytobiotes, suggérant donc plutôt un problème d'accessibilité du site.

Afin de ne pas perdre tous nos échantillons dans la recherche d'enzymes de restrictions adéquates, nous avons décidé de couper l’ADN bactérien par l'action modérée d'ultra violet (Charles et Ishikawa, 1999). Selon cette technique, les coupures sont aléatoires, mais statistiquement la plupart des chromosomes ne sont coupés qu'une seule fois si la dose d'irradiation reste faible. Ils sont donc linéarisés, et leur taille peut être déterminée par estimation du poids moléculaire de la bande observée en électrophorèse en champs pulsés. Après avoir mise au point la technique sur la bactérie symbiotique Buchnera (détermination des concentrations et des temps d'expositions aux UV), cette procédure à été appliquée aux

94 échantillons symbiotiques de M. hemipterus et C. sordidus. Mais encore une fois, quelque soit le temps de coupure réalisé (5 s à 3 min), l’ADN bactérien n'a pas pu être détecté sur les gels après coloration au BET. Cependant, nous avons pu tout de même observer une nette diminution de la quantité d’ADN retenue dans les puits, ce qui semblait indiquer que l’ADN avait bien été linéarisé (Figure 23). Puisque la détection aux UV de l’ADN symbiotique, vraisemblablement en très petite quantité, est impossible, nous avons alors tenté d'utiliser une sonde radioactive et la technique du Southern blot (Figure 23).

1 2 3 4 7 8 9 10 11 4 ’ 7 ’ 8

630 kb

100 kb

Figure 23 : Détermination par PFGE après coupures aux UV de la taille des génomes des endocytobiotes de M. hemipterus et C. sordidus. Coloration au BET pour le gel de gauche et blot correspondant avec la sonde 16S radioactive pour le gel de droite. Pistes (1) Chromosomes YPH 755 de S. cerevisiae ,(2) Ladder 1kb, (3) Ladder λ, (4) et (4') Endocytobiote de M. hemiterus (1 min 30 s sous UV), (7) et (7') Endocytobiotes de C. sordidus (1 min 30 s sous UV), (8) et (8') Endocytobiotes de C. sordidus (3 min sous UV).

Une sonde radioactive a été réalisée à partir du fragment de l’ADNr 16S amplifié par PCR à partir des amorces 008F et 1390R sur l’ADN du bactériome de M. hemipterus. La membrane hybridée n’a pas révélé la présence d’un smear aux tailles attendues pour les deux espèces. En théorie, la sonde hybridée à toutes les molécules d'ADNr 16S présentes sur le gel, aurait dû produire une smear dont le sommet aurait indiqué la taille des chromosomes simplement linéarisés. Mais la trainée produite se situe aux alentours de 100 kb, alors qu’une tache à environ 630 kb n’est présente que sur la moitié de la piste, ce qui est sans doute sur son origine artéfactuelle. Les résultats obtenus laissent encore supposer une taille de génome relativement faible (<1Mb), néanmoins la qualité des gels obtenu n'est pas satisfaisante pour annoncer une taille précise, et ces résultats n'ont pas été publiés

Le matériel disponible a rapidement été consommé et les investigations n’ont donc pas pu être poursuivies. Il serait donc souhaitable de disposer d’un matériel plus abondant, si l’on souhaite réaliser la détermination de la taille des génomes par restriction enzymatique.

95 VI. Proposition de nom de genre « Candidatus » Nardonnella pour les endocytobiotes du clade R

Les endocytobiotes du clade R sont caractéristiques de certaines espèces de la famille des Dryophthoridae. En accord avec Murray et Stackebrandt (1995), des microorganismes partiellement caractérisés et non-cultivables dans des milieux artificiels de laboratoires peuvent porter la désignation « Candidatus ». En conséquence, nous proposons de nommer la lignée des endocytobiotes du clade R des Dryophthoridae : Candidatus Nardonnella, en l’honneur du Professeur Paul Nardon qui a été le premier à caractériser les endocytobiotes des espèces Metamasius hemipterus et Cosmopolites sordidus (Nardon et al., 1985) et qui a consacré sa carrière à l'étude des charançons du genre Sitophilus. La description du nouveau genre bactérien « Candidatus » Nardonnella est la suivante : Position phylogénétique : γ3-Protéobactérie basée sur une phylogénie établie à partir d’un alignement de séquences d’ADNr 16S. Milieu de culture : incultivable in-vitro, mésophile Réaction de Gram : Gram-négatives Morphologie : de forme pléiomorphique (bacille, flexueux ou spiralé) de 3-4 à 200 µm de long , 1-2 µm de diamètre et entouré de substances polysaccharidiques. Ces bactéries sont hébergées dans le cytoplasme des bactériocytes des espèces suivantes : Yuccaborus frontalis, Rhynchophorus palmarum, Cosmopolites sordidus, Metamasius hemipterus, Metamasius callizona, Sphenophorus abbreviata et Scyphophorus yuccae.

96 Discussion

97 I. Caractérisation de la symbiose chez les Dryophthoridae

Les analyses histologiques et moléculaires réalisées dans ce travail ont révélé l’étendue de la symbiose chez les charançons Dryophthoridae. A l’exception de Sitophilus linearis qui s’est révélé dépourvu de symbiote intracellulaire en l’absence de toute structure bactériocytaire et vraisemblablement de S. vateriae, il est remarquable que toutes les espèces étudiées soient symbiotiques. L’étendue de la symbiose dans ce groupe d’insectes peut être interprétée comme une preuve indirecte du rôle très important qu’elle a joué et qu’elle joue encore dans l’évolution de ces espèces. D’un point de vue histologique, les structures symbiotiques chez les Dryophthoridae se sont révélées d'une très grande homogénéité morphologique. En effet, le bactériome larvaire est invariablement situé juste en arrière de la tête à la périphérie du proventricule, à la jonction des intestins antérieur et moyen. Chez l'adulte, les bactériomes sont situés à l'apex des caeca mésentériques des deux sexes et à l'apex des ovarioles chez les femelles. L’organe de la symbiose, le bactériome, est toujours constitué de bactériocytes, des cellules géantes polyploïdes qui hébergent les endocytobiotes ainsi que de plus petites cellules, les cellules interstitielles, dont le rôle reste mal connu. La structure et la localisation très conservées chez les espèces étudiées laisse présager d’une possible homogénéité morphogénétique, même si cet aspect n'a pas été analysé au cours de ce travail. A l’opposé de l'homogénéité tissulaire de l'hôte, une grande hétérogénéité dans la forme et la taille des endocytobiotes est observée. Il semble assez difficile de mettre en relation ce polymorphisme bactérien avec une adaptation à un environnement hôte particulier. A titre d'exemple, S. oryzae et S. zeamais sont deux espèces jumelles très difficiles à discerner (Nardon et Nardon, 2002) qui ont exactement la même écologie et qui pourtant possèdent des endocytobiotes de formes très différentes (filamenteux pour S. oryzae et spiralés pour S. zeamais). Cette hétérogénéité ne reflèterait donc pas précisément une adaptation, mais elle serait plutôt le résultat de mutations génétiques affectant un ou plusieurs gènes bactériens impliqués dans la division cellulaire (Nardon et al., 2003).

L’histologie membranaire des endocytobiotes, au travers de la microscopie électronique, nous apporte des éléments de discussion sur l'établissement de la symbiose chez les Dryophthoridae et les interactions entre les deux partenaires associés. A l'exemple de ce qui s'est passé pour la bactérie Buchnera aphidicola chez le puceron une bactérie qui rentre (vraisemblablement par phagocytose) dans le cytoplasme d'une cellule hôte eucaryote se trouve ensuite entourée d'une membrane vacuolaire hôte. Ainsi, le système de membrane se compose chez Buchnera de trois membranes, la plus externe M3 (correspondant à la membrane vacuolaire), entourant la bactérie, puis M2 et M1, les deux membranes de la bactérie Gram-négative. Classiquement, l'existence de deux membranes chez les endocytobiotes de Sitophilus, a été interprété comme le résultat de la perte de la membrane vacuolaire (M3), et cette perte était perçue comme une preuve de l'ancienneté de l'association (Nardon et Nardon, 1998). En d'autres termes les endocytobiotes qui montraient deux membranes étaient considérés très intégrés à l'hôte (car échappant au sytème immunitaire de l'hôte, par exemple). Or dans ce travail, nous avons montré, que les endocytobiotes des Sitophilus se sont associés récemment (25 MA), contrairement à ce que l'on pensait. Les endocytobiotes les plus primitifs (Nardonella) semble à l'inverse associés depuis 100 MA mais ils montrent également deux membranes. On peut supposer que celles-ci soient de type M1 et M3, suite à

98 la perte de la membrane M2. L'existence de deux membranes M1 et M2 vraisemblablement chez les endocytobiotes des Sitophilus ne serait donc pas le signe d'une forte intégration et l'on peut dire que la perte probable de la membrane M3 reste mal comprise. Car en effet, notre hypothèse basée sur les observations de Buchnera et de Nardonella propose que les endocytobiotes intégrés pourraient tirer profit de la membrane hôte extérieure M3. Celle-ci permettrait l'adressage de certaines protéines hôtes à l'endocytobiotes par exemple.

L’observation de formes vésiculaires sur les images de microscopie (Figure 11-C et 11- D) obtenues à partir des endocytobiotes du genre Nardonella pourrait être un argument en faveur de l’existence d’une membrane vacuolaire M3 chez ces espèces (perte de M2). De telles figures ou des vésicules se forment dans l’espace périplasmique de bactéries Gram- négatives n’ont jamais été observées. A ce sujet il serait intéressant d'observer le système membranaire chez les endocytobiotes Buchnera du puceron Baizongia pistacea dont le génome extrêmement réduit et riche en base A et T, comme Nardonella, montrent l'absence de certains gènes impliqués dans la biosynthèse de la membrane externe de la bactérie (Van Ham et al., 2003). Ainsi il serait intéressant de savoir si ces Buchnera "dégénérées possèdent un système à deux membranes identique à Nardonnella. D'autres observations faites chez les endocytobiotes de Cosmopolites sordidus, plaident en faveur de la perte de la membrane M2. Ainsi sur certaines images (Figure 11-B) on peut observer entourées par une membrane lâche, 2 formes bactériennes à membrane simple. A l'inverse, si l'on observe des images de Buchnera chez le puceron A. pisum (obtenues dans les mêmes conditions, Figure 11-F) on peut, d'une part dénombrer très clairement les trois membranes et observer d'autre part que la membrane M3, même lorsque celle-ci entoure plusieurs bactéries, reste très cohésive à M2. La membrane lâche observée chez Cosmopolites sordidus pourrait cependant être interprétée comme une membrane externe M2 contenant la bactérie spiralée, caractéristique de cette espèce et coupée dans le plan à plusieurs reprises. Mais sous cette hypothèse, la laxité de la membrane externe de la bactérie est encore plus troublante (non décrit dans la littérature). Alors cette laxité membranaire serait vraisemblablement le résultat d’un artéfact de fixation, bien qu'aucun artéfact de ce genre n'ait été observé chez d'autres espèces.

Les nombreux points de contacts entre les deux membranes observés (M1 et M2) chez les endocytobiotes de M. hemipterus, C. sordidus et de façon plus ténue chez S. zeamais et S. rugicollis trahiraient l’importance chez ces espèces des échanges hôtes/symbiotes au niveau du bactériocyte. En effet, il existe chez les bactéries Gram-négatives plusieurs systèmes de sécrétion faisant intervenir des complexes protéiques intermembranaires pouvant être à l’origine des points de contacts observés. Chez la bactérie E. coli, proche des endocytobiotes étudiés, le complexe AcrB-AcrA-TolC court-circuite le périplasme pour exporter dans le milieu de nombreux composés toxiques (Murakami et al., 2002). Chez Sodalis glossinidius (symbiote secondaire de la mouche tsé-tsé) ainsi que chez les endocytobiotes de S. zeamais, l’existence d’un système de sécrétion de type III à pu être mise en évidence (Dale et al., 2002). Ce système fait intervenir un complexe intermembranaire qui intervient lors des phases infectieuses. Il serait intéressant de rechercher par immuno-marquage, par exemple, quelle est l'implication de ces protéines au niveau des points de contacts. Il est notable que les complexes protéiques intermembranaires décrit précédement chez les bactéries sont impliqués dans des réactions de type pathogène. L'origine pathogénique de l'association symbiotique sera discutée dans la suite de ce chapitre.

99 II. Histoire évolutive de la symbiose chez les Dryophthoridae

Après notre analyse descriptive, une analyse phylogénétique a permis de révéler l'existence de trois clades symbiotiques d'endocytobiotes (R, S et D), ce qui indique que les endocytobiotes de Dryophthoridae dérivent de trois espèces bactériennes distinctes. Néanmoins, ces trois associations, bien qu'elles semblent s'être établies à différentes périodes, impliquent des bactéries très proches phylogénétiquement (surtout les clades R et S). Ces deux derniers clades sont de plus très apparentés à d’autres endocytobiotes d’insectes (pucerons, glossines et fourmis). Il se dégage donc de notre analyse phylogénétique l'existence d'un clade de bactéries symbiotiques d'insectes situé entre les entérobactéries et les Pasteurellacea. Cette découverte est en accord avec les précèdents travaux de Charles et al. (2001). L’hypothèse d’un clade souche (« stem clade ») qui est proposée, suggère qu'un groupe restreint de bactéries ancêtres des γ3-Protéobactéries possédant des capacités métaboliques particulières ait permis d’établir des symbioses chez les insectes, et ceci à différent moment de l’évolution. En d’autres termes, il y a eu, et il existe toujours, parmi les γ3-Protéobactéries actuelles, un réservoir de bactéries capables à tout moment d’induire chez les insectes des symbioses de type intracellulaire. Ces bactéries doivent d'abord avoir une certaine prédisposition pour entrer en contact avec les insectes, elles doivent être présentes dans l’environnement des insectes et posséder des capacités pathogéniques, facilitant la mise en contact intime (invasion du milieu intracellulaire). Ensuite ces bactéries doivent induire des endocytobioses, c'est à dire dans un premier temps, ne pas être éliminées par les défenses immunitaires de l’insecte tout en ne proliférant que de façon modérée. Enfin les capacités métaboliques de ces bactéries (biosynthèse de vitamines, d'acides aminés…) doivent leur permettre l'établissement de relations commensales. Le système de sécrétion de type III fonctionel identifié chez Sodalis glossinidius et SOPE (Dale et al., 2002) est étroitement apparenté à ceux présents chez les bactéries pathogènes Salmonella et Shigella. Ce système de sécrétion est requis pour l’exportation des protéines pathogènes et des toxines à l’intérieur de la cellule hôte parasitée. De plus ces résultats indiquent que les Sodalis spp. ainsi que les endocytobiotes du clade S possèdent toujours des capacités infectieuses. Ces capacités ont pu être mise en évidence à la suite d’irradiations de larves de Sitophilus. Lorsque les gènes impliqués dans le contrôle des endocytobiotes (localisation et densité) sont endommagés, les bactéries prolifèrent sans contrôle dans tout le corps de l’insecte et conduisent à la mort de celui-ci (Nardon, 1978). L’origine pathogénique de la symbiose est également soutenue par l’étroite parenté phylogénétique déterminée entre les endocytobiotes du clade D et les bactéries libres parasites Haemophilus et Pasteurella. Cependant, le groupe de bactéries à l'origine des symbioses intracellulaires n'est vraisemblablement pas un groupe de parasites obligatoires pour deux raisons. D'une part, les orientations génomiques (la perte de gène particuliers) d’un symbiote et d’un parasite obligatoire sont très différentes (cf Introduction § IV.5.5.). Et d'autre part, l’évolution génomique des bactéries intracellulaires devient rapidement irréversible en raison de la perte des fonctions de recombinaisons et de réparation de l’ADN en particulier.

Les endocytobiotes du clade R ont été identifiés chez 6 des 9 genres de Dryophthoridae analysés. Yuccaborus frontalis, l’insecte le plus ancestral de notre jeu de donnée (lignée dont l'émergence est la plus ancienne) (Figure 24), possède des endocytobiotes qui appartiennent à ce clade. La phylogénie des insectes hôtes a été réalisées par Farrell et collaborateurs (Université de Harvard) à partir de trois gènes, le gène mitochondrial COI, le gène nucléaire codant le facteur d'élongation α1 et le gène ribosomique 28S (O'Meara et Farrell, communication personnelle). Une calibration a été effectuée en cinq points de l'arbre grâce à

100 des fossiles de charançons afin d'estimer l'âge minimum de divergence de ces groupes. Et de façon inverse, l'âge maximum théorique pour la divergence de la famille des Dryophthoridae, à été estimé d'après la datation de fossiles de palmiers (122 MA), car l'ancêtre des Dryophthoridae était inféodé aux palmiers. Enfin, l'horloge moléculaire du gène COI a été utilisée (1,5% de divergence par million d'années pour les coléoptères, (Farrell et al., 2001). Ainsi, l'âge de divergence de la famille des Dryophthoridae est estimé à 100 MA environ, et celui corespondant à la divergence du genre Sitophilus est estimé à 25 MA.

Figure 24 : Phylogénie des insectes hôtes réalisée par Farrell et collaborateur (Communication personelle) à partir du gène mitochondrial COI, du gène nucléaire codant le facteur d'élongation α1 et du gène ribosomique 28S. Une calibration a été éffectuée en cinq points de l'arbre grâce à des fossiles de charançons. L'horloge moléculaire du gène COI a été utilisée (1,5% de divergence par million d'année pour les coléoptères, (Farrell et al., 2001). La taille des charançons est proportionelle à leur taille actuelle.

La comparaison entre l'arbre des hôtes et celui des endocytobiotes du clade R révèle sans ambiguité une congruence qui traduit une évolution parallèle entre les insectes et leurs symbiotes. Ainsi, les deux éléments, congruence et présence d'endocytobiotes du clade R chez l'insecte le plus ancestral, plaident en faveur d'une association symbiotique ancestrale qui s’est vraisemblablement réalisée chez l’ancêtre des Dryophthoridae à partir d’une γ3- Protéobactérie dont les endocytobiotes du clade R sont les descendants actuels directs. Grâce aux datations hôtes, si l'on considère que la divergence des endocytobiotes du clades R correspond à la divergence de la famille des Dryophthoridae (100 MA) et si la

101 divergence des endocytobiotes du clades S correspond à la divergence des espèces du genre Sitophilus (25 MA), il nous a donc été possible de calculer les taux de substitutions absolus, correspondant à la molécule d'ADNr 16S, pour les clades bactériens R et S. Le clade D n'a pas pu être daté car une seule espèce (Diocalandra frumenti) est commune aux deux analyses phylogénétiques. Le taux de substitutions pour le clade R, estimé d'après le modèle de Galtier et Gouy (1998), est de 0.128 substitutions/site par 100 MA. Ce taux est bien supérieur à celui calculé pour Buchnera (0.058 substitutions/site par 100 MY), ainsi que celui calculé pour les entérobactéries (0.007 to 0.018 substitutions/site par 100 MY), (Clark et al., 1999). Le taux de substitution de Buchnera pour cette même molécule avait pourtant été décrit comme un taux exceptionnellement fort (Moran, 1996). Cette vitesse d'évolution importante est le résultat d'un manque de recombinaison génétique (bactéries intracellulaires isolées dans les bactériocytes), de la fixation importante de mutations délétères par dérive génétique (petite population bactérienne transmise à la descendance), ainsi que d'un taux de mutations élevé (pertes de nombreux gènes impliqués dans la réparation de l'ADN) (Wernegreen, 2002). Cette importante vitesse d’évolution, via des mutations ou des délétions, pourrait être favorable au contournement des défenses de l’hôtes, principalement durant les premières phase de la symbiogénèse. Les bactéries du clade R possèdent de plus un très faible taux de GC (40,5 % GC sur l’ADNr 16S). Ce taux de GC n'est vraisemblablement pas lié à l'existence d'un ancêtre AT riche mais plutôt à un important biais mutationel vers les bases A et T. En effet, le taux de GC estimé au nœud ancestral pour les clades R et S et de 55,3 % (Figure 24). En 100 millions d’années le taux de GC de l’ADNr 16S des endocytobiotes du clade R à donc chuté de 15%, ce qui illustre parfaitement le phénomène de biais mutationnel précédemment décrit chez les bactéries intracellulaires. Ce biais mutationnel n’est vraisemblablement pas constant au cours de l’évolution des génomes symbiotiques. Il suit probablement une courbe à l’allure d’une cloche. Initialement faible, il augmente de façon importante après que certains gènes aient été affectés puis il diminue en raison des contraintes liées au code génétique et aux contraintes fonctionnelles des protéines indispensables (durant les dernières 50 MA le biais AT semble avoir diminué chez Buchnera, (Clark et al., 1999 ; Tamas et al., 2002). Parallèlement à ce changement de composition en base, le génome symbiotique des bactéries du clade R aurait vraisemblablement subit une diminution importante de sa taille. Malheureusement, cette hypothèse n'a pu que très partiellement être validée au cours de ce travail. A l'inverse, SOPE acquis depuis moins de 25 MA possède une taille de génome encore importante (3 Mb) et révèle un taux de GC important (54 % GC) comparé aux taux de GC habituellement rencontrés chez les bactéries intracellulaires

Les endocytobiotes du clade S évoluent à une vitesse proche de celle du clade R (0,119 substitutions/site par 100 MA et 0.128 substitutions/site par 100 MA respectivement). Or les vitesses relatives du clade S et des entérobactéries ne sont pas significativement différentes. Ce décalage important entre les vitesses d’évolutions relatives (identiques pour les endocytobiotes du clade S et les entérobactéries) et absolues (très supérieures pour les endocytobiotes du clade S) indique sans ambiguïté que la vitesse d’évolution à connue récemment (< 25 MA) une très brutale augmentation dans la lignée des bactéries qui à conduit aux bactéries symbiotiques du clade S. Ce changement évolutif dans la vitesse d’évolution des génomes bactériens est probablement à mettre en relation avec le passage à la vie intracellulaire et au mode de transmission verticale des bactéries symbiotiques. Pour les bactéries du clade R, les vitesses d'évolution relative et absolue sont toutes les deux supérieures à celles des entérobactéries car l'association est plus ancienne (l'accumulation de mutations est suffisamment importante pour rendre significatif le test de vitesse d'évolution relative).

102 A l'issue de ces résultats, il paraît très vraisemblable que les endocytobiotes des clades S et D soient issus de remplacements plutôt que d'acquisitions indépendantes. Cette hypothèse de remplacement de symbiotes à déjà été émise par Fukatsu (1996) à propos des levures symbiotiques des pucerons Hamiltonaphis styraci. Par ailleurs, des études ont mit l’accent sur le rôle bénéfique des endocytobiotes secondaires sur la fitness de quelques espèces d’aphididés (Chen et al., 2000 ; Sabater et al., 2001 ; Koga et al., 2003) et de glossinidés (Montllor et al., 2002). Les réductions massives qui ont affecté les génomes symbiotiques, vraisemblablement durant les phases précoces de la symbiose (Wernegreen, 2002), ont entrainé une réduction de l’adaptabilité et de la flexibilité des fonctions bactériennes, et donc une diminution des potentialités évolutives de l’hôte. Mais, ces érosions drastiques du génome des symbiotes pourraient faciliter le recrutement d’un nouveau symbiote possédant certaines des capacités perdues par l’ancien symbiote, ou des nouvelles, et permettre à l’hôte d’exploiter potentiellement de nouvelles niches (Moran et al., 2003). Un remplacement signifie qu’à un certain moment une bactérie devient plus compétitive ou qu’elle agit positivement sur la fitness de l’hôte de façon beaucoup plus importante que l’autre. Dans cette situation, un type bactérien pourrait éliminer l’autre (ou les autres). Ce mécanisme pourrait être favorisé lors d'une réduction importante de la population des insectes, facilitant par la dérive, la disparition d'un type bactérien. Concevoir l’établissement d’une symbiose consécutive à une perte est une hypothèse alternative qui est également envisageable. Si l’on conçoit que les voies métaboliques mises en place lors de la précédente symbiose facilitent l’installation d’une nouvelle symbiose. La première partie de ce travail a été consacrée à l'étude de la symbiose à l'échelle de la famille des Dryophthoridae, nous nous sommes ensuite attaché à une analyse plus ciblée pour caractériser les endocytobiotes de l'espèce modèle du laboratoire Sitophilus oryzae.

III. Analyse de génomique comparative entre les endocytobiotes des charançons Sitophilus (SOPE) et ceux des glossines (Sodalis glossinidius)

Comme les précédentes études l’avaient déjà montré et comme cette étude le confirme, SOPE et Sodalis sont étroitement apparentés (Aksoy et al., 1997 ; Heddi et al., 1998). Les résultats phylogénétiques semblent indiquer que les endocytobiotes de Sitophilus rugicollis et de Glossina pallidipes possèdent un ancêtre commun qui a divergé il y a moins de 25 MA. La forte homologie des séquences d'ADNr 16S trouvée par Aksoy et al (1997) à l’intérieur du groupe des Sodalis (environ 0,6 % de divergence) laisse présager d’un transfert relativement récent entre les différentes glossines hôtes. A l’inverse, ont peut observer une importante divergence à l’intérieur du clade S (environ 6%) et une congruence entre la phylogénie des endocytobiotes (clade S) et celle de leur hôtes respectifs (les Sitophilus), ce qui laisse penser à une transmission verticale des endocytobiotes et à une acquisition plus ancienne. L’insertion de Glossina pallidipes à l’intérieur du clade S ainsi que la congruence observée entre ce clade et le clade des insectes Sitophilus laissent penser que les endocytobiotes secondaires de la mouche tsé-tsé pourraient provenir d'un transfert horizontal depuis l’ancêtre de S. rugicollis. Cependant, les aires de distributions originelles disjointes, déduites des études fossiles pour les mouches tsé-tsé (Afrique) et les Sitophilus (Inde), suggèrent plutôt un transfert indirect via des vecteurs de ces bactéries. Au cours des premières phases de la symbiose, des endocytobiotes qui possédaient des capacités pathogéniques ont pu être transférés horizontalement à de nouveaux hôtes, phylogénétiquement distants, partageant

103 les mêmes écologies alimentaires ou possédant les mêmes prédateurs (mêmes insectes parasitoides par exemple), ou encore entretenant les mêmes relations mutualistes avec des vecteurs potentiels (plantes…). Cependant, même si Sodalis glossinidius et SOPE ont un ancêtre commun récent (moins de 25 MA), ces endocytobiotes ont actuellement des caractéristiques bien distinctes. Sodalis glossinidius est un symbiote dit secondaire, qui a la possibilité d’être cultivé in vitro alors que SOPE, symbiote dit primaire, demeure aujourd’hui incultivable malgré les très nombreuses tentatives. Les modes de transmissions sont différents, alors que SOPE connaît une transmission verticale transovarienne, Sodalis glossinidius est à l’opposé absent des tissus reproductifs même si la bactérie est transmise verticalement via une contamination intra- utérine des larves. Sodalis glossinidius est à la fois intra et extracellulaire, localisée dans l’intestin, les muscles, les glandes salivaires, le tissu adipeux et dans l’hémolymphe (Cheng et Aksoy, 1999). SOPE est toujours intracellulaire et sa localisation est strictement restreinte, sous le contrôle génétique de l’hôte, aux bactériocytes (Nardon et al., 1998).

Disposer rapidement d’une information sur le contenu génétique d’un organisme grâce à une technique d’hybridation sur macropuce a déjà été utilisé précédemment avec succès (Akman et Aksoy, 2001 ; Dziejman et al., 2002). Mais cette technique pose un certain nombre de problèmes et de contraintes techniques. La reconnaissance par hybridation de certains gènes peut être affectée négativement par des mutations ou des évènements d’insertion- délétion. L’hybridation de génomes extrêmement biaisés en base AT peut conduire à des détections artéfactuelles. Afin de limiter ces problèmes, la comparaison doit être effectuée entre génomes au taux de GC très proches et le génome témoin (utilisé pour réaliser la puce) doit être le plus proche phylogénétiquement possible des génomes comparés afin que le plus grand nombre de gènes identifiés soient réellement des gènes orthologues. En effet, cette technique ne permet pas d’identifier les gènes qui ne sont pas présents chez l’organisme témoin. Le choix du génome témoin est donc un problème crucial. En effet, même si celui-ci possède un ancêtre commun avec les organismes étudiés, il a lui aussi évolué selon une orientation particulière (perte, chez l'organisme témoin, de gènes que les lignées d'organismes étudiées ont conservé, par exemple). Ce travail de génomique comparative visant à étudier les génomes de SOPE et Sodalis glossinidius a été réalisé en prenant E. coli comme organisme de référence (car des puces commerciales étaient déjà disponibles). Mais notre étude phylogénétique montre sans ambiguité que E. coli est paraphylétique et non monophylétique avec les deux endocytobiotes. Il serait donc fort intéressant de réaliser, à l’avenir, cette même analyse comparative avec une autre entérobactérie séparée de ces deux endocytobiotes par une distance phylogénétique équivalente à celle qui sépare SOPE/Sodalis de E. coli. Ceci afin de limiter le nombre de gènes présents chez les endocytobiotes étudiés et non détéctés car non présents chez E. coli. Des résultats tout à fait intéressants ont cependant été obtenus.

L’existence de gènes uniques (gènes détectés pour un seul des deux endocytobiotes) chez SOPE et Sodalis glossinidius traduit une évolution génétique différente prise par ces deux endocytobiotes, à partir de l’ancêtre commun libre (supposé avoir une composition génétique proche d’E. coli). Cependant, sachant que le nombre de gènes uniques chez SOPE est déterminé sur 2/3 du génome (contre 90 % du génome de Sodalis glossinidius), il est fort probable que ce nombre de gènes uniques soit sous-estimé. Cette plus forte proportion de gènes non détectés (vraisemblablement non présents chez E. coli) chez SOPE est un élément qui laisse penser que la bactérie SOPE à connue une évolution plus divergente par rapport au mode de vie libre d’E. coli que Sodalis glossinidius. Ceci est peut-être à mettre en relation

104 avec le mode de vie strictement intracellulaire de SOPE alors que Sodalis glossinidius connaît une phase libre extracellulaire. Même si SOPE et Sodalis glossinidius ont connu une évolution différente, elles possèdent néanmoins une composition génétique globalement similaire. Ces endocytobiotes ont conservé un grand nombre de gènes de ménage tels que les gènes impliqués dans la traduction et les modifications post-traductionelles, dans le processus cellulaire, la transcription ainsi que la biosynthèse des nucléotides. Ces fonctions cellulaires semblent conservées chez les bactéries mutualistes et commensales, contrairement aux bactéries parasites, qui exploitent leurs hôtes pour beaucoup de ces ressources. De plus, la forte conservation des processus de traduction, contrairement aux processus de transcription, suppose une importante régulation génétique de la traduction pour SOPE et Sodalis. La conservation des gènes impliqués dans les fonctions de régulation comme les facteurs de régulations σ conforte l’établissement récent de la symbiose. Car des mutualistes obligatoires, qui vivent à l’abri des fluctuations environnementales à l’intérieur des cellules de l’hôte perdent généralement ces gènes de régulation devenus inutiles (Rio et al., 2003). Des différences génétiques entre les deux endocytobiotes ont cependant pu être détectées et sont vraisemblablement à mettre en relation avec l'écologie de l'hôte. Ainsi, le nombre plus élevé de gènes détectés chez SOPE pour le métabolisme énergétique ainsi que pour le métabolisme des acides gras pourrait être dû au régime céréalier des charançons. En effet, les lipides, qui sont en quantité importante dans le sang dont se nourrissent les glossines, fournissent plus d’énergie que les hydrocarbonates des plantes car ils sont sous une forme plus réduite (Ziegler, 1996). La dégradation génétique des voies liées au métabolisme des acides gras chez Sodalis est vraisemblablement le reflet d’une importante production de lipides chez l’hôte. SOPE avec une capacité plus importante pour le catabolisme carboné que Sodalis, est capable de métaboliser les sucres végétaux des graines de céréales qui comprennent pas moins de 70 % d’amidon alors qu’ils sont très pauvre en lipide. A l'inverse, Sodalis a perdu les gènes impliqués dans le métabolisme des sucres végétaux en réponse au régime alimentaire de l’hôte dépourvu de tels sucres. Le nombre plus important de gènes uniques impliqués dans le processus cellulaire (probablement une adaptation nécessaire pour la vie intra- et extracellulaire), le métabolisme central intermédiaire et dans le métabolisme et la biosynthèse des acides aminés détectés chez Sodalis, et dans le catabolisme du carbone, les structures cellulaires, le métabolisme énergétique et le transport et le métabolisme des acides gras, détectés chez SOPE, illustre clairement une orientation génique distincte, qui pourrait être perçue comme une domestication bactérienne par l’hôte.

IV. La symbiose et l’écologie des Dryophthoridae

L'étroite relation de symbiose entre les insectes et leurs bactéries intracellulaires génère un processus de coévolution qui va affecter d'une part, l'évolution de la composition génétique des endocytobiotes, comme nous venons de le voir, et d'autre part, l'évolution et l'adaptation des insectes à leurs milieux. C'est ce dernier point que nous allons maintenant développer au travers de l'histoire évolutive des insectes Dryophthoridae. S. linearis qui est dépourvu d’endocytobiote se nourrit de graines de tamarin mais ne peut être élévés au laboratoire sur des graines de céréales. Or il est frappant de constater que S. rugicollis qui possède des endocytobiotes appartenant au clade S et qui vit naturellement sur graines d’Eugenia (graine dont la composition nutritionnelle est, comparée aux céréales,

105 équilibrée et non déficiente (Delobel et Grenier, 1993)) peut se développer tout à fait normalement sur des graines de céréales. En effet, nous avons pu élever S. rugicollis au laboratoire sur des grains de maïs, avec une durée de développement d’environ 30 jours comparable à la durée de développement de cette espèce sur graine d’Eugenia et comparable à la durée de développement des autres Sitophilus (30 jours environ à 27,5 °C et 75% d'humidité). Même si la fécondité n'a pas été rigoureusement déterminée, elle semble très proche de celle des Sitophilus des céréales. Le blé semble cependant inadéquat au développement complet de la larve. Mais cette observatoin semble plus liée à la taille des grains de blé qu'à leur composition. En effet, les larves de S. rugicollis sont plus grosses que celles des autres Sitophilus céréaliers.

Ce passage possible d’une graine d'Eugenia à une graine de céréale illustre le fait que le génome symbiotique apporte non seulement une capacité métabolique nouvelle mais une potentialité écologique nouvelle permettant à l’insecte d’exploiter des niches écologiques nouvelles et de ce fait, de se diversifier. Les coléoptères connurent une vaste radiation au début de l’aire Tertiaire, il y a environ 65 MA alors que les angiospermes se diversifiaient également (Farrell, 1998). Cette double diversification est vraisemblablement le résultat d’une coévolution globale entre les insectes et les angiospermes à laquelle la symbiose a vraisemblablement participé, en permettant à l’insecte hôte d’exploiter de nouvelles plantes (détoxification des produits secondaires des plantes, comblement des déficiences ou des déséquilibres nutritionel…). Cette hypothèse a été évaluée en essayant d'analyser la congruence des trois phylogénies : celle des endocytobiotes, celle des insectes hôtes et celle des plantes hôtes) La distribution des plantes hôtes sur l’arbre phylogénétique des Dryophthoridae indique que la plante hôte ancestrale est une monocotylédone plus précisément un palmier (Arecaceae). C’est assez récemment dans l’histoire évolutive des Dryophthoridae, au cours de l’Oligocène-Miocène (30 à 10 MA), que six changements de plantes hôtes vont se produire (Figure 24).

Trois changements indépendants vont se produire depuis les Arecacées vers les Poacées durant l’expansion des écosystèmes herbeux. Les deux premiers concernent les Sphenophorus à l’Oligocène sur le continent américain. Durant cette même période, sur ce continent, sous un climat aride, deux autres changements vont se produire. Un changement depuis les palmiers jusqu’aux Cactées et Astéracées pour Cactophagus et Rhodobaenus (accompagné d’une radiation de 70 espèces) puis un second vers les Agaves pour Scyphophorus. Le troisième shift sur Poacées est plus tardif, il y a environ 25 milions d’années (au Miocène) concerne l’ancêtre des Sitophilus sur le continent Indien (Zimmerman, 1993). Ils s’associent de façon concomitante aux graines de monocotylédone qui donneront plus tard les céréales et vraisemblablement à une nouvelle bactérie symbiotique, qui remplace la précédente. Les bactéries de la lignée du clade R sont éliminées aux dépends des endocytobiotes de la lignée du clade S à la suite d’une perte de symbiose ou d’un remplacement compétitif. A ce sujet, aucune trace d’endocytobiotes du clade R n’a pu être retrouvée chez les Sitophilus. L’absence d’endocytobiotes chez S. linearis, espèce aposymbiotique, peut être interprétée comme une perte de la symbiose associée au changement alimentaire depuis les graines de monocotylédones, ancestrale chez les Sitophilus, jusqu’aux graines de dicotylédone, les graines de tamarin à la composition nutritionnelle bien mieux équilibrée que celle des céréales (Delobel et Grenier, 1993). Ce changement s’est produit durant le Miocène sur le continent africain peu après le shift sur graines de monocotylédone. D’un point de vue tout à fait finaliste, nous pourrions dire que l’insecte se développant sur des graines à la composition satisfaisante n’éprouve pas le besoin de posséder des endocytobiotes pour pallier un

106 quelconque déficit ou déséquilibre. La pression de sélection pour maintenir les endocytobiotes n’est plus suffisante, l’apport métabolique de la bactérie n’est plus nécessaire alors que son hébergement à l’intérieur du bactériome est coûteux, la perte des bactéries symbiotiques est alors possible.

En raison de la variabilité des types de plantes hôtes correspondant à chaque type bactérien, on ne peut pas dire que la présence d’un type particulier d’endocytobiotes prédispose à l’exploitation d’un type particulier de plante hôte. D'une façon évidente les changements de plantes hôtes ne sont pas corrélés à la phylogénie des insectes hôtes (absence de congruence). En d’autres termes, les Dryophthoridae n’ont pas dans leur ensemble subit de cospéciation avec leur plante hôte. Cependant, au sein de groupes particuliers, la congruence est retrouvée. Le passage sur Asteraceae pour le genre Rhodobaenus (non présent dans notre analyse) à été suivi par la radiation d'environ 70 espèces (O'Meara, 2001). Il faudrait donc voir dans la symbiose un puissant facteur évolutif pour l'insecte, permettant à celui-ci des changements de plantes hôtes phylogénétiquement éloignées, par exemple. Outre la symbiose, les facteurs qui déterminent ces changements sont encore méconnus, il pourrait s’agir de similarité biochimique entre les plantes ou bien encore de la potentialité de dispersion de l’hôte (Strong et al., 1984).

107 Conclusion : une petite histoire de la symbiose

108

Voici comment à la lumière de ce travail et des connaissances accumulées depuis les premières observations de Buchner dans les années 60, il est possible d'envisager l'histoire d'une symbiose entre un groupe d'insectes (les charançons Dryopthoridae) et une bactérie Gram-négative. L'histoire reste très simpliste, mais elle a cependant l'avantage de faire émerger des questions théoriques très stimulantes pour l'esprit et donc intéressantes pour la recherche. Comme nous avons pu le suggérer, et comme cela est communément admis dans la littérature, la relation qui initie la symbiose est probablement une relation de type pathogène. C'est-à-dire que la bactérie ancêtre possèdait un pouvoir infectieux lui permettant de rentrer en contact intime (intracellulaire) avec l'insecte. Il ne s'agit pas de n'importe quelle bactérie, mais vraisemblablement d'une bactérie du groupe restreint des γ3-Protéobactéries. Cette bactérie devait être présente dans l'environnement de l'insecte et possèder des prédispositions métaboliques particulières (qu'il reste à déterminer) pour induire des symbioses. Il est frappant de constater que ce type de bactéries a été capable d'induire des symbioses chez de très nombreux insectes taxonomiquement distants (homoptères, coléoptères, diptères, hyménoptères). Dans cette phase précose de la symbiogenèse, l’hôte est l’entité "agressée" alors que la bactérie est assimilée à un "parasite". Mais l’hôte peut trouver profit de son nouveau "parasite". Cette bactérie apporte à l'insecte une nouveauté génétique importante, potentiellement utile à son évolution. L'insecte peut ainsi bénéficier de nouvelles capacités métaboliques et explorer de nouvelles niches laissées vierges par exemple, ou bien encore trouver dans son co-génome (le génome de la bactérie) les moyens de se défendre contre d’autres agresseurs. D'un point de vue génétique, la contamination de la lignée germinale par la bactérie offre à l'insecte un moyen très efficace (l'hérédité maternelle) de transmettre à sa descendance le materiel génétique bactérien. Cette relation intime a bien évidement de la même façon un impact sur l'endocytobiote. La bactérie qui vit dans les cellules de son hôte va inéluctablement voir son génome se restreindre, en réponse au relâchement des pressions de sélections et aux mécanismes moléculaires qui induisent des biais dans la composition (% en base A et T qui augmente) et dans la vitesse d'évolution (vitesse qui augmente) de son génome. La dégradation de son génome devient si forte que l'endocytobiote n'est plus capable de se développer à l'extérieur de son hôte (les tentatives de cultures in-vitro des endocytobiotes intégrés restent dans l'échec). Son indépendance perdue, son sort est définitivement lié à son hôte. Certe, l'hôte voit également son autonomie réduite. En l'absence de ses endocytobiotes, les Sitophilus par exemple voient leur fitness diminuer. Néanmoins, le sort évolutif de l'hôte n'est semble-t-il pas complétement figé. Des bactéries candidates, aux compétances bien plus intactes et étendues, pourraient disputer la place aux endocytobiotes intégrés et les éliminer, procurant ainsi à l'insecte de nouvelles perspectives évolutives. Au cours de la symbiose, les statuts relatifs (parasite, parasité) semble s'inverser. L'hôte qui "subi" initialement l'agression de la bactérie, voit au bout du compte son rôle se transformer en une sorte de "parasite" de ces propres endocytobiotes. Même s'il demeure dépendant de ses symbiotes intégrés, il a la possibilité de renouveler ses capacités génétiques en acquérant un nouvel endocytobiote. L'endocytobiote perd quant à lui toutes les capacités qu'ont les bactéries libres de réparer ou d'intégrer des nouvelles fonctions.

Du strict point de vue du gène, le profit évolutif est-il équitablement réparti entre l'hôte et le symbiote ? Cette question ne doit cependant pas faire oublier que cette individualisation des partenaires est tout à fait arbitraire. Comme nous avons pu le rapporter, l'association symbiotique en particulier, et en quelque sorte la gravité du monde vivant. L'individu perd du même coup toute signification biologique. L’association symbiotique peut être perçue comme

109 la manifestation d’un échec des bactéries pathogènes, qui "pensant" profiter d’un organisme se trouve exploitée par celui-ci. Car quel est l’avenir évolutif d’une bactérie symbiotique ? Dégradation progressive de son génome, perte totale de son indépendance, élimination et/ou remplacement par d’autres bactéries. La symbiose apparaît comme un magnifique élan évolutif pour l’hôte mais comme un superbe cul de sac évolutif pour le symbiote. L'avenir évolutif des gènes symbiotiques, pourrait être alors, à l'instar de certains gènes des mitochondries et des plastes, d'intégrer le génome nucléaire. Cette intégration pourrait se réaliser dans le génome des ovocytes léguant ainsi à l'ensemble des cellules de l'insecte les gènes symbiotiques.

110 Références bibliographiques

111

Ahmad, S., Weisburg, W.G. et Jensen, R.A. Evolution of aromatic amino acid biosynthesis and application to the fine-tuned phylogenetic positioning of enteric bacteria. J. Bacteriol., 1990, Vol. 172(2), p. 1051-1061. Akman, L. et Aksoy, S. A novel application of gene arrays : Escherichia coli array provides insight into the biology of the obligate endosymbiont of tsetse flies. Proc. Nat. Acad. Sci. USA, 2001, Vol. 98(13), p. 7546-7551. Akman, L., Yamashita, A., Watanabe, H., Oshima, K., Shiba, T., Hattori, M. et Aksoy, S. Genome sequence of the endocellular obligate symbiont of tsetse flies, Wigglesworthia glossinidia. Nat Genet, 2002, Vol. 32(3), p. 402-407. Aksoy, S. Molecular characteristics of the endosymbionts of tsetse flies: 16S rDNA locus and over-expression of chaperonins. Mol. Biol., 1995, Vol. 4, p. 23-29. Aksoy, S., Chen, X. et Hypsa, V. Phylogeny and potential transmission routes of midgut- associated endosymbionts of tsetse (Diptera: Glossinidae). Insect Mol. Biol., 1997, Vol. 6, p. 183-190. Alonso-Zarazaga, M.A. et Lyal, C.H.C. A World catalogue of family and genera of Curculionoidea (Insecta, Coleoptera) (Excepting Scolitidae and Platipodidae). 1999, Barcelona: Entomopraxis. 315 p. Altschul, S.F., Gish, W., Miller, W., Myers, E.W. et Lipman, D.J. Basic local alignment search tool. J Mol Biol, 1990, Vol. 215(3), p. 403-410. Andersson, J.O. et Andersson, S.G.E. Genome degradation is an ongoing process in Rickettsia. Mol Biol Evol, 1999, Vol. 16(9), p. 1178-1191. Andersson, S.G.E. et Kurland, C.G. Reductive evolution of resident genomes. Trends Microbiol., 1998, Vol. 6, p. 263-268. Bandi, C., Sironi, M., Damiani, G., Magrassi, L., Nalepa, C.A. et Laudani, U. The establishement of intracelluar symbiosis in an ancestor of cockroaches and termites. Proc. R. Soc. Lond. (B), 1995, Vol. 259, p. 293-299. Bernardi, G. The isochore organization of the human genome. Ann. Rev. Genet., 1989, Vol. 23, p. 637-661. Bernardi, G., Mouchiroud, D., Gautier, C. et Bernardi, G. Compositional patterns in vertebrate genomes: conservation and change in evolution. J. Mol. Evol., 1988, Vol. 28, p. 7-18. Blattner, F.R., Plunkett, G., Bloch, C.A., Perna, N.T., Burland, V., Riley, M., Collado- Vides, J., Glasner, J.D., Rode, C.K., Mayhew, G.F., Gregor, J., Davis, N.W., Kirkpatrick, H.A., Goeden, M.A., Rose, D.J., Mau, B. et Shao, Y. The complete genome sequence of Escherichia coli K-12. Science, 1997, Vol. 277, p. 1432-1434. Bordenstein, S.R., O'Hara, F.P. et Werren, J.H. Wolbachia-induced incompatibility precedes other hybrid incompatibilities in Nasonia. Nature, 2001, Vol. 409, p. 707- 710. Bracho, A.M., Martinez-Torres, D., Moya, A. et Latorre, A. Discovery and molecular characterization of a plasmid localized in Buchnera sp. bacterial endosymbiont of the aphid Rhopalosiphum padi. J. Mol. Evol., 1995, Vol. 41(1), p. 67-73. Breeuwer, J.A.J. et Werren, J.H. Hybrid breakdown betwenn two haplodipoid species: role of nuclear and cytoplasmic genes. Evolution, 1995, Vol. 49, p. 705-717. Breeuwers, J.A.J. et Werren, J.H. Microorganisms associated with chromosome destruction and reproductive isolation between two insect species. Nature, 1990, Vol. 346, p. 558- 560. Buchner, P. Endosymbiosis of with plant microorganisms. 1965, New York. 901 p. Bui, E.T.N., Bradley, P.J. et Johnson, P.J. A common evolutionary origin for mitochondria and hydrogenosomes. Proc. Nat. Acad. Sci. USA, 1996, Vol. 93, p. 9651-9656.

112 Bullini, L. et Nascetti, G. Speciation by hybridation in phasmids and other . Can. J. Zool., 1990, Vol. 68, p. 1747-1760. Bush, G.L. Modes of animal speciation. Annu. Rev. Ecol. Syst., 1975, Vol. 6, p. 339-364. Campbell, B.C., Bragg, T.S. et Turner, C.E. Phylogeny of symbiotic bacteria of four weevil species (Coleoptera : ) based on analysis of 16S ribosomal DNA. Insect Biochem., 1992, Vol. 22(5), p. 415-421. Cavalier Smith, C. The simultaneous symbiotic origin of mitochondria, chloroplasts and microbodies. In: Endocytobiology III. 1987, Lee, J. J. and Fredrick, J. F.: New York. Cavalli-Sforza, L.L. et Edwards, A.W. Phylogenetic analysis. Model and estimation procedures. Am. J. Hum. Genet., 1967, Vol. 19, p. 223. Charles, H., Condemine, G., Nardon, C. et Nardon, P. Genome size characterization of the principal endocellular symbiotic bacteria of the weevil Sitophilus oryzae, using pulsed field gel electrophoresis. Insect Biochemistry and Molecular Biology, 1997, Vol. 27(4), p. 345-350. Charles, H., Heddi, A. et Rahbé, Y. A putative insect intracelllar endosymbiont stem clade, whithin the Enterobacteriaceae, infered from phylogenetic analysis based on a heterogeneous model of DNA evolution. C.R. Acad. Sci. Paris, 2001, Vol. 324, p. 489-494. Charles, H. et Ishikawa, H. Physical and genetic map of the genome of Buchnera, the primary endosymbiont of the pea aphid Acyrthosiphon pisum. J. Mol. Evol., 1999, Vol. 48, p. 142-150. Chen, D.Q., Clytia, B., Montllor, C.B. et Pucell, A.H. Fitness effects of two facultative endosymbiotic bacteria on the pea aphid, Acyrthosiphon pisum, and the blue alfalfa aphid, A. kondoi. Ent. Exp. Appl., 2000, Vol. 95, p. 315-323. Cheng, Q. et Aksoy, S. Tissue tropism, transmission and expression of foreign genes in vivo in midgut symbionts of tsetse flies. Insect Mol. Biol., 1999, Vol. 8(1), p. 125-132. Cheng, T.C. Is parasitism symbiosis ? A definition of terms and the evolution of concepts. In: Parasite-Host Association: Coexistence or conflict ? 1991. p. 15-36. Clark, M.A., Moran, N.A. et Baumann, P. Sequence evolution in bacterial endosymbionts having extreme base compositions. Mol. Biol. Evol., 1999, Vol. 16(11), p. 1586-1598. Combes, C. Interactions durables. Ecologie et évolution du parasitisme. 1995, Paris: Masson. 524 p. Crozier, R.H. et Crozier, Y.C. The mitochondrial genome of the honeybee Apis mellifera: complete sequence and genome organisation. Genetics, 1993, Vol. 113, p. 97-117. Dale, C., Plague, G.R., Wang, B., Ochman, H. et Moran, N.A. Type III secretion systems and the evolution of mutualistic endosymbiosis. Proc. Nat. Acad. Sci. USA, 2002, Vol. 99, p. 12397-12402. Dale, C., Yong, S.A., Haydon, D.T., Welburn, S.C. The insect endosymbiont Sodalis glossinidius utilizes a type III secretion system for cell invasion. Proc. Nat. Acad. Sci. USA, 2001, Vol. 98, p. 1883-1888. Dash, G.A., Weiss, E. et Chang, K.P. Endosymbionts of insects. 1984. David, J. Importance évolutive du comportement alimentaire et du comportement de ponte chez les insectes. In: Les mécanismes éthologiques de l'évolution. 1977, Masson: Paris. p. 34-46. De Bary, A. De la symbiose. Revue Inter. Sci., 1879, Vol. 3, p. 301-309. De Duve, C. Construire une cellule. Essai sur la nature et l'origine de la vie. InterEdition ed. 1990, Paris. 156 p. Delobel, B. et Grenier, A.M. Effect of non-cereal food on cereal weevils and tamarind pod weevil (Coleoptera: Curculionidae). J. Stored Prod. Res., 1993, Vol. 29(1), p. 7-14.

113 Delsol, M., Parent, J.P., Monterde, R., Ruget, C., Exbrayat, J.M., Sentis, P., Boudchiche, L. et Nicollin, J. L'origine des espèces aujourd'hui. L'espèce existe-elle? L'impasse ponctualiste. 1995, Paris: Boubée. 361 p. Dieckmann, U. et Doebeli, M. On the origin of species by sympatric speciation. Nature, 1999, Vol. 400, p. 354-357. Dobzhansky, T. Genetics of the evolutionary process. 1970, New York: Columbia University Press p. Doolittle, W.F. Fun with genealogy. Proc. Nat. Acad. Sci. USA, 1997, Vol. 94, p. 12751- 12753. Doolittle, W.F. A paradigm gets shifty. Nature, 1998, Vol. 392, p. 15-16. Douglas, A.E. Symbiotic Interactions. 1994, New York: Oxford Univ. Press p. Ducluzeau, R. et Raibaud, P. Ecologie microbienne du tube digestif. 1979, Paris: Masson p. Dziejman, M., Balon, E., Boyd, D., Fraser, C.M., Heidelberg, J.F. et Mekalanos, J.J. Comparative genomic analysis of Vibrio cholerae: genes that correlate with cholera endemic and pandemic disease. Proc. Natl. Acad. Sci. USA, 2002, Vol. 99, p. 1556- 1561. Ehrlich, P.R. et Raven, P.H. Butterflies and plants: a study in coevolution. Evolution, 1964, Vol. 18, p. 586-608. Erwin, T.L. Biodiversity at its utmost: Tropical forest . In: Biodiversity II : Understanding and Protecting Our Biological Ressources, Reaka-Kudla M. L. , W.D.E., and Wilson E. O., Editor. 1997, Joseph Henry Press: Washington. p. 27-40. Esteban-Duran, J., Yela, J.L., Beitia-Crespo, F. et Jiménez-Alvarez, A. Biologia del curculionido ferruginoso de las palmeras Rhynchophorus ferrugineus (Olivier) en laboratorio y campo: ciclo en cautividad, peculiaridades biologicas en su zona de introducction en Espana y métodos biologicos de deteccion y posible control (Coleoptera: Curculionidae: Rhychophorinae). Bol. San. Veg. Plagas, 1998, Vol. 24, p. 737-748. Esteban-Duran, J., Yela, J.L., Beitia-Crespo, F. et Jiménez-Alvarez, A. Curculionidos exoticos susceptibles de ser introducidos en Espana y otros paises de la Union Europea a través de vegetales importados (Coleoptera: Curculionidae: Rhychophorinae). Bol. San. Veg. Plagas, 1998b, Vol. 24, p. 737-748. Farrell, B.D. "Inordinate fondness" explained: why are there so many beetles? Science, 1998, Vol. 281, p. 555-559. Farrell, B.D., Mitter, C. et Futuyma, D. Diversification at the insect-plant interface. BioScience, 1992, Vol. 42(1), p. 34-42. Farrell, B.D., Sequeira, A.S., O'Meara, B., Normark, B.B., Chung, J. et Jordal, B.H. The evolution of agriculture in beetles (Curculionidae: Scolytinae and platypodini). Evol. Int. J. Org., 2001, Vol. 55, p. 2011-2027. Febvay, G., Liadouze, I., Guillaud, J. et Bonnot, G. Analysis of energetic amino acid metabolism in Acyrthosiphon pisum: a multidimensional approach to amino acid metabolism studies in aphids. Arch. Insect Biochem. Physiol., 1995, Vol. 29, p. 45-69. Felsenstein, J. Evolutionary tree from DNA sequences: a maximum likelihood approach. J. Mol. Evol., 1981, Vol. 17, p. 368-376. Felsenstein, J. PHYLIP: phylogeny inference package. Version 3.5. Distributed by author, Departement of Genetics, University of Washington, Seattle. PHYLIP: phylogeny inference package. Version 3.5. Distributed by author, Departement of Genetics, University of Washington, Seattle., 1993. Fiala-Médioni, A. et Le Pennec, M. Structural adaptations in the gill of the Japanese subduction zone bivalves (Vesicomyidae) Calyptogena phaseoliformis and Calyptogena laubieri. Oceanologica Acta, 1988, Vol. 11(2), p. 185-192.

114 Forterre, P. et Philippe, H. Where is the root of the universal tree of life? BioEssays, 1999, Vol. 21, p. 871-879. Frank, A.C., Amiri, H. et Andersson, S.G.E. Genome deterioration: loss of repeated sequences and accumulation of junk DNA. Genetica, 2002, Vol. 115(1), p. 1-12. Frank, J.H. et Thomas, M.C. Metamasius callizona (Chevrolat) (Coleoptera: Curculionidae), an immigrant pest, destroys bromeliads in Florida. Can. Entomol., 1994, Vol. 126, p. 673-682. Fukatsu, T. et Ishikawa, H. Phylogenetic position of yeast-like symbiont of hamiltonaphis styraci (Homoptera, aphididae) based on 18S rDNA sequence. Insect Biochem. Molec. Biol. , 1996, Vol. 26(4), p. 383-388. Galtier, N. L'approche statistique en phylogénie moléculaire : influence des compositions en bases variables. Thèse de doctorat Université Lyon I, 1997, p. 1-151. Galtier, N. et Gouy, M. Inferring phylogenies from DNA sequences of unequal base compositions. Proc. Natl. Acad. Sci. U S A, 1995, Vol. 92(24), p. 11317-11321. Galtier, N. et Gouy, M. Inferring pattern and process : maximum-likelihood implementation of a nonhomogeneous model of DNA sequence evolution for phylogenetic analysis. Mol. Biol. Evol., 1998, Vol. 15(7), p. 871-879. Galtier, N., Gouy, M. et Gautier, C. SEAVIEW and PHYLO_WIN: two graphic tools for sequence alignment and molecular phylogeny. Comput. Appl. Biosci., 1996, Vol. 12(6), p. 543-548. Galtier, N., Tourasse, N. et Gouy, M. A nonhyperthermophilic common ancestor to extant life forms. Science, 1999, Vol. 283(5399), p. 220-221. Gasnier-Fauchet, F. et Nardon, P. Comparison of methionine metabolism in symbiotic and aposymbiotic larvae of Sitophilus oryzae L. (Coleoptera : curculionidae) - Involvement of the symbiotic bacteria in the oxidation of methionine. Comp. Biochem. Physiol., 1986, Vol. 85B, p. 251-254. Gavrilets, S. et Waxman, D. Sympatric speciation by sexual conflict. Proc. Natl. Acad. Sci. USA, 2002, Vol. 99(16), p. 10533-10538. Génermont, J. Les animaux à reproduction uniparentale. Les problèmes de l'espèce dans le règne animal. 1980, Paris: Société Zoologique de France. 287-372 p. Giblin-Davis, R.M., Oehlschlager, A.C., Perez, A., Gries, G., Gries, R., Weilssling, T.J., Chinchilla, C.M., Pena, J.E., Hallett, R.H., Pierce, H.D. et Gonzalez, L.M. Chemical and behavioral ecology of palm weevils (Curculionidae: Rhynchophorinae). Florida Entomologist, 1996, Vol. 79(2), p. 153-. Gil, R., Sabater, B., Latorre, A., Silva, F. et Moya, A. Extreme genome reduction in Buchnera spp.: toward the minimal genome needed for symbiotic life. Proc. Natl. Acad. Sci. USA, 2002, Vol. 99(2), p. 4454-4458. Giordano, R., Jackson, J.J. et Robertson, H.M. The role of Wolbachia bacteria in reproductive incompatibilities and hybrid zones of Diabrotica beetles and Gryllus crickets. Proc. Nat. Acad. Sci. USA, 1997, Vol. 94, p. 11439-11444. Grenier, A.M., Nardon, C. et Nardon, P. The role of symbiotes in flight activity of Sitophilus weevils. Entomol. Exp. Appl., 1994, Vol. 70, p. 201-208. Grenier, A.M., Nardon, P. et Bonnot, G. Importance de la symbiose dans la croissance des populations de Sitophilus oryzae L. (Coléoptère Curculionidae). Etude théorique et expérimentale. Acta Oecologica Oecol. Applic., 1986, Vol. 7, p. 93-110. Grenier, S., Pintureau, B., Heddi, A., Lassablière, F., Jager, C., Louis, C. et Khatchadourian, C. Successful horizontal transfer of Wolbachia symbionts between Trichogramma wasps. Proc. R. Soc. Lond. B, 1998, Vol. 265, p. 1441-1445. Griffiths, G.W. et Beck, S.D. Intracellular symbiotes of the pea aphid, Acyrthosiphon pisum. J. Insect Physiol., 1973, Vol. 19, p. 75.

115 Hall, J.L., Ramanis, Z. et Luck, D.J. Basal body/centriolar DNA: molecular genetic studies in Chlamydomonas. Cell, 1989, Vol. 59, p. 121-132. Heddi, A. Etude chez Sitophilus oryzae (Coléoptère, Curculionide) de l'influence des bactéries symbiotiques sur le métabolisme énergétique mitochondrial. Thèse de doctorat INSA de Lyon, 1990,, p. 1-151. Heddi, A., Charles, H. et Khatchadourian, C. Intracellular bacterial symbiosis in the genus Sitophilus: the 'biological individual' concept revisited. Res. Microbiol., 2001, Vol. 152, p. 431-437. Heddi, A., Charles, H., Khatchadourian, C., Bonnot, G. et Nardon, P. Molecular characterization of the principal symbiotic bacteria of the weevil Sitophilus oryzae: a peculiar G + C content of an endocytobiotic DNA. J. Mol. Evol., 1998, Vol. 47, p. 52- 61. Heddi, A., Grenier, A.M., Khatchadourian, C., Charles, H. et Nardon, P. Four intracellular genomes direct weevil biology: Nuclear, mitochondrial, principal endosymbionts, and Wolbachia. Proc. Natl. Acad. Sci., USA, 1999, Vol. 96, p. 6814- 6819. Heddi, A., Lefebvre, F. et Nardon, P. Effect of endocytobiotic bacteria on mitochondrial enzymatic activities in the weevil Sitophilus oryzae. Insect Biochem. Molec. Biol., 1993, Vol. 23(3), p. 403-411. Henry, S.M. et Block, R.H. The sulphur metabolism of insects. Metabolism of the sulfur amino acids and related compounds in the German cockroach, Blattella germanica (L.). Contr. Boyce Thompson Inst. Pl. Res., 1961, Vol. 21, p. 129-144. Herdman, M. The evolution of bacterial genomes. In: T. Cavalier-Smith (ed.). The evolution of genome size. John Willey & Sons, Inc., New York. 1985,, p. 37-68. Higashi, M., Takimoto, G. et Yamamura, N. Sympatric speciation by sexual selection. Nature, 1999, Vol. 402, p. 523-526. Hurst, G.D.D. et Randerson, P. Parasitic Sexe Puppeteers. Sci. Am., 2002, Vol. 286, p. 56- 61. Jacob, F. Le jeu des possibles : essai sur la diversité du vivant. 1981, Paris: Fayard. 135 p. Jacquard, A. Le rôle du scientifique dans la société. Journée éthique du département Bioscience de l'INSA de Lyon, 2003. Jeon, K.W. Integration of bacterial endosymbionts in Amoebae. In : International review of cytology, 1983, Vol. Supplement 14, p. 29-47. Jeyaprakash, A. et Hoy, M.A. Long PCR improves Wolbachia DNA amplification: wsp sequences found in 76% of sixty-three species. Insect Mol. Biol., 2000, Vol. 9, p. 393-405. Jiggins, F.M., Hurst, G.D.D., Dolman, C.E. et Majerus, M.E.N. High-prevalence male- killing Wolbachia in the butterfly Acraea encedana. J. Evol. Biol., 2000, Vol. 13, p. 495-501. Jukes, T.H. et Cantor, C.R. Evolution of protein molecules. Munro, H. N. ed. Mammalian protein metabolism. 1969, New York: Academic Press. Kimura, M. A simple method for estimating evolutionary rates of base substitution through comparative studies of nucleotide sequences. J. Mol. Evol., 1980, Vol. 16, p. 111-120. Koga, R., Tsuchida, K. et Fukatsu, T. Changing partners in an obligate symbiosis: a facultative endosymbiont can compensate for loss of the essential endosymbiont Buchnera in an aphid. Proc. R. Soc. London Ser. B, 2003, Vol. in press. Kondrashov, A.S. et Kondrashov, F.A. Interaction with quantitative traits in the course of sympatric speciation. Nature, 1999, Vol. 400, p. 351-354.

116 Lai, C.Y., Baumann, L. et Baumann, P. Amplification of trpEG: adaptation of Buchnera aphidicola to an endosymbiotic association with aphids. Proc. Natl. Acad. Sci. USA, 1994, Vol. 91, p. 95616-95623. Lake, J.A. et Rivera, M.C. Was the nucleus the first endosymbiont ? Proc. Nat. Acad. Sci. USA, 1994, Vol. 91, p. 2880-2881. Laviolette, P. et Nardon, P. Action des rayons gamma du Cobalt 60 sur la mortalité et la fertilité des adultes d'un charançon du riz. Bull. Biol. Fr. Belg., 1963, Vol. 97, p. 305- 33. Lefèvre, C., Charles, H., Vallier, A., Delobel, B., Farrell, B. et Heddi, A. Endosymbiont phylogenesis in the Dryophthoridae weevils: Evidence for bacterial replacement. Mol. Biol. Evol., 2004, Vol. in press. Li, P. et Bousquet, J. Relative-rate test for nucleotide substitutions betwee two lineages. Mol. Biol. Evol., 1992, Vol. 9, p. 1185-1189. Littell, R.C., Milliken, G.A., Stroup, W.W. et Wolfinger, R.D. SAS system for mixted models. SAS institute, 1996. Lockhart, P.J., Steel, M.A., Hendy, M.D. et Penny, D. Recovering evolutionary trees under a more realistic model of sequence evolution. Mol. Biol. Evol., 1994, Vol. 11, p. 605- 612. Lopez-Garcia, P. et Moreira, D. Metabolic symbiosis at the origin of eukaryotes. Trends Biochem Sci, 1999, Vol. 24(3), p. 88-93. Louis, C. Cytologie et cytochimie du mycétome de Pseudococcus maritimus. C. R. Acad. Sci. Paris, 1967, Vol. 265, p. 437-440. Mahé, J. et Devilliers, C. La chrono-espèce, conception chrono-dynamique de l'espèce, conséquence d'une stratégie de rupture au niveau de la spéciation. In: Modalités, rythmes et mécanismes de l'évolution biologique. 1983, Colloques internationaux du CNRS. p. 175-180. Maniloff, J. The minimal cell genome : "on being the right size". Proc. Natl. Acad. Sci., USA, 1996, Vol. 93, p. 10004-10006. Mansour, K. Preliminary studies on the bacteral cell-mass (accessory cell-mass) of Calandra oryzae (Lynn.) : the rice weevil. Q.J. Microsc. Sc., 1930, Vol. 73, p. 421-436. Mansour, K. On the so-called symbiotic relationship between Coleopterous insects and intracellular micro-organisms. Q. J. Microsc. Sci., 1934, Vol. 77, p. 255-272. Mansour, K. On the microorganisms free and the infected Calandra granaria. Bull. Soc. Roy. Entomol. Egypt, 1935, Vol. 19, p. 290-306. Margulis, L. Symbiosis in cell evolution. San Fransisco : Freeman W.H., 1981. Margulis, L. Symbiosis in cell evolution. Microbial communities in the archean and proterozoic eons. 2nd Ed. 1993, New York: Freeman, W.H. 419 p. Martin, W. et Müller, M. The hydrogen hypothesis for the first eukaryote. Nature, 1998, Vol. 392, p. 37-41. Masterson, R.V., Russell, P.R. et Atherly, A.G. Nitrogen fixation (nif) genes and large plasmids of Rhizobium japonicum. J. Bact., 1982, Vol. 152(2), p. 928-931. Maynard Smith, J. Sympatric speciation. Am. Nat., 1966, Vol. 100, p. 637-650. Maynard Smith, J. Generating novelty by symbiosis. Nature, 1989, Vol. 341, p. 224-225. Mayr, E. Population, espèces et évolution. 1974, Paris: Hermann. 496 p. Mereschkowski, C. La plante considérée comme un complexe symbiotique. Bulletin de la Société des Sciences Naturelles Ouest de la France, 1920, Vol. 6, p. 17-21. Montllor, C.B., Maxmen, A. et Purcell, A.H. Facultative bacterial endosymbionts benefit pea aphids Acyrthosiphon pisum under heat stress. Ecol. Entomol., 2002, Vol. 27, p. 189-195.

117 Moran, N. et Wernegreen, J. Lifestyle evolution in symbiotic bacteria: insights from genomics. Tree, 2000, Vol. 15(8), p. 321-326. Moran, N.A. Accelerated evolution and Muller's rachet in endosymbiotic bacteria. Proc. Natl. Acad. Sci. USA, 1996, Vol. 93, p. 2873-2878. Moran, N.A. et Mira, A. The process of genome shrinkage in the obligate symbiont Buchnera aphidicola. Genome Biol., 2001, Vol. 2(12). Moran, N.A., Munson, M.A., Baumann, P. et Ishikawa, H. A molecular clock in endosymbiotic bacteria is calibrated using the insect hosts. Proc. Roy. Soc. London B, 1993, Vol. 253, p. 167-171. Moran, N.A., Plague, G.R., Sandstrom, J.P. et Wilcox, J.L. A genomic perspective on nutriment provisioning by bacterial symbionts of insects. Proc. Nat. Acad. Sci. USA Early Edition, 2003, Vol. www.pnas.org/cgi/doi/10.1073/pnas.2135345100. Moreira, D. et Lopez-Garcia, P. Symbiosis between methanogenic Archaea and ∂- Proteobacteria as the origin of eukaryotes: The syntrophic hypothesis. J. Mol. Evol., 1998, Vol. 47, p. 517-530. Moreno, E. In search of a bacterial species definition. Rev. Biol. Trop., 1997, Vol. 45(2), p. 753-771. Morin, E. La méthode tome II: La vie de la vie. 1980, Paris: Seuil. 484 p. Munson, M.A., Baumann, P., Clark, M.A., Baumann, L., Moran, N., Voegtlin, D.J. et Campbell, B.C. Evidence for the establishment of Aphid eubacterium endosymbiosis in an ancestor of four aphid families. J. Bact., 1991, Vol. 173, p. 6321-6324. Murakami, S., Nakashima, R., Yamashita, E. et Yamaguchi, A. Crystal structure of bacterial multidrug efflux transporter AcrB. Nature, 2002, Vol. 419(6907), p. 587-593. Murray, F.V. et Tiegs, O.W. The metamorphosis of Calandra oryzae. Q. J. Microsc. Sci., 1935, Vol. 77, p. 404-495. Murray, R.G. et Stackebrandt, E. Taxonomic note: implementation of the provisional statuts Candidatus for incompletely described procaryotes. Int. J. Syst. Bacteriol., 1995, Vol. 45(1), p. 186-187. Musgrave, A.J. Insect mycetomes. Can. Entomol., 1964, Vol. 96, p. 377-389. Musgrave, A.J. et Homan, R. Sitophilus sasakii in Canada: anatomy and cetomal symbiotes as valid taxonomic characters. Canad. Ent., 1962, Vol. 94, p. 1196-1197. Musgrave, A.J. et McDermott, L.A. Some media used in an attempt to isolate and culture the mycetomal microorganisms of Sitophilus weevils. Can. J. Microbiol., 1961, Vol. 7, p. 842-843. Musgrave, A.J. et Miller, J.J. Some microoganisms associated with the weevils, Sitophilus granarius and Sitophilus oryzae. I - Distribution and description of the organisms. Can. Ent., 1953, Vol. 85, p. 387-390. Nardon, C. et Nardon, P. Nouveaux caractères distinctifs des larves et adultes des deux espèces jumelles Sitophilus oryzae (L.) et S. zeamais Mots. (Coleoptera : Dryophthoridae). Ann. Soc. Entomol. Fr, 2002, Vol. 38(3), p. 239-246. Nardon, P. Les possibilités d'emploi des radiations dans la lutte contre les insectes. Phytoma, 1963, Vol. 144, p. 7-12. Nardon, P. Contribution a l'étude des symbiotes ovariens de Sitophilus sasakii : localisation, histochimie et ultrastructure chez la femelle adulte. C. R. Acad. Sci. Paris, 1971, Vol. 272D, p. 2975-2978. Nardon, P. Obtention d'une souche asymbiotique chez le charançon Sitophilus sasakii Tak : différentes méthodes d'obtention et comparaison avec la souche symbiotique d'origine. C. R. Acad. Sci. Paris, 1973, Vol. 277D, p. 981-984.

118 Nardon, P. Etude des interactions physiologiques et génétiques entre l'hôte et les symbiotes chez le coléoptère Curculionidae Sitophilus sasakii (= S. oryzae). Thèse de doctorat INSA-Université Lyon I, 1978,, p. 1-285. Nardon, P. Cell to cell interactions in insect endocytobiosis. In: Cell to cell signals in plant, animal and microbial symbiosis. S. Scannerini et al. (eds) Springer-verlag Berlin, 1988,, p. 85-100. Nardon, P. Rôle de la symbiose dans l'adaptation et la spéciation. Bull. Soc. Zool. Fr., 1995, Vol. 120(4), p. 397-406. Nardon, P. et Charles, H. Morphological aspects of symbiosis. In: Cellular origin and life in extreme habitats. "Symbiosis, mechanismes and model systems", Seckbach, J., Editor. 2001, Kluwer Academic Publishers: Dordrecht, Netherlands. p. 13-44. Nardon, P., Charles, H., Delobel, B., Lefèvre, C. et Heddi, A. Symbiosis in the Dryophthoridae weevils (Coleoptera, Curculionoidea): morphological and molecular variability of symbiotic intracellular bacteria. symbiosis, 2003, Vol. 34, p. 231-251. Nardon, P. et Grenier, A.M. Genetical and biochemical interactions between the host and its endosymbiotes in the weevil Sitophilus (Coleoptere Curculionidae) and other related species. In: Cell to cell signals in plant, animal and microbial symbiosis., Scannerini, S., Editor. 1988, Springer-verlag: Berlin. p. 255-270. Nardon, P. et Grenier, A.M. Endocytobiosis in Coleoptera: Biological, Biochemical and Genetic Aspects. In : Insect endocytobiosis: morphology, physiology, genetics, evolution. W. Schwemmler and G. Gassner (eds) CRC Press, Boca Raton, Florida (USA), 1989,, p. 175-215. Nardon, P. et Grenier, A.M. Symbiose et évolution. Ann. Soc. Entomol. Fr. (N.S.), 1993, Vol. 29(2), p. 113-140. Nardon, P., Grenier, A.M. et Heddi, A. Endocytobiote control by the host in the weevil Sitophilus oryzae, Coleoptera, curculionidae. Symbiosis, 1998, Vol. 25, p. 237-250. Nardon, P., Lefevre, C., Delobel, B., Charles, H. et Heddi, A. Occurence of endosymbiosis in Dryophthoridae weevils : cytological insights into bacterial symbiotic structures. Symbiosis, 2002, Vol. 33, p. 227-241. Nardon, P., Louis, C., Nicolas, G. et Kermarrec, A. Mise en évidence et étude des bactéries symbiotiques chez deux charançons parasites du bananier : Cosmopolites sordidus (GERMAR) et Metamasius hemipterus (L.) (Col. Curculionidae). Annls Soc. Ent. Fr. (N. S.), 1985, Vol. 21(3), p. 245-258. Nardon, P. et Nardon, C. Morphology and cytology of symbiosis in insects. Ann. Soc. Entomol. Fr., 1998, Vol. 34(2), p. 105-134. Nardon, P. et Wicker, C. La symbiose chez le genre Sitophilus (Coléoptère, Curculionidae). Principaux aspects morphologiques, physiologiques et génétiques. Ann. Biol., 1981, Vol. 20(4), p. 327-373. Normore, W.M. et Brown, J.R. G+C composition in bacteria. 1970, Cleveland: CRC Press p. O'Meara, B. Bacterial symbiosis and plant host use evolution in (Coleoptera, Curculionidae) : A phylogenetic study using parsimony and Bayesian analysis. Rapport de thèse, Harvard University, 2001,, p. 1-69. O'Meara, B. et Farrell, B.D. Where do grass herbivores come from? soumis, 2003. Ochman, H. et Moran, N.A. Genes lost and genes found: Evolution of bacterial pathogenesis and symbiosis. Science, 2001, Vol. 292(5519), p. 1096-1098. Oliver, J.L. et Marin, A. A relationship between GC content and coding sequence length. J. Mol. Evol., 1996, Vol. 43, p. 216-223. Palmer, J.D. Organelle genomes: going, going, gone! Science, 1997, Vol. 275, p. 790-791.

119 Palmer, J.D. et Delwiche, C.F. Second-hand chloroplasts and the case of the disappearing nucleus. Proc. Natl. Acad. Sci. USA, 1996, Vol. 93, p. 7432-7435. Paterson, H.E.H. Evolution and recognition concept of species. 1993, Baltimore: Maryland University Press p. Perrot-Minnot, M.J., Guo, L.R. et Werren, J.H. Single and double infections with Wolbachia in the parasitic wasp Nasonia vitripennis: effects on compatibility. Genetics, 1996, Vol. 143, p. 961-972. Perru, O. Aux origines de la symbiose, 1870-1920. In: L'évolution biologique, faits, théories, épistémologie, philosophie. 2002a, Librairie philisophique J. Vrin: Paris. p. 194-197. Perru, O. Du parasitisme à la symbiose dans le règne animal: 1875-1883. Revue des Questions Scientifiques, 2002b, Vol. 173, p. 19-38. Pierantoni, U. L'organo simbiotico nello sviluppo di Calandra oryzae. Rend. Reale Acad. Sci. Fis. mat. Napoli, 1927, Vol. 35(3a), p. 244-250. Pintureau, B. Systématique évolutive du genre Trichogramma Westwood (Hym. Trichogrammatidae) en Europe. Thèse Doctorat d'Etat, Université Paris VII, 1987, p. 1-311. Pintureau, B. et Grenier, S. Parthénogénèse symbiotique chez les Trichogrammes. Info-Zoo, 1996, Vol. 12, p. 25-30. Retnakaran, A. et Percy, J. fertilisation and spacial modes of reproduction. In: Comprehensive insect physiology and biochemistery and pharamacology, Kerkut, G.A. et Gilbert, L.I., Editors. 1985, Pergamon Press: Paris. p. 232-267. Riba, G. et Silvy, C. Combattre les ravageurs des cultures; enjeux et perspectives. 1989, Paris: INRA. 230 p. Rice, W.R. et Hoster, E.E. Laboratory experiments on speciation: what have we learned in 40 years ? Evolution, 1993, Vol. 47, p. 1637-1653. Richards, G.A. et Brooks, M.A. Internal symbiosis in insects. Ann. Rev. Entomol., 1958, Vol. 3, p. 37-56. Ridley, R. Evolution biologique. 1997, Paris: De Boeck Université. 719 p. Rigaud, T., Souty-Grosset, C., Raimond, R., Mocquard, J.P. et Juchault, P. Feminizing endocytobiosis in the terrestrial crustacean Armadilidium vulgare Latv: recent acquisistion. Endocytobiosis and Cell Res., 1991, Vol. 7, p. 259-273. Rio, R.V., Lefèvre, C., Heddi, A. et Aksoy, S. Comparative genomics of insect-symbiotic bacteria: influence of host environment on microbial genome composition. Appl. Environ. Microbiol., 2003, Vol. 69, p. 6825-6832. Rispe, C. et Moran, N.A. Accumulation of deleterious mutations in endosymbionts: Muller's ratchet with two levels of selection. 2000, Vol. 156(4), p. 425-441. Robinson, M. et Huchon, D. RRTree: Relative-Rate Tests between groups of sequences on a phylogenetic tree. Bioinformatics, 2000, Vol. 16(3), p. 296-297. Rousset, F., Bouchon, D., Pintureau, B., Juchault, P. et Solignac, M. Wolbachia endosymbionts responsible for various alterations of sexuality in . Proc. R. Soc. Lond. Biol., 1992, Vol. 250, p. 91-98. Sabater, B., Van Ham, R., Martinez Torres, D., Silva, F., Latorre, A. et Moya, A. Molecular evolution of aphids and their primary (Buchnera sp.) and secondary endosymbionts: Implications for the role of symbiosis in insect evolution. Interciencia, 2001, Vol. 26(10), p. 508-524. Saitou, N. et Nei, M. The neighbor joining method for molecular phylogeny. Mol. Biol. Evol., 1987, Vol. 4, p. 406-425. Sanger, F., Nicklen, S. et Coulson, A.R. DNA sequencing with chain-terminating inhibitors. Proc. Nat. Acad. Sci. USA, 1977, Vol. 74, p. 5463-5467.

120 Scheinert, W. Symbiose und embryonalentwicklung bei russel Kafern. Z. morph. Oekol. Tiere., 1933, Vol. 27, p. 76-198. Schröder, D., Deppisch, H., Obermayer, M., Krohne, G., Strackebrandt, E., Hölldobler, B., Goebel, W. et Gross, R. Intracellular endosymbiotic bacteria of Camponotus species (carpenter ants): systematics, evolution and ultrastructural characterization. Mol. Microbiol., 1996, Vol. 21(3), p. 479-489. Shigenobu, S., Watanabe, H., Hattori, M., Sakaki, Y. et Ishikawa, H. Genome sequence of the endocellular bacterial symbiont of aphids Buchnera sp. APS. Nature, 2000, Vol. 407, p. 81-86. Silva, F.J., Latorre, A. et Moya, A. Genome size reduction through multiple events of gene disintegration in Buchnera APS. TRENDS in Genetics, 2001, Vol. 17(11), p. 615-618. Sironi, M., Bandi, C., Sacchi, L., DI Sacco, B., Damiani, G. et Genchi, C. Molecular evidence for a close relative of the arthropod endosymbiont Wolbachia in a filarial worm. Mol. Biochem. Parasitol., 1995, Vol. 74, p. 223-227. Smith, C.L., Kloc, S.R. et Cantor, C.R. Pulsed-field gel electrophoresis ans the technology of large DNA molecules. Genome analysis a practical approach. Edited by Davis K.E. Oxford: IRL press, 1988, p. 41-61. 1988. Sneath, P.A.H. et Sokal, R.R. Numerical taxonomy. 1973, San Francisco: Freeman p. Sogin, M.L. Early evolution and the origine of eucaryotes. Curr. Opin. Genet. Dev., 1991, Vol. 1, p. 457-463. Stouthamer, R., Breeuwers, J.A.J. et Hurst, G.D.D. Wolbachia pipientis: Microbial manipulator of arthropod reproduction. Annu. Rev. Microbiol., 1999, Vol. 53, p. 71- 102. Stouthamer, R., Breeuwers, J.A.J., Luck, R.F. et Werren, J.H. Molecular identification of microorganisms associated with parthenogenesis. Nature, 1993, Vol. 361, p. 247-252. Stouthamer, R. et Kazmer, D.J. Cytoplasmic of microbe-associated parthenogenesis and its consequences for gene flow in Trichogramma wasps. Heredity, 1994, Vol. 73, p. 317- 327. Stouthamer, R., van Tilborg, M., de Jong, J.H., Nunney, L. et Luck, R.F. Selfish element maintains sex in natural populations of a parasitoid wasp. Proc. R. Soc. London Ser B, 2001, Vol. 268(1467), p. 617-622. Strong, D.R., Lawton, J.H. et Southwood, R. Insects on plants. Harvard University Press ed. 1984, Cambridge p. Suommalainen, E. Parthenogenesis in animals. Adv. Genet., 1950, Vol. 3, p. 193-253. Tamas, I. Comparative genomics of endosymbiotic bacteria. Thesis. 2002: Acta Universitatis Upsaliensis. 39 p. Tamas, I., Klasson, L., Canback, B., Naslund, A.K., Eriksson, A.S., Wernegreen, J.J., Sandstrom, J.P., Moran, N.A. et Andersson, S.G. 50 million years of genomic stasis in endosymbiotic bacteria. Science, 2002, Vol. 296(5577), p. 2376-2379. Templeton, A.R. The meaning of species and speciation, a genetic perspective. Sinauer ASS. Inc. ed. Speciation and its consequences. 1989: Otte and Endler, J. A. 3-27 p. Thomas, E.L. Biodiversity: What is it? In: Biodiversity II : Understanding and Protecting Our Biological Ressources, Reaka-Kudla, M.L., Wilson, D.E., et Wilson, E.O., Editors. 1997, Joseph Henry Press: Washington. p. 7-14. Thompson, J.D., Higgins, D.G. et Gibson, T.J. CLUSTAL W: improving the sensitivity of progressive multiple alignment through sequence weighting, position-specific gap penalities and weight matrix choice. Nucl. Acid. Res., 1994, Vol. 22, p. 4673-4680. Tomitani, A., Okada, K., Miyashita, H., Matthijs, H.C.P., Ohno, T. et Tanaka, A. Chlorophyll b and phycobilins in the the common ancestor of cyanobacteria and chloroplasts. Nature, 1999, Vol. 4000, p. 159-162.

121 Tourasse, N.J. et Gouy, M. Evolutionary distances between nucleotide sequences based on the distribution of substitution rates among sites as estimated by parsimony. Mol. Biol. Evol., 1997, Vol. 14(3), p. 287-298. Tregenza, T. et Bultin, R.K. Speciation without isolation. Nature, 1999, Vol. 400, p. 311- 312. Turelli, M. Evolution of incompatibility-inducing microbes and their hosts. Evolution, 1994, Vol. 48, p. 1500-1513. Van Ham, R.C., Kamerbeek, J., Palacios, C., Rausell, C., Abascal, F., Bastolla, U., Fernandez, J.M., Jimenez, L., Postigo, M., Silva, F.J., Tamames, J., Viguera, E., Latorre, A., Valencia, A., Moran, F. et Moya, A. Reductive genome evolution in Buchnera aphidicola. Proc. natl. Acad. Sci. USA, 2003, Vol. 100(2), p. 581-586. von Dohlen, C.D., Kohler, S., Alsop, S.T. et McManus, W.R. Mealybug beta- proteobacterial endosymbionts contain gamma-proteobacterial symbionts. Nature, 2001, Vol. 412(6845), p. 433-436. Wernegreen, J.J. Genome evolution in bacterial endosymbionts of insects. Nature, 2002, Vol. 3, p. 850-861. Werren, J.H. Biology of Wolbachia. Ann. Rev. Entomol., 1997a, Vol. 42, p. 587-609. Werren, J.H. Wolbachia and speciation. In: Endless forms: species and speciation., Howard, D. et Berlocher, S., Editors. 1997b, Oxford University Press. p. 1-47. Werren, J.H., Guo, L. et Windsor, D.W. Distribution of Wolbachia in nenotropical arthropods. Proc. R. Soc. London Ser. B, 1995, Vol. 262, p. 147-204. Werren, J.H. et Windsor, D.M. Wolbachia infection frequences in insects: evidence of a global equilibrum? Proc. R. Soc. Lond. (B), 2000, Vol. 267, p. 1277-1285. White, M.J.D. Modes of speciation. 1978, San Fransisco: Freedman. 455 p. Wicker, C. Differential vitamin and choline requirements of symbiotic and aposymbiotic S. oryzae (Coleoptera: Curculionidae). Comp. Biochem. physiol., 1983, Vol. 76A, p. 177- 182. Wilson, E.O. The diversity of life. 1992, Cambridge: Harvard University Press p. Yang, Z. et Roberts, D. On the use of nucleic acid sequences to infer branchings in the tree of life. Mol. Biol. Evol., 1995, Vol. 12, p. 451-458. Ziegler, R. Energy metabolism. In: The biology of disease vector., Beaty, B.J.a.M., W. C., Editor. 1996, University Press of Colorado: Niwot. p. 356-370. Zillig, W. Comparative biochemistry of Archaea and Bacteria. Curr. Opin. Genet. Dev., 1991, Vol. 1, p. 544-551. Zimmerman, E.C. Australian Weevils. Vol. III. 1993, Melbourne: CSIRO Publication. 854 p.

122 Liste des travaux et communications

Publications

Nardon, P., Lefèvre, C., Delobel, B., Charles, H. et Heddi, A. Occurence of endosymbiosis in Dryophthoridae weevils : cytological insights into bacterial symbiotic structures. Symbiosis, 2002, Vol. 33, p. 227-241. Nardon, P., Charles, H., Delobel, B., Chaudier, S., Lefèvre, C. et Heddi, A. Symbiosis in the Dryophthoridae weevils (Coleoptera, Curculionoidea): morphological and molecular variability of symbiotic intracellular bacteria. Symbiosis, 2003, Vol. 34, p. 231-251. Rio, R.V., Lefèvre, C., Heddi, A. et Aksoy, S. Comparative genomics of insect-symbiotic bacteria: influence of host environment on microbial genome composition. Appl. Environ. Microbiol., 2003, Vol. 69, p. 6825-6832. Lefèvre, C., Charles, H., Vallier, A., Delobel, B., Farrell, B. et Heddi, A. Endosymbiont phylogenesis in the Dryophthoridae weevils: Evidence for bacterial replacement. Mol. Biol. Evol., 2004, in press.

Congrès et communications

Heddi, A., Lefèvre, C., Charles, H., Vallier, A. La symbiose bacterienne intracellulaire chez les insectes Dryophthoridae : Aspects moléculaires et évolutifs. Rencontres des Microbiologistes de l'INRA, Dourdan, 5-7/05/03 (Communication orale). Lefèvre, C., Charles, H., Delobel, B., Nardon, P., Vallier, A. et Heddi, A. Origine des bactéries symbiotiques intracellualaires des Dryophthoridae : analyse phylogénétique basée sur un modèle d'évolution de l'ADN non homogène. ALPHY 2002 (Alignement et Phylogénie). Lyon, 29-30/04/02 (Communication orale). Heddi, A., Lefèvre, C., Charles, H. Impact of endosymbiosis on the Dryophthoridae insect diversity. VIIth European Congress of Entomology, Grèce/Thessaloniki, 7-13/10/02 (Communication orale). Lefèvre, C., Charles, H., Delobel, B., Nardon, P. et Heddi, A. Caractérisation et phylogénie des bactéries symbiotiques intracellulaire chez les Dryophthoridae. Réseau "Biodiversité et Ecologie Microbienne". Aussois IV, 4-5/07/02 (Communication orale). Heddi, A., Lefèvre, C., Charles, H., Khatchadourian. Chairman de la session symbiose animale et communication orale sous le titre "Weevils and Intracellular bacterial associations: Impact on insect development and evolution"9th International Congress on Invertebrate Reproduction and Development. Rhodes University, Grahamstown, South Africa, 15- 20/07/01 (Communication orale). Lefèvre, C., Charles, H., Delobel, B., Nardon, P., Vallier, A. et Heddi, A. Origine des bactéries symbiotiques intracellualaires des Dryophthoridae : analyse phylogénétique basée sur un modèle d'évolution de l'ADN non homogène. 5 ième Conférence Internationale Francophone d'Entomologie (CIFE 2002). Montréal,14-18/07/02 (Communication orale). Lefèvre, C., Charles, H., Delobel, B., Nardon, P. et Heddi, A. Caractérisation et phylogénie des bactéries symbiotiques intracellulaire chez les Dryophthoridae. Journée de la Post- Génomique de la Doua. Villeubanne, 5-6/05/00 (Poster).

123 Lefèvre, C., Charles, H., Delobel, B., Nardon, P. et Heddi, A. Caractérisation et phylogénie des bactéries symbiotiques intracellulaire chez les Dryophthoridae. Colloque InterSciences 2002. Lyon, 4/04/02 (Poster)

124