N° d’ordre 2008-ISAL-0098 Année 2008

Thèse

Caractérisation des capacités de régulation génétique de la bactérie Buchnera aphidicola en liaison avec sa fonction symbiotique chez le puceron Acyrthosiphon pisum

présentée devant L’Institut National des Sciences Appliquées de Lyon

pour obtenir le grade de Docteur

Ecole doctorale : Evolution, Ecosystèmes, Microbiologie, Modélisation Spécialité : Microbes et Interactions

Par

José VIÑUELAS

Soutenue le 26/11/2008 devant la Commission d’examen

Jury

Gérard FEBVAY Directeur de Recherche Président Johannes GEISELMANN Professeur Rapporteur Jean-Christophe SIMON Directeur de Recherche Rapporteur Marylène POIRIE Professeur Examinateur Eduardo ROCHA Chargé de Recherche Examinateur Federica CALEVRO Maître de Conférences Directeur Jean-Michel FAYARD Professeur Directeur INSA Direction de la Recherche - Ecoles Doctorales – Quadriennal 2007-2010

SIGLE ECOLE DOCTORALE NOM ET COORDONNEES DU RESPONSABLE

CHIMIE CHIMIE DE LYON M. Jean Marc LANCELIN. Université Claude Bernard Lyon 1, http://sakura.cpe.fr/ED206 bât. CPE 43 bd du 11 novembre 1918, 69622 VILLEURBANNE Cedex. Tél : 04.72.43.13.95, email : [email protected]

E.E.A. ELECTRONIQUE, M. Alain NICOLAS. Ecole Centrale de Lyon, ELECTROTECHNIQUE, bât. H9 36 av. Guy de Collongue, 69134 ECULLY. AUTOMATIQUE Tél : 04.72.18.60.97, Fax : 04.78.43.37.17, http://www.insa-lyon.fr/eea email : [email protected]

E2M2 EVOLUTION, ECOSYSTEMES, M. Jean-Pierre FLANDROIS. CNRS UMR 5558 Université MICROBIOLOGIE, Claude Bernard Lyon 1, bât. G. Mendel 43 bd du 11 novembre MODELISATION 1918, 69622 VILLEURBANNE Cedex. http://biomserv.univ-lyon1.fr/E2M2 Tél : 04.26.23.59.50, Fax : 04.26.23.59.49, email : [email protected]

EDIIS INFORMATIQUE ET M. Alain MILLE. Université Claude Bernard Lyon 1, INFORMATION POUR LA LIRIS – EDIIS, bât. Nautibus 43 bd du 11 novembre 1918, SOCIETE 69622 VILLEURBANNE Cedex. http://ediis.univ-lyon1.fr Tél : 04.72.44.82.94, Fax : 04.72.44.80.53, emails : [email protected] - [email protected]

EDISS INTERDISCIPLINAIRE M. Didier REVEL. Hôpital Cardiologique de Lyon, SCIENCES-SANTE bât. Central 28 av. Doyen Lépine, 69500 BRON. http://www.ibcp.fr/ediss Tél : 04.72.68.49.09, Fax : 04.72.35.49.16, email : [email protected]

Matériaux MATERIAUX DE LYON M. Jean Marc PELLETIER. INSA de Lyon MATEIS, http://edml.ec-lyon.fr bât. Blaise Pascal 7 av. Jean Capelle, 69621 VILLEURBANNE Cedex. Tél : 04.72.43.83.18, Fax : 04.72.43.85.28, email : [email protected]

Math IF MATHEMATIQUES ET M. Pascal KOIRAN. Ecole Normale Supérieure de Lyon, INFORMATIQUE 46 allée d’Italie, 69364 LYON Cedex 07. FONDAMENTALE Tél : 04.72.72.84.81, Fax : 04.72.72.89.69, http://perso.ens- email : [email protected] lyon.fr./pascal.koiran/MathIF.html

MEGA MECANIQUE, ENERGETIQUE, M. Jean Louis GUYADER. INSA de Lyon, Laboratoire de GENIE CIVIL, ACOUSTIQUE Vibrations et Acoustique, http://mega.ec-lyon.fr bât. Antoine de Saint Exupéry 25 bis av. Jean Capelle, 69621 VILLEURBANNE Cedex. Tél : 04.72.18.71.70, Fax : 04.72.18.87.12, email : [email protected]

ScSo ScSo* M. BRAVARD Jean Paul. Université Lyon 2, 86 rue Pasteur, 69365 LYON Cedex 07. Tél : 04.78.69.72.76, Fax : 04.37.28.04.48, email : [email protected]

*ScSo : Histoire, Géographie, Aménagement, Urbanisme, Archéologie, Science politique, Sociologie, Anthropologie

"La théorie est l'hypothèse vérifiée après qu'elle ait été soumise au contrôle du raisonnement et de la critique. Une théorie, pour rester bonne, doit toujours se modifier avec le progrès de la science et demeurer constamment soumise à la vérification et la critique des faits nouveaux qui apparaissent. Si l'on considérait une théorie comme parfaite, et si on cessait de la vérifier par l'expérience scientifique, elle deviendrait une doctrine." Claude Bernard

Je dédie cette thèse à mes parents Miguel et Célestine qui, au cours de ces longues années d'étude, ont toujours été là pour moi et sans qui tout ceci n'existerait pas…

De nombreuses personnes m'ont apporté leur aide pour la réalisation des ces travaux de thèse. C'est pourquoi :

Je remercie M. Yvan Rahbé, directeur de l'UMR 203 INRA / INSA de Lyon, pour m'avoir permis de réaliser cette thèse de doctorat au sein de son unité et pour m'avoir fait confiance lors de la réalisation du "projet leucine".

Merci à M. Gérard Febvay, pour m'avoir accueilli au sein de cette même unité, qu'il dirigeait lors de mon arrivée, pour sa gentillesse à mon égard, ainsi que pour le temps qu'il m'a accordé lors de chacune de mes nombreuses sollicitations.

Je tiens à souligner ici que j'apprécie maintenant toute l'importance des travaux de M. Rahbé et de M. Febvay dans la compréhension des échanges métaboliques à la base de la symbiose entre Buchnera et les pucerons.

J'exprime ma profonde reconnaissance aux rapporteurs de cette thèse : M. Johannes Geiselmann et M. Jean-Christophe Simon, ainsi qu'aux autres membres du jury : M. Gérard Febvay, Mme Marylène Poirié et M. Eduardo Rocha qui ont accepté de juger ce travail de thèse.

Mes remerciements vont également à M. Christian Boucher, M. Gérard Febvay, M. Johannes Geiselmann, M. Jean Lobry et Mme Marie-France Sagot pour les discussions constructives menées lors des réunions de comité de pilotage.

Je tiens à remercier tout particulièrement ma directrice de thèse Mme Federica Calevro. Bien que me superviser et me comprendre n'ait pas toujours été chose facile, Mme Calevro a su, au cours de ces trois années de thèse, me transmettre sa passion pour la recherche ainsi que sa rigueur expérimentale. Je réalise aujourd'hui la chance qui m'a été offerte de travailler à ses côtés, et cela sur un modèle aussi intéressant que le couple symbiotique Buchnera / puceron. Je profite donc de l'écriture de ces quelques lignes pour lui faire part de toute ma reconnaissance.

Merci aussi à mon directeur de thèse M. Jean-Michel Fayard pour ses conseils, son soutien et sa persévérance à vouloir élucider les mécanismes de régulation de l'expression des gènes de Buchnera. De la même façon que Galilée a dit pour la Terre "Et pourtant elle tourne", M. Fayard a dit de Buchnera "Et pourtant elle régule".

Je remercie chaleureusement M. Hubert Charles pour sa présence et son aide "statistiquement significative" à m'approcher au domaine, ô combien difficile, de l'évolution moléculaire.

Je souhaite aussi remercier Mme Gabrielle Duport pour tout le temps qu'elle a consacré aux expérimentations biologiques et pour avoir eu la patience de m'apprendre à manipuler les pucerons (même si elle sera toujours plus rapide que moi pour les récupérer à la pointe de son pinceau).

Un grand merci à M. Didier Remond qui m'a aidé et éclairé dans ma "période" analyse spectrale du transcriptome de Buchnera.

Je ne saurais oublier M. Jacques Bernillon et M. Nicolas Gadot pour leur précieuse aide lors de la réalisation des expériences de puce à ADN, mais également pour leur bonne humeur et leur conversation.

Mes plus vifs remerciements vont à M. Stefano Colella pour ses conseils et ses réponses à mes questions sur la Recherche "à l'étranger".

Merci encore à M. Simon Grenier et à Mme Anne-Marie Grenier pour leur aide respectivement en entomologie et en bibliographie.

Un clin d'œil à M. Pedro Da Silva pour m'avoir si gentiment accueilli dans son bureau, et ceci malgré la disparition de ma boîte de biscuits entreposée dans ce dernier.

Merci à tous les membres du laboratoire : Mme Séverine Balmand, M. Patrice Bolland, Mlle Lilia Brinza, Mme Elyane Chassignol, M. Alain Clavel, Mme Heïdi Eppe, Mme Catherine Garcia, M. Frédéric Gressent, M. Abdelaziz Heddi, Mlle Sandrine Laroche, M. Christian Laugier, M. Frédéric Login, Mme Carole Monégat, M. Paul Nardon, M. Jacques Pintureau, Mlle Andréane Rabatel, Mme Isabelle Rahioui, M. Lionel Razy, Mlle Marjolaine Rey, Mme Agnès Vallier et M. Aurélien Vigneron, pour leur accueil et les excellents moments que j'ai passés en leur compagnie.

Une pensée toute particulière pour mes amis doctorants : M. Jérôme Bouvier, M. Cédric Goyer et M. Julien Meregnani, dont la solidarité au cours de ces trois dernières années m'a aidé à surmonter certaines épreuves.

Je n'oublierai pas Mme Yvette Friteau pour sa gentillesse, ses précieux conseils et son soutien permanent au cours de ces dernières années.

Cette thèse est l'occasion de remercier encore et toujours mes merveilleuses sœurs Angeles et Carmen, ainsi que toute ma famille et mes amis pour leur patience, leur compréhension et leurs encouragements.

Merci enfin à tous ceux que j'ai pu oublier dans les lignes ci-dessus.

Table des Matières

Table des Matières

José Viñuelas 6 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Table des Matières

LISTE DES FIGURES ...... 11

LISTE DES TABLEAUX ...... 15

INTRODUCTION GENERALE ...... 17

Le puceron ravageur des cultures : un problème agronomique majeur ...... 18

SYNTHESE BIBLIOGRAPHIQUE ...... 23

1 Le concept de symbiose, notamment chez les insectes ...... 24 1.1 Définitions et classification de la symbiose ...... 24 1.2 L'endocytobiose intégrée chez les insectes ...... 27 1.2.1 Endocytobiose insectes/virus ...... 28 1.2.2 Endocytobiose insectes/levures ...... 28 1.2.3 Endocytobiose insectes/bactéries ...... 29 1.3 Le couple symbiotique Buchnera / puceron ...... 30 1.3.1 Un peu d'histoire...... 30 1.3.2 Transmission de Buchnera ...... 32

2 Le génome de Buchnera aphidicola ...... 36 2.1 Histoire et évolution des génomes de Buchnera aphidicola ...... 36 2.1.1 Une réduction du génome par étape ...... 36 2.1.2 La "quasi"-stabilité du génome de Buchnera ...... 39 2.1.3 Buchnera est-elle irremplaçable ? ...... 43 2.2 Organisation et propriétés des génomes de Buchnera aphidicola ...... 46 2.2.1 Des caractéristiques comparables à celles d'autres endocytobiotes ...... 47 2.2.2 Réplication, transcription et traduction chez Buchnera ...... 48 2.2.3 Adaptation aux stress environnementaux...... 50 2.2.4 Quelques voies métaboliques chez Buchnera...... 52 2.2.5 Les systèmes de transport chez Buchnera ...... 55

3 Buchnera aphidicola ou "une usine de production d'acides aminés" ...... 57 3.1 Contexte biologique ...... 57 3.2 Des évidences nutritionnelles...... 59 3.3 Des évidences métaboliques ...... 60

José Viñuelas 7 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Table des Matières

3.3.1 Les premières études ...... 60 3.3.2 Le rôle central du glutamate et de la glutamine ...... 61 3.3.3 Le carbone utilisé par Buchnera ...... 63 3.4 Des évidences génomiques ...... 67 3.5 Les études sur la régulation transcriptionnelle ...... 70

MATERIELS ET METHODES ...... 75

1 Préparation du matériel biologique ...... 76 1.1 Elevage des pucerons ...... 76 1.2 Isolement des bactéries symbiotiques ...... 77 1.3 Extraction et préparation des acides nucléiques ...... 78 1.3.1 Extraction de l'ADN génomique ...... 78 1.3.2 Extraction des ARN totaux ...... 79 1.3.3 Contrôle de qualité des acides nucléiques ...... 80

2 Analyse de la relation entre expression des gènes et organisation du chromosome chez Buchnera à l'aide d'une puce à ADN ...... 81 2.1 Préparation des lames ...... 81 2.1.1 Synthèse des sondes ...... 81 2.1.2 Dépôt des sondes ...... 82 2.1.3 Traitement des lames ...... 83 2.2 Marquage des acides nucléiques ...... 84 2.2.1 Marquage direct de l'ADN génomique ...... 84 2.2.2 Marquage indirect des ARN totaux ...... 85 2.3 Plan expérimental ...... 87 2.4 Hybridation et lavages des lames ...... 87 2.5 Acquisition des images et des données ...... 88 2.6 Analyse de qualité et normalisation des données ...... 88 2.7 Outils et bases de données utilisés pour l'analyse du génome de Buchnera ...... 89 2.8 Analyse spectrale du transcriptome de Buchnera ...... 90 2.9 Analyse statistique des données de puce à ADN ...... 91

3 Analyse de la réponse du puceron et de sa bactérie symbiotique à des stress en leucine ..... 92 3.1 Etude du comportement et du taux de croissance du puceron Acyrthosiphon pisum ...... 92 3.2 Mesure de la néosynthèse des acides aminés branchés par Buchnera ...... 93 3.3 Analyse de la réponse de Buchnera par expériences de PCR et RT-PCR en temps réel ...... 94

José Viñuelas 8 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Table des Matières

3.3.1 Préparation des produits de PCR, des gammes étalon et des dilutions ...... 94 3.3.2 Préparation et dilution des acides nucléiques ...... 96 3.3.3 Protocoles et acquisition des données ...... 97 3.3.4 Plans expérimentaux ...... 98 3.3.5 Normalisation des données ...... 100 3.3.6 Analyse statistique des données ...... 102 3.3.7 Analyse bioinformatique du plasmide pLeu de Buchnera ...... 102 3.4 Validation expérimentale de l'opéron leuABCD et étude de la séquence non codante en amont de leuA ...... 103

RESULTATS ...... 105

1 Relations entre expression des gènes et organisation du chromosome chez Buchnera aphidicola ...... 106 1.1 Introduction de l'étude ...... 106 1.2 Normalisation des données de puce à ADN par l'ADNg pour obtenir des profils transcriptomiques ...... 108 1.3 Etude des signaux de fluorescence issus de l'ADNg et de l'efficacité de la méthode de normalisation ...... 110 1.4 Relations entre les niveaux d'expression des gènes et l'organisation du chromosome ...... 115 1.4.1 Effet de la position sur le brin d'ADN, de l'organisation en opérons et de l'essentialité des gènes ...... 115 1.4.2 Effet du taux d'évolution des gènes ...... 118 1.4.3 Effet de la localisation spatiale des gènes le long du chromosome ...... 120 1.5 Discussion sur les résultats de l'étude ...... 127

2 Réponse du puceron et de Buchnera aphidicola à des stress en leucine ...... 137 2.1 Introduction de l'étude ...... 137 2.1.1 Les plasmides pLeu et pTrp ...... 138 2.2 Effets de la concentration nutritionnelle en leucine sur le comportement et la croissance du puceron Acyrthosiphon pisum ...... 142 2.3 Réponse métabolique de Buchnera à des stress en leucine ...... 145 2.4 Analyse moléculaire de la réponse de Buchnera à des stress en leucine ...... 148 2.4.1 Mesure du taux de réplication du plasmide pLeu ...... 148 2.4.2 Réponse transcriptionnelle ...... 150 2.5 Caractérisation théorique et expérimentale du plasmide pLeu chez Buchnera Ap ...... 153 2.5.1 Analyse bioinformatique de la séquence du plasmide pLeu ...... 153

José Viñuelas 9 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Table des Matières

2.5.2 Confirmation expérimentale de l'existence de l'opéron leuABCD et étude de la séquence non codante en amont de leuA ...... 156 2.6 Des études préliminaires chez un autre puceron ...... 159 2.6.1 Les premières études sur Rhopalosiphum padi ...... 160 2.6.2 Comparaison du nombre de copies de plasmide pLeu à l'état naturel entre Buchnera Ap et Buchnera Rp ...... 162 2.6.3 Réplication du plasmide pLeu après 7 jours de stress en leucine ...... 163 2.7 Discussion sur les résultats de l'étude ...... 164

CONCLUSION GENERALE ET PERSPECTIVES ...... 179

PUBLICATIONS ET COMMUNICATIONS ...... 183

REFERENCES BIBLIOGRAPHIQUES ...... 186

ANNEXES ...... 207

José Viñuelas 10 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Liste des Figures

Liste des Figures

José Viñuelas 11 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Liste des Figures

Figure 1. Enroulements foliaires et court-noué, dégâts typiques sur pommier du puceron Dysaphis plantaginea...... 19 Figure 2. Schéma du cycle de vie du puceron du pois Acyrthosiphon pisum illustrant le mode de reproduction (parthénogénétique et sexuée) en fonction des saisons ...... 20 Figure 3. Co-spéciation entre Buchnera et les pucerons...... 31 Figure 4. Localisation des Buchnera au sein des bactériocytes et répartition de ces derniers dans la cavité abdominale du puceron ...... 32 Figure 5. Illustration de la transmission de Buchnera à un embryon de puceron ...... 34 Figure 6. Evolution des génomes de Buchnera aphidicola ...... 37 Figure 7. Illustration de la synténie des chromosomes de Buchnera aphidicola ...... 42 Figure 8. Hybridation in situ de PASS (en rouge) et de Buchnera (en vert) réalisées sur une coupe histologique d'embryon de pucerons suite à différents traitements ...... 45 Figure 9. Représentation schématique et comparaison du métabolisme de Buchnera aphidicola issue des pucerons Acyrthosiphon pisum (BAp) et Cinara cedri (BCc) ...... 53 Figure 10. Comparaison de la composition moyenne en acides aminés de la sève phloémienne de la plante Vicia faba et des protéines du puceron Acyrthosiphon pisum ...... 58 Figure 11. Illustration de la chambre métabolique mise au point par Febvay et collaborateurs pour les études métaboliques sur le couple symbiotique Buchnera / puceron ...... 64 Figure 12. Quantité et provenance des atomes de carbone constituant chacun des acides aminés néosynthétisés lorsque le puceron Acyrthosiphon pisum est élevé sur un milieu artificiel de composition proche de la sève phloémienne ...... 66 Figure 13. Modèle de dépendance mutuelle des voies de biosynthèse des acides aminés entre Buchnera et la cellule de son hôte, Buchnera étant localisée dans une vacuole du bactériocyte ...... 69 Figure 14. Milieu artificiel d'élevage de pucerons ...... 77 Figure 15. Photo et illustration de l'organisation de la puce à ADN dédiée au génome de Buchnera aphidicola issue du puceron Acyrthosiphon pisum, développée dans l'UMR BF2I ...... 83 Figure 16. Schéma illustrant les étapes d'un marquage direct de cibles d'ADNg en fluorescence par "nick translation" lors d'une expérimentation de puce à ADN...... 85 Figure 17. Schéma illustrant les étapes d'un marquage indirect de cibles d'ARN en fluorescence lors d'une expérimentation de puce à ADN...... 86 Figure 18. Illustration et résumé des conditions de réalisation de la PCR...... 94 Figure 19. Illustration et résumé des conditions de réalisation des PCR et RT-PCR en temps réel...... 98 Figure 20. Organisation de la plaque 96 puits utilisée pour les expériences de PCR quantitative ...... 99

José Viñuelas 12 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Liste des Figures

Figure 21. Illustration et résumé des conditions de PCR pour confirmer expérimentalement l'existence de l'opéron leuABCD...... 104 Figure 22. Principales étapes pour la réalisation d'une expérience de puces à ADN ...... 109 Figure 23. Analyse des signaux de fluorescence issus de l'ADN génomique hybridé sur la puce à ADN dédiée au génome de Buchnera aphidicola...... 111

Figure 24. Distribution des signaux de fluorescence (transformés en log 2) issus des ARN hybridés sur la puce Buchnera aphidicola avant (A) et après (B) normalisation par l'ADN génomique...... 112 Figure 25. Validation de la procédure de normalisation des données transcriptomiques par l'ADN génomique...... 113 Figure 26. Effet de la normalisation par l'ADNg sur les signaux de fluorescence issus de l'hybridation des ARNt sur la puce à ADN dédiée à Buchnera ...... 114 Figure 27. Caractéristiques du génome de Buchnera aphidicola Ap ...... 116 Figure 28. Niveaux d'expression moyens des gènes de Buchnera (normalisés et transformés en log2) ...... 117 Figure 29. Représentation du taux de GC des gènes de Buchnera en fonction de leur niveau d'expression (normalisé et transformé en log2) ...... 119 Figure 30. Représentation de la fonction d'autocorrélation des séries spatiales correspondant aux niveaux d'expression des gènes de Buchnera (normalisés et transformés en log2) le long du chromosome ...... 121 Figure 31. Profils périodiques spatiaux dans le transcriptome de Buchnera ...... 123 Figure 32. Schéma de la simulation d'introduction de permutations ciblées dans la localisation des gènes sur le chromosome de Buchnera ...... 124 Figure 33. Périodogrammes des niveaux d'expression des gènes (normalisés et transformés en log2) de Buchnera ...... 126 Figure 34. Comparaison de la conservation des gènes flagellaires au sein des quatre génomes de Buchnera actuellement séquencés ...... 132 Figure 35. Schéma de l'appareil flagellaire chez Escherichia coli et Salmonella typhimurium...... 133 Figure 36. Cartographie linéaire des différents types de plasmides (pLeu et pTrp) identifiés chez Buchnera aphidicola issus de plusieurs sous-familles de pucerons...... 139 Figure 37. Cartographie des gènes leuABCD localisés sur le chromosome de Buchnera aphidicola des pucerons issus des sous-familles Pemphiginae et Chaitophorinae ...... 140 Figure 38. Réponse comportementale du puceron Acyrthosiphon pisum en fonction de la concentration de leucine présente dans le milieu nutritionnel ...... 143 Figure 39. Taux de croissance du puceron Acyrthosiphon pisum en fonction de la concentration de leucine présente dans le milieu nutritionnel ...... 144 Figure 40. Schéma simplifié de la super-voie de biosynthèse des acides aminés branchés chez Buchnera aphidicola ...... 146

José Viñuelas 13 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Liste des Figures

Figure 41. Néosynthèse des acides aminés branchés par Buchnera chez Acyrthosiphon pisum à partir de saccharose et en fonction de la concentration de leucine présente dans le milieu nutritionnel ...... 147 Figure 42. Comparaison du nombre moyen de copies de plasmide pLeu par unité de chromosome chez Buchnera aphidicola lorsque le puceron Acyrthosiphon pisum est élevé sur un milieu totalement carencé en leucine (leu0mM), ou présentant un excès en cet acide aminé (leu60mM), par rapport à un milieu de contrôle (leu20mM), et ceci selon un temps de traitement variable ...... 149 Figure 43. Réponse transcriptionnelle de Buchnera aphidicola à des stress en leucine induits chez le puceron en fonction de différents temps de traitement...... 151 Figure 44. Cartographie du plasmide pLeu de Buchnera aphidicola Ap...... 154 Figure 45. Comparaison de l'agencement des gènes de l'opéron leuABCD entre Escherichia coli et Buchnera aphidicola Ap ...... 155 Figure 46. Confirmation expérimentale de l'existence du transcrit leuABCD et étude de la séquence intergénique en amont du gène leuA (Inter2-leuA) ...... 157 Figure 47. Représentation de la séquence intergénique entre repA2 et leuA dans le plasmide pLeu de Buchnera aphidicola ...... 158 Figure 48. Photographie de pucerons adultes de l'espèce Acyrthosiphon pisum et Rhopalosiphum padi...... 160 Figure 49. Néosynthèse des acides aminés branchés par Buchnera chez Rhopalosiphum padi à partir de saccharose et en fonction de la concentration de leucine présente dans le milieu nutritionnel ...... 161 Figure 50. Comparaison du nombre moyen de copies de plasmide pLeu par chromosome chez Buchnera aphidicola issue des pucerons Acyrthosiphon pisum et Rhopalosiphum padi à l'état basal ...... 162 Figure 51. Comparaison du nombre moyen de copies de plasmide pLeu par chromosome chez Buchnera aphidicola lorsque le puceron Rhopalosiphum padi est élevé sur un milieu totalement carencé en leucine (leu0mM), sur un milieu de référence (leu20mM) ou sur un milieu présentant un excès de leucine (leu60mM) ...... 164 Figure 52. Cartographie du plasmide pSC101 de Salmonella typhimurium et du plasmide pKL1 d'Escherichia coli...... 169

José Viñuelas 14 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Liste des Tableaux

Liste des Tableaux

José Viñuelas 15 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Liste des Tableaux

Tableau 1. Comparaison des caractéristiques des génomes des symbiotes primaires des pucerons Acyrthosiphon pisum (BAp), Schizaphis graminum (BSg), Baizongia pistaciae (BBp) et Cinara cedri (BCc)...... 47 Tableau 2. Plan expérimental d'hybridation...... 87 Tableau 3. Caractéristiques des amorces de PCR utilisées dans le cadre des expériences de PCR sur Buchnera issue du puceron Acyrthosiphon pisum...... 95 Tableau 4. Caractéristiques des amorces de PCR utilisées dans le cadre des expériences de PCR sur Buchnera issue du puceron Rhopalosiphum padi...... 96 Tableau 5. Caractéristiques des amorces de PCR utilisées dans le cadre des expériences de RT-PCR pour la confirmation de l'existence de l'opéron leuABCD et pour l'étude de la séquence non codante en amont de leuA...... 104 Tableau 6. ANOVA montrant les effets les facteurs "opéron", "essentialité", et "brin d'ADN" sur le niveau d'expression des gènes de Buchnera...... 116 Tableau 7. Distribution (nombre et pourcentage) des gènes de Buchnera en fonction de leur taux d'expression fort, moyen ou faible...... 118 Tableau 8. Valeurs d'autocorrélation des niveaux d'expression des gènes de Buchnera (normalisés et transformés en log2) en fonction des différentes permutations relatives à la position des gènes le long du chromosome...... 125

José Viñuelas 16 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Introduction Générale

Partie I

Introduction Générale

José Viñuelas 17 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Introduction Générale

Le puceron ravageur des cultures : un problème agronomique majeur

Parmi les insectes ravageurs des cultures, les pucerons détiennent une place prépondérante. Dans l'ordre des , ils forment, avec les cochenilles, les psylles et les aleurodes, le sous-ordre des . Ils sont regroupés dans les deux super-familles des Aphidoidea et des . Bien que ce groupe d'insectes soit relativement restreint, environ 4400 espèces identifiées à ce jour (Blackman et Eastop, 1994; 2000; Geneci et Görür, 2007), dont un peu plus de 600 en France, les pucerons sont à l'origine de pertes économiques considérables. Dans nos régions tempérées, on estime qu'une espèce végétale sur quatre, dont la quasi-totalité des plantes d'intérêt agricole, est attaquée par ces ravageurs (Dixon, 1998). Pour ne citer qu'un exemple historique, nous retiendrons le puceron Daktulosphaira vitifoliae, plus communément appelé Phylloxera vastatrix, qui a décimé la quasi totalité du vignoble français au XIXème siècle. Se nourrissant exclusivement de la sève phloémienne des plantes, les pucerons génèrent d'importants dégâts sur l'hôte végétal, et ceci à différents niveaux. Tout d'abord, de part leur mode d'alimentation proprement dit, les pucerons détournent à leur profit une grande quantité de sève élaborée. Les effets sur la plante de cette ponction sont divers : ralentissement de la croissance, mauvaise fructification ou encore production de grains ou de fruits de forme bosselée et de petite taille (Figure 1) (Douglas, 2003; Dedryver, 2007). Les pucerons endommagent également la plante par leurs piqûres. Lorsque l'insecte pique la plante, non seulement il provoque des blessures, mais il lui injecte des secrétions salivaires contenant de nombreux composés chimiques. Ces substances, qui interagissent avec les cellules végétales, peuvent, autour du point de piqûre, perturber les processus de multiplication cellulaire et provoquer la formation de galles (Will et van Bel, 2006). Enfin, c'est grâce à ces piqûres que les pucerons peuvent inoculer des virus ou des parasites aux plantes (Powell, 2005). Circulant dans les vaisseaux du phloème, les phytovirus infectent les cellules à proximité du lieu de piqûre, ce qui engendre des perturbations physiologiques de la plante hôte telles que l'altération de l'accumulation des pigments chlorophylliens dans la feuille, la déformation des tissus, ou encore la mort cellulaire et tissulaire. Mais les dégâts des virus inoculés par les pucerons sont aussi de type qualitatif affectant, par exemple, la forme des fruits ou l'aspect des plants les rendant non commercialisables. Ces différents effets, qui peuvent se cumuler, sont d’autant plus importants que la plante est jeune, et sont fonction du nombre

José Viñuelas 18 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Introduction Générale

de pucerons qui la colonisent. Ainsi, la dangerosité de ces insectes est strictement dépendante de leur succès reproductif.

Figure 1. Enroulements foliaires et court-noué, dégâts typiques sur pommier du puceron Dysaphis plantaginea (d'après Dedryver, 2007).

Les pucerons ont un cycle de reproduction annuel hétérogonique impliquant une alternance de plusieurs générations parthénogénétiques (les femelles produisent leur descendance sans accouplement) et une seule génération sexuée (Miura et al., 2003). Le cycle annuel du puceron se déroule généralement de la manière suivante : au printemps, les larves issues des œufs vont donner des femelles vivipares qui, par parthénogénèse, vont produire en quelques jours une centaine de petits pucerons (larves au premier stade : L1), tous génétiquement identiques. Ces femelles, à l'origine de ces clones, sont appelées les fondatrices (Lees, 1960). Les petits pucerons, qui sont eux mêmes de futures femelles vivipares, portent déjà en eux les générations suivantes d’embryons : on parle de télescopage des générations (Dixon, 1992). Ils vont à leur tour se multiplier par parthénogénèse pour donner une nouvelle colonie de pucerons asexués et ainsi de suite jusqu'à la fin de l'été. Puis, en automne, avec la diminution de la durée des jours et de la température, les pucerons vont donner naissance à des individus sexués qui, après accouplement, vont être à l'origine de la production d'œufs. Ces œufs, dits en diapause, resteront quiescents durant tout l'hiver pour n'éclore qu'au printemps suivant et donner de nouvelles

José Viñuelas 19 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Introduction Générale

fondatrices (Figure 2). Il est à noter que, lorsque la densité de la colonie sur la plante a atteint un certain seuil annonciateur d'une diminution des ressources nutritionnelles disponibles par individu, des formes ailées apparaissent. Ces ailés iront alors coloniser de nouvelles plantes. Enfin, la comparaison des deux modes de reproduction des pucerons ne laisse aucun doute sur le fait que c'est à la reproduction parthénogénétique que l'insecte doit son grand potentiel invasif (Miura et al., 2003), même si la production des œufs diapausants joue un rôle primordial dans la résistance de l'espèce aux rigueurs de l'hiver et, par définition, à sa survie.

Printemps Eté Hiver Œufs en diapause Fondatrice

Reproduction sexuée Femelle aptère Femelle ailée asexuée asexuée Reproduction Femelle aptère parthénogénétique sexuée

Femelle asexuée* Mâle sexué* produisant les Automne formes sexuées * aptère ou ailé

Figure 2. Schéma du cycle de vie du puceron du pois Acyrthosiphon pisum illustrant le mode de reproduction (parthénogénétique et sexuée) en fonction des saisons (d'après Miura et al., 2003).

L'étude de la composition de la sève phloémienne montre que ce milieu est relativement pauvre en vitamines et en acides aminés essentiels, mais riche en sucres et en acides aminés non essentiels au puceron, ce qui est incompatible avec le développement harmonieux de cet insecte (Douglas, 2006). L'adaptation du puceron à ce milieu contraint qui est la sève phloémienne est possible grâce à une symbiose mutualiste intracellulaire obligatoire avec la bactérie Buchnera aphidicola (Buchner, 1965b), une gamma-3-protéobactérie très proche d’entérobactéries libres comme Escherichia coli ou Salmonella spp (Munson et al., 1991b; Canbäck et al., 2004). L'association entre Buchnera et le puceron se serait établie très tôt dans l'histoire évolutive de ce groupe d'insectes amenant à une co- évolution de l'hôte avec son symbiote. Les deux partenaires seraient devenus interdépendants et complémentaires aux plans génomique et métabolique (Baumann, 2005). Ainsi Buchnera a perdu la capacité à

José Viñuelas 20 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Introduction Générale

synthétiser les acides aminés non essentiels au puceron mais utilise ces derniers et des sucres abondants chez l’hôte pour générer les acides aminés limitants et essentiels à l'insecte. L’ensemble du métabolisme est ainsi réparti entre l’insecte et son symbiote (Zientz et al., 2001; 2004). Par conséquent, il est impossible de cultiver Buchnera indépendamment de son hôte (Buchner, 1965b; Douglas, 2003) et les expériences d’élevage de pucerons aposymbiotiques, c’est-à-dire privés de la bactérie par traitement antibiotique, donnent des pucerons à croissance ralentie et incapables de se reproduire (Baumann et al., 1995; Wilkinson, 1998). Les séquences génomiques des Buchnera vivant en symbiose avec quatre espèces différentes de pucerons sont connues et disponibles dans les bases de données. Elles montrent toutes des génomes fortement réduits en comparaison des génomes des bactéries de forme libre. Même si l’annotation du génome de la bactérie symbiotique est de très bonne qualité grâce à l’existence de gènes orthologues chez E. coli pour la quasi-totalité de ses gènes, de nombreuses protéines sont encore annotées avec des fonctions hypothétiques et peu de choses sont connues quant aux adaptations fonctionnelles des protéines de Buchnera qui, dans le contexte de la symbiose, ont été soumises à une évolution très rapide (Fares et al., 2005). Au niveau de la régulation de la transcription, le problème est encore plus exacerbé puisque Buchnera semble avoir perdu les principales protéines régulatrices, ainsi que leurs sites de reconnaissance sur l’ADN, décrits chez les entérobactéries libres les plus proches (Panina et al., 2001). Cependant, les rares études d’analyse globale du transcriptome réalisées sur Buchnera ont montré que, malgré l’absence de régulateurs connus dans son génome, Buchnera est capable de répondre au niveau transcriptionnel à un stress trophique modéré subi par son hôte (Charles et al., 2006; Reymond et al., 2006). Néanmoins, les variations observées ne sont pas toujours spécifiques des voies de biosynthèse relatives au stress trophique appliqué. Ainsi, on sait encore très peu de choses sur les réelles capacités de biosynthèse et de régulation de Buchnera.

L'objectif de ce travail de thèse a été d'apporter de nouveaux éléments relatifs à la fonction symbiotique de Buchnera aphidicola chez le puceron du pois Acyrthosiphon pisum et, en particulier, sur la capacité de Buchnera à répondre d'une façon fonctionnelle à la demande en acides aminés essentiels de son hôte. Pour cela, deux études ont été menées : (i) une étude de génomique fonctionnelle et comparative, puis (ii) une étude de complémentation nutritionnelle de Buchnera vis-à-vis de son hôte. Le premier volet a consisté à étudier la relation entre le niveau d’expression des gènes de Buchnera et leur organisation sur le chromosome, à l’aide d'une puce à ADN dédiée au génome du symbiote. A

José Viñuelas 21 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Introduction Générale

cette fin, des paramètres susceptibles d’avoir un effet sur le niveau d’expression des gènes bactériens ont été pris en compte tels que la position des gènes sur le brin direct (brin précoce ou "leading") ou indirect (brin tardif ou "lagging") du chromosome, leur taux de GC, leur essentialité à la survie de la bactérie, ainsi que leur localisation le long du chromosome à partir de l'origine de réplication. L'intérêt de ce travail était de savoir si, malgré l'importante réduction de la taille de son génome, il existe toujours chez Buchnera une influence réciproque entre la transcription des gènes et l’organisation du chromosome, comme il a été observé chez les bactéries de forme libre. Il convient de préciser que, pour la réalisation de cette étude, il a été nécessaire de développer une méthode de normalisation des données de puce à ADN, basée sur l'utilistion de l'ADN génomique de Buchnera comme standard. Cette étape était indispensable pour pouvoir comparer les niveaux d'expression des gènes les uns par rapport aux autres. Le deuxième volet a consisté à étudier la réponse de la bactérie à une carence et à un excès en leucine dans l'alimentation du puceron. Pour cela, une analyse basée sur des techniques de PCR quantitative nous a permis d'apprécier l'amplification d'un plasmide de Buchnera contenant les gènes de biosynthèse de la leucine, ainsi que les variations des niveaux d'expression de ces derniers en réponse à une cinétique de stress. L'objectif était de déterminer par quels mécanismes Buchnera répond aux variations de la concentration en leucine, et ceci afin d'améliorer nos connaissances sur les capacités du symbiote à répondre, d'un point de vue transcriptionnel, à des demandes nutritionnelles spécifiques de son hôte. Avant d'exposer les résultats obtenus pour chacune de ces deux parties, il m'a semblé indispensable de débuter ce manuscrit par une synthèse bibliographique définissant tout d'abord le concept de "symbiose". J'ai poursuivi cette synthèse bibliographique par une présentation plus détaillée de la symbiose entre le puceron et Buchnera, suivie d'une description des caractéristiques du génome de cette bactérie et de ses capacités de régulation. La présentation des études relatives à la fonction de complémentation nutritionnelle de Buchnera vis-à-vis du puceron fera l'objet de la dernière partie de cette synthèse bibliographique. Enfin, pour chacun des deux volets expérimentaux de ce travail de thèse, la présentation des résultats sera accompagnée par une introduction et une discussion spécifiques.

José Viñuelas 22 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Partie II

Synthèse Bibliographique

José Viñuelas 23 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

1 Le concept de symbiose, notamment chez les insectes

1.1 Définitions et classification de la symbiose

1.2 L'endocytobiose intégrée chez les insectes 1.2.1 Endocytobiose insectes/virus 1.2.2 Endocytobiose insectes/levures 1.2.3 Endocytobiose insectes/bactéries

1.3 Le couple symbiotique Buchnera / puceron 1.3.1 Un peu d'histoire 1.3.2 Transmission de Buchnera

1.1 Définitions et classification de la symbiose

Etymologiquement, le mot symbiose trouve son origine dans le mot grecque "symbiôsis" qui signifie vie (biose) avec (sym).

La majorité des animaux et de nombreuses plantes vivent en association étroite avec des micro-organismes : les relations symbiotiques qu’ils entretiennent avec ces derniers ont alors influé de façon unique sur leur évolution et leurs capacités d’adaptation (Nardon et Charles, 2001; Provorov et al., 2008). C'est en 1877 que le terme de symbiose est utilisé pour la première fois par Albert-Bernhardt Frank pour caractériser les lichens, qui résultent de l'association d'algues avec des champignons. Le botaniste défini alors la symbiose (en utilisant le terme "symbiotismus") comme "vivre ensemble". Le concept fut, une année plus tard, emprunté et généralisé à l'ensemble du règne végétal par Anton de Bary de la manière suivante : "la symbiose est l’association permanente de deux ou plusieurs organismes spécifiquement distincts, qui vivent ensemble pendant une partie de leur cycle de vie" (De Bary, 1879). Cette définition est assez large et comme Jan Sapp écrit à ce sujet : "sous le terme de symbiose, De Bary incluait diverses sortes d'associations complexes, se succédant dans une continuité, depuis des relations parasites jusqu'à des relations d'entraide entre les associés" (Sapp, 1994).

Depuis ces premières définitions, le concept même de symbiose a été longuement discuté dans la littérature, sans aboutir à un vrai consensus. Il est à remarquer que la définition de ce concept se heurte à de nombreuses difficultés. D'un point de vue structural, il est possible de distinguer trois types de relations en fonction de la disposition relative des symbiotes et de l'hôte (Nardon et Charles, 2001). Dans le cas où les partenaires demeurent

José Viñuelas 24 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

extérieurs l'un à l'autre on parlera d'ectosymbiose. Inversement, si le symbiote demeure à l'intérieur de l'hôte on qualifiera l'association d'endosymbiose. Enfin, un cas particulier d'endosymbiose est l'endocytobiose où les symbiotes, ou endocytobiotes selon la terminologie de Schwemmler (1989), sont intracellulaires. Une difficulté majeure dans la définition de la symbiose est l'extension de sa définition, en particulier par rapport aux rôles respectifs des partenaires de l'association symbiotique (Perru, 1997). Les nombreux ouvrages disponibles sur ce sujet mettent en évidence une très grande diversité de situations entre les partenaires associés. "Obligatoire" pour l'hôte et le symbiote, ou pour l'un des deux seulement, ou encore "facultative", la symbiose peut regrouper différents degrés d'association. Pour Scott, et plus récemment pour Smith, on ne peut pas parler de symbiose sans insister sur l’interdépendance entre hôte et symbiote. Plus précisément, Schott (1969) définit la symbiose comme un état d'interdépendance physiologique équilibrée de deux ou plusieurs organismes, n'impliquant pas de stimulation permanente des mécanismes de réactions défensives. Pour Smith (1990), la symbiose consiste en une association de deux ou plusieurs organismes vivant ensemble, en interdépendance mutuelle. Margulis (1991) donne une définition plus large de la symbiose en la reportant comme un ensemble d'interactions écologiques entre les organismes non humains. Elle insiste sur la proximité physique entre les organismes associés ainsi que sur la durée significative de l’association symbiotique dans l’histoire de vie des partenaires.

D'après Nardon et Grenier (1993) cinq niveaux d'association peuvent être définis, probablement corrélés à des degrés différents d'évolution ou de coévolution de l'hôte et du symbiote :

- La symbiose antagoniste, ou parasitisme, dans laquelle il existe une agressivité réciproque des deux partenaires qui mettent en place des mécanismes de défense l'un envers l'autre, l'hôte étant globalement affecté. - La symbiose primaire ou facultative qui affecte peu la fitness de l'hôte et pour laquelle la population de l'hôte potentiel n'est que partiellement concernée. - La symbiose secondaire ou chronique dans laquelle l'interaction est plus forte. Elle concerne l'ensemble de la population de l'hôte (contrairement aux précédentes) et se caractérise par une amélioration des performances de ce dernier et une localisation précise des symbiotes dans un compartiment bien défini de l'hôte.

José Viñuelas 25 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

- L'endocytobiose intégrée dans laquelle toute l'espèce est impliquée dans la symbiose. Le symbiote, qui est intracellulaire, est hébergé dans des structures spécialisées nommées mycétocytes quand le symbiote est une levure et bactériocytes lorsqu'il s'agit d'une bactérie. Le symbiote est devenu obligatoire et améliore nettement les performances de l'hôte. L'intégration des symbiotes à la physiologie de l'hôte est très poussée et l'étape ultime pourrait être atteinte par la transformation du symbiote en organite cellulaire. - La symbiose organogénétique où le symbiote est devenu cette fois-ci un organite cytoplasmique, laissant la porte ouverte à d'importants transferts de gènes vers le noyau de la cellule hôte. C'est sur la base de ce type de symbiose qu'on expliquerait la genèse de la cellule eucaryote. Celle-ci serait issue d'associations par étapes successives de procaryotes avec une cellule hôte (Taylor, 1987), qui auraient ensuite évolué pour donner naissance aux plastes et aux mitochondries (Gray et al., 1998; Martin et al., 1998; Martin, 2003).

Les plus récentes études sur le concept de symbiose tiennent compte des avancées dernièrement réalisées dans les domaines de la génétique et de la génomique (en particulier bactérienne), ainsi que de leur apport à la compréhension de l’évolution moléculaire des génomes bactériens. Ces études soulignent que la ressemblance, sur le plan moléculaire, du mutualisme et du parasitisme reflète leur origine commune et leur évolution parallèle (Herre et al., 1999; Tikhonovich et Provorov, 2003; Tikhonovich et al., 2004). A notre connaissance, l’une des plus récentes classifications des différents types de symbiose bactérienne est celle proposée par Provorov et collaborateurs (Provorov, 2005; Provorov et al., 2008). Ces auteurs reprennent de nombreux éléments de la classification proposée par Nardon et Grenier, mais apparentent mutualisme et parasitisme. Ils définissent ainsi trois différents niveaux dans les associations symbiotiques en se penchant en particulier sur le cas des symbioses bactériennes :

- Les associations facultatives : elles ne sont pas associées à des changements qualitatifs dans le potentiel adaptatif des micro-organismes impliqués dans la symbiose. Il s’agit, dans la plupart des cas, des bactéries de forme libre qui s’associent à différents hôtes de manière très peu spécifique et qui ne subissent aucun réarrangement génomique pour pouvoir persister dans l’hôte. Un exemple de cette forme de symbiose est l’association entre la bactérie Escherichia coli et différents types de vertébrés.

José Viñuelas 26 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

- Les associations obligatoires d’un point de vue écologique : les bactéries occupent une niche chez l’hôte de façon temporaire pour se soustraire à la compétition avec des bactéries de forme libre éventuellement présentes dans l’hôte. Les génomes de ces bactéries sont qualifiés de "multipotents" par Provorov et collaborateurs. Ils sont soumis à la pression adaptative dérivant de leurs interactions avec leurs hôtes : en plus des gènes présents dans les bactéries de forme libre, ils peuvent acquérir des gènes qui ne fonctionnent que dans le contexte symbiotique. Des exemples sont représentés par la symbiose entre la bactérie Rhizobium et les légumineuses ou par certaines associations hôte-pathogène. - Les associations obligatoires d’un point de vue génétique : l’existence des micro-organismes en dehors de leur hôte n’est pas possible. En effet, dans leur adaptation à la vie intracellulaire, ces bactéries subissent d'importantes réductions dans la taille de leurs génomes. Elles ont perdu des gènes essentiels à leur survie sous forme libre. Pour les auteurs, cette réduction adaptative des génomes se met en place de façon semblable aussi bien pour des bactéries mutualistes (comme Buchnera) que pour des bactéries pathogènes (comme Mycoplasma).

A la lumière de ces études, la symbiose entre Buchnera aphidicola et les pucerons peut être définie comme une endocytobiose intégrée et obligatoire sur le plan génétique.

1.2 L'endocytobiose intégrée chez les insectes

Dans le règne , les insectes sont considérés comme le cas d'étude par excellence des phénomènes de symbiose. C'est grâce à leur association symbiotique avec des virus, des levures ou des bactéries qu'ils ont pu coloniser de nombreuses et très disparates niches écologiques. Représentant plus de 80% de la biodiversité totale sur terre, on estime à plus de 10% le nombre d'espèces d'insectes qui dépendent d'endocytobiotes pour leur viabilité et leur reproduction (Moran et Baumann, 2000). Ishikawa (2003) dans son chapitre introductif de l'ouvrage " Symbiosis" précise également que, si on prend en compte le cas des symbioses non permanentes, c'est plus de 70% des espèces d'insectes qui contiennent des symbiotes intracellulaires. Seules quelques familles d'insectes et notamment les Carabidae ne semblent pas posséder d'endocytobiotes (Nardon et Charles, 2001). Les trois paragraphes ci- dessous présentent quelques exemples d'endocytobiose chez les insectes.

José Viñuelas 27 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

1.2.1 Endocytobiose insectes/virus

Selon certains auteurs, les polydnavirus représentent l'un des exemples les plus aboutis d'endocytobiose avec les insectes (Louis, 1990). Chez les guêpes parasitoïdes, telle que Campoletis sonorensis, des études ont montré que lors de la ponte des œufs au sein de l'insecte parasité, les guêpes inoculaient par la même occasion le virus (CsV) qui leur est associé. Ce virus, qui ne se réplique pas au sein de l'hôte parasité, va, grâce à l'expression de gènes de virulence, compromettre la réponse immunitaire de ce dernier, permettant ainsi le développement de la guêpe parasitoïde (Webb et Strand, 2005). Selon les différents polydnavirus, l'action virale peut se limiter uniquement à la protection des œufs de la guêpe ou peut, plus globalement, affecter la réponse immunitaire de l'hôte d'un point de vue général. Dans le premier cas, elle consiste à éviter l'encapsulation des œufs du parasitoïde par les hémocytes de l'insecte parasité (Edson et al., 1981). Dans le deuxième cas, l'action virale altère la réponse humorale de ce dernier (Schmidt et al., 2001). Ce "virus symbiotique" joue ainsi un rôle capital dans le développement et la survie de bon nombre d'espèces de guêpes parasitoïdes.

1.2.2 Endocytobiose insectes/levures

L'association entre les delphacides et leurs symbiotes est un très bon exemple de symbiose à levures chez les insectes. Nous retiendrons le cas de Nilaparvata lugens considéré comme le plus important des ravageurs pour la culture du riz. Ce petit delphacide contient dans ses mycétocytes un symbiote eucaryote du type levure plus communément nommé YLSs pour "yeast-like symbionts" (Chen et al., 1981; Cheng et Hou, 1996). Ces symbiotes, de la classe des pyrénomycètes (Noda et al., 1995), sont transmis de la mère aux œufs par infection via les ovarioles et ceci dans les premières étapes du développement de l'insecte (Cheng et Hou, 2001). Il existe aujourd'hui de nombreuses preuves quant au rôle crucial de ces symbiotes dans le développement et la croissance des delphacides. N. lugens produit de l'acide urique, considéré comme un déchet azoté pour bon nombre d'insectes, mais, à la différence de ces derniers, N. lugens n'excrète pas ce produit. Des études métaboliques ont montré que cet acide urique est stocké dans les tissus de l'insecte puis converti en composés à valeur nutritionnelle élevée grâce à une uricase fournie par les symbiotes (Sasaki et al., 1996). Stocké dans le cas d'un régime alimentaire riche en azote, l'acide urique est recyclé lors d'éventuelles carences alimentaires en

José Viñuelas 28 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

azote par les YLSs afin de permettre le bon développement de leur hôte (Hongoh et Ishikawa, 1997; Wilkinson et Ishikawa, 2001).

1.2.3 Endocytobiose insectes/bactéries

Ce type d'endocytobiose est courant chez les insectes. De nombreuses associations symbiotiques ont été décrites et notamment chez des blattoptères comme les blattes (Bandi et al., 1995), chez des coléoptères comme les charançons (Nardon et Grenier, 1988), chez des diptères comme les mouches tsétsé (Aksoy et al., 1995), chez des hémiptères comme les aleurodes (Clark et al., 1992), les cicadelles (Moran et al., 2003a), les cochenilles (Tremblay, 1989) et les psylles (Fukatsu et Nikoh, 1998), ou encore chez des hyménoptères comme les fourmis (Blochmann, 1892; Schroder et al., 1996). Seules les endocytobioses intégrées seront abordées dans le cadre de cette thèse, ce qui exclut les symbioses à Wolbachia, celle-ci n'étant pas présente en permanence chez l'insecte hôte. Comme dans les exemples précédents d'endocytobiose avec les insectes, l'association symbiotique est obligatoire pour les deux partenaires. La bactérie ne peut pas être cultivée in vitro et l'élimination du symbiote, notamment par traitement antibiotique, a de graves conséquences sur le développement, la survie et la reproduction de l'hôte. La bactérie symbiotique apporte en général à l'hôte des composés peu présents dans son régime alimentaire, comme des acides aminés essentiels, des composés azotés ou encore des vitamines (Zientz et al., 2004). Dans la suite de ce paragraphe, ne seront présentés que trois exemples d'endocytobiose insectes/bactéries. Ce choix est justifié par le fait que les génomes de ces symbiotes ont été séquencés, annotés, et sont disponibles dans les bases de données génomiques. A cela s'ajoute le fait que les informations génomiques sur la complémentation nutritionnelle de ces bactéries vis-à-vis de leur hôte ont été confirmées par des études métaboliques (Zientz et al., 2004).

La symbiose entre les fourmis et la bactérie Blochmannia fut le premier cas d'endocytobiose décrit (Blochmann, 1892). Les fourmis se nourrissent généralement de milieux relativement riches comme des insectes vivants ou morts, des excréments d'oiseaux ou encore de déchets alimentaires sucrés (Pfeiffer et Linsenmair, 2000). Mais selon la saison, les fourmis peuvent également se nourrir d'un milieu extrêmement déséquilibré d'un point de vue nutritionnel comme, par exemple, le miellat sécrété par les pucerons. Durant ces périodes de diète, le déficit nutritionnel peut être compensé par le symbiote qui apporte les acides aminés et autres nutriments dont l'hôte a besoin (Zientz et al., 2004). Mais le rôle de

José Viñuelas 29 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Blochmannia ne se limiterait pas uniquement à la complémentation nutritionnelle. En effet, les fourmis étant des insectes sociaux, le symbiote pourrait contribuer à la synthèse de phéromones, substances importantes pour les interactions au sein de la colonie (Zientz et al., 2004). Un exemple également très étudié d'endocytobiose est l'association entre la mouche tsétsé et la γ-protéobactérie Wigglesworthia glossinidia. L'un des rôles majeurs de cette dernière au sein du couple symbiotique est la fourniture à l'hôte de vitamines du groupe B et de cofacteurs, peu présents dans le sang des mammifères (Akman et al., 2002). Enfin, l'exemple le plus étudié d'endocytobiose chez les insectes est constitué par le couple Buchnera aphidicola / puceron. Il fera l'objet du paragraphe suivant.

Jusqu'ici dans cette synthèse bibliographique, seule la complémentation nutritionnelle du symbiote vis-à-vis de l'hôte a été abordée. Or, le caractère obligatoire des endocytobioses résulte de l'interdépendance mutuelle des métabolismes des deux partenaires. En effet, certains précurseurs sont fournis par l'hôte à la bactérie qui les utilise pour sa survie mais également comme substrat lors de la synthèse de métabolites destinés à l'insecte. Wigglesworthia, par exemple, synthétise les vitamines et cofacteurs dont l'hôte a besoin, mais ce dernier doit la complémenter en acides aminés qu'elle ne peut produire. Inversement, Buchnera et Blochmannia ont besoin de certains métabolites et vitamines qui leur sont apportés par l'hôte, afin de pouvoir synthétiser les acides aminés requis par l'insecte.

1.3 Le couple symbiotique Buchnera / puceron

1.3.1 Un peu d'histoire

Les bactéries symbiotiques des pucerons ont été observées pour la première fois au XIXème siècle par le biologiste Thomas Henry Huxley, qui décrivit ce qu'il voyait au sein de la cavité abdominale du puceron comme du "protoplasme granuleux". Ce n'est qu'en 1910 qu'Umberto Pierantoni et Karl Sulc découvrent en même temps, mais indépendamment, la nature bactérienne de ce "protoplasme" (Pierantoni, 1910; Sulc, 1910). Puis, grâce aux avancées de la microscopie au cours du XXème siècle, Buchner décrit et identifie de manière plus précise ces bactéries de forme coccoïde localisées dans de larges cellules que sont les bactériocytes (Buchner, 1965b). Ne pouvant être cultivées, ces bactéries ont tout d'abord été décrites comme étant proches des mycoplasmes ou des rickettsies (Hinde, 1971). Par la

José Viñuelas 30 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

suite, à partir de la séquence de leur ARN 16S, Munson et collaborateurs identifient le symbiote primaire des pucerons comme étant une γ- protéobactérie proche d'Escherichia coli (Munson et al., 1991a), et lui assignent le genre Buchnera en hommage à Paul Buchner (Munson et al., 1991b). Le qualificatif de "primaire" est employé pour Buchnera depuis 1996, car cinq autres types de bactéries, appelées alors "secondaires", ont été retrouvés chez les pucerons. C'est à la suite des expériences de Mittler menées en 1971 que le caractère obligatoire de l'association Buchnera / puceron est confirmé. En effet Mittler met en évidence que, suite à l'élimination de Buchnera par traitement antibiotique, la croissance ainsi que la reproduction des pucerons, alors aposymbiotiques, sont gravement atteintes (Mittler, 1971a).

De nombreuses études phylogénétiques sur l’hôte et sa bactérie attribuent le début de l’association Buchnera / puceron à l’infection d’un puceron ancestral par une bactérie de forme libre il y a environ 150 à 250 millions d’années (Munson et al., 1991a; Moran et al., 1993; Baumann et al., 1995). Ces études, basées notamment sur une analyse de l'ADNr 16S pour Buchnera et sur l'ADNr 18S du puceron ainsi que sur des pucerons fossiles, soutiennent une origine monophylétique de Buchnera et révèlent une parfaite congruence entre les phylogénies des deux partenaires, démontrant alors une co-spéciation du symbiote avec son hôte (Sabater et al., 2001) (Figure 3).

Bactéries Pucerons Ruminobacter amylophilus Proteus vulgaris Arsenophonus nasoniae symbiote de Bemisia tabaci 48-70 Ma Escherichia coli Schlectendalia chinensis 80-160 Ma Melaphis rhois Pemphigus betae Tetraneura caerulescens Mindarus victoriae Chaitophorus viminalis suberi Diuraphis noxia 80-120 Ma Origine de Acyrthosiphon pisum l'association Buchnera Uroleucon sonchi 150-250 Ma Myzus persicae Rhopalosiphum padi Rhopalosiphum maidis 30-80 Ma Schizaphis graminum

Figure 3. Co-spéciation entre Buchnera et les pucerons. L'arbre relatif à l'endosymbiote est basé sur une étude de l'ADNr 16S, celui relatif aux espèces de pucerons est basé sur une étude de l'ADNr 18S et daté grâce à des fossiles. L'échelle de temps est en millions d'années (Ma) (d'après Sabater et al., 2001).

José Viñuelas 31 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

1.3.2 Transmission de Buchnera

Wilkinson et Douglas (1998) ont déterminé la présence de 23500 Buchnera par bactériocyte chez le puceron Acyrthosiphon pisum. Cependant, la population du symbiote augmente exponentiellement au cours du développement larvaire de l'insecte jusqu'à atteindre un maximum lors de la période de reproduction des adultes. Puis, le nombre de Buchnera décline peu à peu au cours du vieillissement du puceron (Srivastava et al., 1980; Douglas et Dixon, 1987; Baumann et al., 1995; Koga et al., 2003). Entourées individuellement ou par petits groupes par une membrane d'origine eucaryote nommée membrane symbiosomale (Roth et al., 1988), les Buchnera sont localisées dans le cytoplasme des bactériocytes (Figure 4A) (Buchner, 1965a; Griffiths et Beck, 1973; McLean et Houk, 1973), ces derniers étant regroupés en une structure bilobée nommée bactériome, dans la cavité abdominale du puceron (Ponsen, 1987) (Figure 4B). Bien que le nombre puisse varier entre différents clones, Wilkinson et Douglas estiment qu'environ 60 à 100 bactériocytes sont retrouvés au sein d'un puceron A. pisum adulte (Wilkinson et Douglas, 1998).

Chaîne embryonnaire A B Bactériocytes embryonnaires

Intestin

25 µm Bactériocytes maternels

Figure 4. Localisation des Buchnera au sein des bactériocytes et répartition de ces derniers dans la cavité abdominale du puceron. (A) Photo d'un bactériocyte maternel avec, au centre, le noyau de la cellule eucaryote entouré de Buchnera (photo réalisée par T. Fukatsu, http://buchnera.gsc.riken.go.jp). (B) Coupe schématique d'un puceron décrivant le chapelet de bactériocytes dans la cavité abdominale formant le bactériome ainsi que les chaînes embryonnaires (schéma réalisé par T. Sasaki, http://buchnera.gsc.riken.go.jp).

José Viñuelas 32 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

C'est à partir de ces bactériocytes qu'à lieu la transmission de Buchnera aux futures générations de pucerons. Bien qu'à ce jour ce mécanisme complexe ne soit pas parfaitement connu, il est admis que le symbiote est transmis aux embryons (ou aux œufs selon le cycle de reproduction) de manière verticale à partir des femelles reproductrices. Dans le cas de la reproduction par parthénogénèse, c'est lors du septième stade du développement embryonnaire (selon les tables du développement définies par Miura et collaborateurs) que des bactériocytes maternels vont migrer vers les embryons permettant ainsi la transmission de Buchnera (Miura et al., 2003). Plus précisément, il semblerait qu'à l'échelle d'un embryon, les bactéries symbiotiques seraient transmises à partir d'un seul et unique bactériocyte maternel via un conduit membranaire reliant la cellule donneuse à l'embryon receveur (Wilkinson et al., 2003) (Figure 5). Ainsi, dans la cavité abdominale d'une femelle parthénogénétique, un deuxième compartiment symbiotique, constitué par les bactériocytes localisés dans les embryons, coexiste avec les bactériocytes maternels.

José Viñuelas 33 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

A Bactériocyte maternel

Embryon

Bu Bu

Bu Bu

12 µm

B

Cellules folliculaires Cellules germinales

Bactéries

Syncytium Noyaux présomptifs de bactériocyte 10 µm

Figure 5. Illustration de la transmission de Buchnera à un embryon de puceron. (A) Microphotographie montrant la transmission de Buchnera (Bu) d'un bactériocyte maternel à un embryon au stade de blastoderme cellulaire, dans une femelle parthénogénétique (d'après Wilkinson et al., 2003). (B) Schéma d'une coupe transversale d'un embryon de puceron en cours d'infection par Buchnera (d'après Miura et al., 2003).

Lors de la transmission à la descendance, seul un faible nombre de bactéries est transmis d'une génération à l'autre, réduisant de manière drastique l'effectif de la population de symbiotes. Wilkinson et collaborateurs (2003) estiment qu'environ 1100 bactéries sont transmises par embryon, ce qui représente un nombre 120 fois plus faible que la population de symbiotes présente chez un puceron au premier stade de développement larvaire (Mira et Moran, 2002). Ce "goulot d'étranglement"

José Viñuelas 34 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

n'est pas sans conséquences sur l'évolution et les propriétés du génome de Buchnera. Il se traduirait notamment par une accélération de la dérive génétique favorisant la fixation de mutations délétères (Moran, 1996). La vie intracellulaire obligatoire de Buchnera et la perte d'éléments de plasticité dans son génome ont également affecté les propriétés de ce dernier puisqu'il révèle un manque de recombinaisons génétiques évident. L'ensemble de ces éléments conduit à une accumulation, au sein du génome de Buchnera, de mutations délétères irréversibles : c'est le phénomène du "Muller's ratchet" (phénomène évoqué pour la première fois par Muller en 1964) ou "cliquet de Muller".

José Viñuelas 35 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

2 Le génome de Buchnera aphidicola

2.1 Histoire et évolution des génomes de Buchnera aphidicola 2.1.1 Une réduction du génome par étape 2.1.2 La "quasi"-stabilité du génome de Buchnera 2.1.3 Buchnera est-elle irremplaçable ?

2.2 Organisation et propriétés des génomes de Buchnera aphidicola 2.2.1 Des caractéristiques comparables à celles d'autres endocytobiotes 2.2.2 Réplication, transcription et traduction chez Buchnera 2.2.3 Adaptation aux stress environnementaux 2.2.4 Quelques voies métaboliques chez Buchnera 2.2.5 Les systèmes de transport chez Buchnera

A ce jour quatre génomes complets de Buchnera ont été séquencés et annotés, et ceci chez les pucerons du pois Acyrthosiphon pisum (Ap) (famille ; tribu Macrosiphini) (Shigenobu et al., 2000), des céréales Schizaphis graminum (Sg) (famille Aphididae ; tribu Aphidini) (Tamas et al., 2002), du pistachier Baizongia pistaciae (Bp) (famille Pemphigidae ; tribu Fordini) (van Ham et al., 2003) et du cèdre Cinara cedri (Cc) (famille Lachnidae) (Perez-Brocal et al., 2006). Une des conséquences de l'établissement de la symbiose entre Buchnera et les pucerons a été une réduction massive de la taille du génome de la bactérie, la taille actuelle des génomes de Buchnera étant comprise entre 422 et 653 kpb en fonction de l'espèce de puceron hôte. La comparaison des séquences génomiques des Buchnera à celles d'E. coli a permis de reconstruire le génome hypothétique de l'ancêtre commun à ces Buchnera et, par la suite, de reconstituer les évènements (perte ou réorganisation de gènes) qui ont marqué l’évolution des quatre génomes (Wernegreen, 2002; Silva et al., 2003). Les différentes espèces de Buchnera constituent ainsi un modèle d’évolution très riche pour l’étude des phénomènes de réduction des génomes bactériens en milieu intracellulaire.

2.1 Histoire et évolution des génomes de Buchnera aphidicola

2.1.1 Une réduction du génome par étape

L'évolution des génomes de Buchnera par rapport aux bactéries de forme libre et à partir de leur dernier ancêtre en commun est schématisée dans la Figure 6. Le génome de cet ancêtre aurait possédé entre 1818 (Silva et al., 2001) et 2425 gènes (Moran et Mira, 2001). C'est lors de

José Viñuelas 36 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

l'établissement de l'association symbiotique avec les pucerons que les étapes plus importantes du processus de réduction des génomes de Buchnera auraient eu lieu. En effet, il a été estimé que le génome du dernier ancêtre commun aux symbiotes des différentes espèces de pucerons ne possédait plus qu'environ 640 gènes dont 629 localisés sur un chromosome et les 11 restants sur deux plasmides (Silva et al., 2003).

36 gènes perdus

LCSA Inversion de pyrF 8 gènes perdus Chromosome : 629 gènes Buchnera Sg Plasmides : p-Leucine (8 gènes) p-Tryptophane (3 gènes) Buchnera Ap Duplications en tandem des gènes trpEG 24 gènes perdus

> 1000 gènes perdus Buchnera Bp

Localisation de l’opéron Perte de p-Trp 96 gènes perdus Leucine et des gènes trpEG sur le LCA chromosome E. coli 1818-2425 gènes

Salmonella spp.

Infection 150 100 50 Echelle de temps ancestrale approximative (Ma)

Figure 6. Evolution des génomes de Buchnera aphidicola. LCA (= Last Common Ancestor) correspond au dernier ancêtre commun à Buchnera et E. coli. LCSA (= Last Common Symbiont Ancestor) indique le dernier ancêtre commun aux Buchnera des pucerons Acyrthosiphon pisum (Ap), Schizaphis graminum (Sg) et Baizongia pistaciae (Bp). Les lignes vertes sont relatives aux bactéries endosymbiotiques et les lignes rouges aux bactéries de forme libre (d'après Silva et al., 2003).

Plusieurs théories ont été émises sur le processus de réduction de la taille des génomes de Buchnera. Sur la base du premier séquençage d'un des génomes de Buchnera (issue du puceron A. pisum) et en comparaison aux données génomiques disponibles pour E. coli, Silva et collaborateurs ont émis l'hypothèse que la réduction du génome de Buchnera serait due essentiellement à l'accumulation graduelle de petites délétions aboutissant à l'inactivation de gènes tout au long du chromosome de la bactérie (Silva et al., 2001). Une seconde théorie, émise par Moran et Mira (2001), propose que le processus de réduction de taille se serait déroulé en différentes étapes au cours de l’adaptation de la bactérie à l’environnement intracellulaire. Les auteurs suggèrent que les premières étapes de réduction,

José Viñuelas 37 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

immédiatement après l’infection, ont consisté en la perte ou l’inactivation de larges régions génomiques associées à des réarrangements chromosomiques. Ce phénomène aurait été possible grâce à la redondance de gènes entre l’hôte et le symbiote ainsi qu'à la relative stabilité du milieu intracellulaire, ces deux facteurs diminuant vraisemblablement de façon drastique la pression de sélection sur un grand nombre de gènes de la bactérie. Cette première étape aurait ensuite été suivie par la perte ou l’inactivation de gènes (transformation en pseudogènes) (Gomez-Valero et al., 2004), mais de manière beaucoup plus ponctuelle, telle une érosion progressive du génome (Moran et Mira, 2001; Wernegreen, 2002). Les importantes délétions, survenues lors des premières étapes de réduction du génome, auraient également modifié les pressions de sélection sur les gènes restants, influençant ainsi la perte individuelle de certains d'entre eux (Moran et Mira, 2001). Ces auteurs avancent, entre autres, l’exemple des gènes rec, codant les principales protéines responsables des phénomènes de recombinaison et de réparation de l’ADN, pour illustrer ce scénario potentiel. En effet, Buchnera a perdu le gène recA mais pas les gènes recBCD (Perez-Brocal et al., 2006), absents chez plusieurs autres bactéries à génome réduit (Moran et Mira, 2001). Or, on sait que recA est localisé, chez E. coli, dans une région de 10 kb, qui a été perdue dans le génome de Buchnera, car elle ne contenait probablement pas de gènes essentiels au couple symbiotique. Inversement, les gènes codant les protéines RecBCD qui, en l’absence de RecA ne peuvent normalement pas assurer une réparation correcte des dommages à l’ADN, ont été conservés car flanqués par des gènes impliqués dans la biosynthèse de l’arginine, acide aminé essentiel à la survie du puceron (Moran et Mira, 2001). La perte ponctuelle de gènes, conséquente à la réduction massive, peut s’illustrer par le cas du gène recF dont la protéine correspondante coopère fonctionnellement avec RecA : recF aurait été perdu car la perte primitive de recA aurait réduit la pression de sélection agissant sur ce gène (Moran et Mira, 2001; Wernegreen, 2002). Enfin, comparée à celle proposée par Silva et collaborateurs (2001), la théorie de Moran et Mira explique beaucoup mieux la très bonne conservation de l'agencement des gènes entre les chromosomes des différentes Buchnera (cf. Synthèse Bibliographique § 2.1.2).

Plus récemment et contrairement à Moran et Mira, Delmotte et collaborateurs, par l'analyse de cinq génomes réduits d'endosymbiotes (Buchnera Ap, Buchnera Sg, Buchnera Bp, Wigglesworthia et Blochmannia) soulignent que les phénomènes de sélection adaptative agiraient dans toutes les étapes menant à la réduction de la taille de ces

José Viñuelas 38 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

génomes (Delmotte et al., 2006). van Hoek et Hogeweg reprennent cette théorie et expliquent comment la pression de sélection pourrait agir sur la perte de grandes portions chromosomiques dans le processus de réduction des génomes bactériens, caractérisés par une organisation des gènes en opérons (van Hoek et Hogeweg, 2007). Pour ces auteurs, le processus débuterait par des pertes individuelles de gènes suite à des phénomènes de mutations. Lorsqu'un gène appartenant à un opéron et ayant un rôle clé dans une voie métabolique est perdu, alors cette dernière peut perdre sa fonctionnalité, ce qui causerait la perte du reste des gènes de l'opéron. Ce phénomène est également en accord avec le mécanisme de perte des gènes décrit dans la théorie des "Domino" pour laquelle la réduction des génomes des endosymbiotes serait graduelle dans un premier temps (perte d'un gène), puis rapide dans un second temps (perte de larges portions opéroniques) (Dagan et al., 2006).

Enfin, selon certains auteurs le phénomène d'érosion progressif du génome de Buchnera perdurerait à l'heure actuelle (Gil et al., 2002; Latorre et al., 2005), ce qui semble se confirmer avec le récent séquençage du génome de Buchnera du puceron du cèdre (Silva et al., 2001; Perez-Brocal et al., 2006). Ce phénomène mènerait à des génomes symbiotiques qui ne conserveraient que les gènes essentiels aux intéractions hôte/symbiote (Gomez-Valero et al., 2007). Néanmoins, en comparaison aux bactéries de forme libre, le chromosome du symbiote connaîtrait actuellement une longue période de stase génomique.

2.1.2 La "quasi"-stabilité du génome de Buchnera

L'analyse des quatre génomes de Buchnera séquencés à ce jour a révélé, malgré un haut degré de divergence des séquences nucléotidiques, une remarquable conservation de leur architecture (Tamas et al., 2002; Silva et al., 2003; van Ham et al., 2003) en comparaison des remaniements que subissent les génomes des bactéries de forme libre. Il existe en effet une parfaite synténie, qui se définit comme la conservation de l’agencement des gènes au niveau de la séquence chromosomique, respectivement entre Buchnera et E. coli, et entre les quatre génomes de Buchnera connus à l’heure actuelle (Moran et Mira, 2001; Silva et al., 2001; Tamas et al., 2002; Perez-Brocal et al., 2006). Bien que les inversions soient des événements évolutifs courants chez les γ-protéobactéries (Belda et al., 2005), aucune inversion, translocation, duplication ou acquisition de gènes

José Viñuelas 39 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

n’a été observée chez Buchnera Ap et Buchnera Sg, depuis leur divergence il y a 50 à 70 millions d’années (Clark et al., 1999). Par ailleurs, seuls quatre réarrangements mineurs ont été identifiés chez Buchnera Bp par rapport aux deux autres : deux inversions, l'une touchant l’ensemble des gènes ygfZ-prfB-lysS-lysA-lgt-thyA et l’autre le gène pyrF, et deux translocations concernant les gènes trpEG et leuABCD situés sur les plasmides (van Ham et al., 2003) (Figure 6).

Les seules différences observées dans les génomes de ces trois Buchnera sont principalement liées à la perte de certains gènes impliqués dans des voies métaboliques dont l'hôte n'a pas besoin (cf. Synthèse Bibliographique § 3.4). Diverses hypothèses ont été formulées sur la stabilité génomique de Buchnera. L’environnement relativement confiné dans lequel évolue cette bactérie qui limite la probabilité de transferts horizontaux, mais surtout la perte, lors de la réduction massive de son génome, de séquences incluant des éléments de plasticité comme des phages, des séquences répétées ou encore des transposons, pourrait expliquer cette stase génomique (Andersson et Kurland, 1998; Shigenobu et al., 2000; Andersson et al., 2002; Tamas et al., 2002). De même, la perte de gènes fortement impliqués dans le phénomène de recombinaison, tels que recA et recF pourrait jouer un rôle dans cette stabilité génomique (Tamas et al., 2002; Silva et al., 2003).

Enfin, le génome de la bactérie du puceron du cèdre représente un cas à part. En comparaison aux génomes des trois autres Buchnera séquencés à ce jour, ce génome a connu la perte de nombreux gènes relatifs à la plupart des classes fonctionnelles et localisés tout le long du chromosome, pour aboutir à une taille finale d'environ 416 kpb (Perez- Brocal et al., 2006). Malgré ces nombreuses pertes, la synténie entre les quatre génomes de Buchnera n'est pas remise en cause (Perez-Brocal et al., 2005; 2006) (Figure 7). Cependant, la petite taille de ce génome, à la limite entre bactérie symbiotique et organite, a poussé les auteurs à l'origine du séquençage à émettre des doutes vis-à-vis de la conservation des capacités symbiotiques de cette souche de Buchnera. En effet, chez le puceron du cèdre, les capacités de complémentation alimentaire de Buchnera seraient complétées sinon remplacées par des symbiotes secondaires présents en grande quantité dans cette espèce. L'exemple de Buchnera Cc n'est pas un cas isolé de génome très réduit parmi les symbiotes des pucerons. Des études préliminaires par électrophorèse en champ pulsé sur le chromosome de neuf Buchnera issus

José Viñuelas 40 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

de cinq sous-familles de pucerons, montrent une réduction de la taille du génome semblable à celle de Buchnera Cc (Gil et al., 2002). Ces observations confirment que, même si les grandes étapes de réduction du génome eurent lieu durant la transition entre le dernier ancêtre commun aux bactéries de forme libre et le dernier ancêtre symbiotique commun à l'ensemble des souches de Buchnera (Silva et al., 2003), un processus de réduction perdure toujours, mais de manière beaucoup plus lente (Silva et al., 2001; Latorre et al., 2005).

José Viñuelas 41 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

A

Métabolisme de l'ADN Métabolisme du soufre Métabolisme de l'ARN Métabolisme des cofacteurs et des vitamines Maturation des protéines, repliement et sécrétion Membranes cellulaires Forme et division cellulaire Biosynthèse du peptidoglycane Transport Membranes externes Détoxification Machinerie du flagelle Métabolisme des sucres Gènes peu caractérisés Métabolisme du pyruvate et cycle de Krebs Pseudogènes Métabolisme énergétique Composantes ARN Biosynthèse des acides aminés Biosynthèse des lipides Biosynthèse des nucléotides

B

E. coli

10 kb Buchnera

Figure 7. Illustration de la synténie des chromosomes de Buchnera aphidicola. (A) Comparaison des cartes des génomes séquencés de quatre Buchnera aphidicola et du génome reconstruit de leur dernier ancêtre symbiotique commun (LCSA). De l'extérieur vers l'intérieur, les cercles concentriques représentent les gènes du LCSA respectivement (i) absents et (ii) présents dans le plus petit génome de Buchnera (issue du puceron Cinara cedri), ainsi que la totalité des gènes du chromosome de Buchnera issues des pucerons (iii) Acyrthosiphon pisum, (iv) Schizaphis graminum, (v) Baizongia pistaciae et (vi) Cinara cedri. Les différentes couleurs représentent la classe fonctionnelle d'appartenance d'un gène. Elles permettent également d'apprécier la synténie des quatre génomes (d'après Perez-Brocal et al., 2006). (B) Fragment chromosomique illustrant la synténie entre Buchnera Ap et E. coli. Les loci délétés sont reportés en blanc et les gènes orthologues portent les mêmes couleurs dans les deux bactéries. Chez E. coli, les gènes déplacés vers le haut sont localisés sur le brin direct et les autres sur le brin indirect (d'après Moran et al., 2001).

José Viñuelas 42 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

2.1.3 Buchnera est-elle irremplaçable ?

De nombreuses espèces de pucerons possèdent des bactéries non obligatoires communément appelées symbiotes secondaires. Ces symbiotes sont généralement transmis de manière verticale à la descendance, bien que de nombreuses études montrent des phénomènes d'acquisition horizontale de ces bactéries (Chen et Purcell, 1997; Sandstrom et al., 2001; Russell et Moran, 2005; Sakurai et al., 2005; Tsuchida et al., 2005). A ce jour, cinq différents types de bactéries secondaires ont pu être identifiés chez les pucerons. Trois d'entre eux appartiennent aux γ-protéobactéries. Ils sont nommés (i) PASS (Pea Secondary Symbiont) ou "type R", (ii) PABS (Pea Aphid Bemisia-type Symbiont) ou "type T", (iii) PAUS (Pea Aphid U- type Symbiont) ou "type U". (Unterman et al., 1989; Chen et Purcell, 1997; Darby et al., 2001; Sandstrom et al., 2001; Simon et al., 2003). (iv) La quatrième est une α-protéobactérie de type Rickettsia et se nomme PAR (Pea Aphid Rickettsia) (Chen et al., 1996; Tsuchida et al., 2004), (v) la cinquième étant une bactérie du genre Spiroplasma (Fukatsu et al., 2001). Il est à noter que pour les symbiotes de type R, T et U, les noms de "Candidatus Serratia symbiotica", "Candidatus Hamiltonella defensa" et "Candidatus Regiella insecticola" ont été récemment proposés par Moran et collaborateurs (2005b), alors que Darby et collaborateurs proposent pour ces deux derniers types les noms de "Candidatus Consessoris aphidicola" et de "Candidatus Adiaceo aphidicola" (Darby et al., 2005).

La présence et le nombre de ces symbiotes secondaires sont très variables selon les espèces de pucerons, de même que leur localisation au sein de leur hôte. A ce jour, ils ont pu être localisés dans trois sites différents : (i) dans des bactériocytes secondaires différents de ceux renfermant Buchnera mais très proches géographiquement de ces derniers au sein du bactériome, (ii) dans les cellules interstitielles, et (iii) dans l'hémolymphe de l'insecte (Fukatsu et al., 2000; Sakurai et al., 2005; Tsuchida et al., 2005). Bien que non essentiels à la survie et/ou à la reproduction du puceron (Fukatsu 2000), plusieurs études ont montré que ces symbiotes secondaires pouvaient jouer un rôle capital dans la biologie de leur hôte et en particulier dans son adaptation aux conditions de vie extrêmes. PASS interviendrait dans la résistance des pucerons aux températures élevées (Montllor et al., 2002), même si le rôle prépondérant de Buchnera dans la résistance de l'insecte à ce type de stress a été récemment mis en évidence (Dunbar et al., 2007). PASS conférerait également, tout comme PABS, une certaine protection aux pucerons contre

José Viñuelas 43 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

leurs ennemis naturels et notamment les parasitoïdes (Oliver et al., 2003; Ferrari et al., 2004; Oliver et al., 2005; 2006). Enfin, PAUS favoriserait l'adaptation et le bon développement du puceron sur des plantes, à l'origine, inhospitalières (Tsuchida et al., 2004; Ferrari et al., 2007), et protégerait le puceron de certains champignons pathogènes (Scarborough et al., 2005).

Koga et collaborateurs (2003) ont étudié les interactions symbiotiques entre PASS, Buchnera et le puceron. Grâce à un traitement à la rifampicine et à l'ampicilline, l'élimination spécifique respectivement de Buchnera et de PASS a pu être réalisée. Par la suite, des expériences d'injection de PASS dans l'hémolymphe du puceron a permis de réinfecter ce dernier par les bactéries secondaires. Les auteurs ont ainsi pu mettre en évidence, qu'en présence de Buchnera, la réinfection de PASS affectait la croissance et la reproduction du puceron. Cet effet serait dû à l'importante prolifération de PASS, suite à la réinfection, dans l'hémolymphe et dans les bactériocytes primaires où une compétition entre bactéries secondaires et Buchnera s'instaurerait : les auteurs suggèrent que l'élimination du symbiote primaire soit causée par la réinfection par les bactéries secondaires. Cette virulence de PASS n'est pas observée lorsque la souche de pucerons est naturellement porteuse de ces bactéries. En revanche, les auteurs ont montré, qu'en l'absence de Buchnera, une réinfection par PASS complémente la perte du symbiote primaire. PASS semble alors pouvoir assurer le rôle de Buchnera notamment vis-à-vis de la reproduction de l'insecte. La capacité de PASS à remplacer Buchnera est également confirmée d'un point de vue cytologique puisque les bactéries secondaires se localisent, après réinfection, dans les bactériocytes primaires contenant initialement Buchnera (Figure 8).

José Viñuelas 44 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

A B C

Figure 8. Hybridation in situ de PASS (en rouge) et de Buchnera (en vert) réalisées sur une coupe histologique d'embryon de pucerons suite à différents traitements. (A) Souche de pucerons porteuse de PASS à l'état naturel (la localisation spécifique de PASS est ici mise en évidence via les flèches blanches) : cette photo illustre une localisation ordonnée de PASS dans les bactériocytes secondaires et dans les cellules interstitielles, ainsi que l'absence d'invasion ou de prolifération de cette bactérie dans les bactériocytes primaires et dans l'hémolymphe. (B) Souche de pucerons possédant uniquement Buchnera injectée avec PASS : la photo illustre une prolifération massive de PASS dans l'hémolymphe. (C) Souche de pucerons privée de Buchnera par traitement à la rifampicine et injectée par PASS : la photo montre la colonisation organisée du bactériocyte primaire par PASS. La barre d'échelle correspond à une longueur réelle de 50 µm (d'après Koga et al., 2003).

L'étude menée par Koga et collaborateurs montre que Buchnera pourrait être remplacée par les symbiotes secondaires dans ses fonctions symbiotiques vis-à-vis du puceron. Sans pour autant parler de remplacement du symbiote primaire par les secondaires, le puceron du cèdre est un exemple souvent reporté dans la littérature dans lequel la fonction symbiotique de Buchnera est très limitée et probablement complémentée par les symbiotes secondaires. En effet, le séquençage du génome de Buchnera issue de ce puceron a révélé une importante réduction de taille par rapport aux trois autres génomes disponibles. Cette réduction s'est accompagnée de la perte de gènes importants pour le couple symbiotique tels que ceux de biosynthèse de la riboflavine, suggérant l'absence de certaines capacités symbiotiques de Buchnera. Une seconde observation a été la perte des gènes trpDCBA codant les enzymes intervenant dans les dernières étapes de biosynthèse du tryptophane, et par conséquent des capacités à produire cet acide aminé par Buchnera Cc (Perez-Brocal et al., 2006). Malgré cela, cette dernière a conservé le plasmide pTrp portant les gènes trpE et trpG relatifs à la première étape de biosynthèse du tryptophane (Gosalbes et al., 2008). La synthèse de ce dernier chez Cinara cedri serait alors assurée de façon complémentaire par Buchnera et des bactéries secondaires de type PASS. A ce propos, il est à noter que les premières données génomiques concernant PASS ont montré la présence dans le chromosome de ces bactéries de

José Viñuelas 45 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

l'opéron trpDCBA, ce qui suggère l'établissement entre le puceron, Buchnera et PASS d'un consortium symbiotique (Gosalbes et al., 2008).

Enfin, certains pucerons de la tribu des Cerataphidini représentent un exemple où les fonctions symbiotiques de Buchnera sont assurées par un symbiote extracellulaire de type ascomycète localisé dans la cavité abdominale du puceron (Fukatsu et Ishikawa, 1996).

2.2 Organisation et propriétés des génomes de Buchnera aphidicola

D'un point de vue très général, les génomes de Buchnera aphidicola se composent d’un chromosome circulaire et le plus souvent de deux plasmides, eux aussi circulaires, nommés pLeu et pTrp, l'ensemble faisant respectivement 652 et 653 kpb pour Buchnera Ap et Sg (Charles et Ishikawa, 1999; Tamas et al., 2002). Le plasmide pLeu comporte sept ORF et contient l’opéron complet leuABCD, portant les gènes de biosynthèse de la leucine. Le plasmide pTrp se compose lui, de deux répétitions en tandem de l’opéron trpEG (Shigenobu et al., 2000). Les données ci-dessus varient légèrement pour Buchnera Bp, qui possède un génome de taille inférieure aux deux autres (618 kpb) et un unique plasmide qualifié de cryptique, celui-ci ne contenant que deux gènes codant des réplicases (van Ham et al., 2003). Une description plus détaillée des plasmides de Buchnera sera présentée dans la suite de ce manuscrit (cf. Résultats § 2.1.1). Enfin, le génome de Buchnera Cc est le plus petit génome de Buchnera séquencé à ce jour, avec une taille de 422 kpb (Tableau 1). Il est à noter que, sur l’ensemble des quatre génomes de Buchnera séquencés à ce jour, seuls deux gènes (yba3 et yba4) ne semblent pas avoir d’orthologues chez Escherichia coli (van Ham et al., 2003; Perez-Brocal et al., 2006).

José Viñuelas 46 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Tableau 1. Comparaison des caractéristiques des génomes des symbiotes primaires des pucerons Acyrthosiphon pisum (BAp), Schizaphis graminum (BSg), Baizongia pistaciae (BBp) et Cinara cedri (BCc) (d'après Perez-Brocal et al., 2006 et Gosalbes et al., 2008).

Caractéristiques génomiques BAp BSg BBp BCc

Taille du génome (en kpb) 652,115 653,001 618,379 422,434 Plasmides pLeu + pTrp pLeu + pTrp Cp pLeu + pTrp Taille totale des plasmides (en kpb) 11,434 11,547 2,399 8,849 Taille du chromosome (en kpb) 640,681 641,454 615,98 416,38 Taux base GC (total) (en %) 26,3 25,3 25,3 20,1 Taux base GC (régions intergéniques) (en %) 15,3 14,3 15,4 8,5 Régions codantes (en %) 86,8 84,3 81,2 85,1 Nombre total de gènes 609 597 545 404 Codant les protéines (chro + plas) 562 + 9 550 + 9 504 + 3 357 + 7 ARNr 3 3 3 3 ARNt 32 32 32 31 Autres ARN 3 3 3 3 Pseudogènes 13 33 9 3 Taille moy. régions codantes (en pb) 990,2 982,7 990,4 993,7 Taille moy. régions intergéniques (en pb) 126,9 113,3 200,5 135,8

2.2.1 Des caractéristiques comparables à celles d'autres endocytobiotes

Les études de génomique comparative menées sur les génomes de plusieurs endocytobiotes d'insectes ont mis en évidence un ensemble de caractéristiques communes à toutes ces bactéries intracellulaires obligatoires. En effet, (i) réduction de taille, (ii) absence totale de recombinaison, (iii) augmentation du taux de substitutions nucléotidiques, (iv) composition importante en bases adénine (A) et thymine (T), (v) accumulation de mutations délétères, (vi) perte du biais d'usage de code, et (vii) accélération de la vitesse d'évolution, semblent être les principales propriétés des ces génomes (Moran, 1996; Andersson et Kurland, 1998; Clark et al., 1999; Moya et al., 2002; Wernegreen, 2002; Gil et al., 2004a).

Une autre propriété du génome de Buchnera, commune aux génomes de nombreux endocytobiotes, est son taux relativement faible de bases guanine (G) et cytosine (C) (en moyenne de 25%). Ce déséquilibre compositionnel est expliqué par un fort biais mutationnel en faveur des bases A et T, qui touche avant tout les régions non codantes (environ 90% de bases A et T), mais également les régions codantes en modifiant notamment l'usage de code et la composition en acides aminés de certaines

José Viñuelas 47 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

protéines (Charles et al., 2006). Selon certains auteurs, ce biais mutationnel en faveur des bases A et T observé chez de nombreuses bactéries intracellulaires obligatoires aurait une double origine. Il serait dû à une altération des capacités de ces bactéries à réparer l'ADN à laquelle s'ajoutent les mutations (le plus souvent de type GC AT) provoquées par les stress que ces organismes subissent en environnement intracellulaire (Wernegreen et Funk, 2004). Le stress oxydatif, par exemple, produit classiquement des transitions de type GC AT et des substitutions de type G/C A/T (Wang et al., 1998). De même, les déaminations de cytosines souvent couplées à la transcription, induisent d'importants dommages dans les génomes bactériens causant des transitions de type GC AT (Francino et al., 1996; Francino et Ochman, 2001). Or, la perte de nombreux gènes codant des enzymes de réparation de l'ADN aurait rendu Buchnera et d'autres bactéries symbiotiques incapables de réparer ce type de mutations, suggérant l'absence d'un caractère de sélection dans l'origine du biais AT (Wernegreen et Funk, 2004).

2.2.2 Réplication, transcription et traduction chez Buchnera

La réplication de l'ADN représente l'un des processus les plus importants pour une cellule vivante. Par opposition aux mécanismes de recombinaison, gravement affectés au cours de l'évolution du génome de Buchnera, l'analyse des quatre génomes séquencés à ce jour montre une relativement bonne conservation des mécanismes impliqués dans la réplication de la double hélice d'ADN. En effet, bon nombres de gènes codant l'holoenzyme ADN Polymérase III (dnaE, dnaN, dnaQ, dnaX, holA, holB), ou encore les gènes codant l'hélicase DnaB, la primase DnaG, les sous-unités A et B de la gyrase Gyr, la ligase Lig ou encore la protéine de liaison à l'ADN simple brin SSB sont présents dans ces génomes (Perez- Brocal et al., 2006). Cependant, il semblerait que le contrôle du nombre de copies du chromosome lors de la réplication ait été touché au cours du processus évolutif. Chaque Buchnera contient, en effet, de nombreuses copies de son génome (60 à 80 copies par cellule) et contient globalement dix fois plus d’ADN que E. coli (Komaki et Ishikawa, 1999). Cette polyploïdie pourrait être due à la perte de gènes impliqués dans le métabolisme de l'ADN comme seqA et datA qui, dans des bactéries apparentées à Buchnera, contrôlent la réplication dans le cycle cellulaire. Leur disparition aurait entraîné l'augmentation du nombre de copies du chromosome chez Buchnera (Tamas et al., 2002). Une autre hypothèse serait que la présence de plusieurs copies du génome permettrait à Buchnera de faire contrepoids

José Viñuelas 48 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

aux nombreuses mutations délétères en augmentant la probabilité d’avoir des copies fonctionnelles (non touchées par les mutations) de ses gènes (Komaki et Ishikawa, 1999). Enfin, en 2000 Komaki et Ishikawa ont également montré que cette forte polyploïdie variait en fonction de l'âge du puceron. Ainsi le nombre de copies varie d'environ 50 chez les embryons au dernier stade embryonnaire à plus de 100 chez les adultes (18 jours d'âge) avant de redescendre à environ 80 pour les pucerons les plus âgés (40 jours d'âge), suggérant ainsi l'existence d'une corrélation entre la réplication de l'ADN de Buchnera et les conditions physiologiques de son hôte (Komaki et Ishikawa, 2000).

La réduction du génome de Buchnera n’a pas été sans effets sur la transcription de ses gènes. A l'exception de dnaA, la plupart des régulateurs et atténuateurs de la transcription mis en évidence chez E. coli ont disparu, y compris ceux régulant la synthèse des acides aminés (Shigenobu et al., 2000). De même, les systèmes à "deux composants" basés sur la phosphorylation des éléments de régulation en réponse à des changements environnementaux, sont absents chez Buchnera. Enfin, Buchnera aphidicola ne possède que deux facteurs sigma (σ32 et σ70 codés respectivement par rpoH et les gènes rpoABCD), contre sept pour E. coli (Blattner et al., 1997; Shigenobu et al., 2000; Panina et al., 2001). Bien que le symbiote possède le système phosphoenolpyruvate-carbohydrate phosphotransferase (PTSs), impliqué chez de nombreuses bactéries dans la répression catabolique par l’AMPc, les gènes codant l’adénylate cyclase (cyaA) et le récepteur à l’AMPc (crp) sont absents (Shigenobu et al., 2000). Ceci suggère l’absence totale d’une régulation de la transcription par l’AMPc lors d’un changement de source carbonée. Néanmoins, une alternative possible à cette probable absence de régulation transcriptionnelle via l'AMPc, pourrait être chez Buchnera la présence d’un régulateur de stockage du carbone (CsrA), impliqué dans une régulation post-transcriptionnelle des gènes intervenant dans le métabolisme des sucres (Nogueira et Springer, 2000). Cette protéine est conservée dans les quatre génomes de Buchnera. De même, nous retiendrons la conservation de gènes codant des terminateurs, antiterminateurs, ou facteurs d'élongation de la transcription tels que le gène rho, les gènes nusA et nusG, ou encore greA. Il faut savoir également que la richesse du génome de Buchnera en bases A et T rend particulièrement difficile l'identification et la localisation des séquences régulatrices, elles mêmes souvent riches en ces bases (Baumann et al., 1995). De plus, la recherche de ces régions de régulation

José Viñuelas 49 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

est réalisée par homologie avec E. coli, chez qui elles ont été identifiées expérimentalement. Or, l'hypothèse de la perte des régions de régulation ou de la dégénérescence de ces dernières établie sur la base de cette homologie est tout à fait contestable. Des promoteurs en apparence dégradés pourraient être toujours fonctionnels chez Buchnera. Une autre possibilité serait que la bactérie utilise des séquences de régulation différentes de celle d'E. coli. Enfin, l'apparition de nouveaux groupes de gènes contigus causée par le processus de réduction du génome, aurait pu donner vie à de nouvelles unités de transcription non retrouvées chez les bactéries de forme libre (Moran et Mira, 2001).

Une autre conséquence de la réduction du génome de Buchnera, cette fois-ci au niveau des éléments de la traduction, est la conservation d’une unique copie des gènes relatifs aux trois ARN ribosomaux (16S : rrs ; 23S : rrl ; 5S : rrf), répartis en deux unités de transcription, et de seulement 32 ARN de transfert (31 pour Buchnera Cc) eux aussi présents en une seule copie par génome de Buchnera (Baumann et al., 1995; Shigenobu et al., 2000; Moran et Mira, 2001). Cet agencement diffère des sept copies de l’opéron unique relatif aux ARN ribosomaux et des 86 ARN de transferts retrouvés dans le génome d'E. coli (Blattner et al., 1997). Concernant les ribosomes, la comparaison des quatre génomes de Buchnera révèle, entre les différentes souches, une parfaite conservation des 54 gènes codant les protéines ribosomales présents dans les bactéries de forme libre telles que E. coli ou S. typhimurium. Certains facteurs de traduction semblent avoir été également très bien conservés entre les différentes Buchnera. On peut citer par exemple les facteurs d'initiation de la traduction tels que InfA, InfB et InfC, d'élongation de la traduction tels que Efp, FusA, LepA, Tsf et TufA ou encore de terminaison de la traduction tels que PrfA et PrfB.

Enfin, il est important de préciser que les gènes impliqués dans la réplication de l'ADN, la transcription et la traduction, sont également conservés dans le génome du symbiote du puceron du cèdre. Ces gènes font partie du jeu minimal de gènes proposé par Gil et collaborateurs comme étant nécessaire à la survie d'une bactérie (Gil et al., 2004b).

2.2.3 Adaptation aux stress environnementaux

Suite à la réduction de son génome, Buchnera aphidicola a également perdu de nombreux gènes intervenant dans la réparation et dans la recombinaison de son ADN. Parmi ceux-ci, les gènes recA et recF cités

José Viñuelas 50 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

précédemment, mais aussi les gènes uvrABC codant des protéines impliquées dans la lutte contre les effets des ultraviolets sur l’ADN (Moran et Mira, 2001). De même, les gènes impliqués dans la réponse SOS, dans la synthèse de lipopolysaccharides et de phospholipides, dans la méthylation ou la restriction de l’ADN sont absents chez Buchnera. Une seconde hypothèse sur la conservation des gènes recBCD chez Buchnera serait que l'exonucléase codée par ces derniers pourrait assurer une fonction de réparation de l'ADN afin de suppléer l'absence de réparation par recombinaison due à la perte du gène recA (van Ham et al., 2003), élément clé pour cette fonction (Hughes, 2000). Cette hypothèse est renforcée par la conservation des gènes recBCD chez le plus petit génome de Buchnera connu à ce jour (Perez-Brocal et al., 2006). La perte de gènes de réparation et de recombinaison de l'ADN serait une conséquence de la vie intracellulaire prolongée de la bactérie, qui la protège des agressions environnementales extérieures, par opposition aux bactéries de forme libre qui y sont soumises quotidiennement (Shigenobu et al., 2000; Moran et Mira, 2001).

En ce qui concerne la réponse au stress thermique, Buchnera n’a conservé que 20 des 35 gènes présents dans le régulon de choc thermique d’E. coli, parmi lesquels rpoH (codant le facteur de régulation σ32), mopA et mopB (qui codent GroEL et GroES), dnaK, dnaJ, et grpE. Des expériences de puce à ADN ont montré que Buchnera possédait encore la capacité de sur-exprimer ces gènes au cours d'un stress à la chaleur, bien que d'une façon réduite par rapport à E. coli (Wilcox et al., 2003). De plus, les ARN messagers relatifs au complexe protéique GroELS sont abondamment exprimés en l'absence de tout stress chez Buchnera (Moran et al., 2003b; Wilcox et al., 2003). En particulier, la protéine GroEL représente à elle seule 10% des protéines produites par Buchnera (Sato et Ishikawa, 1997; Wernegreen, 2002). Un des rôles les plus importants de ces chaperonnes est classiquement de permettre le repliement correct des protéines (Watson, 1990). Leur sur-expression tamponnerait alors les effets de l'accumulation de mutations dites "faiblement délétères" (Fares et al., 2002), source de nombreuses substitutions d’acides aminés (Moran, 2003; Rispe et al., 2004) qui pourraient affecter la stabilité et la bonne conformation des protéines de Buchnera. Enfin, la présence et la sur-expression de GroELS, pourraient être aussi dues à des stress liés à la vie endocytobiotique, différents de ceux connus pour les bactéries de forme libre, comme par exemple le stress oxydatif présent en environnement intracellulaire.

José Viñuelas 51 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

2.2.4 Quelques voies métaboliques chez Buchnera Cette partie de la synthèse bibliographique de ce manuscrit présente une vue d'ensemble des quatre génomes séquencés de Buchnera. Les voies métaboliques impliquées dans la biosynthèse des acides aminés feront l'objet d'un chapitre à part.

2.2.4.1 Glycolyse, gluconéogenèse et cycle de l'acide citrique

La glycolyse, voie dans laquelle le glucose est oxydé en pyruvate, représente la principale voie catabolique d'utilisation des sucres. L'ensemble des gènes relatifs à cette voie est conservé chez Buchnera. Le symbiote primaire du puceron a également conservé les gènes aceE et aceF codant le complexe pyruvate déshydrogénase qui lui permet d'oxyder le

pyruvate pour obtenir comme produits finaux du CO2 et de l'acéthyl-CoA. Il semblerait cependant que Buchnera soit incapable de synthétiser le coenzyme A (dont elle a besoin pour produire l'acéthyl-CoA) sans l'aide de son hôte (Zientz et al., 2004). Inversement, la gluconéogenèse n'est plus fonctionnelle chez Buchnera, notamment suite à la perte du gène fbp codant la fructose 1,6- biphosphatase. Cette enzyme, intervenant dans la gluconéogenèse, joue également un rôle important dans la régulation de l'équilibre entre glycolyse et gluconéogenèse. Elle permet notamment la conversion du fructose 1,6-biphosphate en fructose 6-phosphate. De même, la bactérie a perdu l'ensemble des gènes du cycle de l'acide citrique à l'exception des gènes sucA et sucB codant l'α-cétoglutarate déshydrogénase. Or, on sait que l'activité de cette enzyme conduit à la production de succinyl-CoA qui est requis dans la biosynthèse de la lysine. Cependant, la source en α-cétoglutarate de Buchnera reste encore inconnue.

Enfin, la présence d’un opéron F0-F1 de type ATP synthétase indique que Buchnera est capable de produire de l’ATP à partir du gradient électrochimique de protons issu du système de transport d’électrons (Shigenobu et al., 2000; Wernegreen, 2002). Cependant, ce système a été perdu par Buchnera issu du puceron Cinara Cedri. La production d'ATP pourrait être réalisée de façon alternative via le système phosphotransacétylase (Pta) / acétate kinase (AckA) qui, lui, est conservé dans les quatre génomes de Buchnera. L'ATP est alors issu de la production d'acétate à partir d'acétyl-CoA, ce qui représenterait une source d'énergie additionnelle pour compenser, par exemple, la perte du cycle de l'acide citrique (Zientz et al., 2004) (Figure 9).

José Viñuelas 52 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

phosphate petits solutés Zn2+ TRANSPORT ? ? glucose noyau de PitA MFS ABC GlpF ABC Krebs la cellule PTS hôte porine

METABOLISME peptidoglycane DU SOUFRE sulfate H S 2 Cys Mitochondrie BIOSYNTHESE DE LA MEMBRANE muréine Ser Gly CELLULAIRE GLYCOLYSE BIOSYNTHESE DES NUCLEOTIDES D-Ala-D-Ala glucose-6-phosphate VOIE DES PENTOSES UMP Pyrimidines D-Ala Ala Voie de recyclage Glu UDP-GlcNac fructose-6-phosphate D-Glu ribose-5-phosphate PRPP des Purines

dihydroxyacétone phosphate cardiolipine IGP + AICAR IMP GTP glycéraldéhyde-3-phosphate érythrose-4-phosphate dihydro-ptéroate phosphatidylglycérol riboflavine

UQ IPP chorismate phosphatidyléthanolamine FMN Ala His THF, DHF, folate pyruvate Trp Phe BIOSYNTHESE DES FAD PHOSPHOLIPIDES Ile, Leu, Val CoA pentothénate BIOSYNTHESE DES précurseur ? Biotine acétyl-CoA ACIDES AMINES EXPORT DE PROTEINES acétyl-phosphate Lys Thr Krebs BIOSYNTHESE DES COFACTEURS Asp NAD+ NADP+ acétate acétyl-ACP Translocation H+ Glu Arg H2O de protéines BIOSYNTHESE DES hème F0F1-ATPase ACIDES GRAS ? porphobilinogène Uroporphynogène III Export par O2 malonyl-ACP sirohème + le flagelle e- NAD malonyl-CoA NADH H+

TRANSPORT Bactériocyte D'ELECTRONS H+

Figure 9. Représentation schématique et comparaison du métabolisme de Buchnera aphidicola issue des pucerons Acyrthosiphon pisum (BAp) et Cinara cedri (BCc). Les voies ou les étapes pour lesquelles aucune enzyme n'a été identifiée chez BAp sont notées en vert, et les voies ou étapes perdues spécifiquement par BCc sont marquées en rose. AICAR, 5'-phosphoribosyl-4- carboxamide-5-aminoimidazoles ; DHF, dihydrofolate ; GlcNac, N- acétylglucosamine ; IGP, imidazoleglycérol phosphate ; IMP, inosine monophosphate ; IPP, delta(3)-isopentenyl-PP ; MFS, perméases de type MFS (Major Facilitator Superfamily) ; PRPP, phosphoribosyl-pyrophosphate ; PTS, système phosphotransférase ; THF, tétrahydrofolate ; UQ, ubiquinone (d'après Shigenobu et al., 2000, et Perez-Brocal et al., 2006).

2.2.4.2 La chaîne respiratoire

Le séquençage des quatre génomes de Buchnera a montré que la bactérie est aérobie stricte. Aucun gène relatif à la fermentation et à la respiration anaérobie n'a été retrouvé. De plus, les données génomiques montrent une parfaite conservation des opérons nuo et cyo respectivement relatifs à la déshydrogénase NADH 1 et au cytochrome C, par rapport à E. coli, et au sein des quatre génomes de Buchnera. Or, la première de ces deux enzymes agit telle une pompe couplant oxydation des substrats et translocation de protons. Ces électrons sont transférés à l'ubiquinone qui les donnera, au final, à la cytochrome-o-oxydase. Cette dernière agit également comme une pompe à protons indispensable dans la chaîne respiratoire.

José Viñuelas 53 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Cependant, l'absence totale des gènes relatifs à la biosynthèse de l'ubiquinone soulève des questionnements. Une possibilité serait que la bactérie puisse s'approvisionner en cet important transporteur d'électrons via son hôte (Shigenobu et al., 2000). Enfin, bien que la superoxyde dismutase (SodA) soit conservée chez Buchnera, la plupart des systèmes détoxifiants dont la catalase, ont été perdus. Il est alors possible que la génération de composés oxygénés toxiques et de radicaux libres durant la respiration cellulaire puisse contribuer à l'important taux de mutations que connaît le génome de Buchnera (Itoh et al., 2002).

2.2.4.3 La voies des pentoses phosphates

Un des rôles majeurs de la voie des pentoses phosphate est la synthèse de NADPH, qui intervient dans la réduction de nombreux composés et notamment lors de la biosynthèse des acides gras ou des nucléotides. Cette voie est conservée chez Buchnera. Nous pouvons citer comme exemple la présence des gènes zwf, pgl et gnd, codant respectivement la glucose-6-phosphate déshydrogénase, la 6-phospho- gluconolactonase, et la 6-phospho-gluconate décarboxylase, qui interviennent dans les trois premières étapes de la branche oxydative de la voie des pentoses phosphates (Zientz et al., 2004).

2.2.4.4 Biosynthèse du LPS, des phospholipides et des acides gras

En ce qui concerne les composants de la membrane cellulaire, l'analyse des différents génomes de Buchnera amène à la conclusion que le symbiote possède très peu de gènes codant des lipoprotéines et des protéines membranaires, mais surtout que la bactérie n'est plus capable de synthétiser des lipopolysaccharides (LPS). De plus, Buchnera ne possède plus le gène imp codant une protéine membranaire qui intervient dans le transport du LPS vers la surface cellulaire chez les bactéries Gram négatif (Bos et al., 2004). La membrane cellulaire de Buchnera semble donc particulièrement vulnérable, ce qui pourrait s'expliquer par son mode de vie intracellulaire qui la protège des attaques extérieures (Shigenobu et al., 2000). Une surprenante constatation est l'absence de gènes impliqués dans la biosynthèse des phospholipides. Ces derniers étant des composants indispensables à la formation de la bicouche lipidique membranaire, il serait possible que Buchnera les importe à partir du bactériocyte hôte (Zientz et al., 2001; Gil et al., 2004b).

José Viñuelas 54 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Concernant les acides gras, la situation est relativement variable entre les différentes souches de Buchnera. Néanmoins, il semblerait que, d'un point de vue global, cette voie de biosynthèse ne soit plus fonctionnelle : Buchnera importerait depuis son hôte les phospholipides dont elle a besoin (Zientz et al., 2004).

2.2.5 Les systèmes de transport chez Buchnera

Malgré la conservation des gènes du système Sec, impliqués dans le transport des protéines, on note chez Buchnera la perte de nombreux gènes intervenant dans des fonctions de transport chez les bactéries de forme libre. Dans BuchneraBase, on dénombre respectivement 53, 54 et 50 gènes impliqués dans des fonctions de transport au sens large chez Buchnera issue d'A. pisum, de S. graminum et de B. pistaciae (http://www.york.ac.uk/res/thomas/Buchnerabase/home.cfm) (Prickett et al., 2006). La fonction de transport parait être encore plus dégradée chez le symbiote primaire de C. cedri par rapport aux trois autres Buchnera (Perez- Brocal et al., 2006). Bien que le système de transport ABC, assurant le transfert de nutriments et autres substances au travers de la membrane cellulaire, soit l’un des plus représentés chez de nombreuses espèces bactériennes (Tomii et Kanehisa, 1998), seuls quelques gènes de ce système ont été retrouvés chez le symbiote du puceron (Shigenobu et al., 2000). On note, par exemple, la conservation des gènes mdlA et mdlB intervenant dans l'exportation de divers composés toxiques pour la bactérie. De plus, à l’exception du système PTS (phosphoenolpyruvate-carbohydrate phosphotransférase), qui permet l’import potentiel de glucose et de mannitol, aucun autre système de transporteur spécifique d’un substrat n’a été mis en évidence chez Buchnera (Shigenobu et al., 2000). Ce système n'est pas présent dans le génome de Buchnera issue du puceron C. cedri. Enfin, une des particularités du génome de Buchnera est la conservation de nombreux gènes de structure constituant le flagelle (corps basal et crochet) à l'exception les gènes fliC et fliD codant respectivement le filament du flagelle et sa partie terminale (Tamas et al., 2002). L’absence du filament du flagelle, associée à celle de gènes relatifs au chimiotactisme, suggère que Buchnera n’est pas une bactérie mobile (Shigenobu et al., 2000). Il a été alors proposé que la bactérie utilise les composants conservés du flagelle pour une nouvelle fonction comme par exemple celle de transporteur. La fonction de transport via le flagelle n'est pas un concept nouveau chez les entérobactéries pathogènes telles que Salmonella typhimurium et Yersinia enterolitica. En effet, ces deux bactéries peuvent utiliser l'appareil flagellaire comme système de sécrétion

José Viñuelas 55 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

de protéines et de facteurs de virulence lors de phases d'infection d'une cellule hôte (Kubori et al., 1998; Young et al., 1999). De plus, Majander et collaborateurs ont montré, chez Escherichia coli, la capacité de la machinerie flagellaire des mutants fliC et fliD à fonctionner comme un transporteur de peptides (Majander et al., 2005). Enfin, une récente étude menée par Maezawa et collaborateurs a mis en évidence chez Buchnera la présence de plusieurs centaines de corps basaux de flagelle en surface de membrane (Maezawa et al., 2006). Ces auteurs appuient notamment l'hypothèse d'une fonction de transport de protéines via le corps du flagelle qui est constitué par les gènes homologues à ceux composant le système de sécrétion de type III, impliqué dans la virulence de bon nombre de bactéries pathogènes. Cette nouvelle fonction du flagelle pourrait jouer un rôle capital dans les échanges et le maintien de la symbiose entre Buchnera et son hôte le puceron. D’autres candidats au transport chez Buchnera pourraient être des gènes codant des protéines hypothétiques, dont les fonctions comme transporteurs ont été suggérées pour leurs homologues retrouvés chez les bactéries de forme libre. Mais, à l’heure actuelle, le mode de transport de produits métaboliques et en particulier des acides aminés, entre les deux partenaires du couple symbiotique reste totalement énigmatique.

José Viñuelas 56 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

3 Buchnera aphidicola ou "une usine de production d'acides aminés"

3.1 Contexte biologique

3.2 Des évidences nutritionnelles

3.3 Des évidences métaboliques 3.3.1 Les premières études 3.3.2 Le rôle central du glutamate et de la glutamine 3.3.3 Le carbone utilisé par Buchnera

3.4 Des évidences génomiques

3.5 Les études sur la régulation transcriptionnelle

3.1 Contexte biologique

C'est grâce à des moyens d'adaptation spécifiques tels que le développement de leurs pièces buccales en stylet, que les pucerons peuvent se nourrir exclusivement de la sève phloémienne des plantes, et ainsi coloniser cette niche écologique. Très riche en sucre et tout particulièrement en saccharose, la sève phloémienne représente une source abondante de carbone et d'énergie pour le puceron (Febvay et al., 1995; Rhodes et al., 1996). Les acides aminés libres dans la sève phloémienne constituent, quant à eux, la principale source d'azote pour l'insecte. Si le puceron utilise le saccharose comme source d'énergie, les acides aminés sont, en revanche, réservés à la production de composés structuraux (Rhodes et al., 1996). Certains acides aminés aromatiques comme la tyrosine ou la phénylalanine, sont indispensables au développement des insectes (Dadd, 1973). Ils interviennent dans la formation de l'exosquelette, élément fondamental pour le puceron qui doit synthétiser une nouvelle cuticule après chaque mue larvaire. Cependant, l'analyse de la composition de la sève phloémienne révèle des taux déséquilibrés en acides aminés et notamment des quantités très faibles en acides aminés essentiels (Douglas, 1993) (Figure 10). De plus, ce milieu montre une importante variation de composition en acides aminés en fonction des différents moments d'une journée, en fonction des saisons, selon les différentes parties de la plante, et au sein même de ces dernières (Douglas, 2006).

José Viñuelas 57 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique s é

s totaux) sève du phloème é protéines du puceron (en % des acides amin % des (en Contenu moyen en acides amin acides en moyen Contenu glx asx rine é onine lysine valine s é glycine leucine alanine tyrosine thionine arginine histidine é thr nylalanine isoleucine m é tryptophane ph

acides aminés acides aminés non essentiels essentiels

Figure 10. Comparaison de la composition moyenne en acides aminés de la sève phloémienne de la plante Vicia faba et des protéines du puceron Acyrthosiphon pisum. Les acides aminés non essentiels cystéine et proline ne sont pas mentionnés ici car indétectables avec la méthode de quantification adoptée. asx = acide aspartique et asparagine, glx = acide glutamique et glutamine. Ce graphique décrit le déséquilibre existant entre les besoins du puceron et les ressources nutritionnelles disponibles dans la sève phloémienne (d'après Douglas, 2006).

Toutefois, les dix acides aminés arginine, histidine, isoleucine, leucine, lysine, méthionine, phénylalanine, thréonine, tryptophane, et valine, qualifiés d'essentiels au bon développement chez le rat (Rose et al., 1948), le sont également pour la plupart des insectes et notamment pour le puceron du pois (Retnakaran et Beck, 1967). C'est donc afin de suppléer la déficience nutritionnelle et métabolique en ces acides aminés que la fonction de Buchnera prend toute son importance. La bactérie va synthétiser et fournir au puceron les acides aminés essentiels, ainsi que certaines vitamines, dont il a besoin pour son bon développement (Buchner, 1965b). Cette fonction symbiotique de Buchnera ne fait plus aucun doute à ce jour. Les études génomiques, nutritionnelles et métaboliques en ont apporté la preuve.

José Viñuelas 58 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

3.2 Des évidences nutritionnelles

C'est lors d'une étude nutritionnelle publiée en 1971 par Mittler que le rôle de Buchnera dans la complémentation nutritionnelle du puceron a été mis en évidence de manière incontestable (Mittler, 1971b). Après avoir traité des pucerons Myzus persicae (puceron du pécher) à l'auréomycine, l'auteur a analysé l'impact du traitement antibiotique sur les larves des pucerons élevés sur des milieux artificiels. L'intérêt de l'étude résidait dans le fait que Mitller a comparé, par rapport à un milieu complet, des milieux carencés de manière individuelle en chacun des acides aminés essentiels ou non au puceron. Les résultats ont montré que la croissance des larves issues des pucerons aposymbiotiques élevées sur des milieux déficitaires en un acide aminé essentiel (et ceci pour tous les acides aminés essentiels) est ralentie par rapport à celle des larves élevées sur le milieu complet. Pour des larves issues de pucerons symbiotiques, les auteurs n'observent qu'une très légère diminution de la croissance des insectes élevés sur les milieux carencés par rapport au milieu complet, à l'exception des milieux déficitaires en histidine, isoleucine et méthionine, pour lesquels un effet comparable à celui observé pour les aposymbiotiques est remarqué. En revanche, lorsque le milieu est déficitaire en un acide aminé non essentiel, les pucerons symbiotiques et aposymbiotiques semblent croître de la même façon, aussi bien sur milieu complet que sur milieu carencé. Cette étude a également conforté les données de Dadd et Krieger quant à l'importance particulière pour le puceron de trois acides aminés essentiels : l'histidine, l'isoleucine et la méthionine (Dadd et Krieger, 1968). En effet, même pour des pucerons issus de mères non traitées, l'absence de ces trois acides aminés ainsi que de la lysine affecte la croissance de l'insecte. Dans cette étude Mittler souligne donc l'importance des acides aminés essentiels pour le développement larvaire et la survie des pucerons. De plus, étant donné l'effet de la privation en acides aminés essentiels sur les pucerons aposymbiotiques, Mittler conclut que Buchnera a pour rôle de subvenir aux besoins de son hôte lorsque les acides aminés essentiels sont présents en quantités insuffisantes dans la nourriture de l'insecte.

Mittler, Dadd et collaborateurs ont été des précurseurs dans ce domaine et leurs travaux ont inspiré les nombreuses études nutritionnelles et métaboliques conduites sur le couple Buchnera / puceron au cours des années qui ont suivi. En 1992, Prosser et Douglas ont étudié la croissance des larves de pucerons symbiotiques et aposymbiotiques sur deux milieux nutritionnels

José Viñuelas 59 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

présentant respectivement un ratio acides aminés essentiels / acides aminés non essentiels de 1/1 (milieu équilibré) et de 1/5 (milieu déséquilibré semblable à la sève phloémienne) chez le puceron Acyrthosiphon pisum. L'un des résultats marquants de leur étude est que les larves traitées présentaient un taux de croissance deux fois plus faible que les non traitées sur le milieu biochimiquement proche de la sève phloémienne, tandis qu'aucune différence entre larves symbiotiques et aposymbiotiques n'était observée sur un milieu équilibré en acides aminés. Cette étude confirme la contribution de Buchnera à l'adaptation du puceron à un milieu déséquilibré en acides aminés (Prosser et Douglas, 1992).

C'est sur la base de ces études nutritionnelles que des études métaboliques ont été mises au point afin de démontrer la réelle capacité de Buchnera à synthétiser les acides aminés essentiels dont le puceron a besoin.

3.3 Des évidences métaboliques

3.3.1 Les premières études

Parmi les nombreuses études métaboliques menées chez le couple Buchnera / puceron, celle conduite par Douglas en 1988 a été la première à démontrer le rôle de Buchnera dans la synthèse d'un acide aminé essentiel au puceron. Au cours de cette étude, le puceron Myzus persicae a été élevé sur un milieu artificiel contenant comme unique source de soufre du sulfate inorganique marqué au 35S. Le radiotraçage a révélé une incorporation de la radioactivité dans les protéines du puceron ainsi que dans les acides aminés cystéine et méthionine. Or, si on considère qu'aucun insecte n'est capable d'assimiler du sulfate inorganique par réduction, la seule explication possible à cette observation est que l'assimilation de ce soufre n'est possible que grâce à une bactérie. Afin de tester cette hypothèse, l'auteur répéta l'expérience sur des pucerons traités à la chlorotétracycline et donc démunis de toute bactérie. Par opposition aux pucerons non traités, les résultats ont montré l'absence d'assimilation et d'incorporation du soufre radiomarqué. Cette observation précise l'origine bactérienne du phénomène observé. Cependant, afin de l'attribuer de manière formelle à Buchnera, Douglas dépose sur un milieu de culture contenant du 35S, des embryons fraichement isolés ainsi que des tubes digestifs de pucerons disséqués. L'expérience a révélé une incorporation de radioactivité chez les embryons mais pas pour les tubes digestifs. Ce résultat écarte l'hypothèse d'un rôle des bactéries de

José Viñuelas 60 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

la flore digestive dans l'assimilation du soufre, au profit de Buchnera qui l'utiliserait pour la synthèse de méthionine (Douglas, 1988). Une étude spécifique au tryptophane a également montré que Buchnera était à l'origine de la synthèse de cet acide aminé, essentiel au puceron (Douglas et Prosser, 1992). Comme pour la plupart des études métaboliques, Douglas et Prosser ont analysé l'effet d'une carence nutritionnelle de l'acide aminé à tester, ici le tryptophane, sur la croissance des pucerons, traités ou non à la chlorotétracycline. Cependant, en plus d'avoir mis en évidence l'effet d'une carence en cet acide aminé aromatique chez les pucerons aposymbiotiques, les auteurs ont mesuré l'activité de l'enzyme tryptophane synthétase dans différents échantillons : un extrait brut de pucerons et un isolat de Buchnera, ces deux types d'échantillons étant issus de pucerons traités ou non traités à l'antibiotique. L'intérêt de cette expérience résidait dans le fait que les pucerons, comme les autres animaux, ne possèdent pas l'enzyme tryptophane synthétase, qui ne peut être que d'origine bactérienne. Les résultats ont révélé, pour les pucerons non traités, une activité de cette enzyme beaucoup plus importante dans l'échantillon enrichi en Buchnera (isolat de Buchnera) que dans l'extrait brut de pucerons. En revanche, aucune activité n'a été détectée dans les échantillons issus de pucerons aposymbiotiques, ce qui démontre le rôle primordial de Buchnera dans la synthèse de cet acide aminé via l'enzyme tryptophane synthétase.

3.3.2 Le rôle central du glutamate et de la glutamine

D'autres expériences de radiotraçage ont révélé l'importance du glutamate et de la glutamine dans le métabolisme des acides aminés essentiels par Buchnera. Sasaki et Ishikawa ont montré, grâce à un traçage au 15N de l'acide glutamique, que des Buchnera isolées étaient capables d'absorber ce composé à partir du milieu et de l'utiliser comme source d'azote pour la synthèse de nombreux acides aminés tels que l'alanine, l'acide aspartique, la glutamine, l'isoleucine, la leucine, la phénylalanine, la proline et la valine (Sasaki et Ishikawa, 1995).

Dans cette étude, les auteurs ont également montré que des isolats de bactériocytes peuvent capter de la glutamine à partir du milieu extérieur, chose non observée sur des isolats de Buchnera. De plus, un radiotraçage au 15N ainsi qu'au 14C ont permis de mettre en évidence que la glutamine captée par les bactériocytes est hydrolysée en glutamate et en ammoniaque. Une partie de cet ammoniaque serait réutilisée au niveau du cytosol du

José Viñuelas 61 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

bactériocyte pour la synthèse du glutamate (Whitehead et al., 1992; Sasaki et Ishikawa, 1995).

Concernant l'origine de la glutamine, de nombreuses études indiquent que le puceron synthétise de grandes quantités de cet acide aminé, ainsi que de l'asparagine, comme produit de détoxification à partir de l'ammoniaque issue du métabolisme de l'azote (Sasaki et al., 1996). Buchnera semble jouer un rôle important dans la détoxification des produits azotés en recyclant le glutamate et l'ammoniaque issus de la glutamine. En effet, il a été montré, qu'après élimination de Buchnera, une grande quantité de glutamine était retrouvée dans les tissus et le miellat des pucerons (Sasaki et al., 1990; Prosser et Douglas, 1991). Une importante sécrétion de glutamine est également observée en absence de ce composé dans le milieu nutritionnel, ce qui ne laisse aucun doute quant à son origine métabolique (Sasaki et al., 1996). L'excrétion de glutamine via le miellat peut être interprétée chez les pucerons aposymbiotiques comme un ajustement métabolique du niveau d'ammoniaque potentiellement dangereux pour l'insecte, dans le cas où celui-ci serait privé de son symbiote (Wilkinson, 1998).

Enfin, les études présentées ici couplées à celle de Whitehead et Douglas (1993) montrent l'importance de l'asparagine dans le métabolisme azoté du couple symbiotique, comme cela a été prouvé pour la glutamine.

A cette même époque, Liadouze et collaborateurs ont étudié le rôle de Buchnera dans l'homéostasie du profil en acides aminés libres chez le puceron. Pour cela, les profils en acides aminés libres issus de pucerons élevés sur trois milieux artificiels différents ont été comparés entre des pucerons symbiotiques et aposymbiotiques. Parmi les trois milieux artificiels, deux avaient une composition en acides aminés déséquilibrés (semblable à celle de la sève phloémienne de la luzerne ou de la fève) alors que le troisième était équilibré, puisque basé sur la composition en acides aminés du puceron. Les résultats de cette étude ont montré un profil en acides aminés libres du puceron relativement stable quel que soit le milieu nutritionnel, à l'exception de l'arginine et de la lysine dont la concentration augmente pour les deux milieux déséquilibrés. En revanche, chez les pucerons aposymbiotiques, le profil obtenu varie et semble être assez corrélé avec la composition en acides aminés du milieu ingéré. Quatre acides aminés voient leur concentration fortement augmenter chez les pucerons démunis de Buchnera : l'asparagine, l'acide aspartique, la glutamine et la proline (Liadouze et al., 1995).

José Viñuelas 62 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Plusieurs conclusions peuvent être tirées de cette étude. Tout d'abord, les résultats obtenus avec les pucerons aposymbiotiques montrent le rôle du symbiote dans le rétablissement du profil en acides aminés libres du puceron et ceci indépendamment du milieu nutritionnel. L'augmentation de la concentration en arginine et en lysine, associée à une importante sécrétion de ces composés dans le miellat, ont permis d'appuyer l'hypothèse de Sasaki quant à l'importance de l'arginine dans le métabolisme de l'azote et d'élargir le concept à la lysine. Enfin, tout comme pour la glutamine et l'asparagine, l'accumulation de l'acide aspartique et de la proline, chez les pucerons aposymbiotiques, suggère que ces deux acides aminés peuvent être utilisés comme substrat pour la synthèse de glutamate.

En 1995, Wilkinson et Douglas montrent expérimentalement le lien entre la quantité élevée de glutamine et la détoxification en ammoniaque chez les pucerons aposymbiotiques. En plus d'une quantité importante d'ammoniaque, les auteurs mettent en évidence chez ces pucerons une forte activité de l'enzyme glutamine synthétase. Afin de mimer les effets métaboliques d'une aposymbiose, des pucerons symbiotiques ont été élevés sur des milieux riches en ammoniaque, ce qui s'est traduit par une augmentation de l'activité de la glutamine synthétase et de la concentration en glutamine. Ils confirment ainsi que ce résultat est bien dû à une réaction métabolique du puceron et non pas une réponse spécifique à l'élimination de la bactérie (Wilkinson et Douglas, 1995).

3.3.3 Le carbone utilisé par Buchnera

Si ces premières expériences de radiotraçage ont montré que la glutamine est utilisée comme source d'azote pour les groupements amino dans la synthèse de nombreux acides aminés, elles n'apportent que peu d'éléments sur la synthèse du squelette carboné des acides aminés produits par le symbiote. A partir de 1995, Febvay et collaborateurs se sont penchés sur la question. Grâce à la mise en point d'un système de "chambre à métabolisme" (Figure 11), ces auteurs ont suivi le devenir d'acides aminés marqués au 14C ingérés par l'insecte.

José Viñuelas 63 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Milieu artificiel emprisonné Pompe entre 2 films de Parafilm® péristaltique

Entrée d'air

Chambre à métabolisme Miellat et (diamètre interne = 1 cm) exuvies (hauteur = 0,5 cm)

Carbosorb®

(piège à CO2)

Figure 11. Illustration de la chambre métabolique mise au point par Febvay et collaborateurs pour les études métaboliques sur le couple symbiotique Buchnera / puceron (schéma réalisé par G. Febvay UMR BF2I).

L'étude a été menée sur huit acides aminés : l'aspartate, le glutamate, la glutamine, la glycine, la sérine, l'alanine, la proline et la thréonine. Pour chacun de ces acides aminés, les auteurs ont mesuré la quantité ingérée par le puceron ainsi que son excrétion dans (i) le miellat,

(ii) l'exuvie et (iii) sous forme de CO2. Maitrisant parfaitement les entrées et les sorties de radioactivité au sein de l'insecte, ils ont démontré la synthèse de trois acides aminés essentiels : l'isoleucine, la lysine et la thréonine à partir de carbones issus d'acides aminés présents dans le milieu nutritionnel. La synthèse de ces trois acides aminés semble nécessiter la conversion des acides aminés donneurs de carbone en glutamate et en aspartate et, dans un moindre cas, en alanine et en proline (Febvay et al., 1995). Le rôle de Buchnera dans cette conversion des carbones et synthèse d'acides aminés essentiels sera démontré en 1996 grâce à des contrôles aposymbiotiques (Liadouze et al., 1996).

Wilkinson et Douglas confirment la reconversion de l'acide glutamique marqué au 14C en d'autres acides aminés et notamment en glutamine, proline, acide aspartique, lysine et thréonine chez les pucerons symbiotiques, et en asparagine chez les aposymbiotiques (Wilkinson et Douglas, 1996). Mais le résultat le plus intéressant de cette étude provient

José Viñuelas 64 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

du dosage des acides aminés totaux et de la phénylalanine. Comme dans d'autres études (Prosser et Douglas, 1991; Liadouze et al., 1995; Wilkinson et Douglas, 1995), les auteurs montrent une augmentation du nombre d'acides aminés totaux chez les pucerons aposymbiotiques par rapport aux symbiotiques. De façon originale, ils mettent également en évidence une diminution significative du taux de phénylalanine pour les pucerons démunis de Buchnera. La phénylalanine ainsi que le rôle de Buchnera dans la synthèse de cet acide aminé semblent avoir une grande importance pour le couple symbiotique. Dans une autre études Wilkinson et Ishikawa montrent qu'une injection de phénylalanine, ainsi que d'un mélange d'acides aminés essentiels dans l'hémolymphe des pucerons aposymbiotiques, réduit l'augmentation et l'accumulation des acides aminés totaux classiquement observées. Cet effet, qui mime le rétablissement d'un système symbiotique chez les pucerons sans leur symbiote, accentue l'importance de la phénylalanine et le rôle Buchnera dans l'approvisionnement du puceron en acides aminés essentiels (Wilkinson et Ishikawa, 2000).

Enfin, la biosynthèse de phénylalanine ainsi que de leucine, et de valine, à partir de saccharose, a été démontrée pour la première fois en 1999 par Febvay et collaborateurs (Figure 12). Dans cette étude, le saccharose, qui représente le nutriment majeur dans le milieu nutritionnel du puceron, a été marqué au 14C et suivi par radiotraçage. La comparaison de la néosynthèse des acides aminés à partir de ce précurseur, entre pucerons élevés sur un milieu de composition proche de la sève phloémienne et pucerons élevés sur un milieu équilibré, a révélé une augmentation globale de la biosynthèse des acides aminés chez les premiers. L'analyse de l'origine des atomes de carbone de l'ensemble des acides aminés a démontré une néosynthèse exclusive à partir du saccharose pour les acides aminés leucine, phénylalanine et valine (Febvay et al., 1999).

José Viñuelas 65 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique natomg che de puceron) che î d'atomes de carbone (en d'atomes de carbone de masse fra de masse é 1 - mg Quantit

Origine des atomes de carbone : Quantité totale dans les Milieu nutritionnel tissus du puceron

Autres acides aminés présents

Saccharose

Figure 12. Quantité et provenance des atomes de carbone constituant chacun des acides aminés néosynthétisés lorsque le puceron Acyrthosiphon pisum est élevé sur un milieu artificiel de composition proche de la sève phloémienne. La proportion des atomes de carbone mesurée est également comparée à celle contenue dans les tissus totaux du puceron pour chacun des acides aminés. Ce graphique met en évidence la synthèse de leucine, phénylalanine et valine à partir du saccharose (d'après Febvay et al., 1999).

L'ensemble des études nutritionnelles et métaboliques présentées dans cette synthèse bibliographique illustre bien les connaissances acquises quant au rôle et à l'importance de Buchnera dans la complémentation nutritionnelle du puceron. Le séquençage des génomes de Buchnera a permis de valider les hypothèses émises par les études ci-dessus et de poser les premières questions sur les mécanismes sous-jacents à la régulation de la fonction symbiotique de Buchnera lors de la synthèse, fourniture et échanges d'acides aminés avec les compartiments métaboliques de l'hôte.

José Viñuelas 66 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

3.4 Des évidences génomiques

Le premier séquençage du génome de Buchnera aphidicola en 2000 par Shigenobu et collaborateurs, ainsi que les trois autres qui ont suivi, ont révélé que, globalement, le symbiote des pucerons a conservé les voies de biosynthèse des acides aminés essentiels à son hôte. Inversement, la bactérie a perdu l'ensemble des gènes relatifs aux voies de biosynthèse des acides aminés non essentiels, laissant penser que les processus évolutifs favorisant la perte des gènes chez Buchnera ont été compensés par une sélection retenant les gènes de biosynthèse des acides aminés essentiels (Rispe et Moran, 2000).

La proportion des gènes codant les acides aminés essentiels représente environ 10% du génome de Buchnera Ap contre moins de 2% pour E. coli (Shigenobu et al., 2000). Une comparaison des génomes de ces deux bactéries a montré que cette dernière renferme environ 60 gènes codant les voies de biosynthèse d’acides aminés essentiels et 20 pour les non essentiels, alors que Buchnera Ap possède les gènes codant les enzymes de biosynthèse des acides aminés essentiels au puceron et seulement quatre pour la synthèse des non essentiels (Shigenobu et al., 2000; Moran et al., 2003b). Buchnera Ap, qui possède le génome le plus complet des quatre génomes séquencés de Buchnera (Moran et al., 2003b; Perez-Brocal et al., 2006), possède aussi le plus grand nombre de gènes impliqués dans la biosynthèse des acides aminés. Les pertes observées chez Buchnera Sg et Bp seraient dépendantes du régime alimentaire du puceron (Moran et al., 2003b). Un exemple est représenté par les gènes cysDGNHI et cysQ, qui interviennent dans la réduction des sulfates et dans la synthèse de la cystéine. Ces gènes sont absents chez Buchnera Bp, présents sous forme de pseudogènes chez Buchnera Sg, et sont fonctionnels chez Buchnera Ap (van Ham et al., 2003). L'incapacité de Buchnera Sg et de Buchnera Bp à synthétiser la cystéine serait due à la présence de grandes quantités de cet acide aminé dans les milieux nutritifs de leurs hôtes. Les graminées, par exemple, apportent à S. graminum beaucoup plus de cystéine que ne le font les légumineuses pour A. pisum (Tamas et al., 2002). On note aussi chez Buchnera Bp la perte de la voie de biosynthèse de l’ornithine (argA, -EBC et -D), qui s’accompagne d’une incapacité à synthétiser l’arginine (van Ham et al., 2003) parfois considérée comme non essentielle (Douglas, 2006).

José Viñuelas 67 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Le modèle courant décrivant les interactions métaboliques pour la biosynthèse des acides aminés entre Buchnera et le puceron est schématisé dans la Figure 13. La bactérie fournirait à son hôte les acides aminés qu'il ne peut synthétiser ni trouver en quantité suffisante dans la plante, et, réciproquement, l'hôte apporterait à la bactérie les acides aminés qui lui font défaut. Bien plus que complémentaires, les voies de biosynthèses du couple symbiotique peuvent être définies comme dépendantes les unes des autres, certains précurseurs d'acides aminés essentiels étant des acides aminés non essentiels (Shigenobu et al., 2000; Zientz et al., 2001). Si les études biochimiques et de génomique ont bien souligné la contribution de la bactérie au métabolisme azoté du couple symbiotique, le rôle exact de l'hôte n'a pas encore été élucidé. En effet, bien que le génome du puceron A. pisum ait été récemment séquencé, son annotation est en cours et n'a pas encore été complétée. Malgré cela, les premières études à large échelle sur la transcriptomique de la cellule bactériocytaire semblent confirmer la complémentarité des voies de biosynthèse entre hôte et symbiote. Nakabachi et collaborateurs, par une analyse d'EST de pucerons et par RT- PCR quantitative, ont été les premiers à réaliser une étude du transcriptome des bactériocytes des pucerons. Dans cette expérience, les auteurs ont pu montrer non seulement la sur-expression dans le compartiment bactériocytaire de gènes intervenant dans la biosynthèse d'acides aminés que Buchnera ne peut pas produire, mais également celle de gènes relatifs à l'utilisation d'acides aminés synthétisés par le symbiote. De même, des gènes codant des systèmes de transport vésiculaire ont révélé un taux d'expression important dans les bactériocytes (Nakabachi et al., 2005). Tout ceci, en plus de mettre en évidence le rôle du bactériocyte dans les échanges d'acides aminés entre l'hôte et son symbiote, souligne bien la complémentarité métabolique entre les deux partenaires de cette association symbiotique.

José Viñuelas 68 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

Figure 13. Modèle de dépendance mutuelle des voies de biosynthèse des acides aminés entre Buchnera et la cellule de son hôte, Buchnera étant localisée dans une vacuole du bactériocyte. La bactérie est capable, d’après les gènes qu’elle possède, de synthétiser les acides aminés essentiels pour l’organisme de l’hôte (en rouge). D’autre part, Buchnera semble nécessiter des apports extérieurs en plusieurs acides aminés qui sont présents dans le milieu nutritionnel de l’hôte ou synthétisés par ce dernier (en bleu). Parmi ces acides aminés, l’aspartate et le glutamate (en magenta) qui, associés à d’autres précurseurs d’acides aminés, sont plus spécifiquement importés par Buchnera pour pouvoir synthétiser les acides aminés essentiels au puceron (d'après Zientz et al., 2001).

Pour certains acides aminés, le degré de complémentarité serait encore plus poussé et les voies de biosynthèse pourraient être partagées entre l'hôte et le symbiote, comme dans le cas de la biosynthèse de la méthionine et de l’isoleucine. Buchnera possède l’ensemble des gènes codant ces deux acides aminés, à l’exception des gènes metC et ilvA. Or, les études métaboliques et physiologiques ont mis en évidence la présence de ces deux acides aminés chez des pucerons élevés sur des milieux nutritionnels qui en manquaient. Une hypothèse serait que ces deux gènes aient été déplacés vers le génome de l’hôte qui fournirait alors les produits correspondants (ARNm ou protéines) à Buchnera, pour qu’elle puisse achever la production de ces deux acides aminés (Douglas, 2003). Seuls les résultats issus de l'annotation du génome du puceron pourront formellement valider ou infirmer cette hypothèse.

José Viñuelas 69 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

3.5 Les études sur la régulation transcriptionnelle

Sur la base des résultats obtenus lors des études nutritionnelles et métaboliques, et face aux évidences génomiques quant au rôle de complémentation nutritionnelle de Buchnera vis-à-vis du puceron, de nombreuses questions se posent sur les capacités de régulation de la biosynthèse des acides aminés chez Buchnera. Comment la bactérie répond-elle aux variations des besoins nutritionnels du puceron ? Est-il envisageable que la bactérie soit toujours capable de réguler l'expression des gènes impliqués dans la biosynthèse des acides aminés essentiels au puceron, même en l'absence des régulateurs spécifiques de ces voies ? D'autres mécanismes de régulations sont-ils possibles ? Ce n'est qu'à la suite du séquençage du premier génome de Buchnera que les premières analyses transcriptomiques ont vu le jour. Auparavant, seuls quelques rares indices quant à l'expression des gènes chez le symbiote étaient disponibles. En 1997, une comparaison de l'expression des gènes par analyse différentielle ("mRNA differential display analysis") entre des pucerons jeunes (ayant 20 jours) et plus âgés (ayant 50 jours) a permis à Nakabachi et Ishikawa de mettre en évidence la sur-expression des gènes argA et thrB chez les plus jeunes pucerons. Ce résultat fut également confirmé par les auteurs via une expérience de RT- PCR quantitative (Nakabachi et Ishikawa, 1997). Ces deux gènes interviennent respectivement dans les voies de biosynthèse du glutamate à partir de l'arginine et de la thréonine à partir de l'aspartate. Leur sur- expression suggère que Buchnera est capable de réguler la biosynthèse de ces acides aminés en fonction de l'âge du puceron et, par conséquent, des besoins métaboliques de ce dernier. Baumann et collaborateurs, par une expérience de RT-PCR, montrent deux ans plus tard l'expression chez Buchnera des gènes aroH, trpE, trpD, trpA, ilvI, ilvD, leuA et hisG intervenant dans la biosynthèse des acides aminés aromatiques, des acides aminés branchés et de l'histidine (Baumann et al., 1999b). La première analyse transcriptomique à large échelle chez Buchnera a été publiée par Moran et collaborateurs en 2003 grâce à une puce à ADN dédiée au génome du symbiote du puceron S. graminum dont les sondes sont issues de produits de PCR. Cette expérience, initialement conçue pour étudier la réponse au choc thermique de la bactérie, a été utilisée par les auteurs afin de mettre en évidence des caractéristiques globales du transcriptome de Buchnera. Dans cette étude, le profil transcriptomique obtenu est décrit comme un nouvel élément montrant l’adaptation de Buchnera, mais cette fois-ci d'un point de vue

José Viñuelas 70 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

transcriptionnel, aux exigences nutritionnelles de son hôte. Selon les auteurs, non seulement Buchnera a conservé les voies de biosynthèse des acides aminés essentiels à son hôte, mais les gènes correspondants à ces voies sembleraient exprimés de manière importante par le symbiote (Moran et al., 2003b). Cependant, Moran et collaborateurs tirent ces conclusions à partir de données pour lesquelles aucune normalisation permettant de comparer le niveau d'expression des gènes les uns par rapport aux autres n'a été effectuée. Ainsi, les auteurs n'ont pas pu s'affranchir du biais dû à l'affinité de chacune des sondes pour leur propre cible, et les résultats présentés pourraient très bien être le reflet de l'efficacité d'hybridation des sondes déposées sur leur puce à ADN. C'est pourquoi il convient de considérer avec précautions les résultats de cette étude.

Deux ans plus tard, les mêmes auteurs publient une expérience de transcriptomique spécifique à l'analyse de la réaction de Buchnera Sg à des carences et à des excès en acides aminés dans le milieu nutritionnel du puceron hôte. Cette expérience a consisté à mettre des pucerons au dernier stade de développement larvaire (ayant 5 jours) en contact avec des fragments de plantes ayant baigné dans une solution enrichie en un acide aminé. Diverses conditions ont été testées : un excès en arginine (10 mM), en glutamine (39 mM), en acide glutamique (75 mM), en acide aspartique (51 mM), en leucine (42 mM) et en tryptophane (10 mM). Une condition de déplétion totale en acides aminés a été également testée, les pucerons ayant été élevés en condition humide dans une boîte de Petri en l'absence de plante (Moran et al., 2005a). L'un des résultats majeurs de cette étude a été qu'un nombre assez restreint de gènes était différentiellement exprimés. On notera cependant l'expression différentielle du gène metE, seul régulateur transcriptionnel conservé par Buchnera Sg (et absent dans le génome des trois autres Buchnera séquencés), qui est sur-exprimé en l'absence d'acide glutamique, de glutamine et de tryptophane. De même, le gène argA présente, mais dans une moindre mesure, une sur-expression lorsque le milieu contient un excès de glutamine et d'arginine, et une sous-expression dans le cas d'une déplétion globale en acides aminés. Enfin, trpA montre une légère répression de son expression lors d'un excès en tryptophane. D'une façon générale, à l'exception de metE, l'expression différentielle des gènes cités ci-dessus et de ceux présentant une variation significative n'excède pas le facteur deux. Le résultat obtenu pour le gène metE a été vérifié par des expériences de RT-PCR en temps réel. La transcription de ce gène étant sous la dépendance du complexe MetR / homocystéine, les auteurs ont inclu dans leur plan expérimental une condition relative à un excès en homocystéine. Le niveau d'expression du gène metE mesuré pour

José Viñuelas 71 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

cette condition est dix fois plus important que pour la condition relative à un excès de glutamine. Cette expérience a également été réalisée sur le puceron du pois dont le symbiote primaire ne possède plus le gène metR. Par opposition au puceron des céréales, aucune modification dans l'expression des gènes du symbiote de ce puceron n'a été observée. La perte de l'ensemble des régulateurs des gènes de biosynthèse des acides aminés essentiels, associée à la faible intensité des réponses transcriptomiques observées dans cette étude ainsi qu'en réponse à un choc thermique (Wilcox et al., 2003), a été interprétée par Moran et collaborateurs comme une preuve de l'absence chez Buchnera de systèmes de régulation transcriptionnelle alternatifs à ceux connus chez les bactéries de forme libre. Mais cette conclusion est discutable. Il serait plus judicieux de conclure sur l'absence de réponse transcriptionnelle dans les conditions testées et non d'un point de vue général. De plus, il est difficile de bien contrôler la composition nutritionnelle de fragments de plantes ayant baigné dans une solution d'acides aminés. Enfin, le plan expérimental de cette étude était plutôt basé sur les effets d'un excès en acides aminés chez le couple symbiotique et seule une condition de carence globale a été testée. Des expériences de déplétion individuelle en certains acides aminés via l'utilisation de milieux artificiels auraient été mieux adaptées pour répondre à la question de la capacité de Buchnera à réguler l'expression de ses gènes en fonction des besoins du puceron.

En 2006, Reymond et collaborateurs publient les résultats de deux expériences de transcriptomique menées chez Buchnera Ap. Dans la première expérience, les pucerons ont été élevés sur un milieu carencé en deux acides aminés aromatiques : la tyrosine et la phénylalanine. La seconde expérience a consisté, quant à elle, en une déplétion globale en acides aminés essentiels combinée à un excès plus ou moins important en saccharose. Pour les deux expériences, les pucerons ont été élevés respectivement cinq et sept jours sur les milieux artificiels et ceci depuis leur naissance (Reymond et al., 2006). D'un point de vue général, les conclusions de ces études montrent chez Buchnera aphidicola l'existence d'une réponse transcriptionnelle à différents niveaux et cela malgré l'absence de la plupart des éléments de régulation connus à ce jour chez les bactéries. Cependant, les réponses observées ne concernent pas directement les voies de biosynthèse testées dans les deux études, et tout comme la dernière expérience de Moran et collaborateurs, les auteurs n'observent pas d'importants différentiels dans les niveaux d'expression des gènes. Néanmoins, ces derniers sont comparables aux taux d'expression différentiels observés chez les bactéries

José Viñuelas 72 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

modèles E. coli et B. subtilis en réponse à des stress modérés (Tao et al., 1999; Berka et al., 2003). On notera l'activation des gènes des voies de biosynthèse de la lysine en réponse à une carence en cet acide aminé, tout comme pour la cystéine (et indirectement de la méthionine) et l'arginine. L'activation de la biosynthèse de la cystéine pourrait s'expliquer par la perte chez Buchnera Ap du régulateur MetR responsable de l'activation du gène metE. Enfin, l'importante expression des gènes ilvI et ilvH serait corrélée avec une importante biosynthèse des acides aminés branchés chez Buchnera. Un des résultats marquants de cette étude concerne la co- expression de certains groupes de gènes, qui suggère que l'organisation des gènes en opérons est un élément conservé chez Buchnera. Le problème de la possible conservation de la structure en opérons des gènes de cette bactérie est l'un des points les plus discutés par les auteurs ayant traité des conséquences de la réduction des génomes bactériens sur leurs capacités fonctionnelles. La perte de nombreux gènes et promoteurs a sans nul doute inactivé certains régulons, mais la réorganisation du génome observée chez Buchnera a pu donner naissance à de nouveaux opérons et unités de transcription, notamment par rapport à ceux connus chez E. coli (Moran et Mira, 2001; Silva et al., 2001). L’apparition de nouveaux opérons et régulons chez Buchnera, appuyée par l’importante synténie, est souvent supposée mais n’a jamais été démontrée expérimentalement. Un deuxième résultat intéressant est l'expression différentielle des gènes gyrB codant une topoisomérase, ainsi que des gènes codant des protéines de type "histone-like" également appelées NAPs (nucleoid- associated proteins) telles que IHF, Fis et H-NS. La conservation de ces gènes, associée à leur action sur le super-enroulement de l'ADN et à leur expression différentielle dans ces deux expériences, pourrait être à l'origine de l'existence d'une réponse transcriptionnelle globale chez Buchnera, comme cela a été observé chez des bactéries de forme libre.

A la lumière des résultats obtenus par Reymond et collaborateurs (2006) de nombreuses questions se posent quant aux mécanismes de régulation transcriptionnelle présents chez Buchnera. D'un point de vue global, nous pouvons nous poser la question de l'existence d'une organisation fonctionnelle du transcriptome de Buchnera, comme par exemple une organisation des gènes en opéron ou encore l'existence d'une expression différentielle des gènes en fonction de leur classe fonctionnelle. En effet, il serait intéressant de savoir si les gènes de biosynthèse des acides aminés essentiels sont plus exprimés que l'ensemble des autres gènes de la bactérie. Si une telle variation existe en fonction de

José Viñuelas 73 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Synthèse Bibliographique

la classe fonctionnelle des gènes, l'étude de l'origine des mécanismes sous- jacents serait une étape clé dans la compréhension de la régulation de l'expression des gènes de Buchnera. Les résultats de Reymond et collaborateurs suggèrent la conservation, chez cette bactérie, d'une régulation transcriptionnelle de type global, probablement via la modification du super-enroulement du chromosome par les protéines de type NAP. Ce mécanisme suffit-il à lui seul pour réguler l'expression des gènes de Buchnera pour toutes les conditions physiologiques que le couple symbiotique peut connaître ? La confirmation de l'existence d'un tel mécanisme chez Buchnera nécessite de nombreuses études expérimentales comme, par exemple, des études visant à analyser l'expression des gènes de la bactérie en fonction de l'organisation de son chromosome. D'un point de vue de la réponse de Buchnera à des carences en acides aminés, certains des résultats obtenus par Reymond et collaborateurs sont cohérents avec les stress imposés, tandis que d'autres ne le sont pas. La question de la pertinence des stress réalisés par les auteurs se pose alors. Chez des bactéries comme E. coli la réponse transcriptionnelle à un stress en acides aminés, comme le tryptophane par exemple, est observée dans les premières minutes qui suivent le début de l'expérience (Khodursky et al., 2000). Bien que Buchnera soit une bactérie symbiotique, ce qui rend très difficile la réalisation d'une expérience comme celle menée sur E. coli, le choix d'un temps de stress plus court que celui réalisé par Reymond et collaborateurs apporterait sans doute de précieux éléments sur les capacités de réponse transcriptionnelle du symbiote. Enfin, une étude ciblée sur une voie de biosynthèse d'un acide aminé en particulier pourrait être un moyen de définir les conditions optimales de traitement avant la réalisation d'une analyse plus globale du transcriptome de la bactérie lors de stress nutritionnels. Les voies de biosynthèse de la leucine ou du tryptophane, qui sont des acides aminés importants pour le bon développement du puceron, pourraient être choisies pour ce travail précurseur, d'autant plus que les gènes correspondants sont localisés sur deux plasmides (pLeu et pTrp), dont le rôle dans la régulation de la biosynthèse de ces deux acides aminés reste totalement énigmatique. Mon travail de thèse a été consacré à trouver des réponses aux questions ci-dessus et plus globalement à l'étude des capacités de régulation génétique de Buchnera en liaison avec sa fonction symbiotique chez le puceron Acyrthosiphon pisum.

José Viñuelas 74 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Partie III

Matériels et Méthodes

José Viñuelas 75 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

1 Préparation du matériel biologique

1.1 Elevage des pucerons

1.2 Isolement des bactéries symbiotiques

1.3 Extraction et préparation des acides nucléiques 1.3.1 Extraction de l'ADN génomique 1.3.2 Extraction des ARN totaux 1.3.3 Contrôle de qualité des acides nucléiques

1.1 Elevage des pucerons

L'ensemble des expérimentations a été réalisé sur des pucerons provenant du clone parthénogénétique du puceron du pois Acyrthosiphon pisum (Harris) LL01. Notre choix s'est porté sur ce puceron plutôt que sur le clone dont est issu le premier séquençage de Buchnera aphidicola (Shigenobu et al., 2000) car il est dépourvu de symbiotes secondaires. Cette précaution évite ainsi tout risque de contamination par du matériel biologique issu de ces derniers. Dans le cadre de l'étude du plasmide pLeu de Buchnera, des expérimentations ont également été réalisées sur des pucerons de l'espèce Rhopalosiphum padi et plus précisément sur le clone qui a fait l'objet de la découverte de ce plasmide (Bracho et al., 1994).

Les pucerons sont élevés et maintenus sur des plants de fèves (Vicia faba L. variété Aquadulce) pour l'espèce A. pisum, et de blé pour l'espèce R. padi, placés dans des cages en plexiglas. Ces cages sont conservées dans un insectarium sous conditions climatiques contrôlées (température de 21°C 1°C, humidité relative de 70%, photopériode de 16 heures) afin d'obtenir uniquement des pucerons se reproduisant par parthénogénèse. Pour réduire une possible variabilité due à l'utilisation de pucerons à différents stades de développement, ces derniers sont issus d'un élevage synchronisé. Pour cela, 1000 pucerons adultes, et prêts à pondre, sont déposés sur plants de fèves ou de blé. Après 24 heures, les adultes sont retirés des plantes et les larves sont maintenues durant le temps de l'expérimentation sur ces mêmes plants, ou sur des milieux artificiels dont la composition en acides aminés est parfaitement maitrisée.

Dans le cadre de cette thèse, pour les expériences dites "en statique", visant à analyser le niveau d'expression des gènes de Buchnera en fonction de leur organisation sur le chromosome, les larves ont été maintenues 7 jours sur les plants de fèves. A l'issue de cette période les pucerons sont au dernier stade de développement larvaire (stade L4)

José Viñuelas 76 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

(Febvay et al., 1988) et peuvent être recueillis pour les expérimentations biologiques. Concernant les expériences en cinétique visant à étudier la réponse de Buchnera lors d'un stress nutritionnel en leucine induit chez le puceron, les larves ont été maintenues pendant 12 heures, 1 jour, 2 jours, 3 jours ou 7 jours sur des milieux artificiels (Figure 14).

Figure 14. Milieu artificiel d'élevage de pucerons. (A) Photo représentant des pucerons sur milieu artificiel. (B) Coupe schématique d’une cage de traitement renfermant du milieu artificiel (photo et schéma réalisés par L. Abate, UMR BF2I).

La composition de ces milieux est basée sur le milieu artificiel

AP3 (pour "A. pisum milieu n°3") mis au point à partir de l'analyse de la composition en acides aminés, vitamines, minéraux et divers oligo- éléments de la carcasse du puceron Acyrthosiphon pisum à l'état naturel (Febvay et al., 1999). Les milieux utilisés pour nos expériences ne diffèrent

du milieu AP3, optimal pour la croissance du puceron que par la concentration en leucine qui varie de 0 à 90 mM selon la condition à tester. Enfin, la concentration de leucine présente chez le puceron à l'état physiologique étant d'environ 20 mM (Febvay et al., 1988), nous avons considéré cette molarité comme condition de référence dans le plan expérimental.

1.2 Isolement des bactéries symbiotiques

La bactérie Buchnera aphidicola a été isolée de son hôte par filtration selon le protocole établi par Charles et Ishikawa (1999). Les pucerons (1 g) sont tout d'abord broyés dans 10 ml de tampon de lyse [KCl

: 0,02 M (Merck, Darmstadt, Allemagne) ; MgCl2 : 0,01 M (Merck) ; saccharose : 0,25 M (Merck) ; Tris : 0,03 M (Sigma-Aldrich, St Quentin

José Viñuelas 77 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Fallavier, France) ; eau UP (ultra-pure), pH = 7,05 ; solution incubée 2 heures à TA (température ambiante)]. Le broyat obtenu est filtré sur une toile de nylon de 100 µm puis successivement sur des membranes isopore™ (Millipore, St Quentin en Yvelines, France) de 30, 5 et 3 µm. Après centrifugation du filtrat pendant 5 minutes à 4000 g à 4°C, le culot obtenu est repris dans 1 ml de tampon de lyse, puis centrifugé 5 minutes à 4000 g à 4°C. Pesé, il est ensuite conservé à -80°C.

1.3 Extraction et préparation des acides nucléiques

1.3.1 Extraction de l'ADN génomique

Cette étape est réalisée à partir d'un culot issu d'une filtration de Buchnera. Pour les expériences de puce à ADN, le produit de filtration (environ 40 mg) est resuspendu dans 500 µl d'un tampon de lyse STE [NaCl : 100 mM (Merck) ; EDTA : 1 mM (Sigma-Aldrich) ; Tris-HCl : 10 mM (Euromedex, Suffelweyersheim, France) ; pH = 8,0]. Après ajout de 25 µl d'une solution contenant 10% de SDS (sodium dodécyl sulfate) (Sigma-Aldrich) et de 3 µl de protéinase K à 20 mg/ml (Roche, Meylan, France), une incubation d'une heure à 55°C est réalisée. Les ARN contaminants sont dégradés par l'ajout de 6 µl de RNase A (Sigma-Aldrich) à une concentration de 10 mg/ml, suivi d'une incubation de 20 minutes à 37°C. L'ADN génomique (ADNg) est ensuite extrait avec un volume (environ 500 µl) de phénol/chloroforme/alcool isoamylique (25 : 24 : 1, v/v/v). Après une agitation manuelle de 30 secondes et une centrifugation d'une minute à 11000xg, la phase aqueuse contenant les acides nucléiques est transvasée dans un nouveau tube pour l'étape de précipitation. Celle-ci est réalisée en présence de 0,1 volume d'acétate de sodium 3 M pH=5,2 (environ 50 µl pour une concentration finale 0,3 M) et par ajout de 2 volumes (environ 1 ml) d'éthanol absolu froid (concentration finale : 70%). Après une incubation d'au moins 2 heures à -20°C, l'ADN précipité est recueilli par centrifugation (15 minutes à 11000 g à 4°C). Le culot ainsi obtenu est lavé avec 1 ml d'éthanol à 75%, afin d'éliminer les traces d'acétate de sodium, puis re-centrifugé 5 minutes à 11000 g à 4°C. Il est ensuite séché à TA ou à l'aide d'un Speed-Vacuum (Savant Instrument, Farmingdale, NY, USA) avant d'être resuspendu avec de l'eau traitée au diéthylpyrocarbonate (Sigma-Aldrich) 0,1% (v/v) (eau DEPC).

José Viñuelas 78 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Pour les études de PCR quantitative visant à analyser la réponse de Buchnera à un stress nutritionnel en leucine imposé au puceron, l'ADNg a été extrait selon les instructions du kit QIAamp DNA Mini (Qiagen, Hilden, Allemagne) et suivant la procédure utilisée par Lee et collaborateurs (2006). Ce protocole présente l'avantage d'obtenir un échantillon d'ADNg d'une pureté suffisante pour des applications comme la détermination du nombre de copies de plasmide chez une bactérie. Comme précédemment, le produit de filtration est resuspendu avec 180 µl d'un tampon de lyse fourni par le fabricant. Après ajout de 20 µl de protéinase K, l'échantillon est mis à incuber 3 heures à 56°C jusqu'à lyse complète des tissus. Afin de faciliter celle-ci, l'échantillon est homogénéisé au moins 3 fois par heure. Les ARN présents sont dégradés durant 2 minutes à TA après ajout de 4 µl de RNase A à une concentration de 100 mg/ml (Qiagen). L'échantillon est de nouveau brièvement centrifugé avant l'ajout de 200 µl d'un tampon de précipitation contenant de l'hydrochlorure de guanidine. Une incubation de 10 minutes à 70°C est alors réalisée avant l'étape de précipitation proprement dite, qui a lieu par ajout de 200 µl d'éthanol absolu. Le mélange obtenu est ensuite déposé sur une colonne QIAamp (Qiagen) et centrifugé à 6000 g durant 1 minute. L'ADNg ainsi collecté est lavé par deux fois avec deux tampons de lavage fournis par le fabricant, ces lavages s'achevant par deux centrifugations respectivement de 1 minute à 6000 g et de 3 minutes à 13000xg. Une dernière étape de centrifugation à vide à 13000 g durant 1 minute permet d'éliminer les dernières gouttes de résidus contaminants. L'échantillon d'ADNg est alors élué avec 100 µl d'eau UP durant une étape de centrifugation à 6000 g pendant 1 minute. Afin d'optimiser l'élution, une incubation de 5 minutes à TA avant centrifugation a été réalisée en suivant les conseils du fabricant.

1.3.2 Extraction des ARN totaux

Tout comme l'ADNg, les ARN totaux sont extraits à partir d'un culot issu d'une filtration de Buchnera. Pour cela, 40 mg de filtration sont resuspendus dans 500 µl de TRIzol® Reagent (Invitrogen, Paisley, RU) avant d'être transvasés dans un homogénéisateur de type Dounce. L'échantillon est broyé strictement 10 fois avec un piston de type A puis 10 fois avec un piston de type B. Ce dernier, plus jointif aux parois du Dounce que le piston A, permet d'affiner le broyage. Il est à noter que l'homogénéisateur est en permanence conservé dans de la glace tout au long de l'extraction. Le broyat est ensuite transféré dans un tube propre puis incubé 5 minutes à TA.

José Viñuelas 79 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Les ARN totaux extraits sont séparés des protéines lors d'une incubation de 3 minutes à TA en présence de 200 µl de chloroforme. Après 15 minutes de centrifugation à 13000 g à 4°C, le surnageant contenant les ARN est transféré dans un tube propre. Ces derniers sont précipités par ajout de 500 µl d'isopropanol et, après 10 minutes d'incubation à TA, l'échantillon est centrifugé pendant 20 minutes à 13000 g à 4°C. Le culot obtenu est lavé avec 1 ml d'éthanol à 75% afin d'éliminer les sels contaminants. Après une centrifugation de 5 minutes à 13000 g à 4°C, l'éthanol est éliminé et le culot est séché à l'air ambiant avant d'être resuspendu avec de l'eau DEPC. L'ADNg, co-extrait et contaminant, est éliminé par traitement avec l'enzyme DNase RQ1 RNase-free (Promega, Madison, WI, USAvà raison d'une unité d'enzyme par µg d'ARN traité. Après une incubation de 30 minutes à 37°C, l'ARN total est enfin purifié sur colonnes RNeasy® selon le protocole du kit RNeasy Mini (Protocol for RNA Cleanup, Qiagen) puis resuspendu dans de l'eau DEPC.

1.3.3 Contrôle de qualité des acides nucléiques

Une mesure au spectrophotomètre NanoDrop® ND-1000 (NanoDrop Technologies, Wilmington, DE, USA) permet de déterminer la concentration et la pureté des échantillons d'ADNg et d'ARN totaux

extraits. Des rapports de DO260/280 et DO260/230 inférieurs à 1,8 signifient respectivement une contamination de l'échantillon par des protéines, ou une contamination par des hydrates de carbones, des peptides, du phénol, de l'urée ou des composés aromatiques. Ainsi, seuls des échantillons dont ces ratios étaient strictement supérieurs à 1,8 ont été sélectionnés pour nos expériences. La qualité des échantillons d'ADNg ou d'ARN, et notamment leur possible dégradation, est mise en évidence par électrophorèse sur un gel d'agarose 1,5% (m/v) réalisée dans un tampon TAE (Tris-Acétate 2 M, EDTA 0,05 mM, pH=8,3) (Sigma-Aldrich). Pour les échantillons d'ARN, l'ensemble de l'appareillage d'électrophorèse subit un traitement préalable avec une solution d'hydroxyde de sodium à 0,1 M durant 15 minutes et un rinçage avec de l'eau DEPC, ceci afin d'éviter tout risque de dégradation par les enzymes RNases ambiantes. De même, la verrerie utilisée est auparavant autoclavée 20 minutes à 120°C grâce à un autoclave de type AER 1200 (Subtil-Crépieux, Chassieu, France). Afin d'apprécier la taille des différentes populations d'ARN et favoriser leur migration, ces derniers, ainsi que le marqueur de poids moléculaires adéquat, sont dénaturés de manière douce par traitement thermique. Enfin, les échantillons d'ADNg et d'ARN totaux sont stockés respectivement à -20°C et à -80°C.

José Viñuelas 80 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

2 Analyse de la relation entre expression des gènes et organisation du chromosome chez Buchnera à l'aide d'une puce à ADN

2.1 Préparation des lames 2.1.1 Synthèse des sondes 2.1.2 Dépôt des sondes 2.1.3 Traitement des lames

2.2 Marquage des acides nucléiques 2.2.1 Marquage direct de l'ADN génomique 2.2.2 Marquage indirect des ARN totaux

2.3 Plan expérimental

2.4 Hybridation et lavages des lames

2.5 Acquisition des images et des données

2.6 Analyse de qualité et normalisation des données

2.7 Outils et bases de données utilisés pour l'analyse du génome de Buchnera

2.8 Analyse spectrale du transcriptome de Buchnera

2.9 Analyse statistique des données de puce à ADN

2.1 Préparation des lames

2.1.1 Synthèse des sondes

Les sondes utilisées, de type oligonucléotidique, ont été choisies, sur la base du séquençage du génome de Buchnera aphidicola (Shigenobu et al., 2000), grâce au logiciel ROSO ("Recherche et Optimisation des Sondes Oligonucléotidiques") développé au laboratoire (Reymond et al., 2004). Les sondes ainsi définies (en moyenne 35 nucléotides) présentent des propriétés optimales en termes de spécificité, de stabilité ou encore de température de fusion. Deux sondes différentes (n°1 et n°2), complémentaires des parties 5' et médiane, ont été choisies pour chacun des gènes de Buchnera. Une troisième sonde (n°3), complémentaire de la partie 3', a également été définie pour quelques gènes d'intérêt, comme ceux intervenant dans la biosynthèse des acides aminés et le transport. En revanche, une seule sonde a été définie pour les ARN de transfert (ARNt), dont les gènes correspondants sont trop courts pour envisager de définir une seconde sonde. Des contrôles positifs sont représentés par les gènes

José Viñuelas 81 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

pelL et pelK, absents chez Buchnera, et issus respectivement des bactéries Erwinia chrysanthemi et Bacillus subtilis. Des témoins négatifs regroupent eux, des dépôts de tampon, des oligonucléotides présentant cinq mutations par rapport aux gènes complémentaires dans le génome de Buchnera et des oligonucléotides dont la séquence a été crée de manière aléatoire et qui ne révèlent aucune similarité avec les gènes de la bactérie.

2.1.2 Dépôt des sondes

Synthétisées par la société Eurogentec (Eurogentec, Seraing, Belgique), les sondes sont déposées sur des lames de type aldéhyde QMT (Interchim, Montluçon, France) par un robot MicroGrid II Pro (BioRobotics, Cambridge, RU) au moyen de quatre aiguilles MicroSpot 2500, (BioRobotics). Chaque sonde est déposée à raison de 0,6 nl par plot à partir d'une solution à 120 µM préparée dans un tampon contenant de la bétaïne (N,N,N-Triméthylglycine) (Sigma-Aldrich) à 1,5 M et du SSC 3X (citrate de sodium salin) (Sigma-Aldrich). Les sondes correspondantes aux gènes de Buchnera ont été déposées par deux aiguilles différentes et en doublets successifs de façon à avoir sur la puce quatre spots différents par sonde. Cette étape est réalisée en collaboration avec la plate-forme transcriptome DTAMB (Développements Technologiques et Analyse Moléculaire de la Biodiversité) de l'Université Claude Bernard Lyon 1. La puce dédiée à l'ensemble du génome de Buchnera comprend 6144 plots répartis selon le schéma représenté dans la Figure 15.

José Viñuelas 82 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Témoins de normalisation Sonde n°3 (en 3' du gène)

Bloc (12 x 16) Sonde n°2 (en partie médiane du gène)

Sonde n°1 Répétitions de (en 5' du gène) spots issus de 2 aiguilles différentes

Doublet de spots issus de la même aiguille

Contrôles Aiguille Aiguille Aiguille Aiguille n°1 n°2 n°3 n°4

Figure 15. Photo et illustration de l'organisation de la puce à ADN dédiée au génome de Buchnera aphidicola issue du puceron Acyrthosiphon pisum, développée dans l'UMR BF2I.

2.1.3 Traitement des lames

Après dépôt, les sondes sont fixées en incubant les lames pendant 15 minutes à 37°C en atmosphère humide, puis 90 minutes à 120°C. Les lames ainsi conditionnées peuvent être conservées à 4°C, à l'abri de l'humidité, pendant 4 mois. Le jour de l'hybridation, afin d'éliminer les sondes non fixées, les lames sont réhydratées 5 secondes au dessus d'un bain de vapeur, lavées 5 minutes dans du SDS 0,2% à TA, lavées 3 fois 2 minutes dans de l'eau UP à TA puis une minute dans de l'eau UP à 95°C. La surface de la lame est ensuite inactivée grâce à une incubation de 15

minutes dans une solution de borohydrure de sodium 0,25% [NaBH4 (Sigma-Aldrich) : 0,5 g ; PBS 1x (Eurobio, Les Ulis, France) : 150 ml ; éthanol 99% : 50 ml]. Enfin, les lames sont rincées 2 fois 2 minutes dans du SDS 0,2% à TA, puis 3 fois pendant 2 minutes dans de l'eau UP à TA, avant d'être séchées par centrifugation 1 minute à 1000 g à TA.

José Viñuelas 83 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

2.2 Marquage des acides nucléiques

2.2.1 Marquage direct de l'ADN génomique

La mise au point du marquage par fluorescence des cibles d'ADNg a été effectuée en plusieurs étapes. Tout d'abord, il a fallu choisir la technique de marquage proprement dite. Pour cela, des expériences précédemment réalisées au laboratoire ont permis de comparer les deux méthodes de marquage basées sur la "nick translation" et sur le "random priming" à partir de 2 et 6 µg d'ADNg. Pour les deux concentrations testées, Calevro et collaborateurs ont montré que le marquage par "random priming" engendrait un bruit de fond de fluorescence beaucoup plus important que le marquage par "nick translation" (données non publiées). Sur la base de ces expériences, différentes quantités d'ADNg (1, 3, 5 et 7 µg) ont ensuite été marquées en fluorescence par "nick translation", afin de déterminer la quantité minimale d'ADNg indispensable à l'obtention d'un signal exploitable. Cette deuxième série d'expériences a montré un très bon signal pour les puces à ADN hybridées avec 5 et 7 µg d'ADNg (données non publiées). Dans le cadre de ce travail de thèse, notre choix s'est donc porté sur ces deux quantités d'ADNg et sur la méthode de marquage par "nick translation" qui a été réalisée à partir du protocole proposé par le fabricant (Ge Healthcare, Chalfont St., UK). Cette technique de marquage direct des cibles fait appel à la double activité de l'enzyme ADN polymérase I d'Escherichia coli. Après action d'une DNase qui ouvre une brèche dans l'un des deux brins du fragment d'ADN, l'ADN polymérase I synthétise un nouveau brin d'ADN à partir de l'extrémité 3'-hydroxyl terminale de la brèche. Simultanément, l'activité 5'→3' exonucléase de cette même enzyme hydrolyse les nucléotides du côté 5'-phosphate. Il en résulte un déplacement de la brèche le long de l'ADN avec un remplacement des nucléotides du brin coupé par des nucléotides marqués (Figure 16). Ces derniers sont dans notre cas des dUTP couplés, selon la condition, à des cyanines Cy3 ou Cy5 (dUTP-Cy3 ou dUTP-Cy5) (Ge Healthcare), qui fluorescent en vert et en rouge respectivement à 532 et 635 nm. L'ensemble de ces réactions a lieu au cours d'une incubation de 4 heures à 15°C dans l'obscurité. Les réactions sont stoppées par ajout d'EDTA à 0,2 M pH=8,0.

José Viñuelas 84 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

5' 3' A Cible à marquer

3' 5'

5' 3' B

3' 5' Ouverture de brèches de manière aléatoire par action d'une DNase : 5' 3' C

3' 5' Hydrolyse des nucléotides par l'ADN polymérase I (activité 5'-3' 5' 3' exonucléasique) : D

3' 5' Synthèse du nouveau fragment d'ADN par la même ADN 5' 3' polymérase I : en présence de dNTP et dUTP- E Cy3 ou -Cy5 : 3' 5'

Figure 16. Schéma illustrant les étapes d'un marquage direct de cibles d'ADNg en fluorescence par "nick translation" lors d'une expérimentation de puce à ADN.

Etant donné la richesse du génome de Buchnera en bases nucléotidiques adénine et thymine, notre choix s'est porté sur des dUTP marqués en lieu et place des dCTP classiquement utilisés. Les cyanines non incorporées sont éliminées par gel-filtration sur colonnes AutoSeqTM G-50 (Ge Healthcare) avant que les échantillons ne soient séchés à l'aide d'un Speed-Vacuum.

2.2.2 Marquage indirect des ARN totaux

Le marquage des ARN a été réalisé selon le protocole établi par Calevro et collaborateurs (2004). Cette étape a nécessité, tout d'abord, le choix d'amorces spécifiques au génome de Buchnera, réalisé avec le logiciel GDP (Genome Directed Primers) (Talaat et al., 2000) afin d'accroître la spécificité de marquage. Dans le cas des ARN, les cibles ont été marquées de façon indirecte. Pour cela, des uraciles modifiées (aminoallyl-dUTP) sont incorporées à l'ADNc selon une réaction de rétrotranscription réalisée à partir de 15 µg d'ARN total à l'aide du kit CyScribe™ Post-labelling

José Viñuelas 85 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

(Ge Healthcare). Une fois l'ADNc synthétisé, la matrice d'ARN est dégradée par un traitement à l'hydroxyde de sodium à 2,5 M (Merck), suivi d'une incubation de 15 minutes à 37°C, avant neutralisation par du Tris- HCl 1 M pH=7,4 (Sigma-Aldrich) (Figure 17). L'ADNc amino-allylé est alors précipité, en présence d'éthanol absolu glacé et d'acétate de sodium froid 3 M pH=5,2 durant 60 minutes à - 80°C. Après une étape de centrifugation à 13000 g durant 30 minutes à TA, un lavage à l'éthanol 75% glacé, et une deuxième centrifugation de 15 minutes à 13000 g à TA, les cibles sont déshydratées à l'aide d'un Speed- Vacuum puis resuspendues dans une solution de bicarbonate de sodium 0,1 M (Merck). Le marquage est enfin réalisé par couplage de carbocyanines Cy3 ou Cy5 (Ge Healthcare) aux groupements allyles de l'ADNc. Cette étape se déroule dans l'obscurité à TA et durant 90 minutes. Après purification sur colonnes AutoSeqTM G-50, permettant d'éliminer les cyanines non incorporées, les cibles sont séchées à nouveau à l'aide du Speed-Vacuum.

5' 3' A Matrice d'ARN

Synthèse de l'ADNc par une rétrotranscriptase : 5' 3' et incorporation de dNTP et de B aminoallyl-dUTP :

3' 5'

Dégradation de la matrice d'ARN par traitement au NaOH 2,5 M C

3' 5' Marquage des ADNc amino-allylés par couplage de carbocyanines Cy3 ou Cy5 : D

3' 5'

Figure 17. Schéma illustrant les étapes d'un marquage indirect de cibles d'ARN en fluorescence lors d'une expérimentation de puce à ADN.

José Viñuelas 86 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

2.3 Plan expérimental

Le plan expérimental adopté est présenté dans le Tableau 2. Parmi les 9 lames hybridées, 5 d'entre elles ont été hybridées avec 5 µg d'ADNg et 15 µg d'ARN. Cette co-hybridation ADNg/ARN a été réalisée en doublet mais également selon une stratégie de type "boucle" en intervertissant les fluorochromes. Cette dernière précaution permet de prendre en compte un éventuel biais dû au marqueur de fluorescence. Trois lames ont été uniquement hybridées avec de l'ADNg et ceci à partir d'une quantité d'acide nucléique de départ de 5 et 7 µg. Inversement, une lame a été uniquement hybridée avec 15 µg d'ARN.

Tableau 2. Plan expérimental d'hybridation.

Quantité Marquage *

ADNg ARN ADNg ARN

lame n°1 5 µg 15 µg Cy3 Cy5 lame n°2 5 µg 15 µg Cy5 Cy3 lame n°3 5 µg 15 µg Cy3 Cy5 lame n°4 5 µg 15 µg Cy5 Cy3 lame n°5 5 µg 15 µg Cy5 Cy3 lame n°6 5 µg + 5 µg Cy3 + Cy5 lame n°7 7 µg + 7 µg Cy3 + Cy5 lame n°8 7 µg + 7 µg Cy3 + Cy5 lame n°9 15 µg + 15 µg Cy3 + Cy5

* : "Cy3" et "Cy5" correspondent à des fluorochromes donnant respectivement une fluorescence verte et une fluorescence rouge.

2.4 Hybridation et lavages des lames

Avant la réaction d'hybridation, les cibles sont resuspendues dans 10 µl d'eau DEPC. Les cibles obtenues respectivement à partir de l'ADNg et/ou de l'ARN sont co-hybridées sur la même lame. Pour cela, elles sont couplées, puis dénaturées durant 5 minutes à 95°C. Après ajout de 200 µl de tampon d'hybridation ChipHybe™ (Ventana Medical Systems, Tuscon, AZ, USA) l'hybridation peut débuter. Cette dernière est réalisée de manière semi-automatique grâce à l'appareillage Discovery® XT System (Ventana Medical Systems) durant 8 heures à 45°C et selon les instructions fournies par le fabricant. Afin d'améliorer la spécificité d'hybridation, une pré-

José Viñuelas 87 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

hybridation de 1 heure 25 minutes en présence de BSA (Albumine Sérique Bovine) (Sigma-Aldrich) est effectuée avec l'automate. L'hybridation terminée, les lames sont rincées manuellement 2 fois 5 minutes dans le tampon RiboWash (Ventana Medical Systems) à TA, une fois 5 minutes et une fois 2 minutes dans du SSC 2x (Sigma-Aldrich) à TA, une fois 2 minutes dans du SSC 0,2x à TA, puis brièvement dans du SSC 0,05x. Les lames sont enfin séchées par centrifugation 1 minute à 1000 g à TA.

2.5 Acquisition des images et des données

Les signaux d'hybridation sont acquis en utilisant un scanner GeneTAC™ LSIV (Genomic Solutions, Huntington, RU) après inspection visuelle de lames à 532 et 635 nm. Au cours de cette inspection, le gain du photomultiplicateur (PMT) est ajusté pour chacun des deux canaux de manière à obtenir environ 1% des plots en saturation. Les lames sont scannées à une résolution de 10 µm puis enregistrées sous forme de deux fichiers au format 16-bit TIFF. L'intensité de fluorescence de chaque plot est alors analysée grâce au logiciel GenePix Pro 4.0 (Axon Instruments, Foster City, CA, USA) qui permet d'attribuer un indice de qualité propre à chaque plot sur la base d'une inspection visuelle mais également en fonction de divers filtres semi-automatisés. Ces filtres prennent en compte la saturation des plots, leur diamètre, la corrélation moyenne/médiane du signal, la variabilité du signal et du bruit de fond, ou encore le rapport signal/bruit de fond. La mesure du signal retenue pour l'analyse est la médiane des pixels et du bruit de fond qui leur est associé.

2.6 Analyse de qualité et normalisation des données

Pour cette étude, les gènes plasmidiques n'ont pas été retenus. De même, les signaux correspondants aux ARN de transferts, aux ARN ribosomiques et au gène rnpB à l'origine du composant ARN de la ribonucléase P, ont été exclus de notre analyse de part leurs propriétés spécifiques d'hybridation (Wilcox et al., 2003; Charles et al., 2006). Parmi les 18 profils d'hybridation obtenus à partir des 9 lames, seuls 2 issus d'une hybridation par de l'ADNg et 2 issus d'une hybridation par de l'ADNc présentaient des signaux d'une excellente qualité. Les 4 profils sélectionnés provenaient tous d'un marquage en Cy3, ce qui a évité une normalisation vis-à-vis du fluorochrome. Une moyenne des signaux d'ADNg et une moyenne des signaux d'ADNc issus des deux lames ont

José Viñuelas 88 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

alors été calculées de façon à obtenir un jeu global de données pour chacune des deux espèces d'acides nucléiques. Avant d'effectuer la normalisation des données transcriptomiques (ADNc) à partir des signaux d'ADNg en vue d'obtenir une valeur absolue du niveau d'expression des gènes, l'analyse de qualité a été complétée de la façon suivante : chacun des signaux transcriptomiques est normalisé par un signal génomique qui lui est propre, c'est pourquoi seuls les spots présentant une excellente qualité de signal en ADNc et en ADNg ont été retenus pour l'analyse. De ce fait, après avoir calculé la moyenne des signaux des 4 répétitions propres à chaque sonde (moyenne intra-sonde), puis ceux des 2 ou 3 sondes propres à chaque gène (moyenne inter-sonde), 30 gènes ont été exclus du jeu de données. Afin de s'assurer que ces exclusions ne biaisaient pas notre étude, nous avons vérifié que ces gènes étaient uniformément répartis vis-à-vis des différents paramètres analysés dans cette étude, c'est-à-dire l'organisation des gènes en opérons, leur essentialité à la survie de la bactérie, leur position sur le brin d'ADN direct ou indirect et leur niveau d'expression. Pour normaliser les données de la puce Buchnera, un coefficient

de normalisation Ki, propre à chacun des S spots de la puce, a été déterminé à partir des signaux d'ADNg. Pour cela, nous avons estimé la valeur moyenne M des signaux d'ADNg. Cette valeur moyenne peut être considérée comme la valeur de fluorescence propre à une seule copie de chacun des gènes de Buchnera. Ainsi, un rapport entre les signaux d'ADNg et cette référence permet de déterminer le coefficient de correction de chaque spot et de chaque sonde de la puce. Ces coefficients sont appliqués

aux signaux transcriptomiques ARNmi (ADNc) afin d'obtenir une valeur

normalisée ARNm.normi selon les formules suivantes :

S 1 ADNgi ARNmi M ADNg i Ki ARNm.normi S i 1 M Ki

2.7 Outils et bases de données utilisés pour l'analyse du génome de Buchnera

Les séquences nucléotidiques relatives au génome de Buchnera aphidicola ainsi que les annotations correspondantes sont issues des bases de données GenBank (http://www.ncbi.nlm.nih.gov) et TIGR (http://www.tigr.org). La définition de l'essentialité des gènes chez Buchnera a fait l'objet d'une attention toute particulière : celle-ci a été basée sur le jeu de gènes minimum à la survie des bactéries proposé par Gil et collaborateurs

José Viñuelas 89 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

(2004b) (cf. Annexes). Ce jeu de gènes essentiels a été défini par une analyse de séquences comparées de génomes de 5 symbiotes d'insectes (dont 3 correspondant à Buchnera aphidicola), mais également à partir du génome réduit de Mycoplasma genitalium ainsi qu'à partir de la liste des gènes essentiels définis pour les bactéries de forme libre E. coli et B. subtilis. L'identification des opérons présumés chez Buchnera a été réalisée manuellement par comparaison avec le génome d'E. coli. Pour cela, les gènes d'E. coli orthologues à ceux de Buchnera ont été recherchés à partir de la base de données EcoCyc (http://ecocyc.org) et les groupes de gènes correspondants à des unités de transcription chez E. coli ont été sélectionnés. Après avoir retiré les singletons, 82 opérons présumés, composés de 2 à 13 gènes, ont pu être déterminés chez Buchnera aphidicola (cf. Annexes). Concernant le taux d'évolution des gènes, celui-ci a été défini dans cette étude par la composition des gènes en base guanine et cytosine. En effet, comme la plupart des génomes réduits de symbiote d'insecte, le génome de Buchnera a connu au cours de l'évolution un fort biais mutationnel en faveur des bases adénine et thymine. Le taux de GC des gènes est, de ce fait, corrélé avec leur taux d'évolution : les gènes les plus riches en bases G et C étant ceux qui sont le moins soumis au biais mutationnel vers les bases A et T et donc les plus conservés (Rispe et al., 2004). Enfin, les données de puce à ADN obtenues dans l'étude présentée ici, ont été sauvegardées sous le format MIAME puis déposées dans la base de données ArrayExpress (http://www.ebi.ac.uk/microarray). Elles sont disponibles en utilisant le numéro d'accession E-TABM-193.

2.8 Analyse spectrale du transcriptome de Buchnera

L'analyse spectrale des signaux transcriptomiques a été réalisée avec le module "Time Series" du logiciel JMP version 5.0.1.2 (SAS Institute). La recherche de composantes spatiales périodiques dans le niveau d'expression des gènes de Buchnera par rapport à leur localisation le long du chromosome a été réalisée par les tests Kappa de Fisher et Kolmogorov-Smirnov de Bartlett (Upshur et al., 2004). Ces tests ont également été appliqués sur divers jeux de données simulées obtenus par des permutations de la position des gènes de Buchnera, conservant ou non l'ordre et l'espacement des opérons le long du chromosome. La détermination des profils transcriptomiques spatiaux a été effectuée par le calcul de la fonction d'autocorrélation du transcriptome de

José Viñuelas 90 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Buchnera, assimilé ici à une série spatiale, ainsi que par la densité spectrale de cette même fonction d'autocorrélation. L'autocorrélation pour la kème distance inter-gène est calculée grâce aux formules suivantes :

N ck 1 rk où ck (yx y)( yx k y) c0 N k x k 1

avec k = 0, 1, 2…, N/4, où yx correspond au niveau d'expression du gène localisé en x, et y est la moyenne des N niveaux d'expression des gènes de Buchnera. L'erreur standard des estimations d'autocorrélation est donnée par la formule suivante : k 1 1 2 SEk ri N i 1

Pour cette étude, la distance inter-gène est définie par la différence de rang entre les gènes. Cette valeur est un bon estimateur de la distance inter-gène, classiquement définie en kilobases, les gènes de Buchnera étant caractérisés par une longueur moyenne de 1 000 bases nucléotidiques, et séparés par des séquences intergéniques relativement courtes. La densité spectrale de la fonction d'autocorrélation, estimée par les transformées de Fourier, a permis, quant à elle, de définir le périodogramme qui illustre les composantes périodiques de l'expression des gènes de Buchnera le long de son chromosome, ainsi que leur intensité relative. Le signal périodique de la principale période du transcriptome de la bactérie (période "86,86") est déterminé par la moyenne des signaux de chacun des segments composant la période. Le signal ainsi obtenu a ensuite été lissé à l'aide de la fonction "Fit Spline" du logiciel JMP. Cette étape de lissage a pour but d'éliminer les composantes accessoires du spectre sans pour autant modifier sa forme native.

2.9 Analyse statistique des données de puce à ADN

L'analyse statistique des données d'expression, les comparaisons de moyennes (ANOVA F-test) et de distribution (test khi-2 du rapport de vraisemblance) ont été réalisées grâce au logiciel JMP.

José Viñuelas 91 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

3 Analyse de la réponse du puceron et de sa bactérie symbiotique à des stress en leucine

3.1 Etude du comportement et du taux de croissance du puceron Acyrthosiphon pisum

3.2 Mesure de la néosynthèse des acides aminés branchés par Buchnera

3.3 Analyse de la réponse de Buchnera par expériences de PCR et RT-PCR en temps réel 3.3.1 Préparation des produits de PCR, des gammes étalon et des dilutions 3.3.2 Préparation et dilution des acides nucléiques 3.3.3 Protocoles et acquisition des données 3.3.4 Plans expérimentaux 3.3.5 Normalisation des données 3.3.6 Analyse statistique des données 3.3.7 Analyse bioinformatique du plasmide pLeu de Buchnera

3.4 Validation expérimentale de l'opéron leuABCD et étude de la séquence non codante en amont de leuA

3.1 Etude du comportement et du taux de croissance du puceron Acyrthosiphon pisum

Ces études ont été effectuées sur des pucerons au premier stade de développement larvaire (nés sur plante et âgés de 0 à 24 heures), transférés sur des milieux artificiels. L'étude de l'appétence du puceron pour le milieu nutritionnel, en fonction de la quantité de leucine, a été réalisée selon le protocole décrit par Sauvion et collaborateurs (2004). Pour cela, des groupes de 6 pucerons sont enfermés dans des cages de choix (n=24 cages, soit 144 pucerons), dans lesquelles ils pourront choisir de s'orienter soit vers un milieu de contrôle (leu20mM) soit vers un milieu test dont la concentration en leucine peut varier de 0 à 90 mM. Après un temps d'attente de 8 heures dans l'obscurité, la préférence des pucerons entre les deux milieux qui leur sont proposés est quantifiée par le décompte du nombre d'insectes fixés sur chacun des milieux. Cette mesure est ensuite transformée en un index compris entre -1 et 1 indiquant, respectivement, une préférence totale pour le milieu de référence ou pour le milieu test. Les tests de croissance des pucerons en fonction de la concentration en leucine présente dans le milieu nutritionnel ont été réalisés selon le protocole décrit par Rahbé et Febvay (1993). Pour chacune des modalités de stress, 54 pucerons ont été élevés sur les milieux artificiels pendant toute la durée de leur vie larvaire (7 jours), puis pesés de manière individuelle. Le taux de croissance est exprimé en pourcentage par rapport au milieu de contrôle et est déterminé pour chacune des conditions tests.

José Viñuelas 92 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

3.2 Mesure de la néosynthèse des acides aminés branchés par Buchnera

La néosynthèse par Buchnera des trois acides aminés branchés, en fonction de la quantité de leucine présente dans le milieu nutritionnel du puceron, a été mesurée selon le protocole établi par Febvay et collaborateurs (1995). Pour cela, des pucerons au premier stade de développement larvaire (âgés de 0 et 6 heures) nés sur plante sont déposés sur des milieux artificiels contenant une concentration en leucine comprise entre 0 et 80 mM ainsi qu'une concentration de saccharose marqué au 14C de 1 MBq/ml (Isotopchim, Ganagobie-Peyruis, France). L'activité radioactive initiale du milieu est quantifiée sur un volume de 10 µl (3 répétitions), après addition de 4,5 ml de liquide scintillant de type Ultima Gold (Packard Instrument SA, Rungis, France) dans un compteur à scintillation Packard Tri-Carb 460C. Après 7 jours de traitement, et pour chacun des différents milieux d'élevage, des groupes de 3 pucerons adultes sont pesés puis hydrolysés sous vapeurs d'acide chlorhydrique, en présence de β-mercaptoéthanol pour préserver les acides aminés soufrés. Après addition de 50 nmol d'acide glucosaminique (étalon interne), les échantillons sont séchés sous vide au Speed-Vacuum puis resuspendus dans 150 µl d'un tampon citrate lithium 0,05 M, pH 2,2. Pour chaque lot, l'activité radioactive totale de l'échantillon est mesurée comme précédemment sur 3 fractions de 10 µl. L'analyse des acides aminés totaux est effectuée sur une fraction de 50 µl : l'analyseur automatique d'acides aminés est couplé à un détecteur de radioactivité en flux en temps réel de type Flo-one Beta A500 (Packard, Meriden, CT, USA) permettant la quantification de composés radiomarqués selon le protocole décrit par Febvay et collaborateurs (1999). La radioactivité enregistrée pour chacun des acides amines branchés est ensuite calculée en nmol d'équivalents de saccharose et exprimée en mg de poids frais de puceron.

José Viñuelas 93 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

3.3 Analyse de la réponse de Buchnera par expériences de PCR et RT-PCR en temps réel

3.3.1 Préparation des produits de PCR, des gammes étalon et des dilutions

Pour les expériences de PCR en temps réel la réalisation d'une gamme d'étalonnage spécifique à chacun des gènes à tester a été nécessaire. Celle-ci permet une détermination absolue du nombre de copies d'un gène ou de son niveau d'expression respectivement pour la PCR et la RT-PCR. De plus, dans le cas des expérimentations présentées ici, où la quantification d'un transcrit est réalisée relativement à un gène de référence, la gamme étalon permet d'obtenir l'efficacité de PCR pour chacun des gènes à tester, critère indispensable pour pouvoir les comparer les uns par rapport aux autres. Chacune des gammes étalon est réalisée sur la base de produits de PCR obtenus à partir de l'ADNg de Buchnera aphidicola. Pour cela, une réaction de PCR est effectuée sur 50 ng d'ADNg de la bactérie, en utilisant l'ADN polymérase "UptiTherm" (Interchim, Montluçon, France) et selon les conditions expérimentales illustrées dans la Figure 18.

Conditions de PCR Tampon 10x de PCR : 5 µl

MgCl2 (50 mM) : 2 µl dNTP (2,5 mM chacun) : 4 µl Taq Uptitherm Pol. (Uptima) (5U/µl) : 0,25 µl ADNg : 50 ng Amorce "Forward" (10 µM) : 1,5 µl Amorce "Reverse" (10 µM) : 1,5 µl 38 cycles Eau UP : qsp 50 µl 2 min 30 s

94°C 1 min 30 s 7 min

72°C 30 s

47°C

Activation Amplification Fin d'élongation Dénaturation

Figure 18. Illustration et résumé des conditions de réalisation de la PCR.

José Viñuelas 94 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Afin d'obtenir une quantité d'amplicon suffisante, cette réaction est réalisée en triplicat pour chacun des gènes à tester. Les amorces de PCR (Tableau 3 et Tableau 4), comprises entre 15 et 20 nucléotides, sont sélectionnées à l'aide du logiciel "Oligo 6.6" (OLIGO Primer Analysis Software, Molecular Biology Insights, http://www.oligo.net/).

Tableau 3. Caractéristiques des amorces de PCR utilisées dans le cadre des expériences de PCR sur Buchnera issue du puceron Acyrthosiphon pisum.

Taille amorce Ta Taille amplicon Gène Amorce Séquence de l'amorce 5'- 3' (en pb) (en °C) (en pb)

aceE aceE-For ATGGAAGGATTATTTCGTAA 20 47 150 aceE-Rev AGATGAAGCTGCACCTAA 18

atpA atpA-For AAATGATTTTATTGCCTAA 19 47,1 99 atpA-Rev CAGAAATATGAATATAGGGA 20

ilvH ilvH-For GAATCAGGTGCACTATCAAG 20 46,8 90 ilvH-Rev AGGATCTTCAGTAGGTGCTA 20

ilvI ilvI-For TCTTTAATGGGATTAGGTAG 20 47,5 183 ilvI-Rev AACAATCGCATTTGG 15

leuA leuA-For GATATACTGTACCCAACGAA 20 46,8 178 leuA-Rev ATTCCGTTTATAGTCCCT 18

leuB leuB-For TTGCCAAAAACTACATTGC 19 47,1 93 leuB-Rev TTCTACTGGAAGGTTATCCC 20

leuC leuC-For AGCCTTTGATTCATTACGAG 20 47,4 127 leuC-Rev TACCTTTGCCATAGAACCT 19

leuD leuD-For ACATGCTGGTATCGTTGTTC 20 44,6 125 leuD-Rev AACGCCAGTCATGAA 15

leuS leuS-For AAATTACAAGATTGGTGCAT 20 47 100 leuS-Rev GGTTTTCTGGTATCGGTAT 19

repA1 repA1-For ATGGGTTTTGTTACTTGC 18 46,4 154 repA1-Rev TATTGATCCACCCTAATTGT 20

repA2 repA2-For ATTATATCGCAATTAGATGA 20 43,6 105 repA2-Rev TAAACCCTTCGGACCT 16

rplX rplX-For AAAAAGAAGCACCTATTCAT 20 44,4 93 rplX-Rev TCCCTTCTTCAAACCTAA 18

rpmC rpmC-For GGCATTGGTAGAATTTAGAA 20 46,8 184 rpmC-Rev CTCTTCCTTTGAATCTAGCA 20

yqhA yqhA-For TTATCATGCCAGATATTGTG 20 47 174 yqhA-Rev CCATCCACCCTAATCTTT 18

José Viñuelas 95 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Tableau 4. Caractéristiques des amorces de PCR utilisées dans le cadre des expériences de PCR sur Buchnera issue du puceron Rhopalosiphum padi.

Taille amorce Ta Taille amplicon Gène Amorce Séquence de l'amorce 5'- 3' (en pb) (en °C) (en pb)

groEL groEL-For TAACTACGGTTATAATGCAG 20 46,9 163 groEL-Rev GTCTTCTTTTGGCAAATC 18

leuA leuA-For CAGTTTGGCTCGTTGTTT 18 47,3 167 leuA-Rev TAACTGACGTTATTGCCATA 20

leuC leuC-For GGTACATCGGGTGGT 15 47,4 127 leuC-Rev CTATTAAGGCTGATTTAGCA 20

yqhA yqhA-For CCGGATATTTTAGCAAT 17 46,3 185 yqhA-Rev GAATTAACATCCATAGTCCC 20

Après vérification sur gel d'agarose de la spécificité d'amplification, les produits de PCR sont purifiés par passage sur des colonnes fournies dans le kit NucleoSpin® Extract II (Macherey-Nagel, Düren, Allemagne), puis dosés au NanoDrop® ND-1000. Les concentrations des produits de PCR sont toutes ramenées à 20 ng/µl avec de l'eau UP autoclavée, avant que les produits ne soient conservés à -20°C. La gamme étalon relative au gène à tester en PCR ou RT-PCR en temps réel est préparée extemporanément à partir de 8 dilutions au 1/10ème réalisées en cascade dans de l'eau UP autoclavée. Pour nos expériences, seules les 6 dernières dilutions sont retenues, de façon à obtenir une gamme étalon allant de 2000 fg/µl à 0,02 fg/µl.

3.3.2 Préparation et dilution des acides nucléiques

3.3.2.1 PCR quantitative : préparation de l'ADN génomique

A partir des concentrations des échantillons d'ADNg mesurées au NanoDrop®, une solution fille d'ADNg à 2,5 ng/µl est réalisée pour chacune des modalités (12h, J1, J2, J3 et J7) des 3 conditions (leu0mM, leu20mM, leu60mM) testées. Ces solutions filles sont ensuite fractionnées de façon à obtenir des échantillons d'ADNg à usage unique pour chaque expérience de PCR quantitative. Ce procédé évite les cycles de congélation/décongélation qui pourraient affecter la qualité de l'ADNg et biaiser sa quantification. Dans chaque puits, la réaction de PCR se déroule dans un volume final de 10 µl et se compose de 2,5 µl de solution d'ADNg à 2,5 ng/µl, et de 7,5 µl d'un mélange de PCR issu du kit LightCycler 480 SYBR Green I

José Viñuelas 96 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Master (Roche Diagnostics). Ce dernier est constitué de 5 µl de mélange réactionnel contenant du "SYBR Green", de 2x0,5 µl d'amorces spécifiques (concentration finale 0,5 µM), et de 1,5 µl d'eau UP.

3.3.2.2 RT-PCR quantitative : préparation de l'ADNc

Dans le cadre des expériences de RT-PCR quantitative, une réaction de rétrotranscription est tout d'abord réalisée à partir de 1 µg d'ARN dans un volume final de 21 µl selon le protocole du kit SuperScript™ First-Strand Synthesis System for RT-PCR (Invitrogen). Pour cela, 1 µl d'amorces aléatoires (hexamères) et 1 µl de dNTP sont ajoutés à 1 µg d'ARN, avant de compléter l'échantillon par de l'eau UP autoclavée pour obtenir un volume de 10 µl. L'échantillon est ensuite incubé 5 minutes à 65°C (dénaturation des structures secondaires des ARN et début d'hybridation des amorces) puis refroidi 1 minute à 4°C. 9 µl de mélange réactionnel, composé de 2 µl de tampon concentré 10x, 4 µl de

MgCl2 25 mM, 2 µl de DTT 0,1 M et 1 µl d'enzyme RNase Out sont alors ajoutés à l'échantillon. Le mélange ainsi obtenu est placé 2 minutes à 25°C avant l'ajout de 1 µl d'enzyme SuperScript™ II RT. Une série d'incubations est alors réalisée : 10 minutes à 25°C (hybridation des amorces), 50 minutes à 42°C (synthèse des ADNc), 15 minutes à 70°C (fin de réaction de synthèse) et enfin, au moins 2 minutes à 4°C (conservation des produits de RT). L'ajout de 1 µl de RNase H associé à une incubation de 20 minutes à 37°C permet de dégrader l'ARN présent initialement. Pour la réalisation de la PCR quantitative, le produit de RT est dilué au 1/5ème avec de l'eau UP autoclavée puis fractionné en échantillons à usage unique, selon le plan expérimental choisi et ceci afin d'éviter une répétition de cycles de congélation/décongélation qui pourrait nuire à la bonne conservation des ADNc. Comme pour les échantillons d'ADNg, 2,5 µl de solution d'ADNc diluée sont ajoutés à 7,5 µl de mélange réactionnel.

3.3.3 Protocoles et acquisition des données

Les réactions de PCR et RT-PCR en temps réel sont réalisées dans un thermocycleur "Light Cycler" 96 puits LC 480 (Roche). Le protocole suivi, résumé dans la Figure 19, se compose de 4 étapes : une étape de dénaturation des échantillons (5 minutes à 95°C) servant également à l'activation de l'ADN polymérase, une étape d'amplification de 45 cycles (15 secondes à 95°C, 15 secondes à 47°C et 15 secondes à 72°C), une étape de fusion permettant de vérifier la spécificité de la réaction de PCR (1 seconde à 95°C puis 30 secondes à 57°C), et une étape de refroidissement (30 secondes à 40°C). Pour l'ensemble des

José Viñuelas 97 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

expérimentations, le cycle seuil (Ct) a été déterminé par la méthode du calcul de la valeur maximale de la dérivée seconde de la courbe RFU=f(n), RFU étant la valeur mesurée relative aux variations du signal de fluorescence émis d'un cycle à un autre, et n le nombre de cycles.

Conditions de PCR en temps réel ADNg à 2,5 µg/µl, ou ADNc dilué au 1/5ème : 2,5 µl Amorce "Forward" (10 µM) : 0,5 µl Amorce "Reverse" (10 µM) : 0,5 µl 45 cycles Mélange réactionnel Roche : 5 µl 5 min 15 s 1 min Eau UP : qsp 10 µl 95°C 15 s 30 s 72°C 15 s 57°C 30 s 47°C 40°C Activation Amplification Fusion Refroidissement Dénaturation

Figure 19. Illustration et résumé des conditions de réalisation des PCR et RT- PCR en temps réel.

3.3.4 Plans expérimentaux

3.3.4.1 Expériences de PCR quantitative

Pour les expériences de PCR quantitative visant à déterminer le nombre de copies du plasmide pLeu de Buchnera, 3 gènes (leuA, leuC, yqhA) répartis uniformément le long du plasmide, ont été testés. Normalement, pour ce type d'expérience, un seul gène est utilisé. Notre choix des trois gènes est motivé par le souci d'apporter plus de robustesse à l'étude mais également par l'objectif de prendre en compte un possible effet "origine de réplication". Le nombre de copies de plasmide obtenu pour chacun des gènes présentés ci-dessus a été normalisé par rapport au nombre de copies de chromosome déterminé grâce au gène chromosomique atpA (dans le cadre des études menées sur Buchnera Ap) ou groEL (dans le cadre des études menées sur Buchnera Rp, la séquence du gène atpA pour cette souche de Buchnera n'étant pas disponible à ce jour), et ceci selon la procédure présentée ci-après (cf. Matériels et Méthodes § 3.3.5). Pour ces expériences de PCR quantitative, le format adopté est celui de la plaque 96 puits. Chacune des plaques utilisées suit le format présenté dans la Figure 20.

José Viñuelas 98 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

1 2 3 4 5 6 7 8 9 10 11 12

A Blanc D1 D2 D3 D4 D5 D6 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 B 12h 12h 12h J1 J1 J1 J2 J2 J2 J3 J3 J3 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 C 12h 12h 12h J1 J1 J1 J2 J2 J2 J3 J3 J3 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 D 12h 12h 12h J1 J1 J1 J2 J2 J2 J3 J3 J3 E Blanc D1 D2 D3 D4 D5 D6 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 leu0 F 12h 12h 12h J1 J1 J1 J2 J2 J2 J3 J3 J3 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 leu20 G 12h 12h 12h J1 J1 J1 J2 J2 J2 J3 J3 J3 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 leu60 H 12h 12h 12h J1 J1 J1 J2 J2 J2 J3 J3 J3

Figure 20. Organisation de la plaque 96 puits utilisée pour les expériences de PCR quantitative. En violet, les puits relatifs au gène de normalisation atpA (ou groEL pour Buchnera Rp), et en rose les puits relatifs au gène n°2. Pour chaque gène, un témoin négatif est réalisé (eau). De même une gamme étalon à 6 points (D1 à D6) est effectuée pour chaque gène de la plaque à partir de produits de PCR. Les mesures concernant les modalités "7 jours" et "plante" ont été réalisées sur une deuxième plaque.

3.3.4.2 Expériences de RT-PCR quantitative

Pour les expériences de RT-PCR quantitative, les niveaux d'expression des 10 gènes du plasmide pLeu (leuABCD, repA1, repA2, yqhA, ilvIH, leuS) et de 3 gènes de normalisation (atpA, rplX, rpmC), ont été mesurés en PCR quantitative, et cela pour les 3 conditions (leu0mM, leu20mM, leu60mM) comportant chacune les 5 modalités (12h, J1, J2, J3 et J7) de traitement. Comme pour les expériences de PCR quantitative sur l'ADNg, les mesures de fluorescence ont été réalisées sur des plaques 96 puits, chacune comportant notamment une gamme étalon pour chaque gène à tester (Figure 20).

José Viñuelas 99 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

3.3.5 Normalisation des données

3.3.5.1 PCR quantitative : normalisation par unité de chromosome

La détermination du nombre de copies de plasmide pLeu chez Buchnera a nécessité une normalisation par rapport au nombre de copies du chromosome. En effet, il convient d'obtenir un résultat en nombre de copies de plasmide par unité de chromosome afin de s'affranchir de variabilités intrinsèques à l'expérimentation, comme par exemple, la variabilité du nombre de symbiotes en fonction du stade de développement de l'insecte, la qualité de la filtration, ou encore la quantité d'acide nucléique extraite pour chaque condition expérimentale. Pour cela, le nombre de copies de chacun des gènes testés, qu'il soit plasmidique ou chromosomique, est tout d'abord défini selon l'équation suivante (Whelan et al., 2003) :

6,02 1023 (copie/ mol) quantité ADN(g) ADN(copie) taille fragment ADN( pb) 660(g / mol / pb)

puis un simple rapport entre la quantité du gène plasmidique testé (leuA, leuC ou yqhA) et le gène chromosomique (atpA ou groEL) permet d'obtenir le nombre de copies de plasmide pLeu normalisé par unité de chromosome. Après avoir vérifié et testé l'homogénéité des réponses des 3 gènes plasmidiques, une moyenne du nombre de copies de pLeu a été réalisée. Enfin, afin de nous affranchir des éventuels biais dus à la mesure de fluorescence (effet plaque, SYBR Green ou appareillage), chacune des 3 plaques 96 puits comporte les ADNg des différentes modalités et conditions pour le gène à tester, mais également l'équivalent pour le gène de normalisation. Ainsi, chacun des gènes leuA, leuC et yqhA sera normalisé avec un témoin atpA ou groEL qui sera issu de la même plaque.

3.3.5.2 RT-PCR quantitative : ratio d'expression relative

Une des difficultés majeures rencontrée lors d'expériences de RT- PCR quantitative est le choix du gène de normalisation. En effet, il est impossible de savoir a priori qu'un gène aura un niveau d'expression invariant pour l'ensemble des conditions expérimentales que nous désirons tester. La littérature a montré que les gènes de ménage, définis à l'origine comme ayant des niveaux d'expression universellement invariants, peuvent voir leur expression significativement varier dans certaines conditions physiologiques (Manganelli et al., 1999). Or, la normalisation des données

José Viñuelas 100 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

d'expression par un gène invariant est une étape indispensable afin de pouvoir s'affranchir de biais propres aux étapes de préparation des échantillons ou encore spécifiques à certaines conditions expérimentales testées. C'est pourquoi, dans le cadre de ces expérimentations de RT-PCR en temps réel, nous avons choisi initialement trois gènes de normalisation : atpA, rplX et rpmC codant respectivement la chaîne de l’ATP synthétase, et les protéines ribosomiques L24 et L29 de la sous-unité ribosomale 50S. Notre choix s'est porté sur ces gènes pour diverses raisons : (i) lors des différentes expériences de transcriptomique menées sur Buchnera dans notre unité, ces gènes n'ont révélé aucune expression différentielle pour les différentes conditions testées, (ii) ces gènes ne présentaient aucune sous- ou sur-expression dans les expériences d'analyse du transcriptome menées par Moran et collaborateurs sur Buchnera, (iii) enfin, ces gènes n'appartiennent pas à la voie de biosynthèse de la leucine ni de tout autre acide aminé. Cependant, afin de s'assurer que le niveau d'expression de ces gènes est bien invariant dans le cadre de notre étude, nous les avons testés grâce au logiciel "BestKeeper" développé par Pfall et collaborateurs (2004). Cet outil permet de tester si un gène a ou non un niveau d'expression qui varie entre deux ou plusieurs conditions expérimentales, et ainsi de savoir si le gène en question peut être utilisé comme témoin de normalisation dans les conditions données. Après avoir sélectionné le ou les gènes présentant toutes les caractéristiques de témoins de normalisation, les données sont normalisées et analysées selon la méthode comparative des Ct ("threshold cycle"), qui correspond au nombre fractionnaire de cycles pour lequel l'intensité de la fluorescence émise a dépassé une valeur seuil significativement différente du bruit de fond (Tse et Capeau, 2003). Cette méthode de quantification relative consiste, après co-amplification du gène cible avec un gène endogène de référence, à comparer les Ct calculés à partir de l'échantillon de la condition "test" et de l'échantillon de la condition "contrôle". Le nombre de transcrits initialement présents pour la condition "test", normalisé par rapport au gène de référence et relatif à la condition contrôle est donné par l'équation 2-ΔΔCt où : ΔΔCt = ΔCt (condition test) – ΔCt (condition contrôle) avec ΔCt = Ct (gène cible) – Ct (gène référence). Cependant, comme pour de nombreuses méthodes de quantification, la méthode du ΔΔCt repose sur l'hypothèse que les efficacités d'amplification de PCR des gènes cibles et de référence sont identiques. Or, ceci est inexact et semble être dû, en partie, aux propriétés structurales de chaque amplicon. C'est pourquoi, dans le cadre de ces expérimentations, nous avons utilisé le modèle mathématique développé par Pfaffl (2001) qui permet de corriger les différences d'efficacité d'amplification entre les différents gènes.

José Viñuelas 101 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Dans ce modèle, le ratio d'expression d'un gène cible entre deux conditions expérimentales, normalisé par rapport à un gène de référence, est calculé selon l'équation suivante :

Ct gènecible(contrôle test) (Egènecible ) Ratio Ct gèneréférence(contrôle test) (Egèneréférence)

où E représente l'efficacité d'amplification, Ct le cycle seuil, et Δ la différence de Ct entre les deux conditions à tester. Afin de faciliter l'utilisation de ce modèle mathématique, Pfaffl et collaborateurs ont développé en 2002 le logiciel REST© (Relative Expression Software Tool), qui permet d'obtenir le ratio présenté ci-dessus (Pfaffl et al., 2002) (http://www.wzw.tum.de/gene-quantification). Un autre avantage de cet outil est la possibilité d'utiliser plusieurs gènes de normalisation et de comparer plusieurs conditions "tests" par rapport à une condition "contrôle".

3.3.6 Analyse statistique des données

L'analyse statistique des données a nécessité la réalisation de tests de comparaison de moyenne (ANOVA F-test, test non paramétrique des rangs signés de Wilcoxon), de régression linéaire ainsi que de comparaison de distribution (test de Dunnett, test exact de Fisher). Tous ces tests ont été effectués grâce au logiciel JMP (SAS Institute, Inc.).

3.3.7 Analyse bioinformatique du plasmide pLeu de Buchnera

L'analyse bioinformatique du plasmide pLeu de Buchnera été réalisée sur la séquence Genbank AJ006878. La recherche de séquences de type Tige-Boucle, des sites de fixation des facteurs IHF et Fis, ou encore des ribosomes a été effectuée via les plateformes internes du logiciel MacVector 9.5.2 (Mac Vector Inc.). Les terminateurs rho-indépendants putatifs ont été mis en évidence grâce au logiciel TransTerm (Ermolaeva et al., 2000) (http://transterm.cbcb.umd.edu/) et à la plateforme IOGMA® (Genostar bioinformatics solutions). Les promoteurs putatifs ont, quant à eux, été identifiés avec le logiciel BPROM (http://linux1.softberry.com/berry.phtml). Enfin, la représentation de la structure secondaire de type Tige-Boucle au niveau de la séquence intergénique entre repA2 et leuA a été réalisée via le logiciel Mfold 3.0 (http://mfold.bioinfo.rpi.edu/).

José Viñuelas 102 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

3.4 Validation expérimentale de l'opéron leuABCD et étude de la séquence non codante en amont de leuA

La validation expérimentale de l'existence de l'opéron leuABCD a été réalisée selon un protocole issu de Charaniya et collaborateurs (2007). Au cours de cette expérience, nous avons également testé si la séquence non codante en amont de leuA était co-transcrite avec ce gène. Pour cela, les ARN totaux de Buchnera ont été traités durant 60 minutes à 37°C avec la DNase issue du kit Turbo DNA-free™ (Ambion, Austin, TX, USA) à raison de 2 unités d'enzyme pour 10 µg d'ARN. Après inactivation de la DNase, l'ARN total est purifié sur les colonnes RNeasy®, puis resuspendu dans de l'eau DEPC. L'utilisation de cette DNase très performante est nécessaire pour ce type d'expériences et ceci, afin d'éliminer toute trace d'ADNg dans les échantillons d'ARN totaux qui pourrait générer des faux positifs lors de l'étape de RT-PCR. La réaction de rétrotranscription est réalisée à partir de 1 µg d'ARN dans un volume final de 21 µl, selon le protocole du kit SuperScript™ III First-Strand Synthesis System for RT-PCR (Invitrogen). Par opposition aux expériences de RT-PCR quantitative, nous avons utilisé ici l'enzyme SuperScript™ III au lieu de la SuperScript™ II car cette dernière est plus performante dans le cadre de la rétrotransciption de transcrits relativement longs. La préparation de l'échantillon ainsi que le type d'amorces utilisées reste inchangés (cf. Matériels et Méthodes § 3.3.2). L'échantillon est ensuite incubé pendant 5 minutes à 65°C (dénaturation des structures secondaires des ARN et début d'hybridation des amorces), puis refroidi 1 minute à 4°C. 10 µl de mélange réactionnel

composé de 2 µl de tampon concentré 10x, 4 µl de MgCl 2 25 mM, 2 µl de DTT 0,1 M, 1 µl d'enzyme RNase Out et 1 µl d'enzyme SuperScript™ III, sont ensuite ajoutés à l'échantillon. Une série d'incubations est alors réalisée : 10 minutes à 25°C (hybridation des amorces), 50 minutes à 50°C (synthèse des ADNc), 5 minutes à 85°C (fin de réaction de synthèse) et enfin, au moins 2 minutes à 4°C (conservation des produits de RT). L'ajout de 1 µl de RNase H associé à une incubation de 20 minutes à 37°C permet ensuite de dégrader l'ARN présent initialement. La réaction de PCR est réalisée à partir de 2 µl de produits de rétrotranscription grâce à l'ADN polymérase issue du kit AccuPrime™ Taq DNA Polymerase High Fidelity (Invitrogen), adaptée pour amplifier des fragments allant jusqu'à 20 kpb, et selon les conditions expérimentales illustrées dans la Figure 21.

José Viñuelas 103 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Matériels et Méthodes

Conditions de PCR Tampon 10x AccuPrime : 5 µl Amorce "Forward" (10 µM) : 1 µl Amorce "Reverse" (10 µM) : 1 µl Produit de RT : 2 µl Taq AccuPrime (Invitrogen) (5U/µl) : 0,4 µl Eau UP : qsp 50 µl

35 cycles 30 s 30 s

94°C 1 min par kpb

68°C 30 s

45,5°C ou 48,3°C ou 50,8°C

Activation Amplification Dénaturation

Figure 21. Illustration et résumé des conditions de PCR pour confirmer expérimentalement l'existence de l'opéron leuABCD.

Les amorces de PCR (Tableau 5), comprises entre 17 et 20 nucléotides, ont été sélectionnées à l'aide du logiciel "Oligo 6.6".

Tableau 5. Caractéristiques des amorces de PCR utilisées dans le cadre des expériences de RT-PCR pour la confirmation de l'existence de l'opéron leuABCD et pour l'étude de la séquence non codante en amont de leuA.

Taille Taille Ta Transcrit Amorce Séquence de l'amorce 5'- 3' amorce amplicon (en pb) (en °C) (en pb) leuABCD ABCD-For TAAACGGAATTGGCGAAAGA 20 50,8 3697 ABCD-Rev GATGAGCCGCAACCAAA 17

Inter1*-leuA Inter1-leuA-For TATTTTGTATATGATGTCTT 20 45,5 1625 Inter1-leuA-Rev TTTTAATTTTTTGTTAACT 19

Inter2*-leuA Inter2-leuA-For TTATCCAATAAAACATTCCA 20 48,3 1494 Inter2-leuA-Rev CAGTAGCCAAACCCACT 17

*: Inter1 et Inter2 correspondent à deux fragments de la séquence intergénique entre les gènes repA2 et leuA du plasmide pLeu. Le site d'hybridation des amorces Inter1-leuA-For et Inter2-leuA-For sur cette séquence non codante est présenté dans la Figure 47.

José Viñuelas 104 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Partie IV

Résultats

José Viñuelas 105 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

1 Relations entre expression des gènes et organisation du chromosome chez Buchnera aphidicola

1.1 Introduction de l'étude

1.2 Normalisation des données de puce à ADN par l'ADNg pour obtenir des profils transcriptomiques

1.3 Etude des signaux de fluorescence issus de l'ADNg et de l'efficacité de la méthode de normalisation

1.4 Relations entre les niveaux d'expression des gènes et l'organisation du chromosome 1.4.1 Effet de la position sur le brin d'ADN, de l'organisation en opérons et de l'essentialité des gènes 1.4.2 Effet du taux d'évolution des gènes 1.4.3 Effet de la localisation spatiale des gènes le long du chromosome

1.5 Discussion sur les résultats de l'étude

1.1 Introduction de l'étude

Les études de génomique comparative qui ont découlé du séquençage de nombreux génomes bactériens ont apporté d'importants éléments relatifs à l'organisation de ces génomes, comme par exemple en termes de localisation des gènes, ou encore d'ordre ou d'orientation de ces derniers le long du chromosome. Ainsi, il apparaît que divers éléments contribuent à déterminer le degré d'organisation des chromosomes bactériens. Un haut degré d'organisation correspond, en général, à des génomes de grande taille, avec une forte composition en base G et C, et il est associé à la présence d'un grand nombre de protéines de type "histone- like", caractéristiques communes aux génomes des bactéries de forme libre (Allen et al., 2006). Cette organisation du chromosome a été décrite comme un moyen d'adaptation fonctionnelle aux contraintes évolutives, indispensable à la survie de la cellule bactérienne. Le biais de distribution des gènes entre les deux brins réplicatifs d'ADN, par exemple, semble avoir un rôle capital dans cette adaptation fonctionnelle des génomes bactériens. En effet, de nombreuses études ont mis en évidence l'existence d'un biais de distribution des gènes entre les deux brins d'ADN du chromosome chez les bactéries et ceci en faveur du brin direct (ou précoce) (pour revue voir Rocha, 2004). En moyenne, 78% des gènes (pour les génomes contenant l'enzyme polymérase PolC) et 58% (pour les autres) sont localisés sur le brin direct du chromosome (Rocha, 2002). Ce biais est d'autant plus important si on considère uniquement les gènes essentiels à la survie de la

José Viñuelas 106 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

bactérie, puisque 76% et 94% des gènes essentiels sont localisés sur le brin direct du chromosome, respectivement chez E. coli et B. subtilis (Rocha et Danchin, 2003b). Il est à remarquer ici qu'un gène est dit essentiel lorsqu'il est indispensable à la survie d'une bactérie : si le gène est muté ou délété la bactérie ne survit pas. Ainsi, pour les bactéries de forme libre qui sont cultivables comme E. coli, le caractère essentiel d'un grand nombre de gènes a été défini expérimentalement. Pour certains gènes, toutefois, l'essentialité est définie grâce à leur appartenance à une certaine classe fonctionnelle : les gènes codant les protéines ribosomiques sont universellement décrits comme essentiels, ce qui n'est pas le cas, par exemple, de ceux codant les protéines du flagelle (Jordan et al., 2002).

Les approches d'analyse transcriptomique à large échelle ont permis de montrer que, dans les bactéries de forme libre, la transcription des gènes et l’organisation du chromosome s’influencent réciproquement. Le premier niveau d'organisation à avoir été décrit est l'organisation des gènes en unités de transcription, moyen sophistiqué de réguler l'expression d'un groupe de gènes en les positionnant sous le contrôle d'un même promoteur (Lawrence, 2003). D’une part, la transcription des gènes est subordonnée à leur organisation en opérons et à leur position sur le chromosome. D’autre part, la distribution des gènes sur le chromosome est modelée par des contraintes évolutives et fonctionnelles. Ainsi, le rapprochement des gènes appartenant à une même voie métabolique en une seule unité de transcription serait un phénomène sélectionné d'un point de vue évolutif parce qu'il apporterait l'avantage fonctionnel de soumettre tous ces gènes à un contrôle exercé par les mêmes protéines régulatrices. A un niveau supérieur d'organisation, il a été démontré que des gènes relativement proches sur le chromosome pouvaient être co-exprimés, même s'ils n'appartenaient pas à un même opéron (Korbel et al., 2004), suggérant l'existence de structures "supra-opéroniques" chez les bactéries (Audit et Ouzounis, 2003). Un dernier exemple d'influence réciproque entre l'expression des gènes et l'organisation du chromosome est constitué par la relation entre le super-enroulement de l'ADN et la transcription observée chez les bactéries de forme libre. En effet, des études récentes ont montré que la structure dynamique du nucléoïde pouvait agir comme un facteur de transcription chez E. coli (Peter et al., 2004; Travers et Muskhelishvili, 2005b; Blot et al., 2006), et serait à l'origine d'une régulation globale de l'expression des gènes, se traduisant par l'existence de certains profils transcriptomiques spatiaux (Jeong et al., 2004; Kepes, 2004; Carpentier et al., 2005).

José Viñuelas 107 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

A l'heure actuelle, très peu d’informations existent sur les bactéries symbiotiques, généralement caractérisées par des génomes réduits, façonnés par les besoins métaboliques de leurs hôtes et par un taux d’évolution très élevé. Buchnera aphidicola, le symbiote primaire des pucerons, est l’un des exemples les mieux connus de bactérie à génome réduit, dont les capacités de régulation sont souvent définies comme dégénérées. Des études récentes menées dans notre unité ont montré que, malgré une réponse transcriptomique réduite suite à un stress nutritionnel, les gènes de Buchnera conservent une organisation en opérons similaire à celle des bactéries libres possédant de grands génomes (Charles et al., 2006; Reymond et al., 2006), alors que les régulateurs spécifiques de ces opérons semblent perdus.

L’objectif de ce travail a été de savoir si, malgré l'importante réduction de la taille de son génome, il existe toujours, chez Buchnera, une relation entre l'organisation du chromosome et l'expression de ses gènes, comme cela a été montré pour les bactéries de forme libre. Cette étude a été réalisée à l’aide de la puce à ADN développée dans notre unité et a nécessité la mise au point d'une méthode adéquate de normalisation des données afin de pouvoir comparer entre eux les niveaux d'expression de l'ensemble des gènes de la bactérie.

1.2 Normalisation des données de puce à ADN par l'ADNg pour obtenir des profils transcriptomiques

La technologie des puces à ADN est aujourd'hui un outil largement utilisé pour l'analyse de transcriptomes (Coppee, 2008; Durinck, 2008; Farber et Lusis, 2008). La procédure d'obtention des données associée à cette technologie inclut un très grand nombre d'étapes successives dont le dépôt des sondes sur la lame, la préparation des échantillons biologiques, le marquage des acides nucléiques, la réaction d'hybridation, le lavage des lames, et la lecture des signaux de fluorescence (Figure 22).

José Viñuelas 108 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Condition 1 Condition 2

Extraction des données

5. Analyse qualité et Extraction des ARN analyse statistique

2. Production des cibles fluorescentes

Transcription Cy3 inverse des ARN Cy5

1. Dépôt des sondes 3. Hybridation des 4. Lecture de l'empreinte cibles sur les sondes d'hybridation

Figure 22. Principales étapes pour la réalisation d'une expérience de puces à ADN.

Chacune de ces étapes peut apporter un certain nombre de biais qu'il convient de prendre en compte pour l'analyse des résultats (Beissbarth et al., 2000; Kreil et Russell, 2005; Steinhoff et Vingron, 2006; Yang et al., 2006). Une normalisation des données de puce est alors indispensable. Pour cela, diverses stratégies de normalisation ont été utilisées, comme la recherche a posteriori de gènes invariants entre deux conditions expérimentales (Schadt et al., 2001) ou encore la prise en compte de gènes exprimés constitutivement (Yang et al., 2002). Cependant, ces deux types de références peuvent fluctuer selon les conditions physiologiques : elles sont propres à l'échantillon et ne constituent donc pas une référence universelle (Manganelli et al., 1999). Une stratégie alternative est basée sur l'utilisation de standards externes à l'échantillon. Pour cela, des ARN messagers connus ou issus de réactions de transcription in vitro sont ajoutés en des concentrations déterminées avant la réaction de marquage et sont co- marqués avec les cibles (Weil et al., 2002). Cette technique de normalisation se heurte à des nombreuses difficultés, comme la détermination du nombre minimal de témoins nécessaire à la bonne

José Viñuelas 109 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

normalisation des données, ou encore le problème de la localisation des témoins sur la lame. De plus, aucune des méthodes citées ci-dessus ne permet de comparer les niveaux d'expression des gènes les uns par rapport aux autres et par conséquent n'est adaptée à l'objectif de notre étude. Depuis 2002, divers auteurs ont décrit l'utilisation de cibles fluorescentes d'ADN génomique en tant que référence comme une alternative possible à l'ensemble de ces méthodes de normalisation et notamment pour l'étude des génomes bactériens (Kim et al., 2002; Talaat et al., 2002; Weil et al., 2002). Ce standard de normalisation, qui peut être obtenu par une simple réaction de marquage de l'ADNg par fluorescence, est invariant dans le temps, entre les différentes conditions expérimentales et permettrait de comparer les données transcriptomiques obtenues par différents laboratoires travaillant sur le même organisme modèle. Mais l'avantage principal de cette technique est le fait que chacun des transcrits a un témoin qui lui est propre, ce qui permet de prendre en compte, lors de la normalisation, l'affinité de chacune des sondes pour leur cible complémentaire. Ainsi, la calibration par l'ADNg permettrait de mesurer la valeur absolue de l'expression des gènes, par opposition aux autres méthodes qui n'en donnent qu'une mesure relative. La comparaison des niveaux d'expression génique entre deux conditions expérimentales différentes, mais également la comparaison de l'expression des gènes les uns par rapport aux autres dans une même condition seraient alors possibles. Cette dernière caractéristique étant indispensable à la réalisation de notre étude, nous avons, dans un premier temps, développé une méthode de marquage de l'ADNg adaptée à Buchnera et aux puces à ADN dont nous disposions au laboratoire. Cette méthode a été par la suite utilisée pour normaliser le transcriptome de Buchnera à l'état basal, c'est-à-dire issue de pucerons élevés sur plantes (cf. Matériels et Méthodes § 1.1).

1.3 Etude des signaux de fluorescence issus de l'ADNg et de l'efficacité de la méthode de normalisation

Etant donné la présence d'une seule et unique copie de chacun des gènes de Buchnera au sein de son génome, l'hybridation des cibles d'ADNg devrait donner des signaux identiques entre les différentes sondes déposées sur la puce. Cependant, en pratique, comme notre étude le montre, cela est impossible (Figure 23A). Cette variabilité, bien que relativement faible, peut être due aux propriétés thermodynamiques intrinsèques à chaque sonde, qui vont caractériser l'affinité de la sonde pour sa cible.

José Viñuelas 110 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Distributions

log2(Moy_ADNg_Recup) Bivariate Fit of log2(ADNg_Recup) By GCrate Quantiles16 Moments Nombre signaux de 2 1250 100.0% maximumR = 0,117 15,821 Mean 14,635259 1000 99.5% 15,528 Std Dev 0,3019963 97.5%15 15,231 Std Err Mean 0,005093 750 90.0% 14,994 upper 95% Mean 14,645245 Count

500 (ADNg) 75.0% quartile 14,817 lower 95% Mean 14,625274 2

50.0%log2(ADNg_Recup) median 14,646 N 3516

250 log 14 25.0% quartile 14,458 10.0% 14,241 12 13 14 15 16 2.5% 0,2 14,0110,3 0,4 0,5 0.5% 13,799 log (ADNg) Taux deGCrate GC des sondes 2 A 0.0% minimum 13,216 B Linear Fit log2(Moy_ARN_Recup) Linear Fit log2(ADNg_Recup)Quantiles = 14,11926 Moments+ 1,4993973 GCrate Figure 23. Analyse des signaux de fluorescenceSummary ofissus Fit de l'ADN génomique hybridé sur la puce à ADN dédiée400 au génome100.0% maximum de Buchnera 16,000 Mean aphidicola. (A)14,052363 99.5%RSquare 15,959 Std0,117095 Dev 0,7891814 Distribution des signaux d'hybridation d'ADNgRSquare Adj (transformés 0,116187 en log ). (B) 300 97.5% 15,769 Std Err Mean2 0,0133092 Corrélation entre les signaux d'ADNg (transformésRoot Mean Squareen log Error) et le0,265638 taux en bases 90.0%Mean of Response 15,1832 upper14,64995 95% Mean 14,078458 200 Count Guanine et Cytosine des sondes de la puce Bu75.0%Observchnera ationsquartile. Le (or Sumcoefficient 14,604 Wgts) lower de 95% 975 corrélation Mean 14,026269 2 de Pearson (R ) est indiqué. 100 Analys50.0% ismedian of Variance 13,946 N 3516 25.0%Source quartileDF Sum 13,451 of Squares Mean Square F Ratio 10.0%Model 1 13,086 9,105754 9,10575 129,0434 12 13 14 15 16 2.5%Error 973 12,795 68,658284 0,07056 Prob > F C. Total 974 77,764038 <.0001 0.5% 12,564 Afin de mieux connaître l'origineParame de te r la Estimates variabilité des signaux 0.0% minimum 12,078 d'ADNg, nous avons analysé l'influence,Term sur cetteEstimate variabilité,Std Error tde Ratio quatreProb>|t| log2(Moy_ARN_norm_Recup) Intercept 14,11926 0,047485 297,34 0,0000 GCrate 1,4993973 0,131992 11,36 <.0001 paramètres relatifs aux sondes500 utiliséesQuantiles : (i) leur richesse Momentsen base G et C,

(ii) leur taille, (iii) leur spécificité400 vis100.0%-à-vismaximum de leur 16,548 cible,Mean et (iv) leurs13,849886 99.5% 15,998 Std Dev 0,7871098 facultés à former des structures300 secondaires97.5% de type "épingles 15,563 Std à Err cheveux" Mean 0,0132743 et "homoduplex". Les analyses statistiques90.0% (modèles ANOVA 14,943 upper et régressions95% Mean 13,875912 200 Count linéaires) ont montré qu'environ 12% de75.0% la variabquartile ilité 14,369 observéelower 95% entreMean les13,82386 100 50.0% median 13,772 N 3516 signaux d'ADNg pouvait être expliquée25.0% par lequartile taux 13,259de bases G et C des 2 -4 10.0% 12,884 12 13 14 15 16 sondes (R =0,117, P-value < 10 ) : les sondes2.5% les plus 12,554 riches en bases G et C sont associées à un signal fluorescent0.5% plus intense 12,265que les sondes riches 0.0% minimum 11,851 en bases A et T (Figure 23B). Inversement les trois autres paramètres analysés ne montrent aucun effet significatif sur les signaux de fluorescence, ce qui suggère que la majeure partie (88%) de la variabilité observée serait causée par d'autres paramètres thermodynamiques non étudiés ici.

La normalisation des signaux transcriptomiques a alors été réalisée en déterminant le ratio entre le signal brut relatif à chaque ARN et le coefficient de normalisation défini pour chacun des plots de la puce (cf. Matériels et Méthodes § 2.6). La question de la validation de la méthode s'est alors posée. Il convient de souligner que, dans aucune des études publiées à ce jour utilisant l'ADNg pour normaliser les données de puce, une validation de la technique n'a été proposée. Pour valider alors cette méthode, nous avons tout d'abord comparé la distribution des signaux transcriptomiques avant et après normalisation. Nous avons ainsi montré que la méthode développée ici n'affecte ni la forme, ni la médiane de la distribution des signaux d'expression (Figure 24).

José Viñuelas 111 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Distributions log2(Moy_ADNg_Recup) Quantiles Moments 1250 100.0% maximum 15,821 Mean 14,635259 1000 99.5% 15,528 Std Dev 0,3019963 97.5% 15,231 Std Err Mean 0,005093 750 90.0% 14,994 upper 95% Mean 14,645245 Count 500 75.0% quartile 14,817 lower 95% Mean 14,625274 250 50.0% median 14,646 N 3516 25.0% quartile 14,458 10.0% 14,241 12 13 14 15 16 2.5% 14,011 0.5% 13,799 Distributions 0.0% minimum 13,216 log2(Moy_ADNg_Recup) log2(Moy_ARN_Recup) Quantiles Moments Quantiles Moments 1250 100.0% maximum 15,821 Mean 400 14,635259100.0% maximum 16,000 Mean 14,052363 1000 99.5% 15,528 Std Dev 0,301996399.5% 15,959 Std Dev 0,7891814 97.5% 15,231 Std Err Mean300 0,005093 750 97.5% 15,769 Std Err Mean 0,0133092 90.0% 14,994 upper 95% Mean 14,64524590.0% 15,183 upper 95% Mean 14,078458 Count 200 Count 500 75.0% quartile 14,817 lower 95% Mean 14,62527475.0% quartile 14,604 lower 95% Mean 14,026269 250 50.0% median 14,646 N 100 351650.0% median 13,946 N 3516 25.0% quartile 14,458 Résultats 25.0% quartile 13,451 10.0% 14,241 10.0% 13,086 12 13 14 15 16 12 13 14 15 16 2.5% 14,011 2.5% 12,795 0.5% 13,799 0.5% 12,564 0.0% minimum 13,216 0.0% minimum 12,078 log2(Moy_ARN_Recup) log2(Moy_ARN_norm_Recup) Nombre signaux de Quantiles Moments500 Nombre signaux de Quantiles Moments 400 100.0% maximum 16,000 Mean 14,052363 400 100.0% maximum 16,548 Mean 13,849886 99.5% 15,959 Std Dev 0,789181499.5% 15,998 Std Dev 0,7871098 300 97.5% 15,769 Std Err Mean300 0,013309297.5% 15,563 Std Err Mean 0,0132743 90.0% 15,183 upper 95% Mean 14,07845890.0% 14,943 upper 95% Mean 13,875912 Count 200 200 Count 75.0% quartile 14,604 lower 95% Mean 14,02626975.0% quartile 14,369 lower 95% Mean 13,82386 100 50.0% median 13,946 N 100 351650.0% median 13,772 N 3516 25.0% quartile 13,451 25.0% quartile 13,259 10.0% 13,086 10.0% 12,884 12 13 14 15 16 12 13 14 15 16 2.5% 12,795 2.5% 12,554 0.5% 12,564 0.5% 12,265 log2(ARNbrut) A log2(ARNnorm) B 0.0% minimum 12,078 0.0% minimum 11,851 log2(Moy_ARN_norm_Recup) Figure 24. Distribution des signaux500 de fluorescenceQuantiles (transformésMoments en log2) issus des ARN hybridés sur la puce Buchnera aphidicola avant (A) et après 400 100.0% maximum 16,548 Mean 13,849886 (B) normalisation par l'ADN génomique. 99.5% 15,998 Std Dev 0,7871098 300 97.5% 15,563 Std Err Mean 0,0132743 90.0% 14,943 upper 95% Mean 13,875912 200 Count 75.0% quartile 14,369 lower 95% Mean 13,82386 Mais bien que ce résultat100 soit en 50.0%partie mediangage d'une 13,772 normalisationN 3516 non drastique, l'efficacité de la méthode 25.0% n'est pasquartile pour 13,259 autant prouvée. 10.0% 12,884 12 13 14 15 16 Nous avons donc tiré profit du fait, que pour2.5% un groupe 12,554restreint de gènes, trois sondes oligonucléotidiques différentes0.5% sont présentes 12,265 sur la puce 0.0% minimum 11,851 dédiée au génome de Buchnera. En effet, l'objectif de la normalisation par l'ADNg étant de s'affranchir du biais dû à la différence d'affinité des sondes pour leur cible, les signaux des différentes sondes spécifiques à un même gène devraient, après normalisation, converger vers une même valeur. Nous avons donc comparé, parmi les gènes possédant trois sondes, l'écart-type des signaux transcriptomiques bruts et normalisés. Sur un échantillon de 43 gènes, dans 79% des cas nous avons observé, après normalisation, une réduction de l'écart-type entre les différents signaux de fluorescence obtenus pour les trois sondes relatives à un gène donné (Figure 25). Bien que la variabilité du signal soit difficilement estimable à partir de deux valeurs, une analyse semblable, réalisée sur un échantillon de 371 gènes possédant deux sondes, a également montré une amélioration des signaux pour 65% des gènes.

José Viñuelas 112 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats types des types des - carts é transcriptomiques rence des rence é signaux Diff

Nombre de gènes à 3 sondes

Figure 25. Validation de la procédure de normalisation des données transcriptomiques par l'ADN génomique. Cette figure représente la différence des écarts-types entre les signaux transcriptomiques brutes et normalisés pour chacun des 43 gènes de Buchnera possédant 3 sondes différentes. Les gènes ont été classés par différence croissante d'écarts-types. Les 34 gènes dans l'aire jaune (différence positive) présentent une diminution dans l'écart-type de leurs signaux après normalisation.

Un second élément qui nous a permis d'être confiants dans notre méthode de normalisation est constitué par l'effet de cette standardisation sur les signaux de fluorescence relatifs aux ARNt de Buchnera. Quand on analyse les niveaux d'expression de l'ensemble des gènes de Buchnera avant normalisation, on remarque que le nuage relatif aux signaux transcriptomiques des ARNt se détache par rapport aux autres gènes : leurs niveaux d'expression sont parmi les plus bas des gènes de la bactérie. Cette différence s'observe également pour les signaux issus de l'hybridation par l'ADNg (Figure 26A), ce qui suggère que ce profil spécifique aux ARNt est probablement dû au facteur affinité "sonde / cible" plutôt qu'à une caractéristique transcriptomique.

José Viñuelas 113 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Fit Y by X GroupFit Y by X Group Bivariate Fit of log2(ADNg_Recup)Bivariate Fit of log2(ADNg_Recup) By log2(ARN_Recup) By log2(ARN_Recup)Bivariate Fit of log2(ADNg_Recup)Bivariate Fit of log2(ADNg_Recup) By log2(ARN_norm_Recup) By log2(ARN_norm_Recup) 16 16 16 16

15 15 15 15 (ADNg) (ADNg) 2 2 log 14 log 14 14 14 log2(ADNg_Recup) log2(ADNg_Recup) log2(ADNg_Recup) log2(ADNg_Recup)

RM : 393/573 RM : 278/573 13 13 13 13 13 14 13 15 14 16 15 16 13 14 13 15 14 16 15 16 log2(ARN_Recup) log2(ARN_Recup) log2(ARN_norm_Recup)log2(ARN_norm_Recup) log2(ARNbrut) A log2(ARNnorm) B Fit Mean Fit Mean Fit Mean Fit Mean Figure 26. Effet de la normalisation par l'ADNg sur les signaux de fluorescence issus de l'hybridation des ARNt sur la puce à ADN dédiée à Buchnera. Les signaux relatifs aux ARNt sont représentés en rouge avant (A) et après normalisation (B). L'axe des abscisses et des ordonnées correspondent respectivement aux signaux de fluorescence (transformés en log2) issus des ARN et de l'ADNg hybridés. Le rang moyen (RM) des signaux de fluorescence correspondant aux ARNt est indiqué par rapport aux signaux relatifs à l'ensemble des gènes de Buchnera. A titre d'information, la moyenne des signaux de fluorescence issus de l'ADNg est indiquée par la ligne bleue.

Après normalisation par l'ADNg, on remarque un déplacement du nuage relatif aux signaux de fluorescence des ARNt et une meilleure intégration de ces points au sein du nuage regroupant l'ensemble des autres gènes du symbiote (Figure 26B). Plus précisément, le rang moyen des signaux transcriptomiques des ARNt passe de 393 à 278. L'application de cette de normalisation a rendu possible la réalisation d'une étude spécifique aux ARNt qui a mis en évidence un biais d'usage de code chez Buchnera (Charles et al., 2006).

La méthode de normalisation pouvant être considérée comme validée sur la base de ces résultats, la suite logique du travail a été d’appliquer cette méthode à l’étude du transcriptome de Buchnera en fonction des caractéristiques du chromosome de la bactérie.

José Viñuelas 114 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

1.4 Relations entre les niveaux d'expression des gènes et l'organisation du chromosome

1.4.1 Effet de la position sur le brin d'ADN, de l'organisation en opérons et de l'essentialité des gènes

Sur la base de l'annotation du génome de Buchnera Ap notre analyse montre tout d'abord que 56% des gènes sont localisés sur le brin direct, ce qui révèle un faible biais de distribution des gènes, mais équivalent à celui d'E. coli, qui est de 55% (Blattner et al., 1997). La proportion des gènes pouvant être considérés comme essentiels est de 32% chez Buchnera contre 6% chez E. coli (http://www.shigen.nig.ac.jp/ecoli/pec). Bien que Rocha et Danchin ne trouvent pas un biais dans la distribution des gènes essentiels chez Buchnera (Rocha et Danchin, 2003b), notre étude, basée sur une autre liste de gènes essentiels (cf. Annexes), révèle que 60% d'entre eux sont localisés sur le brin direct du chromosome du symbiote du puceron. Une fois les 82 opérons putatifs de Buchnera définis sur la base des ressemblances avec E. coli (cf. Matériels et Méthodes § 2.7), nous les avons validés expérimentalement. Notre analyse a montré que l'expression des gènes était plus variable entre les unités de transcription qu'au sein de chacune d'elle (ANOVA F-test, R2 = 0,640, P-value < 10-4). Ce résultat montre la fonctionnalité de ces opérons.

La suite de l'étude a consisté à analyser l'effet de chacun des trois facteurs : "localisation sur le brin d'ADN", "essentialité" et "organisation en opérons", sur le niveau d'expression des gènes de Buchnera. La répartition des gènes de la bactérie en fonction de ces trois paramètres est représentée dans la Figure 27.

José Viñuelas 115 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Lead (+) Lag (-) Brin direct (précoce) Brin indirect (tardif) 200 180 160 140 81 85 120 100

Count 80

Nombre 30 60 39 103 99 40 59 20 45 0 Op nOp Op nOp

E E nE nE

Classe des gènes

Figure 27. Caractéristiques du génome de Buchnera aphidicola Ap. Cette figure représente la distribution des gènes entre le brin direct (en jaune) et indirect (en rouge) pour les gènes essentiels ("E") et non essentiels ("nE") organisés en opérons ("Op") ou non ("nOp").

L'analyse statistique des résultats, basée sur un modèle d'ANOVA complet, a montré que la localisation des gènes sur le brin d'ADN n'a aucun effet sur le niveau d'expression des gènes de Buchnera (Tableau 6). Sur la base de ce résultat, nous avons conclu que, chez Buchnera, les gènes localisés sur le brin direct ne sont pas forcement les plus exprimés, comme cela a été suggéré chez d'autres bactéries comme E. coli (Brewer, 1988). Inversement, l'organisation des gènes en opérons ainsi que leur caractère essentiel à la survie de la bactérie ont une influence sur le niveau d'expression des gènes du symbiote. L'interaction des deux facteurs montre également un effet significatif dans le modèle.

Tableau 6. ANOVA montrant les effets les facteurs "opéron", "essentialité", et "brin d'ADN" sur le niveau d'expression des gènes de Buchnera.

Facteurs Ddl Σ carrés F Ratio P-value Opéron 1 22,216 43,204 < 0,0001 * Essentialité 1 9,627 18,722 < 0,0001 * Brin d'ADN 1 0,009 0,017 0,897 Essentialité x Opéron 1 7,246 14,092 0,0002 * Essentialité x Brin d'ADN 1 0,055 0,107 0,744 Brin d'ADN x Opéron 1 0,280 0,545 0,461 Essentialité x Brin d'ADN x Opéron 1 0,653 1,271 0,260 Erreur résiduelle 533 274,067

*: P-value significative pour un intervalle de confiance de 95%.

José Viñuelas 116 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Sur la base de ces résultats, l'analyse a été poursuivie en découplant chacun des niveaux pour les deux facteurs analysés (essentialité/non essentialité ; opéron/singleton). Une comparaison des niveaux d'expression moyens a été réalisée entre chacune de ces classes et a montré les résultats suivants : l'analyse du facteur "opéron" révèle que les gènes organisés en opérons sont plus fortement exprimés que les singletons et ceci qu'ils soient essentiels ou non à la survie de la bactérie ; l'analyse du facteur "essentialité" montre que, pour les gènes organisés en opérons, les essentiels sont plus exprimés que les non essentiels, ce qui n'est pas observé pour les singletons. Enfin, d'un point de vue global, on remarque que les gènes les plus fortement exprimés chez Buchnera sont les gènes essentiels qui sont organisés en opérons (Figure 28).

14,8 14,6 * ‡ 14,4 14,2 14 † ‡ 13,8 (ARNnorm)

2 * † 13,6 log 13,4 13,2 13 Op nOp Op nOp E E nE nE Classe des gènes

Figure 28. Niveaux d'expression moyens des gènes de Buchnera (normalisés et transformés en log2). Les gènes ont été répartis selon leur caractère essentiel ("E") ou non ("nE") à la survie de la bactérie et selon leur appartenance ("Op") ou non ("nOp") à un opéron. Les barres d'erreur indiquent l'intervalle de confiance à 95% autour de la moyenne. Après avoir appliqué la correction de Bonferroni pour les tests de comparaison multiple, les différences significatives, obtenues par l'ANOVA entre deux classes sont indiquées avec un même symbole : * différence significative entre "Op" et "nOp" pour les gènes "E" ; † différence significative entre "Op" et "nOp" pour les gènes "nE" ; ‡ différence significative entre "E" et "nE" pour les gènes "Op" ; aucune différence significative n'est observée entre "E" et "nE" pour les gènes "nOp".

José Viñuelas 117 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

L'ensemble de ces résultats a été confirmé par une analyse de la distribution du nombre de gènes issus des différentes classes définies dans la Figure 28 en fonction de leur appartenance à trois classes d'expression (Tableau 7). En effet, pour cette étude, les gènes de Buchnera ont été répartis en trois groupes sur la base des données transcriptomiques de l'expérience : le premier groupe comprend les 100 gènes les plus fortement exprimés, le deuxième groupe les 100 gènes les plus faiblement exprimés, tous les autres gènes étant considérés comme moyennement exprimés.

Tableau 7. Distribution (nombre et pourcentage) des gènes de Buchnera en fonction de leur taux d'expression fort, moyen ou faible.

Fort Moyen Faible Test khi-2 Résultat Classe Nb % Nb % Nb % Rapp. Vrais. Figure 28 E 42 47,19% 41 46,07% 6 6,74% Op < 10-4 ║ ‡ nE 31 16,85% 125 67,93% 28 15,22%

E 6 7,14% 63 75,00% 15 17,86% nOp 0,0725 nE 21 11,41% 112 60,87% 51 27,72%

Op 42 47,19% 41 46,07% 6 6,74% E < 10-4 ║ nOp 6 7,14% 63 75,00% 15 17,86% *

Op 31 16,85% 125 67,93% 28 15,22% nE 0,0089 ║ † nOp 21 11,41% 112 60,87% 51 27,72%

Les différences dans la répartition du nombre (Nb) et du pourcentage (%) des gènes en fonction de leur taux d'expression et entre les différentes classes de gènes ont été testées par un test khi-2 du rapport de vraisemblance (Rapp. Vrais.). A titre de comparaison, la correspondance avec les résultats présentés dans la Figure 28 est indiquée dans la dernière colonne du tableau. "║": P-value significative pour un intervalle de confiance de 95%.

Cette étude de la distribution des gènes en fonction de leur taux d'expression est, à notre sens, complémentaire de l'analyse présentée dans la Figure 28 et permet de nous affranchir d'un éventuel biais dû à des écarts importants dans les niveaux d'expression des gènes de Buchnera entre les différentes classes, facteur qui pourrait affecter une analyse de comparaison de moyenne.

1.4.2 Effet du taux d'évolution des gènes

Pour cette analyse, le taux d'évolution des gènes a été défini sur la base de leur composition en bases Guanine et Cytosine, les deux paramètres

José Viñuelas 118 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

étant fortement corrélés : les gènes les plus riches en bases G et C sont ceux qui sont le moins soumis au biais mutationnel vers les bases A et T et donc les plus conservés (Rispe et al., 2004).

Un test de régression linéaire montre que le niveau d'expression des gènes de Buchnera est positivement corrélé avec le taux de GC (R2 = 0,151, P-value < 10-4) : les gènes les plus fortement exprimés sont également les plus riches en base G et C et donc les plus conservés d'un point de vue évolutif (Figure 29). De manière plus précise, il est possible, dans cette analyse, de regrouper les gènes de Buchnera dans les quatre classes définies dans la Figure 29 : les gènes qui tendent à être conservés et qui sont faiblement ou fortement exprimés sont localisés respectivement dans les cadrants 1 et 2 de la figure, alors que ceux qui évoluent rapidement sont localisés dans le cadrant 3 pour les gènes faiblement exprimés et dans le cadrant 4 pour les fortement exprimés.

Bivariate Fit of TigrGC By log2(ARN_norm_Recup)

40 1 R2 = 0,151 2 rpsJ rpsK mopA rplP mopB 35 prsA tufB ftsZ dnaJ cspC fdx dnaK rplL

30 flgC

rpmB

fliF rpmG 25 yba3 rplW

Taux de GC (en %) Taux de GC (en apbE flgF yaeT yba4

20 yigL fliM flgB

holA yciB hscB 15 cvpA 3 4

12 13 14 15 16

log2(ARNnorm)

Biv ariate Normal Ellipse P=0,950  : gènes codant les protéines ribosomiques  : gènes de biosynthèse relatifs aux AA essentiels  : gènes codant les protéines chaperones  : gènes codant les aminoacyl-ARNt synthétases des AA essentiels + : gènes du flagelle  : gènes codant les aminoacyl-ARNt synthétases des AA non essentiels  : gènes orphelins de Buchnera x : pseudogènes

Figure 29. Représentation du taux de GC des gènes de Buchnera en fonction de leur niveau d'expression (normalisé et transformé en log 2). L'ellipse de distribution normale bivariée (%=0,95) est indiquée en noir et quatre cadrants ont été délimitées par la médiane de distribution des taux de GC et par le premier et dernier quartile de la distribution des niveaux d'expression. Le coefficient de corrélation de Pearson (R2) est indiqué ainsi que le nom des gènes localisés en dehors de l'ellipse.

José Viñuelas 119 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Parmi les gènes évoluant peu et étant fortement exprimés (cadrant 2) on retrouve la quasi-totalité des gènes codant les protéines ribosomiques de Buchnera (rplL, rplP, rpmB, rpsJ, rpsK, etc.) mais également des gènes codant des protéines chaperonnes tels que dnaK, dnaJ, ou encore mopA et mopB (équivalents de groEL et de groES d'E. coli). De même, un nombre important de gènes codant les enzymes de biosynthèse des acides aminés essentiels au puceron semble être plutôt conservé et présente des niveaux d'expression élevés. On peut citer par exemple, les gènes argBDG, aroHK, cysK, hisFI, metE, thrC et ilvCDHI respectivement impliqués dans les voies de biosynthèse de l'arginine, des acides aminés aromatiques, de la cystéine, de l'histidine, de la méthionine, de la thréonine, ou encore, des acides aminés branchés. D'un point de vue global, on peut remarquer qu'une importante proportion des gènes codant les protéines de flagelle tend à évoluer rapidement : 16 gènes sur un total de 26, comprenant entre autres 9 des 12 gènes de type fli de Buchnera. Parmi ces 16 gènes 11 sont fortement exprimés. De plus, on remarque que 11 de ces 16 gènes évoluant rapidement sont localisés sur le brin direct d'ADN dont notamment 8 gènes de type fli. Un autre résultat de cette analyse est l'appartenance de deux gènes orphelins de Buchnera (yba3 et yba4) au groupe des gènes fortement exprimés et qui possèdent un faible taux de GC (cadrant 4 de la Figure 29). Notre attention s'est également portée sur les gènes codant les aminoacyl-ARNt synthétases. On peut remarquer, sur le graphique, que huit des dix gènes codant ces enzymes et relatives aux acides aminés essentiels sont faiblement exprimés alors que ceux codant les enzymes relatives aux acides aminés non essentiels sont moyennement ou fortement exprimés (Test de médiane, P-value = 1,4x10-2). Enfin, on notera la présence de pseudogènes tels que apbE, cvpA ou yigL dans le cadrant 3 de la Figure 29 : ces gènes sont faiblement exprimés et tendent à évoluer rapidement.

1.4.3 Effet de la localisation spatiale des gènes le long du chromosome

Dans la dernière partie de cette étude, nous nous sommes demandés si, comme chez E. coli ou B. subtilis, il existait des composantes périodiques spatiales dans les profils transcriptomiques de Buchnera. Les tests Kappa de Fisher (P-value < 10-3), et de Bartlett Kolmogorov-Smirnov (P-value < 10-2) montrent qu'il existe des composantes périodiques dans les signaux transcriptomiques de Buchnera le long du chromosome. Afin d'approfondir ce résultat, une analyse de la

José Viñuelas 120 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

fonction d'autocorrélation du niveau d'expression des gènes en fonction de leur emplacement sur le chromosome a été réalisée et ceci à petite échelle (distance inter-gène comprise entre 1 et 50 gènes). En d'autres mots, nous avons recherché si le niveau d'expression d'un gène donné était autocorrélé avec celui du gène qui le suit sur le chromosome, mais également avec les deux suivants et ainsi de suite, sans pour autant excéder une distance de 50 gènes. La Figure 30 montre que des gènes proches sur le chromosome présentent des niveaux d'expression très semblables entre eux. De manière plus précise, il est possible de dire que, chez Buchnera, il existe des groupes constitués de 2 à 8 gènes qui présentent des profils d'expression hautement corrélés, et ceci tout le long du chromosome. On peut également observer que ce phénomène d'autocorrélation décroit avec la taille des groupes de gènes. De telles structures d'autocorrélation (de 2 à 8 gènes) peuvent être interprétées comme un effet dû à l'existence d'opérons chez Buchnera, comme il a été suggéré chez E. coli (Carpentier et al., 2005).

Overlay Plot Overlay Y's

1,1

1

0,9

0,8

0,7

0,6

0,5 Y 0,4 autocorrelation

0,3

0,2

Valeurs d' Valeurs 0,1

0

-0,1

-0,2

0 5 10 15 20 25 30 35 40 45 50

Distances entre les gènesLag (en nombre de gènes)

Y AutoCorr 2xSE -2xSE Column 9 Figure 30. Représentation de la fonction d'autocorrélation des séries spatiales correspondant aux niveaux d'expression des gènes de Buchnera (normalisés et transformés en log2) le long du chromosome. Les lignes bleues représentent 2 fois l'erreur standard pour un intervalle de confiance de 95%, les valeurs d'autocorrélation au dessus et en dessous de ces limites étant considérées comme significatives.

José Viñuelas 121 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Pour pouvoir déterminer de façon statistiquement significative la présence de composantes périodiques dans le transcriptome de Buchnera, une analyse spectrale de la fonction d'autocorrélation a été nécessaire. Elle nous a permis de confirmer (par rapport aux tests Kappa de Fisher, et de Bartlett Kolmogorov-Smirnov) et de préciser la nature de ces composantes périodiques. Ces périodes ont une taille comprise entre 2 et 152 gènes et ont été regroupées arbitrairement en trois groupes : périodes longues, moyennes et courtes (Figure 31A). A titre d'illustration, le signal périodique moyen de la période "86,86" est représenté dans la Figure 31B. Ce signal a été légèrement lissé, afin d'éliminer le bruit parasitaire lié aux très hautes fréquences. Sur cette figure, l'allure du signal transcriptomique périodique, qui se reproduit tous les 87 gènes, est représenté en noir. Ce signal présente des minima aux 29ème, 116ème, 203ème, 290ème, 377ème, 464ème et 551ème gènes à partir de l'origine de réplication du chromosome. Ces minima, qui se retrouvent également dans le signal relatif au transcriptome global de Buchnera (représenté en rouge sur la Figure 31B) ont pour origine la localisation spécifique de certains gènes sur le chromosome de Buchnera. Ils sont probablement spécifiques au chromosome de la bactérie. Inversement, le signal global du transcriptome, en rouge, présente, quant à lui, certains maxima non périodiques qui sont absents dans le signal relatif à la période "86,86" (en noir), et dans tout autre signal périodique. Ces maxima non périodiques ne sont pas ici le reflet de la structure du chromosome de Buchnera, mais plutôt de l'expression de certaines classes fonctionnelles de gènes, tels que ceux codant les protéines du flagelle (pour le pic dont le maximum est situé au 341ème gène) ou encore ceux codant les protéines ribosomiques (pour le pic dont le maximum est situé au 522 ème gène).

José Viñuelas 122 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Overlay Plot Overlay Y's

longues A 20 moyennes 86.86 15 courtes 152 60.8 10 16.89 13.51 5.15

Amplitude 8 26.43 23.38 15.2 6.76 5 6.02 3.4 2.4

0

500 400 300 200 100 80 60 50 40 30 20 10 8 7 6 5 4 3 2

Overlay Plot Fréquence-1 (en gènes)

OverlayY Periodogram Y's Perio ADNg

87 174 261 348 435 522 B ) 15

14,5 ARNnorm (

2 14 log 13,5

13

0 100 200 300 400 500 600

Localisation des gènes (en rang)

Y Predicted Transcriptome (split=100) Predicted Periode 87 (split=100) Figure 31. Profils périodiques spatiaux dans le transcriptome de Buchnera. (A) Périodogramme des niveaux d'expression des gènes de Buchnera (normalisés et transformés en log2). Les différents groupes de périodes : longues, moyennes et courtes, sont indiqués respectivement en noir, vert et bleu. A titre de comparaison, le périodogramme des signaux d'ADN génomique est indiqué en noir. (B) Comparaison du signal transcriptomique (normalisé et transformé en log2) lissé relatif à la période "86,86" (en noir) avec le signal transcriptomique global (normalisé et transformé en log2) lissé (en rouge) le long du chromosome de Buchnera.

Certaines études ont montré que la présence de composantes périodiques dans les données transcriptomiques issues de puce à ADN pouvait être corrélée à la technique elle-même et, en particulier, à la localisation des sondes sur la puce (Balazsi et al., 2003; Kluger et al., 2003; Lercher et Hurst, 2006). Plus précisément, il semblerait que cette périodicité "technique" et non "biologique" puisse être liée à l'existence de différents biais lors du dépôt des sondes sur la lame tels que l'utilisation de plusieurs aiguilles pour le dépôt des oligonucléotides. Bien que la méthode de normalisation par l'ADNg utilisée dans notre étude soit, par définition, appropriée à la prise en compte de ce type de biais, nous avons tout de même vérifié la possible présence de périodicité "technique" dans notre expérience. Pour cela, nous avons réalisé une analyse spectrale des signaux

José Viñuelas 123 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

d'hybridation obtenus par l'ADNg. Comme le montre la courbe représentée en noire dans la Figure 31A, aucune composante périodique n'est retrouvée dans les signaux d'ADNg. Ce résultat confirme que les périodes observées dans les niveaux d'expression des gènes de Buchnera sont bien une propriété du transcriptome de la bactérie et non un artefact technique.

Enfin, nous avons cherché à savoir si les composantes périodiques observées étaient uniquement dues à la conservation chez Buchnera d'une organisation des gènes en opérons. Pour cela, nous avons simulé des permutations ciblées dans l'ordre des gènes le long du chromosome et nous avons répété les analyses d'autocorrélation et de densité spectrale sur les signaux transcriptomiques associés à chacune de ces nouvelles configurations du chromosome de Buchnera. La première permutation a consisté à modifier la localisation des singletons entre les opérons, tout en conservant le rang et la localisation de ces derniers. La deuxième permutation a consisté à modifier le rang et le nombre des singletons entre les opérons, dont le rang a été conservé. Dans la troisième permutation, rang et localisation des opérons ont été modifiés : seule la structure proprement dite de ces derniers a été conservée. Enfin, dans la dernière permutation, les gènes ont été redistribués de manière aléatoire tout le long du chromosome (Figure 32).

Figure 32. Schéma de la simulation d'introduction de permutations ciblées dans la localisation des gènes sur le chromosome de Buchnera. Les singletons sont notés en vert et les gènes organisés en opérons en rouge. 0 : localisation originale des gènes sur le chromosome ; 1 : permutation conservant l'espacement et le rang des opérons mais modifiant le rang des singletons ; 2 : permutation préservant le rang mais pas l'espacement des opérons les uns par rapport aux autres ; 3 : permutation affectant le rang et l'espacement des opérons ; 4 : permutation aléatoire des gènes sur le chromosome.

José Viñuelas 124 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Si on compare les résultats de l'analyse de l'autocorrélation des gènes entre le transcriptome initial et celui obtenu pour les permutations n°1, 2 et 3, on observe une diminution allant de 8 à 2 dans la taille maximale des groupes de gènes ayant des niveaux d'expression autocorrélés (Tableau 8).

Tableau 8. Valeurs d'autocorrélation des niveaux d'expression des gènes de Buchnera (normalisés et transformés en log2) en fonction des différentes permutations relatives à la position des gènes le long du chromosome.

Distances Perm. 0 Perm. 1 Perm. 2 Perm. 3 Perm. 4 inter-gènes 1 0,3992 * 0,2842 * 0,2498 * 0,2240 * -0,0249 2 0,1977 * 0,1474 * 0,1385 * 0,1386 * 0,0467 3 0,1430 * 0,1346 * 0,0834 0,0582 0,0311 4 0,1336 * 0,0987 * 0,0993 * 0,0067 0,0078 5 0,1277 * 0,1165 * 0,1571 * 0,0185 0,0595 6 0,1577 * 0,1153 * 0,0968 * -0,0069 -0,0314 7 0,1079 * 0,0983 * 0,0375 0,0745 -0,0070 8 0,0925 * 0,0093 0,0279 0,0415 -0,0934 * 9 0,0920 0,0259 0,0345 0,0237 -0,0013 10 0,1025 * 0,0784 0,0387 -0,0063 -0,0502 11 0,0866 0,0081 0,0121 0,0266 -0,0291 12 0,1071 * 0,0598 0,0854 -0,0336 0,0014 13 0,0372 0,0428 0,0632 -0,0822 0,0508 14 0,0888 0,0689 0,0554 -0,0703 0,0079 15 0,0786 0,0891 * 0,0079 -0,0469 -0,0382

Les valeurs d'autocorrélation sont reportées ici à l'échelle de taille des opérons (distances inter-gènes comprise entre 1 et 15). *: P-value significative pour un intervalle de confiance de 95%.

La taille moyenne des unités de transcription hypothétiques déterminées chez Buchnera est d'environ 2 gènes (45 des 82 opérons potentiels chez Buchnera sont des doublets), ce qui semble être conforté par les valeurs d'autocorrélation relatives à la permutation n°3. L'analyse des différentes densités spectrales (périodogrammes) montre que la présence de composantes périodiques dans les niveaux d'expression tend à décroitre en fonction de la stringence des permutations simulées, et ceci jusqu'à disparaître lorsque les gènes sont permutés de manière aléatoire (Figure 33).

José Viñuelas 125 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Overlay Plot Se parate Y's

20 0 FK = 13,148 ** 86,86 BKS = 0,275 ** 15 152 60,8

10 16,89 13,51 5,15 8 26,4323,38 15,2 6,76 5 6,02 3,4 2,4 Amplitude perm. 0 perm. Amplitude 0

FK = 10,930 ** 20 1 BKS = 0,194 ** 15 60,8

10 152 86,86 15,2

5 23,38 8 3,4 Amplitude perm. 1 perm. Amplitude 0

FK = 9,174 * 20 2 BKS = 0,177 ** 15 86,86 10 152 15,2 5 60,8 Amplitude perm. 2 perm. Amplitude 0

FK = 6,941 20 3 BKS = 0,173 ** 15

10

5

Amplitude perm. 3 perm. Amplitude 0

FK = 6,595 20 4 BKS = 0,041 15

10

5

0 Amplitude perm. 4 perm. Amplitude

600 400 300 200 100 70 50 40 30 20 10 8 6 5 4 3 2

Fréquence-1 (en gènes) Y Perm 0 Perm 1 Perm 2 Perm 3 Perm 4

Figure 33. Périodogrammes des niveaux d'expression des gènes (normalisés et transformés en log2) de Buchnera. 0 : périodogramme du transcriptome de Buchnera ; 1 à 4 : périodogrammes du transcriptome de Buchnera après la simulation de l'introduction de différentes permutations de l'emplacement des gènes le long du chromosome (Figure 32). Les périodes principales issues du périodogramme original sont spécifiées. La présence de périodes dans le transcriptome a été testée via deux tests statistiques et ceci pour la localisation originale des gènes le long du chromosome pour les différentes permutations. Les résultats des deux tests Kappa de Fischer (FK) et de Bartlett Kolmogorov- Smirnov (BKS) sont indiqués par "**" (P-value < 0,01) ou par "*" (P-value < 0,05) lorsqu'ils sont statistiquement significatifs.

José Viñuelas 126 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Plus précisément, on peut remarquer que les périodes les plus affectées par les permutations sont : (i) les courtes périodes pour la permutation n°1 (qui affecte l'ordre des singletons mais pas l'ordre ou l'emplacement des opérons), (ii) les périodes moyennes pour la permutation n°2 (qui affecte légèrement l'organisation en opérons), (iii) les longues périodes pour la permutation n°3 (qui modifie entièrement l'ordre des opérons). Ces observations suggèrent que, même si la structure des gènes en opérons joue un rôle clé dans la présence de composantes spatiales périodiques dans le transcriptome de Buchnera, l'ordre et le nombre des singletons qui les entourent ont un rôle tout aussi important dans la mise en place de cette périodicité transcriptomique. Enfin, comme il avait été suggéré auparavant dans un travail de Moran et collaborateurs (Moran et Mira, 2001), on remarque que les gènes localisés à proximité des opérons tendent à être co-exprimés avec ces unités de transcription, comme s'ils appartenaient à des structures "supra-opéroniques".

1.5 Discussion sur les résultats de l'étude

Jusqu'à présent, ce travail est la seule étude publiée mettant en relation le profil d'expression des gènes et l'organisation du chromosome chez Buchnera aphidicola, et plus globalement chez une bactérie à génome réduit. L'importance des résultats présentés ici provient également du fait qu'ils sont issus des données expérimentales et non de simulations. Précédemment à notre étude, grâce aux données de séquençage disponibles pour de nombreux génomes procaryotes, des études d'analyses globales de la relation entre "expressivité" des gènes et des caractéristiques du chromosome bactérien ont été réalisées. Cependant, dans la majeure partie des cas, elles sont basées sur une valeur estimée du niveau d'expression des gènes : les CAI (Codon Adaptation Index) calculés à partir du biais d'usage de code des protéines ribosomiques. Ainsi, Rocha et Danchin ont montré, chez E. coli et B. subtilis, que le déterminant principal du biais de distribution des gènes en faveur du brin direct d'ADN est le caractère essentiel des gènes plutôt que leur niveau d'expression (Rocha et Danchin, 2003a). Les auteurs ont confirmé ce résultat pour de nombreux génomes séquencés, à l'exception de certaines bactéries intracellulaires dont Buchnera, pour lesquelles l'essentialité ne semble pas influencer la distribution des gènes en faveur de l'un des deux brins d'ADN (Rocha et Danchin, 2003b). Cependant, Rocha et Danchin soulignent, dans leur étude, la difficulté d'obtenir des valeurs correctes de CAI pour les gènes de bactéries intracellulaires, dont les génomes souffrent, en général, d'un

José Viñuelas 127 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

faible biais d'usage de code. Récemment, Price et collaborateurs ont précisé la question du biais de distribution des gènes chez les bactéries, en prenant en compte l'organisation des gènes en opéron (Price et al., 2005). Pour ces auteurs, la structure opéronique jouerait un rôle important dans le biais de distribution des gènes, d'autant plus que chez E. coli les gènes essentiels sont abondamment présents au sein des opérons (Pal et Hurst, 2004). Dans leur étude, les auteurs mettent en évidence chez E. coli et chez B. subtilis que les groupes de gènes organisés en opéron subissent une pression de sélection, en faveur d'une localisation sur le brin direct, supérieure à celle des singletons. De plus, à partir de données issues d'expériences de puce à ADN menées par différentes équipes, Price et collaborateurs ont montré, chez ces deux bactéries modèles, que les gènes organisés en opérons et localisés sur le brin direct ont des niveaux d'expression plus importants que les gènes en opérons situés sur le brin indirect, et ceci aussi bien pour les gènes essentiels que les gènes non essentiels. Même si les auteurs confirment que l'expression des gènes n'est pas la cause principale du biais du biais de distribution des gènes, ce dernier résultat indique que l'expressivité des gènes organisés en opéron est corrélée avec leur localisation préférentielle sur le brin direct d'ADN.

En nous inspirant des deux études présentées ci-dessus, nous avons réalisé une étude globale prenant en compte le niveau d'expression des gènes, leur caractère essentiel, leur localisation sur le brin d'ADN et leur organisation en opérons afin de mettre en évidence les relations potentielles qui existeraient entre ces différents paramètres chez Buchnera aphidicola. Cette étude a révélé l'absence de corrélation entre le niveau d'expression des gènes et leur localisation sur l'un des deux brins du chromosome. En d'autres mots, les gènes les plus exprimés ne sont pas forcément localisés sur le brin direct dans le génome du symbiote du puceron. Ce premier résultat conforte les résultats de Rocha et Danchin, ainsi que ceux de Price et collaborateurs quant au rôle minime de l'expressivité des gènes sur le biais de distribution. Inversement, le caractère essentiel d'un gène semble être étroitement relié à ce biais puisque 60% des gènes essentiels sont localisés sur le brin direct chez Buchnera. Cette caractéristique, retrouvée pour des bactéries de forme libre par Rocha et Danchin (2003a; 2003b), s'expliquerait par le fait qu'il est considéré plus important pour la survie d'une bactérie de préserver la fonctionnalité et l'expression des gènes essentiels que celles des non essentiels (Mirkin et Mirkin, 2005). Selon certains auteurs, cette asymétrie de répartition des gènes en faveur du brin direct a été mise en relation avec le besoin, chez les

José Viñuelas 128 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

bactéries, de minimiser les interruptions de la transcription des gènes dues aux collisions entre l'ADN et l'ARN polymérase. La théorie la plus communément émise est que les collisions de type "co-directionnel" entre l'ADN et l'ARN polymérase sur le brin direct auraient des répercussions moins importantes sur la processivité de l'ARN polymérase lors de la transcription que les collisions de type "face à face" qui ont lieu sur le brin indirect (ou tardif) entre les deux enzymes (Rocha, 2004; Price et al., 2005). Ainsi, ce biais en faveur du brin direct est un moyen de garantir de manière efficace la transcription des gènes et plus précisément des gènes essentiels, localisés sur ce brin d'ADN (Brewer, 1988; French, 1992; Omont et Kepes, 2004; Mirkin et Mirkin, 2005). De façon plus précise, ce biais de localisation permettrait d'éviter la production d'un trop grand nombre d'ARNm tronqués (pouvant donner naissance à des polypeptides potentiellement toxiques) issus des collisions de type "face à face" entre les deux enzymes (Rocha et Danchin, 2003a; 2003b). D'autres auteurs suggèrent que, d'un point de vue évolutif, ce biais de distribution a été retenu afin d'éviter tout problème lié à la réplication du chromosome plutôt qu'à la transcription, ce qui peut être également le cas chez Buchnera. La réduction du taux de réplication du chromosome, issue d'une collision de type "face à face" entre les deux enzymes, augmenterait le temps nécessaire à la duplication du génome, ce qui limiterait la progression du cycle cellulaire. Ces collisions stopperaient également la réplication de la fourche d'ADN et causeraient potentiellement des délétions et autres mutations, voire même la mise en place d'une réponse de type SOS (Wang et al., 2007). En conclusion, il se pourrait que cette asymétrie de distribution des gènes permette de préserver l'ensemble des deux processus que sont la transcription et la réplication chez le symbiote du puceron. Il est à noter, qu'aucun aucun biais de distribution des gènes essentiels en faveur du brin direct n'avait été détecté par Rocha et Danchin chez Buchnera aphidicola ainsi que chez d'autres bactéries symbiotique et parasitaires. Or cette différence avec notre étude pourrait être liée à la manière par laquelle ces auteurs ont défini les gènes essentiels chez Buchnera (Rocha et Danchin, 2003b). Cette liste de gènes essentiels déterminée par homologie des gènes de Buchnera avec ceux d'E. coli, est probablement moins adaptée aux bactéries symbiotiques que le jeu de gènes essentiels proposé par Gil et collaborateurs sur lequel nous avons basé notre étude (Gil et al., 2004b).

José Viñuelas 129 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

D'un point de vue global, notre étude a montré que, les gènes les plus fortement exprimés, chez Buchnera, sont les gènes essentiels organisés en opérons. De plus, qu'ils soient essentiels ou non, les gènes organisés en opérons ont un niveau d'expression plus important que les singletons. Enfin, parmi les gènes en opérons, les gènes essentiels sont plus exprimés que les non essentiels, ce qui n'est pas observé pour les singletons. L'ensemble de ces observations suggère que cette organisation des gènes en unités de transcription pourrait être un moyen, pour Buchnera, de favoriser, à moindre coût, l'expressivité de certains de ses gènes.

Les résultats de cette première partie de l'étude montrent une conservation, chez Buchnera, de relations cohérentes entre le niveau d'expression des gènes et leurs propriétés fonctionnelles telles que l'essentialité ou l'organisation en unités de transcription, comme cela a été observé chez les bactéries de forme libre, et ceci malgré l'importante réduction de la taille de son génome.

La deuxième partie de cette étude visait à étudier la relation entre le niveau d'expression des gènes de Buchnera et leur taux de GC, utilisé ici comme indicateur du taux d'évolution des gènes. En analysant les signaux transcriptomiques combinés au taux d'évolution et à une étude de génomique comparative, de nouveaux candidats à l'ensemble des gènes essentiels à Buchnera semblent pouvoir être mis en évidence. Chez les bactéries les gènes codant les protéines ribosomiques, les protéines de division cellulaire et les protéines chaperonnes sont considérés comme essentiels et sont aussi connus pour être fortement transcrits. De manière cohérente avec ces données, nos résultats montrent que la plupart des gènes codant les protéines ribosomiques ainsi que des chaperonnes sont relativement bien conservés et fortement exprimés chez Buchnera. Parmi les gènes fortement transcrits et conservés, nous avons également détecté un nombre important de gènes impliqués dans la biosynthèse des acides aminés essentiels comme ceux de la voie de biosynthèse de deux acides aminés branchés : l'isoleucine et la valine. Un résultat intéressant a été la mise en évidence d'un faible taux d'expression des gènes codant huit des dix aminoacyl-ARNt synthétases relatives aux acides aminés essentiels au puceron, alors que les gènes codant ces enzymes mais relatives aux acides aminés non essentiels sont moyennement ou fortement exprimés. Une explication possible à cela pourrait être le fait que, Buchnera étant une bactérie avec un faible taux de croissance, elle ne nécessiterait pas un fort taux de production protéique. Elle synthétiserait de manière constitutive

José Viñuelas 130 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

des acides aminés essentiels afin de les fournir au puceron. En réduisant l'abondance de certaines aminoacyl-ARNt synthétases, la concentration en acides aminés essentiels libres pourrait augmenter dans le symbiote, ce qui faciliterait le transport de ces acides aminés vers l'insecte. Ce résultat recoupe une réponse adaptative de Buchnera précédemment observée où, lors d'une carence en acides aminés essentiels aromatiques, le gène pheT était sous-exprimé (Reymond et al., 2006). Dans cette étude, nous avons également remarqué que les gènes orphelins yba3 et yba4 chez Buchnera semblent évoluer rapidement et sont fortement exprimés, yba4 étant l'un des dix gènes les plus exprimés chez la bactérie. La conservation de ces deux gènes chez Buchnera Ap et chez Buchnera Sg, couplée à leur fort niveau d'expression, laisse penser qu'ils pourraient avoir un rôle important dans la symbiose entre Buchnera et ces deux espèces de pucerons. Cette hypothèse avait déjà été formulée par Shimomura et collaborateurs pour A. pisum après que les auteurs aient mis en évidence, par des études de RT-PCR, l'existence de ces deux transcrits dans le symbiote de ce puceron (Shimomura et al., 2002). Parmi les gènes définis comme évoluant rapidement chez Buchnera (dans ce travail, mais également dans le travail de Tamas et collaborateurs (2002) et celui de Reymond et collaborateurs (2006)) et fortement exprimés, certains des gènes codant les protéines de flagelle ont une place non négligeable. Le jeu de gènes flagellaires présent chez Buchnera Ap se compose de 26 gènes parmi lesquels les gènes fliEFGHIJKMNPQR et flhAB localisés sur le brin direct du chromosome (à l'exception de fliE) et les gènes flgNABCDEFGHIJK localisés sur le brin indirect (excepté flgN et flgA). L'ensemble de ces gènes est conservé chez Buchnera Sg. Cependant, Buchnera issue du puceron B. pistaciae, un peu plus éloigné phylogénétiquement du puceron A. pisum que ne l'est le puceron S. graminum, a perdu cinq gènes flagellaires de type flg (flgA, flgD, flgE, flgK, flgN) mais aucun de type fli. Enfin, le symbiote de C. cedri, possédant le plus petit des quatre génomes séquencé de Buchnera a perdu les mêmes gènes du flagelle que Buchnera Bp ainsi que quatre autres gènes de type flg (flgB, flgC, flgG, flgJ) et quatre gènes de type fli (fliE, fliJ, fliK, fliM), pour ne garder que le jeu de gènes minimum à l'obtention d'un système de sécrétion de type III (Perez-Brocal et al., 2006) (Figure 34 et Figure 35).

José Viñuelas 131 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Buchnera Ap Buchnera Sg

fliF fliG fliH fliI fliJ fliK fliM fliN fliP fliQ fliR flhA flhB fliE

flgN flgA flgB flgC flgD flgE flgF flgG flgH flgI flgJ flgK

Buchnera Bp

fliF fliG fliH fliI fliJ fliK fliM fliN fliP fliQ fliR flhA flhB fliE

flgN flgA flgB flgC flgD flgE flgF flgG flgH flgI flgJ flgK

Buchnera Cc

fliF fliG fliH fliI fliJ fliK fliM fliN fliP fliQ fliR flhA flhB fliE

flgN flgA flgB flgC flgD flgE flgF flgG flgH flgI flgJ flgK

gènes fli gènes flh gènes flg jeu de gènes minimum pour obtenir un SST3

Figure 34. Comparaison de la conservation des gènes flagellaires au sein des quatre génomes de Buchnera actuellement séquencés. Pour Buchnera Bp et Cc les gènes flagellaires perdus par rapport à Buchnera Ap sont barrés d'une croix. Les gènes localisés sur le brin direct et indirect d'ADN sont respectivement placés au dessus et en dessous du trait. Le jeu de gènes minimum à l'obtention d'un système de sécrétion de type III (SST3) est représenté en vert.

José Viñuelas 132 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Coiffe

Filament

FliC

Jonction Filament-Crochet

FlgL Crochet FlgK FlgD FlgE Bâtonnet FlgJ FlgG Anneau L FlgH FliO FlgF FliP Anneau P FlgI FliQ Bâtonnet ME FliR FliE, FlgBC PG FliF Anneaux MS Moteur MotB MC FlhA FlhB Anneau S MotA ATP FliG C Anneau ADP+Pi Anneau M FliM Anneau C FliN FliH Système de sécrétion FliI de type III Chaperonne Substrat exporté cytoplasmique

Figure 35. Schéma de l'appareil flagellaire chez Escherichia coli et Salmonella typhimurium. Seules les protéines intervenant dans la structure du flagelle sont précisées sur la figure. Une attention particulière est portée aux gènes homologues aux composantes du système de sécrétion de type III (voir encadré). Les différentes parties du flagelle, la membrane cytoplasmique (MC), la couche de peptidoglycane (PG) et la membrane externe (ME) sont indiquées ici. Enfin, les protéines notées en bleu forment les coiffes temporaires (d'après Toft et Fares, 2008).

Il est à noter que les gènes de type fli et flh très conservés entre les différentes souches de Buchnera sont localisés sur le brin direct du chromosome alors que la plupart de ceux peu conservés entre les différentes Buchnera, se localisent sur le brin indirect. De même, le jeu de gènes minimum à l'obtention d'un système de sécrétion de type III se compose exclusivement des gènes de type fli et flh localisés sur le brin direct (Figure 34). Ces résultats suggèrent l'existence d'un rôle important de ce groupe de gènes flagellaires qui, dans le contexte symbiotique,

José Viñuelas 133 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

auraient pu évoluer vers des fonctions de transport de protéines, du symbiote vers l'hôte, comme cela a été également proposé par Maezawa et collaborateurs (Maezawa et al., 2006) (cf. Synthèse Bibliographique § 2.2.5). Enfin, une étude très récente d'évolution moléculaire des gènes flagellaires dans les quatre génomes de Buchnera indique l'existence de pressions de sélection variables entre les différents gènes du flagelle (Toft et Fares, 2008). Une fois de plus, les auteurs concluent que les gènes du flagelle, et notamment ceux homologues au système de sécrétion de type III et conservés dans les quatre génomes de Buchnera, ont connus une divergence fonctionnelle pour l'adaptation à un nouvel environnement et devenir spécialisés dans l'export de protéines de la bactérie vers l'hôte.

De précédentes études comparant les données de séquençage disponibles pour plusieurs bactéries symbiotiques d'insectes ont tenté de comprendre les phénomènes évolutifs impliqués dans l'organisation du génome dans différentes souches de Buchnera, tels que le biais de distribution des gènes, la composition des gènes en bases nucléotidiques et des protéines en acides aminés, l'expressivité des gènes, le taux d'évolution des gènes ou encore la perte de certains d'entre eux au cours du temps (Schaber et al., 2005; Delmotte et al., 2006). Nos résultats sont en partie en adéquation avec les conclusions de ces études : (i) les gènes les plus conservés sont fortement exprimés, (ii) les gènes essentiels organisés en opérons sont fortement exprimés et sont probablement préservés des mutations par un processus de purification sélective, (iii) un processus de sélection positive semble façonner de nouvelles fonctions "symbiotiques" pour certains gènes fortement exprimés et bien conservés au cours de l'évolution. Cependant, tout comme Rocha et Danchin, nous rejetons l'hypothèse précédemment émise à partir des valeurs de CAI quant au rôle majeur de l'expressivité des gènes dans le biais de distribution entre les deux brins du chromosome.

Enfin, un important résultat de notre étude a été la mise en évidence de profils périodiques spatiaux dans le niveau d'expression des gènes de Buchnera le long du chromosome. En d'autres mots, la transcription des gènes le long du chromosome semble se dérouler selon des contraintes spatiales. L'analyse de la fonction d'autocorrélation et de la densité spectrale correspondante a permis de mettre en évidence quatre types de profils transcriptionnels spatiaux chez Buchnera : (i) des autocorrélations à faible échelle (groupes de 2 à 8 gènes), (ii) des périodes

José Viñuelas 134 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

à faible échelle (jusqu'à 17 gènes), (iii) des périodes d'envergure moyenne (de 23 à 61 gènes) et (iv) de longues périodes (au-delà de 84 gènes). Les profils d'autocorrélation à faible échelle, déterminés à partir de la fonction d'autocorrélation des niveaux d'expression des gènes, montrent qu'il existe tout le long du chromosome des groupes de gènes espacés d'une distance inter-gène inférieure à 8 gènes ayant des niveaux d'expression hautement corrélés. Comme cela a été suggéré pour les bactéries E. coli et B. subtilis, ces corrélations refléteraient la transcription coordonnée des gènes au sein des opérons de Buchnera (Jeong et al., 2004; Carpentier et al., 2005). Cette observation renforce le résultat mentionné précédemment concernant la conservation d'unités de transcription fonctionnelles chez Buchnera. Cependant, les simulations de permutations de l'emplacement des gènes le long du chromosome montrent bien que l'organisation des gènes en opérons ne suffit pas à elle seule à expliquer les profils périodiques spatiaux de transcription observés chez Buchnera. Si tel avait été le cas, les modifications simulées de l'ordre et/ou du nombre de singletons localisés entre les opérons n'auraient pas dû avoir d'influence sur la périodicité et les valeurs d'autocorrélation du transcriptome de Buchnera. Or, nous avons montré que ces permutations virtuelles engendraient une réduction dans l'intensité des profils spatiaux observés, ce qui met en évidence l'importance du haut degré d'arrangement de la totalité des gènes le long du chromosome du symbiote. Jeong et collaborateurs ont classé les périodes retrouvées dans le niveau d'expression des gènes de E. coli en trois catégories : les courtes (jusqu'à 16 gènes), les moyennes (de 100 à 125 gènes) et les longues périodes (de 600 à 800 gènes) (Jeong et al., 2004). L'existence de courtes périodes (jusqu'à 17 gènes) dans le transcriptome de Buchnera nous permet de soutenir l'hypothèse précédemment émise chez B. subtilis et E. coli selon laquelle les courtes périodes représenteraient une caractéristique commune à tous les génomes bactériens. Elles seraient dues à l'organisation particulière du nucléoïde bactérien, qui serait caractérisé par la présence de grandes spires à sa surface (Carpentier et al., 2005). Les moyennes et longues périodes identifiées chez Buchnera sont plus petites que celles mises en évidence chez les deux bactéries de forme libre, phénomène que nous attribuons à la petite taille du génome du symbiote. Cependant, même chez E. coli et B. subtilis, l'origine de ces moyennes et longues périodes est encore méconnue. Elles ne correspondent à aucun domaine du nucléoïde identifié à ce jour (Carpentier et al., 2005; Riva et al., 2008). Chez Buchnera en particulier, les opérons et les singletons les avoisinant semblent former des structures de type "supra-opéronique", comme indiqué par l'effet des permutations n°2 et n°3 (Perm.2 et Perm.3 de la Figure 32)

José Viñuelas 135 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

sur les moyennes et longues périodes. De plus, la diminution de la taille maximale des groupes de gènes autocorrélés, en fonction des différentes permutations de la position des gènes, corrobore cette hypothèse de "supra- opérons" chez le symbiote d'A. pisum. La conservation de profils périodiques spatiaux chez Buchnera peut être expliquée par le fait que la bactérie possède dans son génome les gènes codant des protéines de type NAP (nucleoid-associated proteins) comme H-NS, IHF et Fis, connues pour assurer la topologie du nucléoïde à l'état basal et qui seraient à l'origine des changements physiologiques de ce dernier. L'existence d'une régulation transcriptionnelle de type global via l'organisation spatiale du nucléoïde et l'action des NAPs chez les bactéries ne fait plus aucun doute, comme il est montré par de nombreuses et récentes publications (Travers et Muskhelishvili, 2005a; 2005b; Blot et al., 2006; Travers et Muskhelishvili, 2007; Wright et al., 2007). Les résultats obtenus dans notre étude indiquent que ce mécanisme de régulation pourrait être conservé chez Buchnera. Ainsi une perspective de travail intéressante serait d'étudier de manière approfondie le rôle de ces NAPs chez Buchnera par l'inhibition de l'activité de ces facteurs. L'analyse des effets de cette inhibition sur les profils transcriptomiques et les périodogrammes pourrait nous permettre de mettre en évidence le rôle de ces protéines en tant que régulateurs globaux de la transcription chez cette bactérie. La thèse de Lilia Brinza (UMR BF2I) est en partie consacrée à cette question.

José Viñuelas 136 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

2 Réponse du puceron et de Buchnera aphidicola à des stress en leucine

2.1 Introduction de l'étude 2.1.1 Les plasmides pLeu et pTrp

2.2 Effets de la concentration nutritionnelle en leucine sur le comportement et la croissance du puceron Acyrthosiphon pisum

2.3 Réponse métabolique de Buchnera à des stress en leucine

2.4 Analyse moléculaire de la réponse de Buchnera à des stress en leucine 2.4.1 Mesure du taux de réplication du plasmide pLeu 2.4.2 Réponse transcriptionnelle

2.5 Caractérisation théorique et expérimentale du plasmide pLeu chez Buchnera Ap 2.5.1 Analyse bioinformatique de la séquence du plasmide pLeu 2.5.2 Confirmation expérimentale de l'existence de l'opéron leuABCD et étude de la séquence non codante en amont de leuA

2.6 Des études préliminaires chez un autre puceron 2.6.1 Les premières études sur Rhopalosiphum padi 2.6.2 Comparaison du nombre de copies de plasmide pLeu à l'état naturel entre Buchnera Ap et Buchnera Rp 2.6.3 Réplication du plasmide pLeu après 7 jours de stress en leucine

2.7 Discussion sur les résultats de l'étude

2.1 Introduction de l'étude

Les résultats présentés dans la première partie de ce travail de thèse montrent la présence, à l'état basal, d'une relation réciproque entre le niveau d'expression des gènes et l'organisation du chromosome chez le symbiote du puceron A. pisum. Même dans le génome très réduit de Buchnera, une régulation globale de l'expression des gènes est mise en place pour permettre à certains gènes essentiels à la survie de la bactérie (groELS, gènes codant les protéines ribosomiques) et à d'autres particulièrement importants dans la relation symbiotique (gènes de biosynthèse des acides aminés essentiels) d'être très exprimés en absence de stress trophique (pucerons élevés sur plante) (Viñuelas et al., 2007). A cette réponse de type global on a également attribué l'induction ou la répression de l'expression de certains groupes de gènes de Buchnera en réponse à des carences en acides aminés essentiels dans le régime alimentaire d'A. pisum (Charles et al., 2006; Reymond et al., 2006). Malgré cela, seule une très faible régulation spécifique des gènes appartenant aux voies de biosynthèse des acides aminés essentiels a pu être mise en

José Viñuelas 137 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

évidence comme réponse de la bactérie à la demande nutritionnelle de son hôte par nos travaux et les travaux de Moran et collaborateurs (2005a). La deuxième partie de ce travail a consisté à étudier de manière ciblée la réponse du symbiote d'A. pisum à des stress en leucine chez le puceron hôte. Notre étude se démarque des autres études réalisées à ce jour à différents niveaux : (i) elle couple l'analyse de paramètres physiologiques et comportementaux du puceron hôte en réponse à un stress trophique avec l'analyse moléculaire de la réponse de la bactérie ; (ii) cette étude est la première à analyser la réponse de Buchnera à des stress trophique imposés à son hôte selon une cinétique de traitement ; (iii) elle est concentrée sur l'une des deux voies de biosynthèse d'acides aminés de Buchnera comprenant des gènes à localisation chromosomique et plasmidique.

2.1.1 Les plasmides pLeu et pTrp

Une des particularités fonctionnelle du génome de Buchnera est la présence de deux plasmides, accessoires au chromosome bactérien, spécialisés dans la biosynthèse de la leucine (pLeu) et du tryptophane (pTrp). Ces deux plasmides existent dans la majorité des génomes de Buchnera analysés à l'heure actuelle (Figure 36). L'hypothèse la plus répandue concernant l'origine de ces plasmides est que les gènes les composant seraient d'origine chromosomique (Latorre et al., 2005; Gil et al., 2006). Par opposition à la relative stabilité du chromosome, l'organisation des gènes sur ces plasmides semble avoir été façonnée par de nombreux événements évolutifs tels que des retours sur le chromosome ou encore des réarrangements au sein même du plasmide. En ce qui concerne le plasmide pLeu, celui-ci est présent au sein des Buchnera issues de quatre différentes sous-familles de pucerons : les Aphidinae, les Pterocommatinae, les Thelaxinae et les Lachninae (Bracho et al., 1994; van Ham et al., 1997; Baumann, 2005; Latorre et al., 2005).

José Viñuelas 138 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Aphidinae

Pterocommatinae

Thelaxinae

Pemphiginae

Lachninae

-BCc

Figure 36. Cartographie linéaire des différents types de plasmides (pLeu et pTrp)Pemphiginae identifiés chez Buchnera aphidicola issus de plusieurs sous-familles de pucerons. Ap : Acyrthosiphon pisum, Dn : Diuraphis noxia, Sg : Schizaphis graminum, Rm : Rhopalosiphum maidis, Rp : Rhopalosiphum padi, Pp : Pterocomma populeum, Ts : Thelaxes suberi, Ps : Pemphigus spyrothecae, Tc : Tetraneura caerulescens, Bp : Baizongia pistaciae, Tg : Tuberolachnus salignus, Cc : Cinara cedri, Ct : Cinara tujafilina. Les origines de réplication sont indiquées avec des triangles : ▼ réplicon de type RepA, réplicon de type RepA/C. ↑ : séquence de type "Chi" (d'après Gil et al., 2006 et Gosalbes et al,. 2008). Chaitophorinae

De taille comprise entre 6,5 et 8,5 kpb, le plasmide pLeu se compose des quatre gènes spécifiques à la biosynthèse de la leucine (leuA, leuB, leuC et leuD) et de un ou deux gènes codant des enzymes de type réplicases (repA1 et/ou repA2). Chez les symbiotes des Aphidinae, des Pterocommatinae et des Thelaxinae, les plasmides pLeu comportent également un gène codant une protéine de choc thermique (ibp) et/ou un gène codant potentiellement une protéine de membrane (yqhA). Chez les Lachninae ces deux gènes sont absents. De plus, une des particularités des symbiotes de certaines espèces de pucerons appartenant à cette sous-famille est qu'ils possèdent un plasmide regroupant les gènes de biosynthèse de la leucine avec ceux de biosynthèse du tryptophane (plasmide pLeu/Trp de Buchnera Ct, Figure 36). Enfin, chez les pucerons des sous-familles Pemphiginae, Buchnera possède un plasmide dit cryptique, de taille comprise entre 1,7 et 2,4 kpb, qui est considéré être un vestige du plasmide

José Viñuelas 139 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

pLeu ayant perdu les gènes codant les protéines de biosynthèse de la leucine. En contrepartie, dans cette sous-famille de pucerons ainsi que chez les Chaitophorinae, qui ne semblent pas posséder de plasmide cryptique, les gènes leuABCD auraient été réintégrés dans le chromosome (Sabater Munoz et al., 2002; Sabater-Munoz et al., 2004) (Figure 37).

Pemphiginae

Chaitophorinae

Figure 37. Cartographie des gènes leuABCD localisés sur le chromosome de Buchnera aphidicola des pucerons issus des sous-familles Pemphiginae et Chaitophorinae. Ps : Pemphigus spyrothecae, Tc : Tetraneura caerulescens, Bp : Baizongia pistaciae, Cp : Chaitophorus populeti (d'après Latorre et al., 2005).

Cette dernière observation, associée à la stase évolutive qu'a connu le chromosome de Buchnera, laisse penser que les plasmides pLeu et pTrp étaient déjà présents dans le génome du dernier ancêtre symbiotique commun aux différentes souches de Buchnera avant leur diversification et co-spéciation avec leurs hôtes (Latorre et al., 2005). Depuis leur découverte par Bracho, Lai, et collaborateurs, de nombreuses hypothèses ont été formulées quant à la fonction possible de ces deux plasmides (Bracho et al., 1994; Lai et al., 1994). L'hypothèse initiale était qu'ils permettraient une importante biosynthèse de leucine et de tryptophane. Cependant, la variation du ratio entre le nombre de copies de chacun des plasmides et le nombre de copies du chromosome au sein, et entre, chacune des espèces de pucerons, (Thao et al., 1998; Plague et al., 2003) remet en cause cette hypothèse de surproduction. En effet, pour certaines espèces de pucerons, ce ratio est inférieur à 1, ce qui indique que le nombre de copies de plasmide est inférieur au nombre de copies du chromosome. Or dans le cas d'une surproduction de leucine et de tryptophane via les plasmides, une quantité supérieure de nombre de copies de plasmide par rapport au chromosome aurait été plus en adéquation avec

José Viñuelas 140 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

cette hypothèse. De plus, une étude menée par Birkle et collaborateurs en 2004 sur le plasmide pTrp, montre que le niveau d'amplification de ce plasmide ne semble pas être corrélé aux besoins nutritionnels du puceron (Birkle et al., 2004). D'après certains auteurs, ces variations du ratio entre le nombre de copies de plasmide et le nombre de copies du chromosome chez les différentes espèces de pucerons seraient étroitement liées aux besoins nutritionnels qui sont spécifiques à chaque puceron en fonction des ressources trophiques mises à disposition par la plante (Thao et al., 1998; Moran et al., 2003b). Cependant, les mécanismes d'ajustement de la production des acides aminés ne sont pas encore connus (Moran et al., 2003b). Depuis peu, une nouvelle hypothèse sur la fonction de ces plasmides chez Buchnera a été émise par Latorre et collaborateurs, qui considèrent que le transfert des gènes codant les enzymes de biosynthèse de la leucine et du tryptophane sur les plasmides serait un moyen pour s'affranchir des mécanismes de régulation génomique et ainsi permettre une production continue et non régulée de ces deux acides aminés essentiels (Latorre et al., 2005). Malgré ces hypothèses, la raison de l'existence de ces plasmides dans la plupart des souches de Buchnera reste encore énigmatique (Latorre et Moya, 2006).

L'objectif de ce travail a été d'étudier la réponse de Buchnera lors de stress nutritionnels en leucine induits chez son hôte le puceron. La première étape de notre analyse a été d'observer les effets d'une variation de la concentration nutritionnelle en leucine sur le comportement alimentaire du puceron ainsi que sur sa croissance. Les résultats obtenus ont montré un effet significatif de la leucine sur l'appétence du puceron pour son milieu nutritionnel et sur son taux de croissance soulignant ainsi l'importance physiologique de cet acide aminé pour l'insecte. Après la mise en évidence d'une néosynthèse de leucine par Buchnera en réponse à une carence en cet acide aminé, notre étude a consisté à analyser la réponse moléculaire du symbiote, dans le cadre de ce même type de stress, au niveau de la réplication du plasmide pLeu ainsi qu'au niveau de la transcription des gènes intervenant dans la biosynthèse de la leucine.

José Viñuelas 141 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

2.2 Effets de la concentration nutritionnelle en leucine sur le comportement et la croissance du puceron Acyrthosiphon pisum

Nous avons tout d'abord analysé l'effet d'un milieu plus ou moins riche en leucine sur le comportement et sur le taux de croissance des pucerons. Dans un premier temps, et sur la base d'un choix binaire, nous avons déterminé le milieu nutritionnel préféré des pucerons parmi des milieux contenant des concentrations différentes en leucine. Pour chacun des milieux à tester, le puceron était confronté à un milieu de référence contenant 20 mM de leucine et à un milieu contenant une concentration comprise entre 0 et 90 mM de cet acide aminé. La Figure 38 montre une importante corrélation positive entre l'appétence de l'insecte pour son milieu nutritionnel et la quantité de leucine présente dans ce dernier (R2=0,876, P-value < 10-4). Ainsi, le puceron s'oriente préférentiellement vers des milieux riches en leucine plutôt que vers des milieux pauvres en cet élément. Enfin, si l'on compare chacun des index de phagostimulation, qui est une moyenne de plusieurs mesures, à celui issu du milieu de référence 20 mM, on constate que les milieux contenant une concentration en leucine inférieure à cette valeur et supérieure à 40 mM sont, respectivement, moins et plus prisés par le puceron (Test non paramétrique des rangs signés de Wilcoxon, P-value < 0,05).

José Viñuelas 142 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

0,8 RR2=0.8762=0,876 0,6

0,4

0,2

0

-0,2

-0,4 Index de phagostimulation

-0,6 (par rapport au rapport milieu(par contrôle leu20mM) -0,8 -10 0 10 20 30 40 50 60 70 80 90 100 Concentration du milieu en leucine (en mM)

Figure 38. Réponse comportementale du puceron Acyrthosiphon pisum en fonction de la concentration de leucine présente dans le milieu nutritionnel. L'index de phagostimulation pIx quantifie le choix d'orientation du puceron entre un milieu de référence contenant 20 mM de leucine et un milieu ayant une quantité comprise entre 0 et 90 mM de cet acide aminé (les valeurs -1 et 1 indiquent, respectivement, une préférence totale pour le milieu de référence ou pour le milieu test). Les différences significatives entre les différents milieux sont données par un test non paramétrique des rangs signés de Wilcoxon testant l'hypothèse pIx=0 pour un intervalle de confiance de 95% : ● pas de différences significatives entre le pIx observé et pIx=0; ■ pIx inférieur à pIx=0; ▲ pIx supérieur à pIx=0. Le coefficient de corrélation de Pearson (R2) est indiqué.

L'effet sur la croissance des pucerons de ces différents milieux a également été testé. Pour cela le pourcentage de croissance par rapport au milieu de référence contenant 20 mM de leucine a été déterminé lorsque les pucerons sont élevés sur chacun des milieux testés (Figure 39).

José Viñuelas 143 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

C C 130 C 2 2 RR=0.408=0,408 C C C C 120

110 B

B 100

90 Taux de croissance de Taux A

80 (en % par rapport au milieu contrôle leu20mM) contrôle milieu au rapport par% (en 70 -10 0 10 20 30 40 50 60 70 80 90 100 Concentration du milieu en leucine (en mM)

Figure 39. Taux de croissance du puceron Acyrthosiphon pisum en fonction de la concentration de leucine présente dans le milieu nutritionnel. Les taux moyens de croissance sont représentés avec leurs erreurs standards et comparés entre eux grâce à un test de Tukey-Kramer HSD. Les différences significatives pour un intervalle de confiance de 95% entre deux milieux sont indiquées avec une lettre différente. Le coefficient de l'ANOVA (R2) est indiqué.

Nous pouvons observer, dans un premier temps, que la quantité de leucine présente dans les milieux d'élevage exerce un effet significatif sur la croissance des pucerons (ANOVA F-test, R2=0,408, P-value < 10-4). De manière plus précise, si l'on compare l'ensemble des conditions, la croissance des pucerons est réduite d'environ 20% par rapport au milieu de référence (leu20mM) lorsqu'ils sont élevés sur un milieu totalement carencé en leucine (leu0mM) (Test de Tukey-Kramer HSD, P-value < 0,05). De même, bien que non statistiquement significative, une diminution du taux de croissance de l'insecte d'environ 6%, par rapport au milieu de référence, apparaît lorsqu'il est élevé sur un milieu contenant 10 mM de leucine. Inversement, pour des milieux contenant une concentration en leucine supérieure à 20 mM, la croissance de l'insecte augmente d'environ 20% par rapport à la condition contrôle (Test de Tukey-Kramer HSD, P-value < 0,05). Pour une gamme de concentrations en leucine allant de 30 mM à 90 mM, aucune différence significative quant à la croissance de l'insecte n'est observée, ce qui se traduit sur la figure par une stabilisation de la croissance à environ 120% par rapport au milieu contrôle.

José Viñuelas 144 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

2.3 Réponse métabolique de Buchnera à des stress en leucine

Sur la base des résultats obtenus ci-dessus, la deuxième étape de notre travail a consisté à étudier la réponse de Buchnera aphidicola à des variations de la concentration en leucine dans le milieu nutritionnel du puceron. La néosynthèse de leucine par Buchnera a été quantifiée par radiotraçage au carbone 14C à partir du précurseur naturel de cet acide aminé qui est le saccharose. Afin de mettre en évidence un éventuel effet de la variation de la concentration nutritionnelle en leucine sur la super-voie de biosynthèse des acides aminés branchés (Figure 40), nous avons également quantifié la néosynthèse d'isoleucine et de valine par Buchnera (Figure 41).

José Viñuelas 145 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

2 Pyruvate

acétolactate CO2 synthétase : ilvH ilvI

2-acétolactate

NADPH+H+ Acide acétohydroxy- isoméroréductase : ilvC NADP+

2,3-dihydroxy- L-isoleucine isovalérate

Acide dihydroxy- H2O déhydratase ilvD

2-céto-isovalérate

H O + acétyl-CoA 2 2-isopropylmalate L-glutamate Coenzyme A synthétase : leuA 2-cétoglutarate Valine transaminase : ilvE 2-isopropylmalate (absent chez Buchnera) Isopropylmalate H2O isomérase : leuD leuC L-valine

isopropylmaléate

H2O Isopropylmalate isomérase : leuD leuC 3-isopropylmalate + NADP 3-isopropylmalate déhydrogénase : leuB NADH+H+ 2-isopropyl-3-oxosuccinate

CO2 Réaction spontanée

2-cétoisocaproate

L-glutamate Leucine aminotransférase : tyrB 2-cétoglutarate (absent chez Buchnera) Leucine transaminase : ilvE (absent chez Buchnera)

L-leucine

Figure 40. Schéma simplifié de la super-voie de biosynthèse des acides aminés branchés chez Buchnera aphidicola. Les produits et sous-produits des réactions sont indiqués respectivement en rouge et en orange. Les noms des enzymes intervenant dans chacune des étapes de biosynthèse sont notés en vert et les gènes correspondants indiqués en mauve (d'après http://biocyc.org).

José Viñuelas 146 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

25,0 2 R2=0.951=0,951 A

20,0

leu0mM 15,0 2 leu20mM R 2=0.626=0,626 leu40mM C C leu60mM 10,0 B.C B A.B leu80mM A A A A A B.C A C 5,0 C unité unité de poids mg)(en de frais pucerons Equivalent en saccharose (en nmoles) (en par Equivalent en saccharose 0,0 Isoleucine Leucine Valine Acides aminés néosynthétisés

Figure 41. Néosynthèse des acides aminés branchés par Buchnera chez Acyrthosiphon pisum à partir de saccharose et en fonction de la concentration de leucine présente dans le milieu nutritionnel. Les données (moyenne et erreur standard) sont exprimées en équivalents en saccharose (en nmoles) par unité de poids frais de pucerons (en mg). Pour chacun des acides aminés, les conditions présentant des néosynthèses significativement différentes, révélées par un test de Tukey-Kramer HSD avec un intervalle de confiance de 95%, sont indiquées avec des lettres différentes. Le coefficient de l'ANOVA (R2) est indiqué.

En ce qui concerne la leucine, la variation de concentration de cet acide aminé dans le milieu nutritionnel du puceron a un effet très significatif sur la néosynthèse de ce composé par Buchnera (ANOVA F- Test, R2=0,951, P-value < 10-4). Plus précisément, plus le milieu est pauvre en leucine et plus l'acide aminé est synthétisé par le symbiote et ceci jusqu'à atteindre, dans le cas d'une absence totale de leucine, une augmentation de la production de 194% par rapport à ce qui est produit sur le milieu de référence leu20mM (Test de Tukey-Kramer HSD, P-value < 0,05). Inversement, lorsque le milieu nutritionnel du puceron contient une quantité de leucine supérieure à 20 mM, Buchnera réduit sa production en moyenne de 48% (Test de Tukey-Kramer HSD, P-value < 0,05). De manière intéressante, il a également été observé un effet de la concentration du milieu en leucine sur la néosynthèse de la valine par Buchnera (ANOVA F-test, R2=0,626, P-value < 2x10-4), mais avec une tendance inversée par rapport à la leucine. En effet, la néosynthèse de valine par Buchnera diminue avec l'augmentation de la carence nutritionnelle en leucine (Test de Tukey-Kramer HSD, P-value < 0,05). De même que pour la leucine, il apparaît des différences dans la néosynthèse

José Viñuelas 147 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

de valine entre des pucerons élevés sur les milieux ayant une concentration en leucine supérieure ou inférieure à 20 mM. Enfin, aucune variation significative de la néosynthèse d'isoleucine n'est observée en fonction de la variation de la concentration en leucine dans l'alimentation du puceron.

2.4 Analyse moléculaire de la réponse de Buchnera à des stress en leucine

Cette étude trouve ses bases dans les expériences présentés dans les paragraphes ci-dessus et avait comme objectif de mieux comprendre les mécanismes moléculaires sous-jacents à la synthèse de leucine lors d'une carence en cet acide aminé (cf. Résultats § 2.3) et ainsi de connaître par quel moyen Buchnera est capable de réguler sa biosynthèse en leucine en fonction des besoins nutritionnels du puceron.

2.4.1 Mesure du taux de réplication du plasmide pLeu

Le premier type d'expériences réalisé sur le plasmide pLeu visait à savoir s'il existe une possible régulation de la réplication de ce plasmide en fonction des besoins nutritionnels du puceron en leucine. Pour cela, nous avons quantifié le nombre de copies de plasmide pLeu à partir de pucerons élevés sur un milieu carencé en leucine (leu0mM) ainsi que sur un milieu ayant un excès en cet acide aminé (leu60mM). Le nombre de plasmides quantifié dans ces deux conditions est ensuite comparé à celui obtenu lorsque le puceron est élevé sur le milieu de référence (leu20mM). Pour maximiser nos chances de détecter une modification de la réplication de pLeu chez Buchnera, une cinétique de stress en leucine a été réalisée : les pucerons ont été élevés pendant 12 heures, 1 jour, 2 jours, 3 jours et 7 jours sur les milieux artificiels.

José Viñuelas 148 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

0,8 ** 0,7 ** 0,6

0,5 * * leu0mM 0,4 leu20mM leu60mM 0,3

0,2 par par copie de chromosome Nombre Nombre de copies de pLeu 0,1

0 12 heures 1 jour 2 jours 3 jours 7 jours Temps de traitement

Figure 42. Comparaison du nombre moyen de copies de plasmide pLeu par unité de chromosome chez Buchnera aphidicola lorsque le puceron Acyrthosiphon pisum est élevé sur un milieu totalement carencé en leucine (leu0mM), ou présentant un excès en cet acide aminé (leu60mM), par rapport à un milieu de contrôle (leu20mM), et ceci selon un temps de traitement variable. Pour chaque modalité, la barre représente l'erreur standard. * et ** : variation significative du nombre de copies de pLeu par rapport au milieu de référence révélée par un test de Dunnett avec un intervalle de confiance respectif de 95% et 99%.

Les résultats ainsi obtenus sont reportés sur la Figure 42. Chaque valeur correspond à une moyenne du nombre de copies de pLeu mesuré à partir de trois gènes plasmidiques et normalisé par rapport à un gène chromosomique (cf. Matériels et Méthodes § 3.3.5). Nous pouvons remarquer l'absence de toute variation dans le nombre de copies de pLeu après 12 heures de stress, et ceci aussi bien pour le milieu leu0mM que pour le milieu leu60mM, par rapport au milieu leu20mM. Après 1 jour de stress, le nombre de copies de pLeu diminue curieusement de 20% en l'absence de leucine (Test de Dunnett, P-value < 0,05). En revanche, aucune variation n'est observée pour le milieu leu60mM. C'est lorsque les pucerons sont élevés 2 jours sur les milieux testés que le taux de réplication du plasmide pLeu semble varier le plus. En effet, en l'absence totale de leucine (milieu leu0mM), on constate une augmentation du nombre de copies du plasmide d'environ 51% par rapport au milieu de référence (Test de Dunnett, P-value < 0,01). Inversement, une diminution de 15% du nombre de copies de pLeu est observée sur le milieu leu60mM (Test de Dunnett, P-value < 0,05).

José Viñuelas 149 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Après 3 jours de stress une augmentation (de 39%) du nombre de copies de plasmide lors d'une carence en leucine est toujours observée (Test de Dunnett, P-value < 0,01), ce qui n'est plus le cas pour la diminution du nombre de copies de pLeu observée après 2 jours de stress sur le milieu leu60mM. Au bout d'une semaine de stress, il n'existe aucune différence significative du nombre de copies du plasmide pLeu entre les pucerons élevés sur les milieux contenant 0 mM, 20 mM et 60 mM de leucine.

2.4.2 Réponse transcriptionnelle

Une analyse de la réponse transcriptionnelle de Buchnera à une carence et à un excès de leucine a également été réalisée. L'objectif était de savoir (i) s'il existe une réponse transcriptionnelle du symbiote à une variation de la concentration nutritionnelle en leucine chez le puceron, (ii) et si tel est le cas, si elle est indépendante de la réplication du plasmide. Par RT-PCR en temps réel, nous avons dosé le niveau d'expression de l'ensemble des gènes présents sur le plasmide pLeu ainsi que des gènes ilvI, ilvH et leuS, localisés sur le chromosome et intervenant dans la biosynthèse et le métabolisme de la leucine. Pour cette expérience, la même cinétique de traitement que celle présentée dans le paragraphe précédent a été réalisée.

José Viñuelas 150 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

16 A 14

12

10

12h 8 J1 J2 6 J3 J7 [leu0mM/leu20mM]

différentiel d'expression différentiel 4 2 log 2

0

ilvI ilvH leuS leuA leuB leuC leuD repA1 repA2 yqhA -2

10

8 B

6

4 12h 2 J1 J2 0 J3 J7 u60mM/leu20mM] -2 [le différentiel d'expression différentiel

2 ilvI ilvH leuS leuA leuB leuC leuD repA1 repA2 yqhA

log -4

-6

-8

Figure 43. Réponse transcriptionnelle de Buchnera aphidicola à des stress en leucine induits chez le puceron en fonction de différents temps de traitement. Le différentiel d'expression moyen des gènes étudiés est représenté par rapport au milieu de référence leu20mM respectivement en (A) pour le milieu leu0mM et en (B) pour le milieu leu60mM. Pour chaque modalité la barre représente l'erreur standard. Le seuil de significativité du différentiel d'expression (ligne en pointillés) est fixé à +1 dans le cas d'une sur-expression et à -0,5 dans le cas d'une sous-expression.

José Viñuelas 151 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

La Figure 43 présente les résultats ainsi obtenus. Le rapport d'expression des gènes est reporté ici par rapport à la condition de référence leu20mM pour la condition de déplétion (leu0mM) et d'excès en leucine (leu60mM) et ceci pour chacune des modalités de la cinétique de stress. D'un point de vue général, nous avons observé une sur-expression globale de l'ensemble des gènes, dans le cas d'une carence en leucine, et une sous-expression globale dans le cas d'un excès en leucine, toutes modalités confondues. Plus particulièrement, si on considère uniquement les gènes directement impliqués dans la biosynthèse de la leucine (ilvIH, leuABCD) pour lesquels le profil d'expression peut être prédit en fonction des stress en leucine induits, l'analyse de la tendance du différentiel d'expression de ces gènes confirme la sur-expression globale et la sous- expression globale de ces gènes respectivement pour les conditions leu0mM et leu60mM (Test exact de Fisher, R2=0,224, P-value < 10-4). L'analyse des réponses transcriptionnelles obtenues pour la condition leu0mM révèle une sur-expression de l'ensemble des gènes testés qui débute dès 12 heures (12h) de stress et qui s'accentue pour devenir maximale après 1 jour de traitement (J1). Pour les gènes ilvIH et leuBCD, le niveau de sur-expression s'attenue après 2 jours (J2) mais semble remonter faiblement après 3 jours de traitement (J3), avant de devenir non significatif 7 jours après le début du stress (J7). Les gènes leuA, leuS et repA2 présentent un profil légèrement différent puisque leur sur-expression atteint un maximum à J2 avant de diminuer et devenir non significative respectivement à J3 et à J7. Le gène repA1 présente un pic de sur- expression à J1 dont l'intensité diminue graduellement au cours du temps et devient, comme pour les autres gènes testés, non significative entre J2 et J7. Enfin, le gène yqhA présente une réponse transcriptionnelle au stress particulièrement intense, avec une importante sur-expression entre 12h et J3, l'intensité maximale étant atteinte à J2. Cependant, comme pour l'ensemble des autres gènes, aucune expression différentielle significative n'est observée à 7 jours de traitement. Concernant la condition leu60mM, une réponse spécifique des gènes ilvIH, leuABCD et leuS est observée, et ceci, comme pour la condition leu0mM, dès 12 heures de traitement. Pour les gènes ilvIH, leuA et leuS, cette réponse spécifique perdure toujours à J1 mais s'affaiblit et devient non significative lorsque le traitement se prolonge. Cette diminution dans l'intensité de la réponse au cours du temps est particulièrement perceptible pour le gène leuD qui ne présente qu'une sous- expression significative à 12h. Il faut noter qu'à J3 une sous-expression et une légère sur-expression se produisent respectivement pour les gènes leuA et leuS. De même, une sous-expression apparaît de nouveau à J2 pour leuB

José Viñuelas 152 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

et leuC, qui se prolonge à J3 pour ce dernier gène. Les gènes codant les réplicases présentent, quant à eux, des profils d'expression assez proches. En effet, repA1 et repA2 sont tous deux sous-exprimés dès 12 heures de traitement et leur sous-expression perdure 12 heures de plus. Inversement à J3 la réponse transcriptionnelle de ces gènes se situe à la limite de la significativité avec une tendance de type sur-expression pour repA1 et de type sous-expression pour repA2. Lorsque le traitement se prolonge, la seule réponse significative observée pour ces deux gènes est une sous- expression de repA2 à J3. Enfin, tout comme pour la condition leu0mM, nous observons une sur-expression de yqhA à J2 et à J3 dont l'intensité est maximale à J2. Les résultats présentés ici montrent pour la première fois une réponse transcriptionnelle spécifique de Buchnera à un stress nutritionnel en acides aminés, ici, la leucine. De plus, cette réponse est cohérente avec le type de stress : une carence en leucine induit une sur-expression des gènes de la biosynthèse de cet acide aminé, alors qu'un excès induit une sous-expression. Enfin, l'intensité de cette réponse transcriptionnelle semble être variable selon la durée du traitement. Sur la base de ces résultats, et étant donnée la perte chez Buchnera des régulateurs transcriptionnels de la biosynthèse des acides aminés, nous nous sommes posés la question des mécanismes de régulation mis en jeu par la bactérie dans la réponse observée. Une étude détaillée de la séquence du plasmide pLeu nous a semblé indispensable pour aborder cette question.

2.5 Caractérisation théorique et expérimentale du plasmide pLeu chez Buchnera Ap

2.5.1 Analyse bioinformatique de la séquence du plasmide pLeu

Une première annotation du plasmide pLeu de Buchnera aphidicola était déjà disponible (Silva et al., 1998; Soler et al., 2000), mais elle était relativement pauvre en éléments de régulation. Ainsi, nous avons essayé de compléter cette annotation, notamment par rapport aux éléments de régulation existant chez les bactéries de forme libre. Pour cela nous avons recherché et tenté de repositionner des séquences de régulation de type "promoteurs" mais également les régions putatives de liaison à des facteurs transcriptionnels globaux tels que Fis et IHF. Les structures intervenant dans la régulation transcriptionnelle comme les terminateurs rho-indépendants ou encore les structures de type Tige-Boucle, pouvant agir en tant qu'atténuateur de la transcription ou stabilisateur d'ARNm, ont

José Viñuelas 153 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

aussi fait l'objet d'une recherche bioinformatique. Enfin, nous avons tenté d'identifier pour chacun des messagers du plasmide la séquence de fixation du ribosome. Cette nouvelle annotation est schématisée dans la Figure 44.

Ori. TB (17) (47 pb) leuD (7182-7805) Term. (24) TB (173) (56 pb) Term. (297) RBS (7165) Term. (752) repA1 (345-1196) Term. (6490) TB (1229) (25 pb) leuC (5764-7179) Prom. repA1 (1245) Prom. yqhA (1292) IHF (6303) RBS (1491)

IHF (6073) pLeu Buchnera Ap yqhA (1512-2015) IHF (5878) 7805 bp RBS (5754) Prom. repA2 (2054)

leuB (4671-5762) RBS (2151) Fis (5041) Term. (2515) TB (4761) (16 pb) repA2 (2160-2912) Term. (4754) Prom. leuA (2882) RBS (4637) TB (2911) (97 pb)

Prom. leuB (4359) RBS (3028) leuA (3051-4610)

Figure 44. Cartographie du plasmide pLeu de Buchnera aphidicola Ap. Les éléments potentiels de régulation sont indiqués de la manière suivante : en vert les structures de type Tige-Boucle (TB), en rouge les terminateurs de transcription de type rho-indépendant (Term.), en brun les séquences promotrices associées aux gènes du plasmide (Prom.), en bleu les sites de fixation des ribosomes (RBS), en violet les sites potentiels de fixation de facteurs globaux de la régulation transcriptionnelle (IHF, Fis). La localisation (nucléotide initial) de l'ensemble de ces éléments est indiquée entre parenthèse, de même que la taille des structures de type Tige-Boucle. Le nom des gènes et leur localisation sur le plasmide (nucléotide initial et final) sont indiqués en noir.

Dans cette analyse, nous avons pu mettre en évidence des séquences promotrices hypothétiques localisées en amont des gènes repA1, yqhA, repA2 ainsi qu'en amont de l'opéron leuABCD. Nous noterons également dans ce plasmide l'importante séquence intergénique de 61 pb entre les gènes leuA et leuB, absente chez E. coli K12 (Figure 45).

José Viñuelas 154 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Escherichia coli K12 (localisation chromosomique)

leuD leuC leuB leuA leuL leuO ilvI ilvH

-9 pb -3 pb 0 pb 93 pb 660 pb 318 pb 3 pb

Buchnera aphidicola Ap (localisation plasmidique)

leuA leuB leuC leuD

61 pb 0 pb 3 pb

Figure 45. Comparaison de l'agencement des gènes de l'opéron leuABCD entre Escherichia coli et Buchnera aphidicola Ap. La taille des séquences intergéniques sont indiquées et les valeurs négatives correspondes à des superposition des phases de lecture. Les gènes dont la phase de lecture est orientée vers la droite sont localisés sur le brin direct d'ADN et ceux orientés vers la gauche sur le brin indirect. Pour E. coli les gènes leuL, leuO ainsi que l'opéron ilvIH intervenant dans la régulation de l'expression de l'opéron leuABCD sont indiqués.

La recherche de sites de fixation de facteurs globaux de la régulation transcriptionnelle de type "histone-like" (ou NAPs) a mis en évidence la présence de trois sites putatifs de fixation pour le facteur IHF localisés au niveau du gène leuC, et un pour le facteur Fis au niveau de leuB. De plus, six sites pouvant agir comme terminateurs de la transcription de type rho-indépendant ont été identifiés sur le plasmide pLeu. Concernant les structures secondaires de type Tige-Boucle (n'étant pas des terminateurs rho-indépendant) notre analyse a révélé l'existence de quatre de ces structures dont la taille est comprise entre 16 et 56 pb. Nous avons également retrouvé une cinquième Tige-Boucle entre les gènes repA2 et leuA, qui avait déjà été identifiée lors du séquençage du plasmide (Silva et al., 1998), dont l'importante taille (97 pb) et la structure parfaite laisserait supposer qu'elle puisse avoir un rôle fonctionnel dans le plasmide pLeu (Figure 47). Enfin, l'analyse bioinformatique nous a permis d'identifier les probables sites de fixation aux ribosomes relatifs à chacun des messagers, à l'exception du gène repA1 pour lequel aucune séquence de ce type n'a été détectée.

José Viñuelas 155 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

2.5.2 Confirmation expérimentale de l'existence de l'opéron leuABCD et étude de la séquence non codante en amont de leuA

Les résultats des expériences de RT-PCR en temps réel suggèrent que les gènes leuABCD sont organisés en opéron, comme cela est le cas chez E. coli et chez de nombreuses autres bactéries de forme libre. Cependant, l'existence de la séquence intergénique de 61 pb entre leuA et leuB chez Buchnera, qui peut mettre en doute l'intégrité de cette unité de transcription, a motivé la réalisation d'une validation expérimentale de l'opéron leuABCD chez le symbiote, chose qui n'a jamais été réalisée auparavant. Une stratégie de RT-PCR adaptée à l'amplification de longs fragments a été mise au point afin de pouvoir amplifier l'amplicon localisé entre les nucléotides n°3736 et n°7432 de l'opéron putatif leuABCD (Figure 44). L'amplification a été réalisée à partir d'ARN totaux de Buchnera issue de pucerons élevés sur plantes (état basal). Le résultat de l'expérience montre l'existence d'un transcrit correspondant au produit d'expression des gènes leuABCD et par conséquent confirme l'organisation de ces derniers en opéron (Figure 46). L'absence de bande au niveau du puits de dépôt relatif au témoin négatif de l'étape de rétrotranscription confirme que ce résultat est bien propre au transcriptome de Buchnera et qu'il n'est pas dû à une contamination des ARNm par de l'ADNg de Buchnera.

José Viñuelas 156 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

leuABCD Inter2-leuA

1 2 3 4 5 6 7 8 9

10 kpb 4 kpb 3 kpb 3697 pb

1,5 kpb 1494 pb

1 : Marqueur 2 : TN PCR 3 : PCR 4 : TN RT-PCR 5 : RT-PCR 6 : TN PCR 7 : PCR 8 : TN RT-PCR 9 : RT-PCR

Figure 46. Confirmation expérimentale de l'existence du transcrit leuABCD et étude de la séquence intergénique en amont du gène leuA (Inter2-leuA). Pour chacune de ces deux études quatre produits de PCR ont été déposés sur un gel d'agarose à 1,5 % (m/v) : un témoin négatif de PCR (TN PCR) pour s'assurer de l'absence de contamination au niveau des amorces ; un témoin positif de PCR (PCR) réalisé à partir de 75 ng d'ADNg de Buchnera qui permet de vérifier la spécificité des amorces et éviter les faux négatifs ; un témoin négatif de rétrotranscription (TN RT-PCR) pour vérifier l'absence d'ADNg au niveau des ARN et ainsi éviter les faux positifs ; le produits de rétrotranscription amplifié (RT-PCR) mettant ou non en évidence la présence d'une séquence transcrite. Dans chacun des puits 5 µL de produit de PCR associé à 1 µl d'orange de dépôts ont été déposés. L'échelle de migration est donnée par un marqueur de poids moléculaires (Fermentas, Burlington, Canada) déposé dans le puits n°1.

Au cours de cette expérience, nous avons également recherché si l'importante Tige-Boucle localisée en amont du gène leuA était transcrite avec ce dernier. Pour cela, en plus des amorces "Reverses" spécifiques à une portion du gène leuA, deux autres amorces "Forwards" ont été définies, chacune spécifique d'une portion de la région intergénique entre repA2 et leuA (Figure 47).

José Viñuelas 157 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Amorce "Forward" couple Inter1-leuA

Amorce "Forward" couple Inter2-leuA

Figure 47. Représentation de la séquence intergénique entre repA2 et leuA dans le plasmide pLeu de Buchnera aphidicola. Cette image met en évidence l'importante structure de type Tige-Boucle de 97 pb en aval du gène repA2 et en amont du gène leuA. L'amorce "Forward" du couple d'amorces Inter1-leuA et celle du couple Inter2-leuA sont représentées respectivement en rouge et en vert.

Il est à noter que la recherche de ces couples d'amorces a été difficile à réaliser, et ceci malgré l'utilisation du logiciel "Oligo 6.6". En effet, le problème majeur a été la présence de structures secondaires de type Tige-Boucle et épingle à cheveux au sein de la majorité des couples d'amorces proposés par le logiciel. Après avoir choisi les deux meilleurs couples parmi ceux proposés, un test de PCR sur de l'ADNg de Buchnera a été réalisé pour chacun d'entre eux. Or, ce test n'a révélé aucune amplification pour le couple d'amorces "Inter1-leuA". Afin de résoudre ce problème, de nombreux essais d'optimisation des conditions de PCR ont été réalisés, notamment en modifiant la durée de l'étape initiale de dénaturation, en réalisant un gradient de température d'amplification, ou encore en modifiant la quantité d'enzyme dans le mélange réactionnel de la PCR. Malgré cela, aucune amplification sur l'ADNg n'a été obtenu pour le couple "Inter1-leuA". Ce résultat pourrait s'expliquer par l'impossibilité de dénaturer les amorces à la température d'amplification qui est de 45,5°C.

José Viñuelas 158 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Par opposition au couple "Inter1-leuA", une amplification sur de l'ADNg de Buchnera a été obtenue pour le couple "Inter2-leuA", et le résultat de la RT-PCR montre indiscutablement qu'une partie de la séquence intergénique entre repA2 et leuA est transcrite avec ce dernier gène (Figure 46).

2.6 Des études préliminaires chez un autre puceron

Dans la deuxième partie de cette étude nous nous sommes intéressés à un autre ravageur des cultures, le puceron Rhopalosiphum padi, qui est adapté à une plante hôte différente de celle d'A. pisum : le blé. L'intérêt d'étudier ce puceron est aussi lié au fait qu'il appartient à une autre tribu que le puceron du pois : les Aphidini (Figure 48). Enfin, l'étude de ce puceron, et notamment lorsqu'il est soumis à un stress en leucine, est motivée par l'existence sur le plasmide pLeu de Buchnera Rp d'une séquence codant un peptide "leader" de 31 acides aminés comprenant 9 leucines adjacentes issues de codons rares chez Buchnera (Bracho et al., 1994). Cette séquence, qui n'est pas présente sur le plasmide pLeu de Buchnera Ap, est localisée en amont du gène repA2. Bracho et collaborateurs suggèrent que cette séquence puisse jouer un rôle en tant qu'atténuateur de la transcription de repA2 et, indirectement, dans la réplication du plasmide pLeu en fonction de la concentration de leucine disponible (Bracho et al., 1994). L'objectif de notre étude a donc été de savoir si ce puceron s'adaptait d'une manière différente ou non, par rapport à A. pisum, à des stress en leucine.

José Viñuelas 159 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

A. pisum

1 mm R. padi

Figure 48. Photographie de pucerons adultes de l'espèce Acyrthosiphon pisum et Rhopalosiphum padi.

2.6.1 Les premières études sur Rhopalosiphum padi

La néosynthèse de leucine a été quantifiée chez Buchnera de R. padi de la même façon que pour A. pisum (cf. Matériels et Méthodes § 3.2). Chez le puceron R. padi la concentration en leucine à l'état basal est proche de celle d'A. pisum, ce qui permet à nouveau de considérer la condition leu20mM comme référence du plan expérimental.

José Viñuelas 160 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

30 2 RR2=0.970=0,970 A 25

20 leu0mM R2=0.746=0,746 leu20mM 15 leu40mM B leu60mM B.C B B B 10 leu80mM A A C A.B A A C A A 5 unité unité de poids mg) (en de frais pucerons Equivalent en saccharose (en nmoles) (en par Equivalent en saccharose 0 Isoleucine Leucine Valine Acides aminés néosynthétisés

Figure 49. Néosynthèse des acides aminés branchés par Buchnera chez Rhopalosiphum padi à partir de saccharose et en fonction de la concentration de leucine présente dans le milieu nutritionnel. Les données (moyenne et erreur standard) sont exprimées en équivalent en saccharose (en nmoles) par unité de poids frais de pucerons (en mg). Pour chacun des acides aminés les conditions présentant des néosynthèses significativement différentes, révélées par un test de Tukey-Kramer HSD avec un intervalle de confiance de 95%, sont indiquées avec des lettres différentes. Le coefficient de l'ANOVA (R2) est indiqué.

Si l'on compare la Figure 49 à la Figure 41, on remarque que des profils de néosynthèse similaires sont retrouvés dans les deux espèces de pucerons. En effet, on observe chez Buchnera issue du puceron du blé, en l'absence totale de leucine, une augmentation de la néosynthèse de cet acide aminé de 112% par rapport à la condition de référence leu20mM (Test de Tukey-Kramer HSD, P-value < 0,05). De même que chez A. pisum lorsque le milieu nutritionnel contient une quantité de leucine supérieure à 20 mM, la bactérie réduit en moyenne sa production de leucine de 35% (Test de Tukey-Kramer HSD, P-value < 0,05). Concernant la néosynthèse de valine, on constate, comme pour Buchnera Ap, une diminution de la production de cet acide aminé qui semble être corrélée avec l'intensité de la carence en leucine. En d'autres termes, moins il y a de leucine disponible dans le milieu et moins il y a de valine néosynthétisée par le symbiote. Enfin, aucune différence significative dans la néosynthèse d'isoleucine n'est détectée en fonction de la concentration en leucine dans le milieu nutritionnel du puceron.

José Viñuelas 161 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

2.6.2 Comparaison du nombre de copies de plasmide pLeu à l'état naturel entre Buchnera Ap et Buchnera Rp

Le ratio entre le nombre de plasmides pLeu et le nombre de chromosomes varie chez Buchnera issue de différentes espèces de pucerons. Ainsi, la deuxième question que nous nous sommes donc posée a été de savoir si le nombre de plasmide pLeu à l'état basal était différent entre les Buchnera issues de ces deux espèces de pucerons, sachant qu'à l'heure actuelle la détermination du nombre de plasmides pLeu n'a pas encore été réalisée chez R. padi.

100 R2=0,997

10

1 par par copie de chromosome Nombre Nombre de copies de pLeu

0,1 Acyrthosiphon pisum Rhopalosiphum padi Espèce de puceron

Figure 50. Comparaison du nombre moyen de copies de plasmide pLeu par chromosome chez Buchnera aphidicola issue des pucerons Acyrthosiphon pisum et Rhopalosiphum padi à l'état basal. Les deux pucerons ont été élevés 7 jours respectivement sur un plant de fève pour A. pisum et un plant de blé pour R. padi. Pour chacune des deux valeurs moyennes, l'erreur standard est représentée par une barre. Le coefficient de l'ANOVA (R2) est indiqué.

La Figure 50 présente le nombre de copies de plasmide pLeu à l'état basal (pucerons élevés sur leur plante hôte respective) par unité de chromosome chez Buchnera issue des pucerons A. pisum et R. padi. Ces résultats sont issus d'une moyenne du nombre de copies de pLeu mesuré à partir de trois gènes plasmidiques et normalisé par rapport à un gène

José Viñuelas 162 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

chromosomique (cf. Matériels et Méthodes § 3.3.5). Nous pouvons ainsi remarquer l'importante différence entre ces deux pucerons dans la quantité de plasmide pLeu à l'état naturel. En effet, on retrouve environ 0,3 copies de plasmide pLeu par chromosome chez le symbiote d'A. pisum, alors que chez le symbiote de R. padi le ratio nombre de copies de pLeu par unité de chromosome est d'environ 58 (ANOVA F-test, R2=0,997, P-value < 10-4). Sur la base de ces résultats, nous nous sommes demandé si, chez Buchnera issue du puceron du blé, la régulation du plasmide pLeu se faisait de la même manière que chez le symbiote du puceron du pois en réponse à un stress en leucine.

2.6.3 Réplication du plasmide pLeu après 7 jours de stress en leucine

Pour répondre à cette question, nous avons analysé l'effet d'une carence et d'un excès de leucine sur la variation du nombre de copies de plasmide pLeu par unité de chromosome chez le symbiote du puceron du blé. Contrairement à l'expérience réalisée chez le puceron du pois, l'expérience n'a pas pu être conduite en cinétique et seule la condition J7 a pu être testée à cause de la petite taille de R. padi. En effet, malgré de nombreux essais, la taille de ce puceron et par conséquent le nombre d'insectes nécessaire pour obtenir une quantité d'acides nucléiques suffisante était trop importante pour la réalisation de chacune des modalités de la cinétique de stress. Dans cette expérience, les pucerons ont donc été élevés 6 heures sur plantes puis déposés 7 jours sur des milieux artificiels contenant 0 mM, 20 mM ou 60 mM de leucine. La détermination du nombre de copies de plasmide pLeu par unité de chromosome a été réalisée selon la même procédure que celle utilisée dans le paragraphe précédent.

José Viñuelas 163 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

90

80

70

60

50

40

30

20 par par copie de chromosome Nombre Nombre de copies de pLeu

10

0 leu0mM leu20mM leu60mM Traitement

Figure 51. Comparaison du nombre moyen de copies de plasmide pLeu par chromosome chez Buchnera aphidicola lorsque le puceron Rhopalosiphum padi est élevé sur un milieu totalement carencé en leucine (leu0mM), sur un milieu de référence (leu20mM) ou sur un milieu présentant un excès de leucine (leu60mM). Pour chacune des valeurs moyennes, l'erreur standard est représentée par une barre.

Bien que les résultats présentent une tendance cohérente avec les stress induits (augmentation du nombre de pLeu pour le milieu leu0mM et diminution du nombre pour le milieu leu60mM) (Figure 51), aucune de ces variations n'est statistiquement significative. Ce résultat avait également été observé chez Buchnera Ap après 7 jours de stress (cf. Résultats § 2.4.1).

2.7 Discussion sur les résultats de l'étude

Depuis la découverte du plasmide pLeu chez Buchnera associée au puceron Rhopalosiphum padi en 1994, la fonction de cette composante du génome de la bactérie, portant l'ensemble des gènes spécifiques de la voie de biosynthèse de la leucine, reste encore mal comprise. Ce plasmide a fait l'objet de nombreuses études qui ont consisté à le caractériser génétiquement (Silva et al., 1998; Baumann et al., 1999a; Soler et al., 2000), à le quantifier chez des symbiotes issus de différents pucerons (Thao et al., 1998; Moran et al., 2003b; Plague et al., 2003) ou encore à étudier son histoire évolutive (Silva et al., 1998; Sabater Munoz et al., 2002; Latorre et al., 2005; Gil et al., 2006). Cependant, à notre connaissance, il

José Viñuelas 164 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

n'existe à ce jour aucune étude décrivant précisément la fonction du plasmide pLeu dans le contexte symbiotique et aucune des théories évoquées dans la littérature n'a été confirmée expérimentalement.

C'est pourquoi nous avons essayé, dans notre unité, de mettre en évidence (i) les effets de variations de la concentration alimentaire en leucine chez le puceron ainsi que (ii) les mécanismes mis en jeu en réponse à ces stress par la bactérie Buchnera. Concernant la réaction du puceron, des études comportementales nous ont permis de caractériser les effets de la leucine vis-à-vis de l'appétence du puceron pour son milieu nutritionnel, et vis-à-vis du taux de croissance de l'insecte. Ces études ont montré que, d'une manière générale, le puceron est d'autant plus attiré par le milieu nutritionnel que celui-ci est riche en leucine. Plus précisément, en comparaison au milieu de référence contenant une concentration dite "physiologique" (20 mM) de leucine, le puceron préfère ce milieu à des milieux contenant une concentration inférieure en cet acide aminé, alors que l'inverse se produit pour des concentrations supérieures à 40 mM où le puceron montre une attirance plus importante par rapport au milieu de contrôle. En conclusion, les résultats montrent clairement une attirance très significative de l'insecte pour un régime alimentaire riche en leucine et par conséquent, mettent en évidence l'importante demande alimentaire du puceron en cet acide aminé. Bien que ces résultats montrent l'importance de la leucine pour l'alimentation du puceron, il nous a semblé indispensable d'évaluer l'influence de la variation de la concentration en cet acide aminé sur la physiologie et, plus précisément, sur la croissance de l'insecte. Pour cela, le taux de croissance du puceron a été quantifié en fonction de différentes quantités de leucine présentes dans le régime alimentaire de l'insecte, puis comparé par rapport au milieu de référence. Les résultats ont montré une augmentation de 20% et une diminution de 20% du taux de croissance, par rapport au milieu de contrôle, respectivement pour des milieux ayant une concentration en leucine supérieure à 20 mM et inférieure à 10 mM. Ces résultats démontrent, dans un premier temps, qu'en plus d'être attiré par une alimentation riche en leucine, le puceron se nourrit de celle-ci. Mais le résultat le plus important de cette expérience est le fait qu'un excès ou une carence alimentaire en leucine ont une influence directe sur la croissance de l'insecte. Les résultats de ces deux expériences confirment et précisent une précédente étude de Srivastava et Auclair (1975) sur le rôle individuel de neuf acides aminés essentiels sur la phagostimulation, la croissance et la survie du puceron du pois. En effet, les auteurs ont mis en évidence le

José Viñuelas 165 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

caractère phagostimulant de la leucine, l'augmentation de la prise alimentaire et de la croissance du puceron lorsque son alimentation est enrichie en cet acide aminé, ainsi que le rôle bénéfique de la leucine dans l'augmentation de la durée de vie du puceron suite à son ingestion. D'après ces résultats et en comparaison aux autres acides aminés, Srivastava et Auclair ont qualifié la leucine (tout comme l'homosérine et la valine) de phagostimulant et d'élément nutritif pour le puceron. Une étude assez semblable, mais menée chez la cochenille Phenacoccus herreni, montre un ralentissement du développement ainsi qu'une diminution du poids de l'insecte, lorsque ce dernier est élevé sur un milieu carencé en leucine, sans pour autant observer une modification de la prise alimentaire de la cochenille. Les auteurs conclurent que la principale fonction de la leucine est de type nutritif chez P. herreni (Calatayud et al., 2002). On sait également, chez la sauterelle mormone, que la leucine est un constituant protéique de l'exuvie et de certaines parties de l'exosquelette de l'insecte (Johnson et al., 1952; DeHaas et al., 1957). Cette fonction capitale de la leucine pour le puceron est également confirmée d'un point de vue métabolique dans l'étude de Srivastava et Auclair, où les auteurs, grâce à de la leucine radiomarquée, mettent en évidence l'incorporation de cet acide aminé dans des fractions protéiques de l'exuvie et du corps des larves. Les résultats obtenus suggèrent également un bon turnover protéique : la leucine étant captée par le système puis métabolisée (Srivastava et Auclair, 1975). L'ensemble de ces résultats souligne le rôle important de la leucine dans la croissance et le développement du puceron, et par conséquent, le rôle déterminant de Buchnera dans la biosynthèse et la fourniture de cet acide aminée insuffisamment présent dans la sève phloémienne.

La seconde étude qui a été menée dans notre unité a consisté à savoir si les stress nutritionnels en leucine imposés au puceron étaient perçus par Buchnera et, auquel cas, si la bactérie était capable de répondre d'un point de vue métabolique aux demandes du puceron en cet acide aminé suite aux stress. Un radiotraçage réalisé à partir du saccharose, le précurseur naturel de la leucine, a mis en évidence de façon très significative qu'en réponse à une variation de la concentration alimentaire en leucine du puceron, Buchnera est capable de moduler sa biosynthèse de leucine. De plus, les résultats montrent également que plus la carence en leucine est élevée et plus Buchnera synthétise cet acide aminé, et ceci jusqu'à atteindre, dans le cas d'une carence totale, une augmentation de la biosynthèse d'environ 200% par rapport à la condition physiologique

José Viñuelas 166 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

(20 mM de leucine), ce qui suggère que la bactérie perçoit de manière fine l'intensité du stress en leucine imposé à son hôte. C'est en 1999 que Febvay et collaborateurs ont mis en évidence pour la première fois la néosynthèse de la leucine ainsi que de la phénylalanine et de la valine à partir de saccharose chez le puceron A. pisum, et ceci en comparant le profil des acides aminés de pucerons élevés sur un milieu artificiel de composition proche de celui de la sève phloémienne par rapport à celui obtenu pour des pucerons élevés sur un milieu équilibré (cf. Synthèse Bibliographique § 3.3.3). Le puceron ne pouvant synthétiser les acides aminés essentiels, l'intervention de Buchnera dans leur synthèse et notamment dans celle de la leucine a ainsi pu être démontrée (Febvay et al., 1999). Les résultats métaboliques de notre étude confirment la néosynthèse de la leucine par Buchnera mais montrent également que la bactérie est capable de répondre spécifiquement à un stress en cet acide aminé et de manière proportionnelle à l'intensité de celui-ci. De plus, une étude réalisée par Douglas et collaborateurs sur le puceron Aphis fabae, et plus précisément sur les protéines de croissance, montre que la leucine est un acide aminé ayant un rôle clé dans la synthèse protéique chez le puceron. Dans leur étude, les auteurs mettent également en évidence que cet acide aminé est celui pour lequel l'apport de Buchnera est le plus important pour la synthèse protéique (Douglas et al., 2001), ce qui souligne à nouveau l'importance de la leucine pour la croissance et le développement du puceron. La leucine étant un acide aminé de type branché, tout comme l'isoleucine et la valine, nous avons voulu quantifier, de la même façon que pour la leucine, la néosynthèse de ces deux acides aminés lors des stress en leucine imposés au puceron, et ceci afin d'avoir une vision globale de l'effet de ces derniers sur la super-voie de biosynthèse des acides aminés branchés. Les différents radiotraçages ont révélé une tendance inversée de la biosynthèse de valine par rapport à la leucine et aucun effet sur celle de l'isoleucine. En d'autres mots, alors que la néosynthèse de leucine augmente en fonction de l'intensité de la carence en cet acide aminé, celle de la valine diminue. Etant donné l'organisation des voies de biosynthèse de ces deux acides aminés, ce résultat suggère qu'une certaine quantité de 2-céto- isovalérate localisé au carrefour des deux voies de biosynthèse et, initialement destiné à la synthèse de la valine, pourrait être détournée au profit de la synthèse de la leucine et au dépend de la synthèse de valine (Figure 40).

José Viñuelas 167 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Sur la base de ces résultats, nous nous sommes posé la question des mécanismes moléculaires mis en jeu par Buchnera dans la biosynthèse de la leucine, lors des stress en cet acide aminé imposés au puceron. Pour cela nous avons, dans premier temps, quantifié la variation du taux de réplication du plasmide pLeu portant les gènes de biosynthèse de la leucine en réponse à ces stress. Cependant, bien que les résultats métaboliques présentés ci-dessus aient été obtenus après 7 jours de stress, nous avons, en plus de cette modalité, quantifié l'éventuelle amplification du plasmide selon une cinétique de stress comportant 5 modalités allant de 12 heures à 7 jours de stress, ceci lors d'une carence totale en leucine (0 mM) et lors d'un excès en cet acide aminé (60 mM), par rapport à la condition de référence (20 mM). Or, ces différents temps de stress correspondent à différentes phases du développement larvaire du puceron. Ainsi, il nous paraît important de préciser que la manière avec laquelle nous avons déterminé le nombre de copies de plasmide pLeu au sein de chaque temps de cinétique (comparaison des conditions leu0mM et leu60mM avec la condition de référence leu20mM) nous a permis d'obtenir des mesures qui sont indépendantes d'une éventuelle variation de la polyploïdie chromosomique de Buchnera. En effet, bien que cette variation n'ait jamais été mise en évidence pour des pucerons au même stade de développement que ceux utilisés dans notre étude, une variation du nombre de copies du chromosome de Buchnera en fonction de l'âge des pucerons a été montrée par Komaki et collaborateurs (Komaki et Ishikawa, 2000) (cf. Synthèse Bibliographique § 2.2.2). Les résultats obtenus montrent, dans le cas d'une carence en leucine, une augmentation du nombre de copies du plasmide qui apparaît après 2 et 3 jours de stress, alors qu'aucune réponse n'apparaît après 7 jours de stress. Ce profil d'induction montre tout d'abord que, suite à une carence assez prolongée en leucine, Buchnera est capable de mettre en place une réponse visant à accentuer l'amplification du plasmide pLeu dont l'objectif est probablement d'augmenter la biosynthèse de la leucine. Dans le cas d'un excès en leucine, la réponse de Buchnera via la réplication du plasmide est beaucoup moins perceptible. En effet, seule une diminution significative du nombre de copies de pLeu est observée après 2 jours de stress. Ce résultat montre que les mécanismes régulant le nombre de copies du plasmide pLeu chez Buchnera sont moins sollicités lors d'un excès de leucine que lors d'une carence en cet acide aminé. Les variations dans le taux de réplication de plasmides en réponse à des stress environnementaux tels que des carences en acides aminés sont des phénomènes couramment décrits dans le monde bactérien (Wegrzyn, 1999; Wegrzyn et Wegrzyn, 2002) et de nombreuses études ont eu pour objectif d'élucider les mécanismes et la

José Viñuelas 168 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

chronologie des événements mis en jeu pour contrôler le taux de réplication de plasmides en réponse à ces stress. On peut citer par exemple le cas d'expériences de déplétion en arginine, isoleucine, histidine, leucine, ou encore thréonine réalisées chez E. coli, dans lesquelles des réponses en termes de variation de réplication des plasmides pSC101 ou λ sont observées et mesurées dans un délai compris entre 2 et 24 heures après le début du stress (Wrobel et Wegrzyn, 1997a; Wrobel et Wegrzyn, 1997b). Or, dans notre étude, que ce soit lors d'une déplétion totale en leucine ou lors d'un excès, on notera que la réponse maximale de Buchnera concernant la réplication de pLeu n'apparaît qu'au bout de 2 jours de stress. Une explication à cela pourrait être que l'effet du stress imposé soit dans les premières heures tamponnées par le puceron (Reymond et al., 2006). Une autre explication serait que l'amplification du plasmide pLeu en réponse à des stress en leucine soit un mécanisme mis en jeu dans le cadre d'une réponse tardive de Buchnera à ces derniers.

Les résultats obtenus dans cette étude montrent que la réponse à un stress en leucine peut se faire chez Buchnera via la régulation de son plasmide. Concernant la compréhension des mécanismes régulant la réplication du plasmide pLeu, un rapprochement peut être fait avec le fonctionnement des plasmides pSC101 de S. typhimurium et pKL1 d'E. coli (Figure 52).

tetR tetA

gène 1

pSC101 Salmonella typhimurium pKL1 Escherichia coli repA 9263 bp 1549 bp

mobX

repA mobA

Figure 52. Cartographie du plasmide pSC101 de Salmonella typhimurium et du plasmide pKL1 d'Escherichia coli. Seules les séquences codantes sont indiquées sur la figure.

José Viñuelas 169 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Découvert chez S. typhimurium, mais également présent chez E. coli (Hasunuma et Sekiguchi, 1977) pSC101 est un plasmide de taille égale à 9,2 kpb (Bernardi et Bernardi, 1984) et dont le mécanisme de réplication est sous la dépendance de la protéine RepA, de DnaA (Hasunuma et Sekiguchi, 1977; Frey et al., 1979) et du facteur IHF (Gamas et al., 1986; Stenzel et al., 1987). Ces trois protéines peuvent être toutes synthétisées par Buchnera Ap, RepA étant codée par les gènes repA1 et repA2 localisés sur pLeu. Les premières études relatives à l'amplification de ce plasmide suite à des déplétions en acides aminés ont montré que le taux de réplication du plasmide dépendait de la nature de l'acide aminé testé (Herman et al., 1994). En 1997, Wrobel et Wegrzyn ont montré pour plusieurs acides aminés dont la leucine, une augmentation de l'amplification du plasmide pSC101 lors d'une déplétion en ces composés chez E. coli. Au cours de ces expériences, le coefficient moyen d'amplification de pSC101 était de 4,1 ± 2,4 (Wrobel et Wegrzyn, 1997a). Or, on sait que l'initiation de la réplication du plasmide pSC101 est sous la dépendance du nombre de protéines RepA présentes, mais également que la transcription du gène repA est autorégulé par la protéine RepA elle-même (Furuno et al., 2000). Plus précisément RepA peut se fixer sous forme de monomères au niveau de trois séquences répétées de type itérons (RS1, RS2 et RS3) (Helinski et al., 1996; del Solar et al., 1998), situées à l'origine de réplication du plasmide pSC101, afin d'initier la réplication de ce dernier, mais également sous forme de dimères au niveau de deux séquences répétées inversées (IR1 et IR2) de la région promotrice du gène repA afin de réprimer la transcription de celui-ci (Manen et al., 1992). De plus, la formation d'un complexe entre RepA, IHF et DnaA est requise pour l'initiation de la réplication de pSC101 (Stenzel et al., 1991). Le juste équilibre entre les monomères et les dimères de RepA possède un rôle clé dans la régulation de la réplication de ce plasmide (Ingmer et al., 1995). Dans notre expérience de stress en leucine menée chez Buchnera, la mesure des niveaux d'expression de repA1 et de repA2 révèle une sur- expression de ces deux gènes lors d'une carence en leucine et une sous- expression globale lors d'un excès en leucine. Il faut préciser aussi que dans le cas de la déplétion en leucine les profils de sur-expression de ces deux gènes semblent être décalés dans le temps. Sur la base des résultats observés au niveau de l'augmentation du nombre de copies de plasmide pLeu en réponse à une carence en leucine, et étant donné l'existence de cette sur-expression des gènes repA chez Buchnera en réponse à ce même stress, il est très probable que l'amplification de pLeu, suite à une variation de la concentration en leucine, soit sous la dépendance de l'expression des gènes repA chez le symbiote. Afin de conforter cette hypothèse, nous avons recherché les séquences de régulation impliquées dans le mécanisme de

José Viñuelas 170 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

réplication de pSC101 dans le plasmide pLeu de Buchnera. Malgré l'identification de plusieurs sites potentiels de fixation du facteur IHF (Figure 44), des séquences de type RS1/RS2/RS3 ou encore IR1/IR2 n'ont pas pu être identifiées, probablement en raison du fort biais mutationnel en base A et T du génome de Buchnera. Une recherche bioinformatique plus approfondie, avec des outils plus adaptés à ce type de génome, serait indispensable avant de tirer des conclusions sur les mécanismes de régulation de l'amplification du plasmide pLeu. Il est à noter qu'à l'heure actuelle la raison de la conservation de deux copies du gène repA sur le plasmide pLeu de Buchnera n'est pas encore connue. Une hypothèse serait que cela puisse être un moyen de synthétiser une première protéine RepA (RepA1) dont le rôle est d'initier la réplication du plasmide, et une seconde (RepA2) dont la fonction pourrait être la régulation de la réplication, comme le suggèrent Perez-Brocal et collaborateurs dans leur annotation du génome du symbiote de Cinara cedri (Perez-Brocal et al., 2006). Le mécanisme de régulation du plasmide pLeu de Buchnera pourrait également être apparenté à un second plasmide : le plasmide pKL1. Ce plasmide, dont la taille est de 1549 pb, retrouvé dans des souches d'Escherichia coli issues de milieu hospitalier, est stable, de type réplication polA-indépendant et code une unique protéine qui est RepA. Burian et collaborateurs suggèrent que la persistance de ce plasmide dans la souche bactérienne serait due à son efficacité de réplication ainsi qu'à sa stabilité peu communes (Burian et al., 1997). Une étude sur ce plasmide, dit cryptique, menée par ces mêmes auteurs, montre que ce dernier ne possède pas de régions de régulation de type itérons à l'origine de réplication, ni de sites de fixation pour la protéine DnaA. Le mécanisme de réplication, assez proche de celui de pSC101, mais unique en son genre, fait appel aux protéines RepA et IHF, ainsi qu'à des séquences riches en base A et T et/ou pouvant former des structures secondaires de type Tige- boucle. Burian et collaborateurs qualifient ce mécanisme, basé essentiellement autour du rôle multiple de RepA (initiateur et répresseur de l'amplification), de "stratégie réplicative économique" (Burian et al., 1999). Etant donné l'importante réduction du génome de Buchnera et la perte de nombreux éléments de régulation génétique, on ne peut pas exclure qu'un mécanisme "de réplication économique" de ce type puisse être utilisé pour la régulation du plasmide pLeu à l'état basal et en fonction des ressources nutritives disponibles en leucine. Une analyse détaillée du rôle de la protéine RepA chez Buchnera serait par conséquent indispensable à la compréhension des mécanismes de réplication de pLeu du symbiote, et pourra faire l'objet d'une prochaine étude dans notre unité.

José Viñuelas 171 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Dans un deuxième temps, nous nous sommes posé la question de l'existence d'une réponse transcriptionnelle de la bactérie à des stress en leucine imposés au puceron. Pour répondre à cette question, nous avons quantifié, pour les mêmes conditions expérimentales que celles utilisées pour l'étude de la réplication du plasmide, le niveau des transcrits de chacun des gènes du plasmide pLeu (leuABCD, repA1, repA2 et yqhA) ainsi que de certains gènes chromosomiques relatifs à la super-voie de biosynthèse des acides aminés branchés (ilvIH) ou au métabolisme de la leucine (leuS). D'un point de vue global, nos résultats montrent l'existence d'une réponse transcriptionnelle significative et cohérente avec la nature du stress en leucine imposé. En effet, lors d'une carence en leucine, les gènes impliqués dans sa biosynthèse (ilvIH, leuABCD) sont sur-exprimés et, inversement, ils sont réprimés en présence d'un excès de leucine. Plus précisément, dans le cas d'une carence en leucine la réponse transcriptionnelle de ces gènes apparaît dès 12 heures de stress et semble être la plus intense après un jour. L'intensité de cette sur-expression diminue ensuite à partir de 2 jours de stress, à l'exception du gène leuA pour lequel elle perdure un jour de plus, pour devenir non significative après 7 jours. Dans le cas d'un excès en leucine la réponse semble encore plus précoce puisqu'elle apparaît dès 12 heures et présente un maximum de répression pour ce même temps de stress. Comme dans le cas de la carence, l'intensité de la réponse diminue au cours du temps et notamment à partir d'un jour de stress pour devenir non significative après 7 jours. Cette dernière observation prend toute son importance si on la compare aux précédentes études de transcriptomique réalisées dans notre unité (Reymond et al., 2006). Dans ces dernières, le transcriptome de Buchnera était analysé après 7 jours de stress et, globalement, aucune réponse transcriptionnelle spécifique aux stress en acides aminés imposés n'avait été observée. Les résultats obtenus dans cette thèse suggèrent qu'un temps de stress nutritionnel de 7 jours n'est peut être pas adapté pour mesurer la réponse transcriptionnelle de Buchnera à ces types de stress. Il serait alors pertinent de répéter ces expériences d'analyse du transcriptome pour des temps de traitement plus courts. Ce type d'approche serait également justifié par les études de stress nutritionnel menées chez d'autres bactéries, qui montrent que l'induction des gènes de biosynthèse du tryptophane sont induits seulement 5 minutes après le début d'une carence en cet acide aminé (Khodursky et al., 2000). La variation du niveau des transcrits ilvIH, indique que la régulation transcriptionnelle de Buchnera, suite aux stress en leucine, ne s'effectue pas seulement sur les gènes plasmidiques spécifiques aux dernières étapes de biosynthèse de la leucine, mais également sur des gènes

José Viñuelas 172 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

chromosomiques impliqués dans les premières étapes de la super-voie de biosynthèse des acides aminés branchés. Lorsque l'on compare les profils transcriptomiques des gènes leuABCD dans le cas d'une carence en leucine, il semble que la sur- expression du gène leuA perdure à son maximum un jour de plus par rapport aux trois autres gènes de l'opéron. Or, la 2-isopropylmalate synthétase codée par le gène leuA agit au carrefour des voies de biosynthèse de la leucine et de la valine (Figure 40) pour transformer le 2- céto-isovalérate en 2-isopropylmalate. Dans le cadre d'une carence en leucine, une activité accrue de cette enzyme, issue d'une sur-expression de leuA pourrait détourner une partie de 2-céto-isovalérate destiné à la biosynthèse de la valine au profit de la biosynthèse de la leucine, ce qui expliquerait la tendance inversée de la néosynthèse de ces deux acides aminés par Buchnera lors d'une carence croissante en leucine (cf. Résultats § 2.3). Enfin, nous sommes en mesure de dire que Buchnera perçoit le stress en leucine dès les 12 première heures, ce qui, associé à la réponse un peu plus tardive observée d'un point de vue de la réplication du plasmide, montre que la réponse transcriptionnelle de Buchnera précède une réponse de type réplication plasmidique lors de stress en leucine. La réplication du plasmide pourrait ainsi être un moyen mis en œuvre par Buchnera, lorsque le stress en leucine se prolonge, pour complémenter et renforcer la réponse transcriptionnelle précoce. A ce propos, il est à remarquer que pour Moran et collaborateurs, de part l'absence de multiples origines de réplication sur le plasmide pLeu, la régulation de son taux de réplication ne semble pas être le meilleur mécanisme pour répondre de manière rapide à une variation des besoins du puceron en leucine (Moran et al., 2003b). Indépendamment des gènes de biosynthèse des acides aminés branchés, nous avons également mesuré le niveau d'expression du gène leuS codant l'aminoacyl-ARNt synthétase relative à la leucine chez Buchnera. Les résultats obtenus révèlent globalement une sur-expression de ce gène dans le cas d'une déplétion en leucine. En présence d'un excès de leucine on a mis en évidence une sous-expression du gène qui n'excède pas une durée d'un jour et qui précède une très légère sur-expression lorsque le stress se poursuit dans le temps. La sur-expression de leuS observée lors d'un déficit en leucine favoriserait indirectement l'incorporation dans les protéines de la bactérie des faibles quantités de leucine présentes et/ou de la leucine nouvellement synthétisée par Buchnera. Inversement, lors d'un excès en cet acide aminé, l'incorporation protéique pourrait être limitée, via une sous-expression de leuS, au profit de leucine à l'état libre, potentiellement transportable vers l'hôte. Cependant, afin de maintenir la

José Viñuelas 173 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

viabilité de la cellule bactérienne, nous supposons que cette limitation d'incorporation ne pourrait être maintenue de manière constante plus de 24 heures, ce qui expliquerait le point d'inflexion observé dans le profil d'expression de leuS après un jour d'excès en leucine. Bien entendu, l'ensemble de ces interprétations ne sont que des hypothèses. Des travaux complémentaires sont nécessaires afin de confirmer ou infirmer cette explication possible. Enfin, parmi les gènes testés, le gène yqhA localisé sur le plasmide pLeu présente des réponses relativement intenses suite aux stress en leucine imposés au puceron. Lors d'une carence en leucine, yqhA connaît une sur- expression dès 12 heures de stress dont le maximum d'intensité est atteint 2 jours après le début de l'expérience. Cette sur-expression est également observée lors d'un excès en leucine, même si elle n'apparaît qu'après 2 jours de stress. A l'heure actuelle, peu de données sont disponibles dans la littérature sur la fonction de YqhA et les quelques rares informations disponibles sont essentiellement issues d'études menées sur Bacillus subtilis, chez qui cette hypothétique protéine membranaire jouerait un rôle dans la voie de signalisation des stress environnementaux (thermique, à l'éthanol, osmotique, acide, hydrique) et énergétiques (déplétion en glucose ou phosphates). Plus précisément, YqhA agirait comme répresseur du facteur de transcription σB (Akbar et al., 2001) qui intervient dans l'activation de la transcription de plus de 150 gènes (régulon de stress global) ayant un rôle dans la réponse à ces stress (Volker et al., 1999; Hecker et Volker, 2001). Kim et collaborateurs ont montré que, en association avec de nombreuses autres protéines impliquées dans la perception et la transmission de stress environnementaux et énergétiques, YqhA ferrait partie d'un complexe appelé "stressosome" dont le rôle est capital dans la perception et la transmission de ces stress chez B. subtilis (Kim et al., 2004b). Le mécanisme de fonctionnement d'un tel complexe n'est pas encore élucidé, cependant il ferait appel à des mécanismes de phosphorylation touchant diverses protéines du complexe pour la transmission du signal de stress et l'activation de σB (Kim et al., 2004a; 2004b). Le complexe "stressosome" est retrouvé chez diverses espèces bactériennes parmi lesquelles les γ-protéobactéries, même si bon nombre d'entre elles ne possèdent pas la sous unité σB de l'ARN polymérase (Pane- Farre et al., 2005) comme par exemple Buchnera aphidicola. Etant donnée l'intense réponse transcriptionnelle de yqhA observée, aussi bien lors d'une carence que lors d'un excès en leucine, associée à la conservation de yqhA sur plusieurs plasmides pLeu de Buchnera au cours du temps (Figure 36), il se pourrait que ce gène soit essentiel pour le couple symbiotique Buchnera / puceron (Latorre et al., 2005). La protéine membranaire

José Viñuelas 174 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

putative codée par ce gène pourrait jouer un rôle important dans la perception et la réponse au stress en leucine chez Buchnera et plus globalement en relation avec le rôle symbiotique de cette bactérie, même si des études récentes confirment le fait qu'YqhA n'agit pas seule au sein du "stressosome" (Delumeau et al., 2006; Reeves et Haldenwang, 2007). L'indentification des partenaires possibles d'YqhA chez Buchnera nous apporterait plus de précision sur l'action de cette protéine chez le symbiote du puceron.

Indépendamment des mécanismes liés à l'amplification du plasmide, nous avons recherché des éléments pouvant intervenir dans la régulation transcriptionnelle des gènes de biosynthèse de la leucine. Notre analyse bioinformatique a mis en évidence des promoteurs putatifs le long du chromosome et notamment en amont de l'opéron leuABCD, mais également en amont de leuB. Or, la régulation du transcrit leuA semble différer légèrement de celle des autres gènes de l'opéron lors d'une carence en leucine. En effet, après 2 jours de stress le différentiel d'expression de leuA continue à augmenter alors que pour le reste de l'opéron il tend à diminuer. Cette différence dans les profils d'expression pourrait s'expliquer par l'existence d'un promoteur interne pouvant réguler, dans certaines conditions, leuBCD indépendamment de leuA. Cette hypothèse est également confortée par l'existence d'une séquence intergénique de 61 pb entre leuA et leuB, absente chez E. coli et entre les autres gènes de l'opéron, ainsi que d'une structure de type Tige-Boucle juste en amont de leuB, qui pourraient intervenir en tant qu'éléments régulateurs dans la transcription de leuBCD. D'autres promoteurs putatifs ont également été identifiés en amont des gènes repA1, repA2 et yqhA. Néanmoins, étant donné la difficulté d'identification des séquences promotrices chez Buchnera, due à l'important biais en base A et T de son génome et notamment au niveau des séquences intergéniques, les éléments décrits ici doivent être considérés avec précaution. De plus, bien que ces éléments promoteurs aient été mis en évidence, les régulateurs agissant sur ces séquences, et connus chez d'autres bactéries, ne sont pas présents dans le génome de Buchnera aphidicola. Chez E. coli et S. typhimurium l'expression de l'opéron leuABCD est sous le contrôle d'un mécanisme complexe de type promoteur relais ("promoter relay mechanism"), faisant intervenir le ppGpp (guanosine 3',5'-bispyrophosphate) synthétisé via l'enzyme codée par le gène relA (Fang et al., 2000), le facteur Lrp (leucine-responsive regulatory protein) (Jafri et al., 2002; Chen et al., 2005b), l'opéron ilvIH, le régulateur transcriptionnel LeuO (Majumder et al., 2001; Chen et al., 2003), et l'opéron leuABCD (Fang et Wu, 1998). La présence de certaines régions

José Viñuelas 175 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

riches en bases A et T entre les deux opérons (Chen et al., 2001) ainsi que l'existence de super-enroulements de l'ADN (Chen et Wu, 2003; Wu et Fang, 2003; Chen et al., 2005a; Chen et Wu, 2005) semblent également jouer un rôle dans les étapes de ce mécanisme relais. Pour le résumer de manière très succincte, lors d'une carence en acides aminés branchés, le taux de ppGpp augmente dans la cellule bactérienne ainsi que celui du facteur Lrp, ce qui va activer la transcription de l'opéron ilvIH. Cette activation transcriptionnelle va elle-même déclencher l'expression du facteur LeuO qui lui, va induire l'expression de l'opéron leuABCD. Chez Buchnera ce mécanisme de régulation n'est pas envisageable parce que la bactérie a perdu les gènes relA, lrp et leuO. De plus l'opéron leuABCD a été délocalisé sur un plasmide ce qui le sépare physiquement des gènes leuO et de l'opéron ilvIH (Figure 45). Ainsi, d'autres mécanismes de régulation transcriptionnelle de l'opéron leuABCD auraient pu être mis en place chez Buchnera. Contrairement à des mécanismes de type "induction de l'expression" via des régulateurs transcriptionnels, il se pourrait que chez Buchnera des mécanismes de type "atténuation de l'expression", comme c'est le cas chez de nombreuses protéobactéries, pour la régulation de l'expression d'opérons relatif à la biosynthèse des acides aminés (Vitreschak et al., 2004). Ce mécanisme de régulation consiste en la formation d'une structure secondaire de type Tige-Boucle par le transcrit naissant. Selon la localisation sur le transcrit et suivant la concentration d'éléments régulateurs (acides aminés par exemple) cette structure secondaire pourra agir comme antiterminateur ou terminateur de la transcription (Merino et Yanofsky, 2005). Dans ce dernier cas, la transcription du gène ou de l'opéron avorte prématurément. Enfin, l'existence de structure de type Tige-Boucle notamment en amont des gènes leuA et leuB pose la question du rôle de ces structures notamment en tant que stabilisateurs de transcrits. Des études chez E. coli ont montré que la localisation de Tige-Boucle en position 5' terminale de certains transcrits tels que ompA augmentait la durée de vie de ces ARNm (Emory et al., 1992; Arnold et al., 1998; Bricker et Belasco, 1999; Xia et al., 2002). Bien que cette hypothèse ait déjà été proposée lors de la mise en évidence de la Tige-Boucle en amont du gène leuA chez Buchnera (Silva et al., 1998), elle doit être démontrée. Même si un premier résultat expérimental de notre étude montre que la séquence intergénique qui fait suite à la Tige-Boucle en amont du gène leuA est transcrite avec ce dernier, des études complémentaires de bioinformatique couplées à des travaux expérimentaux pourraient fournir des résultats déterminants.

José Viñuelas 176 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Au cours de ces travaux de thèse, nous avons également cherché à savoir si deux pucerons appartenant à des tribus différentes (Acyrthosiphon pisum et Rhopalosiphum padi) et adaptés à des plantes hôtes différentes (le pois et le blé) possédaient des mécanismes comparables de réponses à un stress en leucine. La première étape, a été la réalisation d'études métaboliques qui ont montré, chez les deux pucerons, une néosynthèse de leucine par Buchnera proportionnelle à l'intensité de la déplétion en cet acide aminé imposée à l'hôte. Nous avons par la suite quantifié le nombre de copies de plasmide pLeu chez ces deux espèces de pucerons. Les résultats ont révélé un nombre de copies de pLeu par unité de chromosome environ 200 fois plus élevé chez Buchnera issue de R. padi par rapport à A. pisum. Ces résultats confirment les données publiées par Moran et collaborateurs pour le puceron A. pisum (Moran et al., 2003b). Le taux de plasmide pLeu n'ayant jamais été quantifié chez R. padi, notre étude révèle chez ce puceron que le nombre de pLeu est assez semblable à celui mesuré chez S. graminum, qui appartient tout comme R. padi à la tribu des Aphidini, même si ce taux semble varier en fonction du biotype du puceron des graminées (Moran et al., 2003b). La variabilité dans le nombre de plasmide serait le reflet de besoins nutritionnels variables entre les différentes espèces de pucerons (Thao et al., 1998) et serait dépendante de la plante hôte à laquelle ces insectes se sont adaptés (Lai et al., 1994; Baumann et al., 1997). Les résultats obtenus dans notre étude sur R. padi ouvrent également la question d'une corrélation entre la tribu d'appartenance du puceron et le nombre de copies de pLeu. En effet, si on regarde les pucerons pour lesquels une mesure du nombre de copies du plasmide pLeu a été réalisée, on remarque que A. pisum, D. noxia et U. ambrosiae (tribu des Macrosiphini) possèdent une proportion relativement faible de plasmide pLeu (respectivement 0,3, 0,9, et 1,6 copies par unité de chromosome) et que S. graminum et R. padi (tribu des Aphidini) possèdent tous deux une importante quantité de pLeu par unité de chromosome (respectivement 23,5 et 58) (Thao et al., 1998; Plague et al., 2003). En plus d'une composante nutritionnelle, peut-être existe-t-il une composante phylogénétique qui expliquerait cette variabilité dans la quantité de pLeu entre les différentes espèces de pucerons. Il serait alors intéressant de confirmer cette théorie par la détermination du nombre de copies de pLeu à large échelle chez des espèces de pucerons différentes et adaptée à des plantes hôtes variées. Enfin, les derniers travaux menés chez le puceron R. padi au cours de cette thèse ont consisté à analyser le nombre de copies de plasmide pLeu de Buchnera en réponse à un excès et à une carence totale en leucine.

José Viñuelas 177 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Résultats

Cependant, étant donné la très petite taille de ce dernier puceron, cette quantification s'est limitée à des pucerons ayant atteint le stade adulte (7 jours de stress). Aucune variation significative du nombre de copies de pLeu par unité de chromosome n'a été observée après 7 jours de carence ou d'excès alimentaire de leucine. Ce résultat peut avoir diverses origines : soit le temps de stress imposé est trop long et ne permet pas de déceler une réponse de type réplication du plasmide comme cela a été le cas pour A. pisum, soit la quantité de leucine produite par Buchnera Rp à l'état basal est telle que le couple symbiotique n'est pas sensible à ce stress nutritionnel. Cette dernière théorie s'appuie sur le nombre important de plasmide pLeu chez Buchnera Rp par rapport à Buchnera Ap. Pour être validée, cette hypothèse nécessite des travaux complémentaires. En effet, comme nous l'avons observé pour Buchnera Ap, la quantification du nombre de plasmide pLeu lors des premiers jours de stress (2 et 3 jours) chez Buchnera Rp permettrait de savoir si oui ou non la bactérie répond à une carence en leucine via une augmentation du nombre de copies de pLeu. Cependant, la réalisation de cette expérience nécessiterait des quantités très importantes de pucerons R. padi en stade précoce de développement. L'analyse de la réponse transcriptionnelle précoce de Buchnera à ce stress serait également indispensable pour pouvoir comparer la réponse de la bactérie, dans sa totalité, entre les deux pucerons étudiés ici. Cette dernière étape serait éventuellement possible mais nécessiterait d'abord une étape d'amplification des ARN totaux avant leur quantification.

José Viñuelas 178 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Conclusion Générale et Perspectives

Partie V

Conclusion Générale et Perspectives

José Viñuelas 179 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Conclusion Générale et Perspectives

La bactérie symbiotique Buchnera aphidicola est connue pour son rôle dans la fourniture en acides aminés essentiels au puceron. Ces acides aminés sont rares dans la sève phloémienne, dont se nourrit le puceron, et ne peuvent pas être synthétisés par l'insecte. Le séquençage et de l'annotation des premiers génomes de Buchnera aphidicola ont montré une forte réduction de la taille de ces derniers, ainsi que la perte des principaux régulateurs transcriptionnels de la biosynthèse des acides aminés. Aussi, la capacité de Buchnera à réguler l'expression de ses gènes reste une question ouverte et un enjeu pour la communauté scientifique.

Au cours de ce travail de thèse j'ai recherché l'existence de possibles mécanismes de régulation de l'expression des gènes chez Buchnera, et ceci, aussi bien sur des symbiotes à l'état basal, que sur des symbiotes ayant subi un stress nutritionnel. La première partie de ce travail de thèse a été de savoir si, malgré l'importante réduction de taille qu'a connue le génome de Buchnera, il existait toujours des relations réciproques entre les niveaux d'expression des gènes et l'organisation du chromosome, comme cela a été démontré chez des bactéries libres telles que Escherichia coli ou Bacillus subtilis. L'analyse du transcriptome de Buchnera à l'état basal, c'est-à-dire lorsque le puceron est élevé sur plantes, a révélé la conservation de certaines de ces relations. Chez Buchnera les gènes fortement exprimés sont de préférence des gènes essentiels, conservés et organisés en opérons. Inversement, aucune relation entre expressivité et distribution préférentielle des gènes sur le brin direct d'ADN n'a été détectée. Enfin, l'observation de signaux transcriptomiques périodiques liés à l'agencement des gènes le long du chromosome suggère la conservation de mécanismes de régulation transcriptionnels globaux via la conformation du nucléoïde chez cette bactérie. Ces résultats montrent que le génome de Buchnera, façonné par les contraintes de la vie intracellulaire, n'est pas aussi dégénéré qu'on pourrait le penser. Des mécanismes de régulation conservés, ou développés, par le symbiote, semblent donc être présents au sein de cette bactérie. Ces résultats offrent des perspectives d'étude intéressantes. En effet, tout comme cela a été précédemment suggéré pour E. coli ou B. subtilis, la périodicité transcriptomique observée pourrait être le reflet d'une certaine conformation spatiale du nucléoïde de Buchnera, voire un moyen pour le symbiote de réguler de manière globale et via les protéines de type "histone-like" l'expression de ses gènes (Jeong et al., 2004; Carpentier et al., 2005). Afin d'étayer cette hypothèse, nous pourrions

José Viñuelas 180 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Conclusion Générale et Perspectives

envisager de réaliser des études de modélisation moléculaire sur ces régulateurs globaux de la transcription. Ces approches apporteront de précieux éléments sur les mécanismes d'action de ces facteurs au niveau de la structure du chromosome de Buchnera et, indirectement, sur leur rôle dans la régulation transcriptionnelle des gènes du symbiote. Elles pourront également être complétées par une approche de bioinformatique visant à rechercher des sites de fixation de ces facteurs, même si les outils actuellement disponibles sont peu adaptés à l'étude de génomes fortement biaisés en bases A et T comme celui de Buchnera. La deuxième partie de ce travail de thèse a consisté à analyser la réponse de Buchnera à un stress nutritionnel en leucine imposé au puceron. Les résultats obtenus ont révélé l'existence d'une réponse transcriptionnelle spécifique de Buchnera dès 12 heures de stress : une carence en leucine entraîne une induction de l'expression des gènes de la voie de biosynthèse de cet acide aminé, alors qu'un excès induit leur répression. Cette réponse, dont l'intensité décroit dans le temps, est ensuite relayée (36 heures plus tard) par une variation du taux d'amplification du plasmide pLeu qui augmente ou diminue respectivement lorsque la carence ou l'excès de leucine perdure. L'ensemble de ces résultats montre donc l'existence chez Buchnera de capacités à réguler la production de leucine en réponse à un stress nutritionnel selon deux mécanismes complémentaires : de façon précoce au niveau transcriptionnel, et de façon plus tardive par la réplication du plasmide pLeu. Compte tenu de la précocité de la réponse transcriptionnelle que nous avons mis en évidence, une de nos perspectives de travail est d'étudier la réponse de Buchnera à d'autres stress, dans les premières heures de traitement. Notre étude a également montré que les gènes ilvIH et leuABCD étaient régulés d'un point de vue transcriptionnel suite à un stress en leucine. Or, étant donné la perte des régulateurs transcriptionnels classiques des gènes de biosynthèse des acides aminés chez Buchnera, la régulation de l'expression de ces gènes se base, par définition, sur d'autres systèmes qui pourraient être l'atténuation de la transcription ou encore la stabilisation des transcrits. La recherche et l'identification de ces mécanismes apporterait de nombreuses réponses quant aux capacités d'un génome réduit, comme celui de Buchnera, à réguler l'expression de ses gènes en fonction des besoins métaboliques du couple symbiotique. L'observation d'une variation de l'amplification du plasmide pLeu en réponse à un stress en leucine ouvre également de nombreuses perspectives dans l'analyse des capacités de régulation génétiques de Buchnera. En effet, il serait pertinent d'élucider le mécanisme moléculaire sous-jacent à la réplication du plasmide pLeu : la

José Viñuelas 181 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Conclusion Générale et Perspectives

caractérisation détaillée du rôle de la réplicase RepA chez Buchnera pourrait être la première étape de cette analyse.

Enfin, l'annotation du génome du puceron, qui est en cours (Sabater-Muñoz et al., 2006), permet d'envisager des études sur les deux partenaires simultanément et ouvre donc des perspectives prometteuses. En effet, le décryptage et l'analyse des génomes de deux partenaires font du couple Buchnera / puceron un modèle parfaitement adapté à l'étude des systèmes symbiotiques.

José Viñuelas 182 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Publications et Communications

Partie VI

Publications et Communications

José Viñuelas 183 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Publications et Communications

PUBLICATIONS DANS DES REVUES AVEC COMITE DE LECTURE

Viñuelas J, Duport G, Febvay G, Fayard J-M, Charles H, Rahbé Y, Calevro F. Transcriptional regulation precedes plasmid amplification in the response of Buchnera aphidicola to a leucine stress imposed to its host. En préparation.

Bermingham J, Calevro F, Viñuelas J, Charles H, Douglas A, Wilkinson T. Comparative analysis of the aphid-Buchnera symbiosis: gene expression in the embryonic compartment. En préparation.

Viñuelas J, Calevro F, Remond D, Bernillon J, Rahbé Y, Febvay G, Fayard J-M, Charles H. Conservation of the links between gene transcription and chromosomal organization in the highly reduced genome of Buchnera aphidicola. BMC Genomics 2007, 8:143.

Charles H, Calevro F, Viñuelas J, Fayard J-M, Rahbé Y. Codon usage bias and tRNA over- expression in Buchnera aphidicola after aromatic amino acid nutritional stress on its host Acyrthosiphon pisum. Nucleic Acids Res 2006, 34:4583-4592.

Reymond N, Calevro F, Viñuelas J, Morin N, Rahbé Y, Febvay G, Laugier C, Douglas A, Fayard J-M, Charles H. Different levels of transcriptional regulation due to trophic constraints in the reduced genome of Buchnera aphidicola APS. Appl Environ Microbiol 2006, 72:7760-7766.

COMMUNICATIONS ORALES

Viñuelas J, Calevro F, Remond D, Bernillon J, Rahbé Y, Febvay G, Fayard J-M et Charles H. Conservation de la relation entre niveau d’expression des gènes et organisation du chromosome chez Buchnera aphidicola, symbiote primaire des pucerons : exemple d’un génome symbiotique réduit mais non dégénéré. XVème Colloque de Physiologie de l’Insecte, Juillet 2007, Rennes, France.

Calevro F, Reymond N, Viñuelas J, Febvay G, Rahbé Y, Douglas A, Fayard J-M, Charles H. Metabolic interactions between the bacteria Buchnera aphidicola and their obligate symbiotic partner, the pea aphid: nutritional studies combined with transcriptome analyses. 5th International Symbiosis Congress (5 th-ISS), Août 2006, Vienne, Autriche.

Charles H, Calevro F, Viñuelas J. Transcriptional responses of Buchnera aphidicola to combined amino acid and osmotic stress in the diet of its symbiotic partner, Acyrthosiphon pisum. COST853: Agricultural Biomarkers for Array-Technology - Combined WG4 & WG5 meetings "Chip production and analysis, and environmental monitoring", Novembre 2005, Villeurbanne, France (invité).

José Viñuelas 184 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Publications et Communications

COMMUNICATIONS AFFICHEES

Bermingham J, Calevro F, Viñuelas J, Charles H, Wilkinson T. Comparative analysis of gene expression in the aphid-Buchnera symbiosis: the role of Buchnera in the nutrition of aphid embryos. Society for Experimental Biology meeting (SEB'07), Avril 2007, Glasgow, Grande Bretagne.

Viñuelas J, Calevro F, Bernillon J, Remond D, Rahbé Y, Febvay G, Fayard J-M, Charles H. Spatial transcriptomic patterns in the genome of the endosymbiotic bacterium Buchnera aphidicola. Workshop Theoretical Approches for the Genome, Novembre 2006, Annecy-Le- Vieux, France.

Viñuelas J, Calevro F, Bernillon J, Remond D, Rahbé Y, Febvay G, Fayard J-M, Charles H. Relationships between gene expression and genome properties in Buchnera aphidicola, the primary endosymbiont of the pea aphid. 5th International Symbiosis Congress (5-ISS), Août 2006, Vienne, Autriche.

Charles H, Calevro F, Viñuelas J, Febvay G, Rahbé Y, Fayard J-M. Buchnera aphidicola, endocytobiote du puceron : transcriptome d'un génome "dégénéré". Rencontres 2006 des Microbiologistes de l'INRA, Juin 2006, Dourdan, France.

Calevro F, Reymond N, Viñuelas J, Groppi A, Barre A, Rahbé Y, Febvay G, Douglas A, Fayard J-M, Charles H. Buchnera aphidicola: evidences for transcriptional regulation in a degenerated genome. Colloque INRA "Apports de la génomique à la physiologie et la pathologie de l'insecte", Mars 2006, Montpellier, France.

Viñuelas J, Calevro F, Bernillon J, Rahbé Y, Febvay G, Fayard J-M, Charles H. Genomic DNA: an attractive candidate for microarray data normalization. Integrative Post Genomics (IPG ‘05), Novembre 2005, Villeurbanne, France.

Calevro F, Reymond N, Viñuelas J, Groppi A, Barre A, Rahbé Y, Febvay G, Douglas A, Fayard J-M, Charles H. Buchnera aphidicola: evidences for transcriptional regulation in a degenerated genome, Integrative Post Genomics (IPG ‘05), Novembre 2005, Villeurbanne, France.

José Viñuelas 185 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Partie VII

Références Bibliographiques

José Viñuelas 186 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Akbar S., T. A. Gaidenko, C. M. Kang, M. O'Reilly, K. M. Devine and C. W. Price. New family of regulators in the environmental signaling pathway which activates the general stress transcription factor sigma(B) of Bacillus subtilis. J. Bacteriol., 2001, 183: 1329-1338. Akman L., A. Yamashita, H. Watanabe, K. Oshima, T. Shiba, M. Hattori and S. Aksoy. Genome sequence of the endocellular obligate symbiont of tsetse flies, Wigglesworthia glossinidia. Nat. Genet., 2002, 32: 402-407. Aksoy S., A. A. Pourhosseini and A. Chow. Mycetome endosymbionts of tsetse flies constitute a distinct lineage related to Enterobacteriaceae. Insect Mol. Biol., 1995, 4: 15-22. Allen T. E., N. D. Price, A. R. Joyce and B. O. Palsson. Long-range periodic patterns in microbial genomes indicate significant multi-scale chromosomal organization. PLoS Comput. Biol., 2006, 2: e2. Andersson S. and C. Kurland. Reductive evolution of resident genomes. Trends Microbiol., 1998, 6: 263-268. Andersson S. G., C. Alsmark, B. Canback, W. Davids, C. Frank, O. Karlberg, L. Klasson, B. Antoine-Legault, A. Mira and I. Tamas. Comparative genomics of microbial pathogens and symbionts. Bioinformatics, 2002, 18, suppl. 2: S17. Arnold T. E., J. Yu and J. G. Belasco. mRNA stabilization by the ompA 5' untranslated region: two protective elements hinder distinct pathways for mRNA degradation. Rna, 1998, 4: 319-330. Audit B. and C. A. Ouzounis. From genes to genomes: universal scale-invariant properties of microbial chromosome organisation. J. Mol. Biol., 2003, 332: 617-633. Balazsi G., K. A. Kay, A. L. Barabasi and Z. N. Oltvai. Spurious spatial periodicity of co- expression in microarray data due to printing design. Nucleic Acids Res., 2003, 31: 4425-4433. Bandi C., M. Sironi, G. Damiani, L. Magrassi, C. A. Nalepa, U. Laudani and L. Sacchi. The establishment of intracellular symbiosis in an ancestor of cockroaches and termites. Proc. Biol. Sci., 1995, 259: 293-299. Baumann L., P. Baumann, N. A. Moran, J. Sandstrom and M. L. Thao. Genetic characterisation of plasmids containing genes encoding enzymes of leucine biosynthesis in endosymbionts (Buchnera) of . J. Mol. Evol., 1999a, 48: 77-85. Baumann L., P. Baumann and M. L. Thao. Detection of messenger RNA transcribed from genes encoding enzymes of amino acid biosynthesis in Buchnera aphidicola (Endosymbiont of aphids). Curr. Microbiol., 1999b, 38: 135-136. Baumann P. Biology of bacteriocyte-associated endosymbionts of plant sap-sucking . Annu. Rev. Microbiol., 2005, 59: 155-189. Baumann P., L. Baumann, C. Y. Lai, D. Rouhbakhsh, N. A. Moran and M. A. Clark. Genetics, physiology, and evolutionary relationships of the genus Buchnera: intracellular symbionts of aphids. Annu. Rev. Microbiol., 1995, 49: 55-94. Baumann P., N. A. Moran and L. Baumann. The evolution and genetics of aphid endosymbionts. Bioscience, 1997, 47: 12-20.

José Viñuelas 187 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Beissbarth T., K. Fellenberg, B. Brors, R. Arribas-Prat, J. Boer, N. C. Hauser, M. Scheideler, J. D. Hoheisel, G. Schutz, A. Poustka and M. Vingron. Processing and quality control of DNA array hybridization data. Bioinformatics, 2000, 16: 1014-1022. Belda E., A. Moya and F. J. Silva. Genome rearrangement distances and gene order phylogeny in gamma-Proteobacteria. Mol. Biol. Evol., 2005, 22: 1456-1467. Berka R. M., X. Cui and C. Yanofsky. Genomewide transcriptional changes associated with genetic alterations and nutritional supplementation affecting tryptophan metabolism in Bacillus subtilis. Proc. Natl. Acad. Sci. USA, 2003, 100: 5682-5687. Bernardi A. and F. Bernardi. Complete sequence of pSC101. Nucleic Acids Res., 1984, 12: 9415-26. Birkle L. M., L. B. Minto, K. F. A. Walters and A. E. Douglas. Microbial genotype and insect fitness in an aphid-bacterial symbiosis. Funct. Ecol., 2004, 18: 598-604. Blackman R. L. and V. F. Eastop. Aphids on the world's trees: an identification and information guide. Wallingford, CAB International, 1994, 996 p. Blackman R. L. and V. F. Eastop. Aphids on the world’s crops: an identification information guide. 2nd ed. Chichester, John Wiley, 2000, 476 p. Blattner F. R., G. Plunkett, C. A. Bloch, N. T. Perna, V. Burland, M. Riley, J. Colladovides, J. D. Glasner, C. K. Rode, G. F. Mayhew, J. Gregor, N. W. Davis, H. A. Kirkpatrick, M. A. Goeden, D. J. Rose, B. Mau and Y. Shao. The complete genome sequence of Escherichia coli K-12. Science, 1997, 277: 1453. Blochmann F. Über das Vorkommen von bakterienähnlichen Gebilden in den Geweben und Eiern verschiedener Insekten. Zentralbl. Bakteriol., 1892, 11: 234-240. Blot N., R. Mavathur, M. Geertz, A. Travers and G. Muskhelishvili. Homeostatic regulation of supercoiling sensitivity coordinates transcription of the bacterial genome. EMBO Rep., 2006, 7: 710-715. Bos M. P., B. Tefsen, J. Geurtsen and J. Tommassen. Identification of an outer membrane protein required for the transport of lipopolysaccharide to the bacterial cell surface. Proc. Natl. Acad. Sci. U S A, 2004, 101: 9417-9422. Bracho A. M., D. Martineztorres, A. Moya and A. Latorre. Discovery and molecular characterization of a plasmid localized in Buchnera sp. bacterial endosymbiont of the aphid Rhopalosiphum padi. J. Mol. Evol., 1994, 41: 67-73. Brewer B. J. When polymerases collide: replication and the transcriptional organization of the E. coli chromosome. Cell, 1988, 53: 679-686. Bricker A. L. and J. G. Belasco. Importance of a 5' stem-loop for longevity of papA mRNA in Escherichia coli. J. Bacteriol., 1999, 181: 3587-3590. Buchner P. Aphids. In: Endosymbiosis of with plant microorganisms. P. Buchner, Ed. New York, Interscience, 297-332. Buchner P. Symbiosis in animals which suck plant juices. In: Endosymbiosis of Animals with Plant Microorganisms. P. Buchner, Ed. New York, Interscience, 210-432. Burian J., L. Guller, M. Macor and W. W. Kay. Small cryptic plasmids of multiplasmid, clinical Escherichia coli. Plasmid, 1997, 37: 2-14.

José Viñuelas 188 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Burian J., S. Stuchlik and W. W. Kay. Replication control of a small cryptic plasmid of Escherichia coli. J. Mol. Biol., 1999, 294: 49-65. Calatayud P. A., M. A. Polania, J. Guillaud, D. F. Munera, J. C. Hamon and A. C. Bellotti. Role of single amino acids in phagostimulation, growth, and development of the cassava mealybug Phenacoccus herreni. Entomol. Exp. Appl., 2002, 104: 363-367. Calevro F., H. Charles, N. Reymond, V. Dugas, J. P. Cloarec, J. Bernillon, Y. Rahbe, G. Febvay and J. M. Fayard. Assessment of 35mer amino-modified oligonucleotide based microarray with bacterial samples. J. Microbiol. Methods, 2004, 57: 207-218. Canbäck B., I. Tamas and S. G. Andersson. A phylogenomic study of endosymbiotic bacteria. Mol. Biol. Evol., 2004, 21: 1110-1122. Carpentier A. S., B. Torresani, A. Grossmann and A. Henaut. Decoding the nucleoid organisation of Bacillus subtilis and Escherichia coli through gene expression data. BMC Genomics, 2005, 6: 84. Charaniya S., S. Mehra, W. Lian, K. P. Jayapal, G. Karypis and W. S. Hu. Transcriptome dynamics-based operon prediction and verification in Streptomyces coelicolor. Nucleic Acids Res., 2007, 35: 7222-7236. Charles H., F. Calevro, J. Vinuelas, J. M. Fayard and Y. Rahbe. Codon usage bias and tRNA over-expression in Buchnera aphidicola after aromatic amino acid nutritional stress on its host Acyrthosiphon pisum. Nucleic Acids Res., 2006, 34: 4583-4592. Charles H. and H. Ishikawa. Physical and genetical map of the genome of Buchnera, the primary endosymbiont of the pea aphid Acyrthosiphon pisum. J. Mol. Evol., 1999, 48: 142-150. Chen C. C., L. L. Cheng, C. C. Kuan and R. F. Hou. Studies on the intracellular yeast- like symbiote in the brown Nilaparvata lugens Stal. I. Histological observations and population changes of the symbiote. Z. Ang. Entomol., 1981, 92: 321–327. Chen C. C., M. Y. Chou, C. H. Huang, A. Majumder and H. Y. Wu. A cis-spreading nucleoprotein filament is responsible for the gene silencing activity found in the promoter relay mechanism. J. Biol. Chem., 2005a, 280: 5101-5112. Chen C. C., M. Fang, A. Majumder and H. Y. Wu. A 72-base pair AT-rich DNA sequence element functions as a bacterial gene silencer. J. Biol. Chem., 2001, 276: 9478-9485. Chen C. C., M. Ghole, A. Majumder, Z. Wang, S. Chandana and H. Y. Wu. LeuO- mediated transcriptional derepression. J. Biol. Chem., 2003, 278: 38094-38103. Chen C. C. and H. Y. Wu. Transcription-driven DNA supercoiling and gene expression control. Front. Biosci., 2003, 8: 430-439. Chen C. C. and H. Y. Wu. LeuO protein delimits the transcriptionally active and repressive domains on the bacterial chromosome. J. Biol. Chem., 2005, 280: 15111-15121. Chen D. Q., B. C. Campbell and A. H. Purcell. A new rickettsia from a herbivorous insect, the pea aphid Acyrthosiphon pisum (Harris). Curr. Microbiol., 1996, 33: 123- 128.

José Viñuelas 189 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Chen D. Q. and A. H. Purcell. Occurrence and transmission of facultative endosymbionts in aphids. Curr. Microbiol., 1997, 34: 220-225. Chen S., M. Iannolo and J. M. Calvo. Cooperative binding of the leucine-responsive regulatory protein (Lrp) to DNA. J. Mol. Biol., 2005b, 345: 251-264. Cheng D. J. and R. F. Hou. Ultrastructure of the yeast-like endocytobiont in the brown planthopper, Nilaparvata lugens (Stal) (Homoptera: ). Endocytobiosis Cell Res., 1996, 11: 107–117. Cheng D. J. and R. F. Hou. Histological observations on transovarial transmission of a yeast-like symbiote in Nilaparvata lugens Stal (Homoptera, Delphacidae). Tissue Cell, 2001, 33: 273-279. Clark M. A., L. Baumann, M. A. Munson, P. Baumann, B. C. Campbell, J. E. Duffus, L. S. Osborne and N. A. Moran. The eubacterial endosymbionts of (Homoptera, Aleyrodoidea) constitute a lineage distinct from the endosymbionts of aphids and mealybugs. Curr. Microbiol., 1992, 25: 119-123. Clark M. A., N. A. Moran and P. Baumann. Sequence evolution in bacterial endosymbionts having extreme base composition. Mol. Biol. Evol., 1999, 16: 1586- 1598. Coppee J. Y. Do DNA microarrays have their future behind them? Microbes Infect., 2008. Dadd R. H. Insect nutrition : current developments and metabolic implications. Annual Review of Entomology, 1973, 18: 381-420. Dadd R. H. and D. L. Krieger. Dietary amino acid requirements of the aphid Myzus persicae. J. Insect Physiol., 1968, 14: 741-764. Dagan T., R. Blekhman and D. Graur. The "domino theory" of gene death: gradual and mass gene extinction events in three lineages of obligate symbiotic bacterial pathogens. Mol. Biol. Evol., 2006, 23: 310-316. Darby A. C., L. M. Birkle, S. L. Turner and A. E. Douglas. An aphid-borne bacterium allied to the secondary symbionts of . FEMS Microbiol. Ecol., 2001, 36: 43- 50. Darby A. C., S. M. Chandler, S. C. Welburn and A. E. Douglas. Aphid-symbiotic bacteria cultured in insect cell lines. Appl. Environ. Microbiol., 2005, 71: 4833-4839. De Bary H. De la symbiose. Revue Internationale des Sciences, 1879, 3: 301-309. Dedryver C. A. Pucerons : des dégâts et des hommes. In: Biofutur, juillet-août 2007, 279: 22-25. DeHaas B. W., L. H. Johnson, J. H. Pepper, E. Hastings and G. L. Baker. Proteins of mormon cricket exoskeleton-I. Amino acid composition of (a) pronotal shields, (b) abdominal tergites, (c) abdominal intersegmental connectives. Physiol. Zoöl., 1957, 30: 121-127. del Solar G., R. Giraldo, M. J. Ruiz-Echevarria, M. Espinosa and R. Diaz-Orejas. Replication and control of circular bacterial plasmids. Microbiol. Mol. Biol. Rev., 1998, 62: 434-464. Delmotte F., C. Rispe, J. Schaber, F. J. Silva and A. Moya. Tempo and mode of early gene loss in endosymbiotic bacteria from insects. BMC Evol. Biol., 2006, 6: 56.

José Viñuelas 190 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Delumeau O., C. C. Chen, J. W. Murray, M. D. Yudkin and R. J. Lewis. High- molecular-weight complexes of RsbR and paralogues in the environmental signaling pathway of Bacillus subtilis. J. Bacteriol., 2006, 188: 7885-7892. Dixon A. F. G. Constraints on the rate of parthenogenetic reproduction and pest status of aphids. Invertebr. Reprod. Dev., 1992, 22: 159-163. Dixon A. F. G. Aphid Ecology. 2nd ed. London, Chapman & Hall, 1998, 300 p. Douglas A. E. Sulphate utilization in an aphid symbiosis. Insect Biochem., 1988, 18: 599- 605. Douglas A. E. The nutritional quality of phloem sap utilized by natural aphid populations. Ecol. Entomol., 1993, 18: 31-38. Douglas A. E. The nutritional physiology of aphids. Adv. Insect Physiol., 2003, 31: 73-140. Douglas A. E. Phloem-sap feeding by animals: problems and solutions. J. Exp. Bot., 2006, 57: 747-754. Douglas A. E. and A. F. G. Dixon. The mycetocyte symbiosis of aphids: variation with age and morph in virginoparae of Megoura viciae and Acyrthosiphon pisum. J. Insect Physiol., 1987, 33: 109-113. Douglas A. E., L. B. Minto and T. L. Wilkinson. Quantifying nutrient production by the microbial symbionts in an aphid. J. Exp. Biol., 2001, 204: 349-358. Douglas A. E. and W. A. Prosser. Synthesis of the essential amino acid tryptophan in the pea aphid (Acyrthosiphon pisum) symbiosis. J. Insect Physiol., 1992, 38: 565-568. Dunbar H. E., A. C. Wilson, N. R. Ferguson and N. A. Moran. Aphid thermal tolerance is governed by a point mutation in bacterial symbionts. PLoS Biol., 2007, 5: e96. Durinck S. Pre-processing of microarray data and analysis of differential expression. Methods Mol. Biol., 2008, 452: 89-110. Edson K. M., S. B. Vinson, D. B. Stoltz and M. D. Summers. Virus in a parasitoid wasp: suppression of the cellular immune response in the parasitoid's host. Science, 1981, 211: 582-583. Emory S. A., P. Bouvet and J. G. Belasco. A 5'-terminal stem-loop structure can stabilize mRNA in Escherichia coli. Genes Dev., 1992, 6: 135-148. Ermolaeva M. D., H. G. Khalak, O. White, H. O. Smith and S. L. Salzberg. Prediction of transcription terminators in bacterial genomes. J. Mol. Biol., 2000, 301: 27-33. Fang M., A. Majumder, K. J. Tsai and H. Y. Wu. ppGpp-dependent leuO expression in bacteria under stress. Biochem. Biophys. Res. Commun., 2000, 276: 64-70. Fang M. and H. Y. Wu. A promoter relay mechanism for sequential gene activation. J. Bacteriol., 1998, 180: 626-633. Farber C. R. and A. J. Lusis. Integrating global gene expression analysis and genetics. Adv. Genet., 2008, 60: 571-601. Fares M. A., A. Moya and E. Barrio. Adaptive evolution in GroEL from distantly related endosymbiotic bacteria of insects. J. Evolution. Biol., 2005, 18: 651-660.

José Viñuelas 191 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Fares M. A., M. X. Ruiz-Gonzalez, A. Moya, S. F. Elena and E. Barrio. Endosymbiotic bacteria: groEL buffers against deleterious mutations. Nature, 2002, 417: 398. Febvay G., B. Delobel and Y. Rahbé. Influence of the amino acid balance on the improvement of an artificial diet for a biotype of Acyrthosiphon pisum (Homoptera: Aphididae). Can. J. Zool., 1988, 66: 2449-2453. Febvay G., I. Liadouze, J. Guillaud and G. Bonnot. Analysis of energetic aminoacid metabolism in Acyrthosiphon pisum: a multidimensional aproach to amin acid metabolism in aphids. Arch. Insect Biochem. Physiol., 1995, 29: 45-69. Febvay G., Y. Rahbé, M. Rynkiewicz, J. Guillaud and G. Bonnot. Fate of dietary sucrose and neosynthesis of amino acids in the pea aphid, Acyrthosiphon pisum, reared on different diets. J. Exp. Biol., 1999, 202: 2639-2652. Ferrari J., A. C. Darby, T. J. Daniell, H. C. J. Godfray and A. E. Douglas. Linking the bacterial community in pea aphids with host-plant use and natural enemy resistance. Ecol. Entomol., 2004, 29: 60-65. Ferrari J., C. L. Scarborough and H. C. Godfray. Genetic variation in the effect of a facultative symbiont on host-plant use by pea aphids. Oecologia, 2007, 153: 323-329. Francino M. P., L. Chao, M. A. Riley and H. Ochman. Asymmetries generated by transcription-coupled repair in enterobacterial genes. Science, 1996, 272: 107-109. Francino M. P. and H. Ochman. Deamination as the basis of strand-asymmetric evolution in transcribed Escherichia coli sequences. Mol. Biol. Evol., 2001, 18: 1147-1150. French S. Consequences of replication fork movement through transcription units in vivo. Science, 1992, 258: 1362-1365. Frey J., M. Chandler and L. Caro. The effects of an Escherichia coli dnaAts mutation on the replication of the plasmids colE1 pSC101, R100.1 and RTF-TC. Mol. Gen. Genet., 1979, 174: 117-126. Fukatsu T. and H. Ishikawa. Phylogenetic position of yeast-like symbiont of Hamiltonaphis styraci (Homoptera, aphididae) based on 18S rDNA sequence. Insect Biochem. Molec. Biol., 1996, 26: 383-388. Fukatsu T. and N. Nikoh. Two intracellular symbiotic bacteria from the mulberry psyllid Anomoneura mori (Insecta, Homoptera). Appl. Environ. Microbiol., 1998, 64: 3599- 3606. Fukatsu T., N. Nikoh, R. Kawai and R. Koga. The secondary endosymbiotic bacterium of the pea aphid Acyrthosiphon pisum (Insecta, Homoptera). Appl. Environ. Microbiol., 2000, 66: 2748-2758. Fukatsu T., T. Tsuchida, N. Nikoh and R. Koga. Spiroplasma symbiont of the pea aphid, Acyrthosiphon pisum (Insecta : Homoptera). Appl. Environ. Microbiol., 2001, 67: 1284-1291. Furuno S., Y. Watanabe-Murakami, N. Takebe-Suzuki and K. Yamaguchi. Negative control of plasmid pSC101 replication by increased concentrations of both initiator protein and iterons. J. Gen. Appl. Microbiol., 2000, 46: 29-37.

José Viñuelas 192 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Gamas P., A. C. Burger, G. Churchward, L. Caro, D. Galas and M. Chandler. Replication of pSC101: effects of mutations in the E. coli DNA binding protein IHF. Mol. Gen. Genet., 1986, 204: 85-89. Geneci E. and G. Görür. Aphid (Homoptera: Aphididae) species of the Central Aksaray. International Journal of Natural and Engineering Sciences, 2007, 1: 19-21. Gil R., A. Latorre and A. Moya. Bacterial endosymbionts of insects: insights from comparative genomics. Environ. Microbiol., 2004a, 6: 1109-1122. Gil R., B. Sabater-Munoz, A. Latorre, F. J. Silva and A. Moya. Extreme genome reduction in Buchnera spp.: Toward the minimal genome needed for symbiotic life. Proc. Natl. Acad. Sci. USA, 2002, 99: 4454-4458. Gil R., B. Sabater-Munoz, V. Perez-Brocal, F. J. Silva and A. Latorre. Plasmids in the aphid endosymbiont Buchnera aphidicola with the smallest genomes. A puzzling evolutionary story. Gene, 2006, 370: 17-25. Gil R., F. J. Silva, J. Pereto and A. Moya. Determination of the core of a minimal bacterial gene set. Microbiol. Mol. Biol. Rev., 2004b, 68: 518-537. Gomez-Valero L., A. Latorre and F. J. Silva. The Evolutionary Fate of Nonfunctional DNA in the Bacterial Endosymbiont Buchnera aphidicola. Mol. Biol. Evol., 2004, 21: 2172-2181. Gomez-Valero L., F. J. Silva, J. C. Simon and A. Latorre. Genome reduction of the aphid endosymbiont Buchnera aphidicola in a recent evolutionary time scale. Gene, 2007, 389: 87-95. Gosalbes M. J., A. Lamelas, A. Moya and A. Latorre. The striking case of tryptophan provision in the cedar aphid Cinara cedri. J. Bacteriol., 2008, 190: 6026-6029. Gray M. W., B. F. Lang, R. Cedergren, G. B. Golding, C. Lemieux, D. Sankoff, M. Turmel, N. Brossard, E. Delage, T. G. Littlejohn, I. Plante, P. Rioux, D. Saint- Louis, Y. Zhu and G. Burger. Genome structure and gene content in protist mitochondrial DNAs. Nucleic Acids Res., 1998, 26: 865-878. Griffiths G. W. and S. D. Beck. Intracellular symbiotes of the pea aphid, Acyrthosiphon pisum. J. Insect Physiol., 1973, 19: 75–84. Hasunuma K. and M. Sekiguchi. Replication of plasmid pSC101 in Escherichia coli K12: requirement for dnaA function. Mol. Gen. Genet., 1977, 154: 225-230. Hecker M. and U. Volker. General stress response of Bacillus subtilis and other bacteria. Adv. Microb. Physiol., 2001, 44: 35-91. Helinski D. R., A. Toukdarian and R. P. Novick. : Replication control and other stable maintenance mechanisms of plasmids. In Escherichia coli and Salmonella: cellular and molecular biology. F. C. Neidhardt, I. R. Curtiss, J. Ingraham, et al., Eds., Washington DC, American Society for Microbiology, 2295–2324. Herman A., A. Wegrzyn and G. Wegrzyn. Differential replication of plasmids during stringent and relaxed response of Escherichia coli. Plasmid, 1994, 32: 89-94. Herre E. A., N. Knowlton, U. G. Mueller and S. A. Rehner. The evolution of mutualisms: exploring the paths between conflict and cooperation. Trends Ecol. Evol., 1999, 14: 49-53.

José Viñuelas 193 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Hinde R. Maintenance of aphid cells and the intracellular symbiotes of aphids in vitro. J. Invertebr. Pathol., 1971, 17: 333. Hongoh Y. and H. Ishikawa. Uric acid as a nitrogen resource for the brown planthopper, Nilaparvata lugens: Studies with synthetic diets and aposymbiotic insects. Zool. Sci., 1997, 14: 581-586. Hughes D. Evaluating genome dynamics: the constraints on rearrangements within bacterial genomes. Genome Biol., 2000, 1: 61-68. Ingmer H., E. L. Fong and S. N. Cohen. Monomer-dimer equilibrium of the pSC101 RepA protein. J. Mol. Biol., 1995, 250: 309-314. Ishikawa H. Insect Symbiosis : An introduction. In: Insect Symbiosis. K. Bourtzis and T. A. Miller, Eds., Boca Raton, Florida, CRC Press, 1-21. Itoh T., W. Martin and M. Nei. Acceleration of genomic evolution caused by enhanced mutation rate in endocellular symbionts. Proc. Natl. Acad. Sci. USA, 2002, 99: 12944- 12948. Jafri S., S. Chen and J. M. Calvo. ilvIH operon expression in Escherichia coli requires Lrp binding to two distinct regions of DNA. J. Bacteriol., 2002, 184: 5293-5300. Jeong K. S., J. Ahn and A. B. Khodursky. Spatial patterns of transcriptional activity in the chromosome of Escherichia coli. Genome Biol., 2004, 5: R86. Jin D. J. and J. E. Cabrera. Coupling the distribution of RNA polymerase to global gene regulation and the dynamic structure of the bacterial nucleoid in Escherichia coli. J. Struct. Biol., 2006, 156: 284-291. Johnson L. H., J. H. Pepper, M. N. Botkin Banning, E. Hastings and R. S. Clarck. Composition of the protein material in the exuviae of the mormon cricket, Anabrus simplex Hald. Physiol. Zoöl., 1952, 25: 250-258. Jordan I. K., I. B. Rogozin, Y. I. Wolf and E. V. Koonin. Essential genes are more evolutionarily conserved than are nonessential genes in bacteria. Genome Res., 2002, 12: 962-968. Kepes F. Periodic transcriptional organization of the E. coli genome. J. Mol. Biol., 2004, 340: 957-964. Khodursky A. B., B. J. Peter, N. R. Cozzarelli, D. Botstein, P. O. Brown and C. Yanofsky. DNA microarray analysis of gene expression in response to physiological and genetic changes that affect tryptophan metabolism in Escherichia coli. Proc. Natl. Acad. Sci. U S A, 2000, 97: 12170-12175. Kim H., B. Zhao, E. C. Snesrud, B. J. Haas, C. D. Town and J. Quackenbush. Use of RNA and genomic DNA references for inferred comparisons in DNA microarray analyses. Biotechniques, 2002, 33: 924-930. Kim T. J., T. A. Gaidenko and C. W. Price. In vivo phosphorylation of partner switching regulators correlates with stress transmission in the environmental signaling pathway of Bacillus subtilis. J. Bacteriol., 2004a, 186: 6124-6132. Kim T. J., T. A. Gaidenko and C. W. Price. A multicomponent protein complex mediates environmental stress signaling in Bacillus subtilis. J. Mol. Biol., 2004b, 341: 135-150.

José Viñuelas 194 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Kluger Y., H. Yu, J. Qian and M. Gerstein. Relationship between gene co-expression and probe localization on microarray slides. BMC Genomics, 2003, 4: 49. Koga R., K. Tsuchida and T. Fukatsu. Changing partners in an obligate symbiosis: a facultative endosymbiont can compensate for loss of the essential endosymbiont Buchnera in an aphid. Proc. Roy. Soc. London, Ser. B, 2003, 270: 2543-2550. Komaki K. and H. Ishikawa. Intracellular bacterial symbionts of aphids possess many genomic copies per bacterium. J. Mol. Evol., 1999, 48: 717-722. Komaki K. and H. Ishikawa. Genomic copy number of intracellular bacterial symbionts of aphids varies in response to developmental stage and morph of their host. Insect Biochem. Molec. Biol., 2000, 30: 253-258. Korbel J. O., L. J. Jensen, C. von Mering and P. Bork. Analysis of genomic context: prediction of functional associations from conserved bidirectionally transcribed gene pairs. Nat. Biotechnol., 2004, 22: 911-917. Kreil D. P. and R. R. Russell. There is no silver bullet--a guide to low-level data transforms and normalisation methods for microarray data. Brief. Bioinform., 2005, 6: 86-97. Kubori T., Y. Matsushima, D. Nakamura, J. Uralil, M. Lara-Tejero, A. Sukhan, J. E. Galan and S. I. Aizawa. Supramolecular structure of the Salmonella typhimurium type III protein secretion system. Science, 1998, 280: 602-605. Lai C. Y., L. Baumann and P. Baumann. Amplification of trpEG - adaptation of Buchnera aphidicola to an endosymbiotic association with aphids. Proc. Natl. Acad. Sci. USA, 1994, 91: 3819-3823. Latorre A., R. Gil, F. J. Silva and A. Moya. Chromosomal stasis versus plasmid plasticity in aphid endosymbiont Buchnera aphidicola. Heredity, 2005, 95: 339-347. Latorre A. and A. Moya. Comparative Genomics in Buchnera aphidicola, Primary Endosymbiont of Aphids. In: Insect Symbiosis Vol. 2. K. Bourtzis and T. A. Miller, Eds., Boca Raton, Florida, CRC Press, 157-174. Lawrence J. G. Gene organization: selection, selfishness, and serendipity. Annu. Rev. Microbiol., 2003, 57: 419-440. Lee C., J. Kim, S. G. Shin and S. Hwang. Absolute and relative QPCR quantification of plasmid copy number in Escherichia coli. J. Biotechnol., 2006, 123: 273-280. Lees A. D. The role of photoperiod and temperature in the determination of parthenogenetic and sexual forms in the aphid Megoura viciae Buckton. II. The operation of an 'interval timer' in young clones . J. Insect Physiol., 1960, 4: 154-175. Lercher M. J. and L. D. Hurst. Co-expressed yeast genes cluster over a long range but are not regularly spaced. J. Mol. Biol., 2006, 359: 825-831. Liadouze I., G. Febvay, J. Guillaud and G. Bonnot. Effect of diet on the free amino acid pools of symbiotic and aposymbiotic pea aphids, Acyrthosiphon pisum. J. Insect Physiol., 1995, 41: 33-40. Liadouze I., G. Febvay, J. Guillaud and G. Bonnot. Metabolic fate of energetic amino acids in the aposymbiotic pea aphid Acyrthosiphon pisum (Harris) (Homoptera: Aphididae). Symbiosis, 1996, 21: 115-127.

José Viñuelas 195 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Louis C. Non pathogenic and symbiotic virus-host relationships in Invertebrates - A review. In: Endocytobiology IV. P. Nardon, V. Gianinazzi-Pearson, A. M. Grenier, L. Margulis and D. C. Smith, Eds., Paris, INRA, 413-420. Maezawa K., S. Shigenobu, H. Taniguchi, T. Kubo, S. Aizawa and M. Morioka. Hundreds of flagellar basal bodies cover the cell surface of the endosymbiotic bacterium Buchnera aphidicola sp. strain APS. J. Bacteriol., 2006, 188: 6539-6543. Majander K., L. Anton, J. Antikainen, H. Lang, M. Brummer, T. K. Korhonen and B. Westerlund-Wikstrom. Extracellular secretion of polypeptides using a modified Escherichia coli flagellar secretion apparatus. Nat. Biotechnol., 2005, 23: 475-481. Majumder A., M. Fang, K. J. Tsai, C. Ueguchi, T. Mizuno and H. Y. Wu. LeuO expression in response to starvation for branched-chain amino acids. J. Biol. Chem., 2001, 276: 19046-19051. Manen D., L. C. Upegui-Gonzalez and L. Caro. Monomers and dimers of the RepA protein in plasmid pSC101 replication: domains in RepA. Proc. Natl. Acad. Sci. U S A, 1992, 89: 8923-8927. Manganelli R., E. Dubnau, S. Tyagi, F. R. Kramer and I. Smith. Differential expression of 10 sigma factor genes in Mycobacterium tuberculosis. Mol. Microbiol., 1999, 31: 715-724. Martin W. Gene transfer from organelles to the nucleus: frequent and in big chunks. Proc. Natl. Acad. Sci. U S A, 2003, 100: 8612-8614. Martin W., B. Stoebe, V. Goremykin, S. Hapsmann, M. Hasegawa and K. V. Kowallik. Gene transfer to the nucleus and the evolution of chloroplasts. Nature, 1998, 393: 162- 165. McLean D. L. and E. J. Houk. Phase contrast and electron microscopy of the mycetocytes and symbiotes of the pea aphid, Acyrthosiphon pisum. J. Insect Physiol., 1973, 19: 625–633. Merino E. and C. Yanofsky. Transcription attenuation: a highly conserved regulatory strategy used by bacteria. Trends Genet., 2005, 21: 260-264. Mira A. and N. A. Moran. Estimating population size and transmission bottlenecks in maternally transmitted endosymbiotic bacteria. Microbial Ecol., 2002, 44: 137-143. Mirkin E. V. and S. M. Mirkin. Mechanisms of transcription-replication collisions in bacteria. Mol. Cell. Biol., 2005, 25: 888-895. Mittler T. E. Dietary amino acid requirements of the aphid Myzus persicae affected by antibiotic uptake. J. Nutr., 1971a, 101: 1023-1028. Mittler T. E. Some effects on the aphid Myzus persicae of ingesting antibiotics incorporated into artificial diets. J. Insect Physiol., 1971b, 17: 1333-1347. Miura T., C. Braendle, A. Shingleton, G. Sisk, S. Kambhampati and D. L. Stern. A comparison of parthenogenetic and sexual embryogenesis of the pea aphid Acyrthosiphon pisum (Hemiptera: Aphidoidea). J. Exp. Zool., 2003, 295B: 59-81. Montllor C. B., A. Maxmen and A. H. Purcell. Facultative bacterial endosymbionts benefit pea aphids Acyrthosiphon pisum under heat stress. Ecol. Entomol., 2002, 27: 189-195.

José Viñuelas 196 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Moran N. A. Accelerated evolution and Muller's rachet in endosymbiotic bacteria. Proc. Natl. Acad. Sci. USA, 1996, 93: 2873-2878. Moran N. A. Tracing the evolution of gene loss in obligate bacterial symbionts. Curr. Opin. Microbiol., 2003, 6: 512-518. Moran N. A. and P. Baumann. Bacterial endosymbionts in animals. Curr. Opin. Microbiol., 2000, 3: 270-275. Moran N. A., C. Dale, H. Dunbar, W. A. Smith and H. Ochman. Intracellular symbionts of sharpshooters (Insecta: Hemiptera: Cicadellinae) form a distinct clade with a small genome. Environ. Microbiol., 2003a, 5: 116-126. Moran N. A., H. E. Dunbar and J. L. Wilcox. Regulation of transcription in a reduced bacterial genome: nutrient-provisioning genes of the obligate symbiont Buchnera aphidicola. J. Bacteriol., 2005a, 187: 4229-37. Moran N. A. and A. Mira. The process of genome shrinkage in the obligate symbiont Buchnera aphidicola. Genome Biol., 2001, 2: 54.1-54.12. Moran N. A., M. A. Munson, P. Baumann and H. Ishikawa. A molecular clock in endosymbiotic bacteria is calibrated using the insect hosts. Proc. Roy. Soc. London, Ser. B, 1993, 253: 167-171. Moran N. A., G. R. Plague, J. P. Sandstrom and J. L. Wilcox. A genomic perspective on nutrient provisioning by bacterial symbionts of insects. Proc. Natl. Acad. Sci. USA, 2003b, 3: 3. Moran N. A., J. A. Russell, R. Koga and T. Fukatsu. Evolutionary relationships of three new species of Enterobacteriaceae living as symbionts of aphids and other insects. Appl. Environ. Microbiol., 2005b, 71: 3302-3310. Moya A. S., A. Latorre, B. Sabater Munoz and F. J. Silva. Comparative molecular evolution of primary (Buchnera) and secondary symbionts of aphids based on two protein-coding genes. J. Mol. Evol., 2002, 55: 127-137. Munson M. A., P. Baumann, M. A. Clark, L. Baumann, N. A. Moran, D. J. Voegtlin and B. C. Campbell. Evidence for the establishment of aphid-eubacterium endosymbiosis in an ancestor of four aphid families. J. Bacteriol., 1991a, 173: 6321- 6324. Munson M. A., P. Baumann and M. G. Kinsey. Buchnera Gen-Nov and Buchnera- Aphidicola Sp-Nov, a taxon consisting of the mycetocyte-associated, primary endosymbionts of aphids. Int. J. Syst. Bacteriol., 1991b, 41: 566-568. Nakabachi A. and H. Ishikawa. Differential display of mRNAs related to amino acid metabolism in the endosymbiotic system o aphids. Insect Biochem. Molec. Biol., 1997, 27: 1057-1062. Nakabachi A., S. Shigenobu, N. Sakazume, T. Shiraki, Y. Hayashizaki, P. Carninci, H. Ishikawa, T. Kudo and T. Fukatsu. Transcriptome analysis of the aphid bacteriocyte, the symbiotic host cell that harbors an endocellular mutualistic bacterium, Buchnera. Proc. Natl. Acad. Sci. USA, 2005, 112: 5477-5482. Nardon P. and H. Charles. Morphological aspects of symbiosis. In: Symbiosis. J. Seckbach, Ed., 13-44.

José Viñuelas 197 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Nardon P. and A. M. Grenier. Genetical and biochemical interactions between the host and its endocytobionts in the weevils Sitophilus (Coleoptera, Curculionidae) and other related species. In: Cell to Cell Signals in Plant, Animal and Microbial Symbiosis - NATO ASI Series. S. e. a. Scannerini, Ed. Berlin, Heidelberg, Springer-Verlag. Nardon P. and A. M. Grenier. Symbiose et évolution. Ann. Soc. Entomol. Fr., 1993, 29: 113-140. Noda H., N. Nakashima and M. Koizumi. Phylogenetic position of yeast-like symbiotes of rice based on partial 18S rDNA sequences. Insect Biochem. Molec. Biol., 1995, 25: 639-646. Nogueira T. and M. Springer. Post-transcriptional control by global regulators of gene expression in bacteria. Curr. Opin. Microbiol., 2000, 3: 154-158. Oliver K. M., N. A. Moran and M. S. Hunter. Variation in resistance to parasitism in aphids is due to symbionts not host genotype. Proc. Natl. Acad. Sci. USA, 2005, 102: 12795-12800. Oliver K. M., N. A. Moran and M. S. Hunter. Costs and benefits of a superinfection of facultative symbionts in aphids. Proc. Biol. Sci., 2006, 273: 1273-1280. Oliver K. M., J. A. Russell, N. A. Moran and M. S. Hunter. Facultative bacterial symbionts of aphids confer resistance to parasitic wasps. Proc. Natl. Acad. Sci. USA, 2003, 100: 1083-1807. Omont N. and F. Kepes. Transcription/replication collisions cause bacterial transcription units to be longer on the leading strand of replication. Bioinformatics, 2004, 20: 2719- 2725. Pal C. and L. D. Hurst. Evidence against the selfish operon theory. Trends Genet., 2004, 20: 232-234. Pane-Farre J., R. J. Lewis and J. Stulke. The RsbRST stress module in bacteria: a signalling system that may interact with different output modules. J. Mol. Microbiol. Biotechnol., 2005, 9: 65-76. Panina E. M., A. G. Vitreschak, A. A. Mironov and M. S. Gelfand. Regulation of aromatic amino acid biosynthesis in gamma-proteobacteria. J. Mol. Microbiol. Biotechnol., 2001, 3: 529-543. Perez-Brocal V., R. Gil, S. Ramos, A. Lamelas, M. Postigo, J. M. Michelena, F. J. Silva, A. Moya and A. Latorre. A small microbial genome: the end of a long symbiotic relationship? Science, 2006, 314: 312-313. Perez-Brocal V., A. Latorre, R. Gil and A. Moya. Comparative analysis of two genomic regions among four strains of Buchnera aphidicola, primary endosymbiont of aphids. Gene, 2005, 345: 73-80. Perru O. Qu'est ce que la symbiose ? Rev. Questions Scient., 1997, 168: 113-136. Peter B. J., J. Arsuaga, A. M. Breier, A. B. Khodursky, P. O. Brown and N. R. Cozzarelli. Genomic transcriptional response to loss of chromosomal supercoiling in Escherichia coli. Genome Biol., 2004, 5: R87. Pfaffl M. W. A new mathematical model for relative quantification in real-time RT-PCR. Nucleic Acids Res., 2001, 29: e45.

José Viñuelas 198 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Pfaffl M. W., G. W. Horgan and L. Dempfle. Relative expression software tool (REST) for group-wise comparison and statistical analysis of relative expression results in real-time PCR. Nucleic Acids Res., 2002, 30: e36. Pfaffl M. W., A. Tichopad, C. Prgomet and T. P. Neuvians. Determination of stable housekeeping genes, differentially regulated target genes and sample integrity: BestKeeper--Excel-based tool using pair-wise correlations. Biotechnol. Lett., 2004, 26: 509-515. Pfeiffer M. and K. E. Linsenmair. Contributions to the life history of the Malaysian giant ant Camponotus gigas (Hymenoptera / Formicidae). Insectes sociaux, 2000, 47: 123- 132. Pierantoni U. Origine e struttura del corpo ovale del Dactylopius citri e del corpo verde dell'Aphis brassicae. Boll. Soc. Nat. Napoli, 1910, 24: 1-4. Plague G. R., C. Dale and N. A. Moran. Low and homogeneous copy number of plasmid- borne symbiont genes affecting host nutrition in Buchnera aphidicola of the aphid Uroleucon ambrosiae. Mol. Ecol., 2003, 12: 1095-1100. Ponsen M. B. Alimentary Tract. In: Aphids, their biology, natural enemies and control. A. K. Minks and P. Harrewijn, Eds., Elsevier, 79-97. Powell G. Intracellular salivation is the aphid activity associated with inoculation of non- persistently transmitted viruses. J. Gen. Virol., 2005, 86: 469-472. Price M. N., E. J. Alm and A. P. Arkin. Interruptions in gene expression drive highly expressed operons to the leading strand of DNA replication. Nucleic Acids Res., 2005, 33: 3224-3234. Prickett M. D., M. Page, A. E. Douglas and G. H. Thomas. BuchneraBASE: a post- genomic resource for Buchnera sp. APS. Bioinformatics, 2006, 22: 641-642. Prosser W. A. and A. E. Douglas. The aposymbiotic aphid - an analysis of chlortetracycline-treated pea aphid, Acyrthosiphon pisum. J. Insect Physiol., 1991, 37: 713-719. Prosser W. A. and A. E. Douglas. A test of the hypotheses that nitrogen is upgraded and recycled in an aphid (Acyrthosiphon pisum) symbiosis. J. Insect Physiol., 1992, 38: 93-99. Provorov N. A. Molecular basis of symbiogenic evolution: from free-living bacteria towards organelles. Zh. Obshch. Biol., 2005, 66: 371-388. Provorov N. A., N. I. Vorob'ev and E. E. Andronov. Macro- and microevolution of bacteria in symbiotic systems. Genetika, 2008, 44: 12-28. Rahbé Y. and G. Febvay. Protein toxicity to aphids - an in vitro test on Acyrthosiphon pisum. Entomol. Exp. Appl., 1993, 67: 149-160. Reeves A. and W. G. Haldenwang. Isolation and characterization of dominant mutations in the Bacillus subtilis stressosome components RsbR and RsbS. J. Bacteriol., 2007, 189: 1531-1541. Retnakaran A. and S. D. Beck. Aminoacid requirements and sulfur aminoacid metabolism in the pea aphid, Acyrthosiphon pisum. Comp. Biochem. Physiol., 1967, 24: 611-619.

José Viñuelas 199 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Reymond N., F. Calevro, J. Vinuelas, N. Morin, Y. Rahbe, G. Febvay, C. Laugier, A. Douglas, J. M. Fayard and H. Charles. Different levels of transcriptional regulation due to trophic constraints in the reduced genome of Buchnera aphidicola APS. Appl. Environ. Microbiol., 2006, 72: 7760-7766. Reymond N., H. Charles, L. Duret, F. Calevro, G. Beslon and J. M. Fayard. ROSO: optimizing oligonucleotide probes for microarrays. Bioinformatics, 2004, 20: 271-273. Rhodes J. D., P. C. Croghan and A. F. G. Dixon. Uptake, excretion and respiration of sucrose and amino acids by the pea aphid Acyrthosiphon pisum. J. Exp. Biol., 1996, 199: 1269-1276. Rispe C., F. Delmotte, R. C. van Ham and A. Moya. Mutational and selective pressures on codon and amino acid usage in Buchnera, endosymbiotic bacteria of aphids. Genome Res., 2004, 14: 44-53. Rispe C. and N. A. Moran. Accumulation of deleterious mutations in endosymbionts: Muller's ratchet with two levels of selection. Am. Naturalist, 2000, 156: 425-441. Riva A., A. S. Carpentier, F. Barloy-Hubler, A. Cheron and A. Henaut. Analyzing stochastic transcription to elucidate the nucleoid's organization. BMC Genomics, 2008, 9: 125. Rocha E. Is there a role for replication fork asymmetry in the distribution of genes in bacterial genomes? Trends Microbiol., 2002, 10: 393-395. Rocha E. P. The replication-related organization of bacterial genomes. Microbiology, 2004, 150: 1609-1627. Rocha E. P. and A. Danchin. Essentiality, not expressiveness, drives gene-strand bias in bacteria. Nat. Genet., 2003a, 34: 377-378. Rocha E. P. and A. Danchin. Gene essentiality determines chromosome organisation in bacteria. Nucleic Acids Res., 2003b, 31: 6570-6577. Rose W. C., M. J. Oesterling and M. Womack. Comparative growth on diets containing ten and nineteen amino acids, with further observations on the role of glutamic and aspartic acids. J. Biol. Chem., 1948, 176: 753–762. Roth E., K. Jeon and G. Stacey. Homology in endosymbiotic systems: The term 'symbiosome'. In: Molecular Genetics of Plant–Microbe Interactions. R. Palacios and D. P. S. Verma, Eds., St. Paul, APS Press, 220–225. Russell J. A. and N. A. Moran. Horizontal transfer of bacterial symbionts: heritability and fitness effects in a novel aphid host. Appl. Environ. Microbiol., 2005, 71: 7987-7994. Sabater B., R. C. H. J. Van Ham, D. Martinez Torres, F. Silva, A. Latorre and A. Moya. Molecular evolution of aphids and their primary (Buchnera sp.) and secondary endosymbionts: Implications for the role of symbiosis in insect evolution. Interciencia, 2001, 26: 508-512. Sabater Munoz B., L. Gomez Valero, R. C. H. J. van Ham, F. J. Silva and A. Latorre. Molecular characterization of the leucine cluster in Buchnera sp strain PSY, a primary endosymbiont of the aphid Pemphigus spyrothecae. Appl. Environ. Microbiol., 2002, 68: 2572-2575.

José Viñuelas 200 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Sabater-Muñoz B., F. Legeai, C. Rispe, J. Bonhomme, P. Dearden, C. Dossat, A. Duclert, J.-P. Gauthier, D. Giblot Ducray, W. Hunter, P. Dang, S. Kambhampati, D. Martinez-Torres, T. Cortes, A. Moya, A. Nakabachi, C. Philippe, N. Prunier- Leterme, Y. Rahbé, J.-C. Simon, D. L. Stern, P. Wincker and D. Tagu. Large-scale gene discovery in the pea aphid Acyrthosiphon pisum (Hemiptera). Genome Biol., 2006, 7: 1-11. Sabater-Munoz B., R. C. van Ham, A. Moya, F. J. Silva and A. Latorre. Evolution of the leucine gene cluster in Buchnera aphidicola: insights from chromosomal versions of the cluster. J. Bacteriol., 2004, 186: 2646-2654. Sakurai M., R. Koga, T. Tsuchida, X. Y. Meng and T. Fukatsu. Rickettsia symbiont in the pea aphid Acyrthosiphon pisum: Novel cellular tropism, effect on host fitness, and interaction with the essential symbiont Buchnera. Appl. Environ. Microbiol., 2005, 71: 4069-4075. Sandstrom J. P., J. A. Russell, J. P. White and N. A. Moran. Independent origins and horizontal transfer of bacterial symbionts of aphids. Mol. Ecol., 2001, 10: 217-228. Sapp J. Evolution by association: a history of symbiosis. New York, Oxford, Oxford university press, 1994, 255 p. Sasaki T., T. Aoki, H. Hayashi and H. Ishikawa. Amino acid composition of the honeydew of symbiotic and aposymbiotic pea aphids Acyrthosiphon pisum. J. Insect Physiol., 1990, 36: 35-40. Sasaki T. and H. Ishikawa. Production of essential amino acids from glutamate by mycetocyte symbionts of the pea aphid, Acyrthosiphon pisum. J. Insect Physiol., 1995, 41: 41-46. Sasaki T., M. Kawamura and H. Ishikawa. Nitrogen recycling in the brown planthopper, Nilaparvata lugens: involvement of yeast-like endosymbionts in uric acid metabolism. J. Insect Physiol., 1996, 42: 125-129. Sato S. and H. Ishikawa. Expression and control of an operon from an intracellular symbiont which is homologous to the groE operon. J. Bacteriol., 1997, 179: 2300- 2304. Sauvion N., H. Charles, G. Febvay and Y. Rahbé. Effects of the jackbean lectin (ConA) on the feeding behaviour and kinetics of intoxication of the pea aphid, Acyrthosiphon pisum (Harris). Entomol. Exp. Appl., 2004, 10: 31-44. Scarborough C. L., J. Ferrari and H. C. Godfray. Aphid protected from pathogen by endosymbiont. Science, 2005, 310: 1781. Schaber J., C. Rispe, J. Wernegreen, A. Buness, F. Delmotte, F. J. Silva and A. Moya. Gene expression levels influence amino acid usage and evolutionary rates in endosymbiotic bacteria. Gene, 2005, 352: 109-117. Schadt E. E., C. Li, B. Ellis and W. H. Wong. Feature extraction and normalization algorithms for high-density oligonucleotide gene expression array data. J. Cell. Biochem. Suppl., 2001, Suppl 37: 120-125. Schmidt O., U. Theopold and M. Strand. Innate immunity and its evasion and suppression by hymenopteran endoparasitoids. Bioessays, 2001, 23: 344-351.

José Viñuelas 201 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Schroder D., H. Deppisch, M. Obermayer, G. Krohne, E. Stackebrandt, B. Holldobler, W. Goebel and R. Gross. Intracellular endosymbiotic bacteria of Camponotus species (carpenter ants): systematics, evolution and ultrastructural characterization. Mol. Microbiol., 1996, 21: 479-489. Shigenobu S., H. Watanabe, M. Hattori, Y. Sakaki and H. Ishikawa. Genome sequence of the endocellular bacterial symbiont of aphids Buchnera sp. APS. Nature, 2000, 407: 81-86. Shimomura S., S. Shigenobu, M. Morioka and H. Ishikawa. An experimental validation of orphan genes of Buchnera, a symbiont of aphids. Biochem. Biophys. Res. Commun., 2002, 292: 263-267. Silva F. J., A. Latorre and A. Moya. Genome size reduction through multiple events of gene disintegration in Buchnera APS. Trends Genet., 2001, 17: 615-618. Silva F. J., A. Latorre and A. Moya. Why are the genomes of endosymbiotic bacteria so stable? Trends Genet., 2003, 19: 176-180. Silva F. J., R. C. H. J. Vanham, B. Sabater and A. Latorre. Structure and evolution of the leucine plasmids carried by the endosymbiont (Buchnera aphidicola) from aphids of the family Aphididae. FEMS Microbiol. Lett., 1998, 168: 43-49. Simon J. C., S. Carre, M. Boutin, N. Prunier-Leterme, B. Sabater-Mun, A. Latorre and R. Bournoville. Host-based divergence in populations of the pea aphid: insights from nuclear markers and the prevalence of facultative symbionts. Proc. Roy. Soc. London, Ser. B, 2003, 270: 1703-1712. Soler T., A. Latorre, B. Sabater and F. J. Silva. Molecular characterization of the leucine plasmid from Buchnera aphidicola, primary endosymbiont of the aphid Acyrthosiphon pisum. Curr. Microbiol., 2000, 40: 264-268. Srivastava P. N. and J. L. Auclair. Role of single amino acids in phagostimulation, growth, and survival of Acythosyphon pisum. J. Insect Physiol., 1975, 21: 1865-1871. Srivastava P. N., J. L. Auclair and U. Srivastava. Nucleic acid, nucleotide and protein concentrations in the pea aphid. Insect Biochem., 1980, 10: 209-213. Steinhoff C. and M. Vingron. Normalization and quantification of differential expression in gene expression microarrays. Brief. Bioinform., 2006, 7: 166-177. Stenzel T. T., T. MacAllister and D. Bastia. Cooperativity at a distance promoted by the combined action of two replication initiator proteins and a DNA bending protein at the replication origin of pSC101. Genes Dev., 1991, 5: 1453-1463. Stenzel T. T., P. Patel and D. Bastia. The integration host factor of Escherichia coli binds to bent DNA at the origin of replication of the plasmid pSC101. Cell, 1987, 49: 709- 717. Sulc K. "Pseudovitellus" und ähnliche Gewebe der Homopteren sind Wohnstätten symbiotischer Saccharomyceten. Sitzber. Bohm. Ges. Wiss., 1910, 25: 108-134. Talaat A. M., S. T. Howard, W. t. Hale, R. Lyons, H. Garner and S. A. Johnston. Genomic DNA standards for gene expression profiling in Mycobacterium tuberculosis. Nucleic Acids Res., 2002, 30: e104.

José Viñuelas 202 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Talaat A. M., P. Hunter and S. A. Johnston. Genome-directed primers for selective labeling of bacterial transcripts for DNA microarray analysis. Nat. Biotechnol., 2000, 18: 679-682. Tamas I., L. Klasson, B. Canback, A. K. Naslund, A. S. Eriksson, J. J. Wernegreen, J. P. Sandstrom, N. A. Moran and S. G. Andersson. 50 million years of genomic stasis in endosymbiotic bacteria. Science, 2002, 296: 2376-2379. Tao H., C. Bausch, C. Richmond, F. Blattner and T. Conway. Functional genomics: expression analysis of Escherichia coli growing on minimal and rich media. J. Bacteriol., 1999, 181: 6425-6440. Taylor F. J. An overview of the status of evolutionary cell symbiosis theories. Ann. N.Y. Acad. Sci., 1987, 503: 1-16. Thao M. L., L. Baumann, P. Baumann and N. A. Moran. Endosymbionts (Buchnera) from the aphids Schizaphis graminum and Diuraphis noxia have different copy numbers of the plasmid containing the leucine biosynthetic genes. Curr. Microbiol., 1998, 36: 238-240. Tikhonovich I. A., B. J. J. Lugtenberg and N. A. Provorov. Molecular Microbe-Plant Interactions: New Bridges between Past and Future (Editorial Remarks). In: Biology of Plant-Microbe Interactions. I. A. Tikhonovich, B. J. J. Lugtenberg and N. A. Provorov, Eds., St. Petersburg: Biont, 17-18. Tikhonovich I. A. and N. A. Provorov. Symbiogenetics of Microbe-Plant Interactions. Ekol. Genet., 2003, 1: 36-46. Toft C. and M. A. Fares. The evolution of the flagellar assembly pathway in endosymbiotic bacterial genomes. Mol. Biol. Evol., 2008, 25: 2069-2076. Tomii K. and M. Kanehisa. A comparative analysis of ABC transporters in complete microbial genomes. Genome Res., 1998, 8: 1048-1059. Travers A. and G. Muskhelishvili. Bacterial chromatin. Curr. Opin. Genet. Dev., 2005a, 15: 507-514. Travers A. and G. Muskhelishvili. DNA supercoiling - a global transcriptional regulator for enterobacterial growth? Nat. Rev. Microbiol., 2005b, 3: 157-169. Travers A. and G. Muskhelishvili. A common topology for bacterial and eukaryotic transcription initiation? EMBO Rep., 2007, 8: 147-151. Tremblay E. Coccoidea endosymbiosis. In: Insect endocytobiosis: morphology, physiology, genetics, evolution. W. Schwemmler and G. Gassner, Eds., Boca Raton, CRC Press, 145-173. Tse C. and J. Capeau. Real time PCR methodology for quantification of nucleic acids. Ann. Biol. Clin. (Paris), 2003, 61: 279-293. Tsuchida T., R. Koga and T. Fukatsu. Host plant specialization governed by facultative symbiont. Science, 2004, 303: 1989. Tsuchida T., R. Koga, X. Y. Meng, T. Matsumoto and T. Fukatsu. Characterization of a facultative endosymbiotic bacterium of the pea aphid Acyrthosiphon pisum. Microbial Ecol., 2005, 49: 126-133.

José Viñuelas 203 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Unterman B. M., P. Baumann and D. L. Mclean. Pea aphid symbiont relationships established by analysis of 16S rRNAs. J. Bacteriol., 1989, 171: 2970-2974. Upshur R. E., R. Moineddin, E. J. Crighton and M. Mamdani. Is there a clinically significant seasonal component to hospital admissions for atrial fibrillation? BMC Health Serv. Res., 2004, 4: 5. van Ham R. C., J. Kamerbeek, C. Palacios, C. Rausell, F. Abascal, U. Bastolla, J. M. Fernandez, L. Jimenez, M. Postigo, F. J. Silva, J. Tamames, E. Viguera, A. Latorre, A. Valencia, F. Moran and A. Moya. Reductive genome evolution in Buchnera aphidicola. Proc. Natl. Acad. Sci. USA, 2003, 100: 581-586. van Ham R. C., A. Moya and A. Latorre. Putative evolutionary origin of plasmids carrying the genes involved in leucine biosynthesis in Buchnera aphidicola (Endosymbiont of aphids). J. Bacteriol., 1997, 179: 4768-4777. van Hoek M. J. and P. Hogeweg. The role of mutational dynamics in genome shrinkage. Mol. Biol. Evol., 2007, 24: 2485-2494. Viñuelas J., F. Calevro, D. Remond, J. Bernillon, Y. Rahbe, G. Febvay, J. M. Fayard and H. Charles. Conservation of the links between gene transcription and chromosomal organization in the highly reduced genome of Buchnera aphidicola. BMC Genomics, 2007, 8: 143. Vitreschak A. G., E. V. Lyubetskaya, M. A. Shirshin, M. S. Gelfand and V. A. Lyubetsky. Attenuation regulation of amino acid biosynthetic operons in proteobacteria: comparative genomics analysis. FEMS Microbiol. Lett., 2004, 234: 357-370. Volker U., B. Maul and M. Hecker. Expression of the sigmaB-dependent general stress regulon confers multiple stress resistance in Bacillus subtilis. J. Bacteriol., 1999, 181: 3942-3948. Wang D., D. A. Kreutzer and J. M. Essigmann. Mutagenicity and repair of oxidative DNA damage: insights from studies using defined lesions. Mutat. Res., 1998, 400: 99- 115. Wang J. D., M. B. Berkmen and A. D. Grossman. Genome-wide coorientation of replication and transcription reduces adverse effects on replication in Bacillus subtilis. Proc. Natl. Acad. Sci. U S A, 2007, 104: 5608-5613. Watson K. Microbial stress proteins. Adv. Microb. Physiol., 1990, 31: 183-223. Webb B. A. and M. R. Strand. The biology and genomics of polydnaviruses. In: Comprehensive molecular insect science. L. I. Gilbert, K. Iatrou and S. S. Gill, Eds., New York, Elsevier, 323-360. Wegrzyn G. Replication of plasmids during bacterial response to amino acid starvation. Plasmid, 1999, 41: 1-16. Wegrzyn G. and A. Wegrzyn. Stress responses and replication of plasmids in bacterial cells. Microb. Cell. Fact., 2002, 1: 2. Weil M. R., T. Macatee and H. R. Garner. Toward a universal standard: comparing two methods for standardizing spotted microarray data. Biotechniques, 2002, 32: 1310- 1314.

José Viñuelas 204 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Wernegreen J. J. Genome evolution in bacterial endosymbionts of insects. Nat. Rev. Genet., 2002, 3: 850-861. Wernegreen J. J. and D. J. Funk. Mutation exposed: a neutral explanation for extreme base composition of an endosymbiont genome. J. Mol. Evol., 2004, 59: 849-858. Whelan J. A., N. B. Russell and M. A. Whelan. A method for the absolute quantification of cDNA using real-time PCR. J. Immunol. Methods, 2003, 278: 261-269. Whitehead L. F. and A. E. Douglas. A metabolic study of Buchnera, the intracellular bacterial symbionts of the pea aphid Acyrthosiphon pisum. J. Gen. Microbiol., 1993, 139: 821-826. Whitehead L. F., T. L. Wilkinson and A. E. Douglas. Nitrogen recycling in the pea aphid (Acyrthosiphon pisum) symbiosis. Proc. Roy. Soc. London, Ser. B, 1992, 250: 115- 117. Wilcox J. L., H. E. Dunbar, R. D. Wolfinger and N. A. Moran. Consequences of reductive evolution for gene expression in an obligate endosymbiont. Mol. Microbiol., 2003, 48: 1491-1500. Wilkinson T. L. The elimination of intracellular microorganisms from insects: an analysis of antibiotic-treatment in the pea aphid (Acyrthosiphon pisum). Comp. Biochem. Physiol. A, Molecul. Integr. Physiol., 1998, 119A: 871-881. Wilkinson T. L. and A. E. Douglas. Why pea aphid (Acyrthosiphon pisum) lacking symbiotic bacteria have elevated levels of the amino acid glutamine. J. Insect Physiol., 1995, 41: 921-927. Wilkinson T. L. and A. E. Douglas. The impact of aposymbiosis on amino acid metabolism of pea aphids. Entomol. Exp. Appl., 1996, 80: 279-282. Wilkinson T. L. and A. E. Douglas. Host cell allometry and regulation of the symbiosis between the pea aphids, Acyrthosiphon pisum, and bacteria, Buchnera. J. Insect Physiol., 1998, 44: 629-635. Wilkinson T. L., T. Fukatsu and H. Ishikawa. Transmission of symbiotic bacteria Buchnera to parthenogenetic embryos in the aphid Acyrthosiphon pisum (Hemiptera: Aphidoidea). Struct. Dev., 2003, 32: 241-245. Wilkinson T. L. and H. Ishikawa. Injection of essential amino acids substitutes for bacterial supply in aposymbiotic pea aphids (Acyrthosiphon pisum). Entomol. Exp. Appl., 2000, 94: 85-91. Wilkinson T. L. and H. Ishikawa. On the functional significance of symbiotic microorganisms in the Homoptera: a comparative study of Acyrthosiphon pisum and Nilaparvata lugens. Physiol. Entomol., 2001, 26: 86-93. Will T. and A. J. van Bel. Physical and chemical interactions between aphids and plants. J. Exp. Bot., 2006, 57: 729-737. Wright M. A., P. Kharchenko, G. M. Church and D. Segre. Chromosomal periodicity of evolutionarily conserved gene pairs. Proc. Natl. Acad. Sci. U S A, 2007, 104: 10559- 10564. Wrobel B. and G. Wegrzyn. Amplification of pSC101 replicons in Escherichia coli during amino acid limitation. J. Biotechnol., 1997a, 58: 205-208.

José Viñuelas 205 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Références Bibliographiques

Wrobel B. and G. Wegrzyn. Replication and amplification of lambda plasmids in Escherichia coli during amino acid starvation and limitation. FEMS Microbiol. Lett., 1997b, 153: 151-157. Wu H. Y. and M. Fang. DNA supercoiling and transcription control: a model from the study of suppression of the leu-500 mutation in Salmonella typhimurium topA- strains. Prog. Nucleic Acid Res. Mol. Biol., 2003, 73: 43-68. Xia B., H. Ke, W. Jiang and M. Inouye. The Cold Box stem-loop proximal to the 5'-end of the Escherichia coli cspA gene stabilizes its mRNA at low temperature. J. Biol. Chem., 2002, 277: 6005-6011. Yang A. X., J. Mejido, B. Bhattacharya, D. Petersen, J. Han, E. S. Kawasaki and R. K. Puri. Analysis of the quality of contact-pin fabricated oligonucleotide microarrays. Mol. Biotechnol., 2006, 34: 303-315. Yang Y. H., S. Dudoit, P. Luu, D. M. Lin, V. Peng, J. Ngai and T. P. Speed. Normalization for cDNA microarray data: a robust composite method addressing single and multiple slide systematic variation. Nucleic Acids Res., 2002, 30: e15. Young G. M., D. H. Schmiel and V. L. Miller. A new pathway for the secretion of virulence factors by bacteria: the flagellar export apparatus functions as a protein - secretion system. Proc. Natl. Acad. Sci. USA, 1999, 96: 6456-6461. Zientz E., T. Dandekar and R. Gross. Metabolic interdependence of obligate intracellular bacteria and their insect hosts. Microbiol. Mol. Biol. Rev., 2004, 68: 745-770. Zientz E., F. J. Silva and R. Gross. Genome interdependence in insect-bacterium symbioses. Genome Biol., 2001, 2: 321-326.

José Viñuelas 206 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Annexes

Annexes

José Viñuelas 207 Thèse de doctorat Spécialité : Microbes et Interactions Institut National des Sciences Appliquées de Lyon Annexes

Tableau A1. Caractéristiques des gènes du chromosome de Buchnera aphidicola issue du puceron Acyrthosiphon pisum.

Identifiant Rang Nom Position sur le chomosome Taille Taux de GC Localisation Essentialité du gène du gène Début Fin (en pb) (en %) sur le brin d'ADN

BU001 1 gidA 197 2083 1887 30,1 Précoce non essentiel BU002 2 atpB 2278 3102 825 27,74 Précoce non essentiel BU003 3 atpE 3139 3378 240 36,71 Précoce non essentiel BU004 4 atpF 3497 3982 486 26,09 Précoce non essentiel BU005 5 atpH 3982 4515 534 21,66 Précoce non essentiel BU006 6 atpA 4530 6068 1539 30,92 Précoce non essentiel BU007 7 atpG 6101 6973 873 29,08 Précoce non essentiel BU008 8 atpD 6997 8394 1398 33,55 Précoce non essentiel BU009 9 atpC 8421 8837 417 27,13 Précoce non essentiel BU010 10 gyrB 8911 11322 2412 28,14 Tardif essentiel BU011 11 dnaN 11449 12549 1101 23,68 Tardif essentiel BU012 12 dnaA 12554 13918 1365 29,18 Tardif essentiel BU013 13 rpmH 14369 14512 144 25,88 Précoce essentiel BU014 14 rnpA 14525 14872 348 24,93 Précoce essentiel BU015 15 yidC 15011 16609 1599 26,88 Précoce essentiel BU016 16 thdF 16651 18009 1359 28,48 Précoce non essentiel BU017 17 tRNA-Phe 18029 18101 73 60,27 Tardif inconnue BU018 18 mopB 18376 18666 291 35,42 Précoce essentiel BU019 19 mopA 18715 20361 1647 36,19 Précoce essentiel BU020 20 efp 20985 21596 612 27,09 Précoce essentiel BU021 21 dnaC 21614 22354 741 29,81 Tardif essentiel BU022 22 dnaT 22354 22848 495 28,05 Tardif essentiel BU023 23 yhhF 22945 23520 576 23,56 Tardif inconnue BU024 24 ftsY 23651 24787 1137 25,04 Précoce essentiel BU025 25 rpoH 24950 25804 855 32,16 Précoce non essentiel BU026 26 glmS 25945 27810 1866 27,64 Tardif non essentiel BU027 27 glmU 27844 29223 1380 26,07 Tardif essentiel BU028 28 yigL 29403 29972 570 20 Précoce inconnue BU029 29 cof 30011 30220 210 29,95 Précoce inconnue

Annexes

BU030 30 metE 31191 33467 2277 28,85 Précoce non essentiel BU031 31 purH 33590 35167 1578 27,11 Tardif non essentiel BU032 32 hupA 35308 35586 279 27,17 Tardif non essentiel BU033 33 rpoC 36321 40544 4224 13,48 Tardif essentiel BU034 34 rpoB 40622 44650 4029 31,64 Tardif essentiel BU035 35 rplL 44871 45239 369 31,97 Tardif essentiel BU036 36 rplJ 45306 45803 498 28,89 Tardif essentiel BU037 37 rplA 46069 46764 696 29,87 Tardif essentiel BU038 38 rplK 46767 47195 429 29,81 Tardif essentiel BU039 39 nusG 47243 47788 546 33,89 Tardif essentiel BU040 40 secE 47791 48174 384 23,1 Tardif essentiel BU041 41 tRNA-Thr 48489 48561 73 53,42 Tardif inconnue BU042 42 tRNA-Gly 48577 48648 72 54,17 Tardif inconnue BU043 43 tRNA-Tyr 48671 48755 85 56,47 Tardif inconnue BU044 44 tRNA-Thr 48771 48843 73 54,79 Tardif inconnue BU045 45 murB 48981 50051 1071 24,06 Tardif essentiel BU046 46 metF 50166 51044 879 27,05 Précoce non essentiel BU047 47 argE 51056 52201 1146 28,26 Tardif non essentiel BU048 48 argC 52362 53366 1005 28,34 Précoce non essentiel BU049 49 argB 53387 54160 774 31,53 Précoce non essentiel BU050 50 argG 54190 55401 1212 32,42 Précoce non essentiel BU051 51 argH 55473 56852 1380 29,56 Précoce non essentiel BU052 52 yibN 56934 57368 435 22,92 Précoce inconnue BU053 53 secB 57475 57903 429 25,35 Précoce non essentiel BU054 54 cysE 58005 58829 825 29,93 Précoce non essentiel BU055 55 rpoD 58935 60773 1839 31,54 Tardif essentiel BU056 56 dnaG 60941 62674 1734 24,73 Tardif essentiel BU057 57 rpsU 62755 62970 216 38,5 Tardif essentiel BU058 58 ygjD 63204 64214 1011 28,47 Précoce essentiel BU059 59 ribB 64192 64839 648 33,95 Tardif essentiel BU060 60 yb3052 65111 66058 948 27,41 Tardif non essentiel BU061 61 cca 66272 67516 1245 26,49 Précoce non essentiel BU062 62 bacA 67542 68339 798 22,64 Tardif non essentiel BU063 63 crr 68425 68910 486 26,29 Tardif non essentiel

Annexes

BU064 64 ptsI 68960 70675 1716 27,61 Tardif non essentiel BU065 65 ptsH 70824 71081 258 29,41 Tardif non essentiel BU066 66 cysK 71230 72177 948 30,26 Tardif non essentiel BU067 67 lig 72432 74459 2028 25,83 Précoce essentiel BU068 68 tRNA-Lys 74472 74544 73 47,95 Tardif inconnue BU069 69 tRNA-Val 74573 74645 73 56,16 Tardif inconnue BU070 70 gltX 74771 76174 1404 26,41 Précoce essentiel BU071 71 tRNA-Ala 76348 76423 76 53,95 Précoce inconnue BU072 72 fliE 76514 76810 297 24,39 Tardif non essentiel BU073 73 fliF 77074 78711 1638 25,57 Précoce non essentiel BU074 74 fliG 78708 79703 996 25,18 Précoce non essentiel BU075 75 fliH 79696 80358 663 22,88 Précoce non essentiel BU076 76 fliI 80316 81719 1404 29,76 Précoce non essentiel BU077 77 fliJ 81749 82186 438 20,41 Précoce non essentiel BU078 78 yba1 82195 82533 339 16,96 Précoce inconnue BU079 79 fliK 82624 83331 708 20,57 Précoce non essentiel BU080 80 fliM 83392 84339 948 20,85 Précoce non essentiel BU081 81 fliN 84332 84733 402 22,56 Précoce non essentiel BU082 82 fliP 84745 85884 1140 27,44 Précoce non essentiel BU083 83 fliQ 85956 86225 270 27,34 Précoce non essentiel BU084 84 fliR 86225 87001 777 22,87 Précoce non essentiel BU085 85 rpmG 87154 87321 168 26,06 Tardif essentiel BU086 86 rpmB 87332 87559 228 28,75 Tardif essentiel BU087 87 ytfN 87905 90817 2913 17,99 Précoce inconnue BU088 88 ppa 90833 91381 549 27,29 Tardif essentiel BU089 89 pmbA 91575 92915 1341 27,28 Précoce non essentiel BU090 90 rnpB 92990 93313 324 40,35 Tardif essentiel BU091 91 yraL 93393 94241 849 24,82 Tardif inconnue BU092 92 fabB 94380 95600 1221 31,53 Précoce essentiel BU093 93 talA 95840 96790 951 30,27 Précoce non essentiel BU094 94 tktB 96845 98842 1998 32,03 Précoce non essentiel BU095 95 dapE 98947 100074 1128 28,89 Précoce non essentiel BU096 96 dapA 100464 101348 885 32,09 Tardif non essentiel BU097 97 aroC 101924 102988 1065 35,88 Tardif non essentiel

Annexes

BU098 98 yb2331 103284 103844 561 27,06 Précoce inconnue BU099 99 hisG 104169 105068 900 30,77 Précoce non essentiel BU100 100 hisD 105077 106384 1308 29,96 Précoce non essentiel BU101 101 hisC 106381 107487 1107 26,72 Précoce non essentiel BU102 102 hisB 107477 108538 1062 28,61 Précoce non essentiel BU103 103 hisH 108538 109128 591 26,7 Précoce non essentiel BU104 104 hisA 109133 109873 741 28,59 Précoce non essentiel BU105 105 hisF 109852 110628 777 30,49 Précoce non essentiel BU106 106 hisI 110622 111269 648 26,2 Précoce non essentiel BU107 107 gnd 111628 113034 1407 29,1 Précoce non essentiel BU108 108 dcd 113197 113817 621 30,27 Précoce non essentiel BU109 109 metG 113965 115608 1644 25,29 Précoce non essentiel BU110 110 mesJ 115656 116978 1323 24,55 Tardif essentiel BU111 111 tRNA-Val 117008 117081 74 45,95 Tardif inconnue BU112 112 ribE 117204 117830 627 23,88 Précoce non essentiel BU113 113 rnfA 117867 118448 582 26,6 Précoce non essentiel BU114 114 rnfB 118451 118954 504 28,8 Précoce non essentiel BU115 115 rnfC 119117 120538 1422 26 Précoce non essentiel BU116 116 ydgO 120631 121629 999 25,74 Précoce non essentiel BU117 117 rnfG 121778 122272 495 28,86 Précoce non essentiel BU118 118 ydgQ 122247 122930 684 25,26 Précoce non essentiel BU119 119 nth 122941 123573 633 23,97 Précoce non essentiel BU120 120 priA 123653 125776 2124 21,53 Précoce non essentiel BU121 121 tyrS 125936 127204 1269 26,38 Précoce essentiel BU122 122 ydiC 127212 127604 393 20,51 Tardif non essentiel BU123 123 yb1688 127828 128910 1083 29,05 Précoce non essentiel BU124 124 aroH 129262 130308 1047 34,69 Précoce non essentiel BU125 125 thrS 130460 132388 1929 27,15 Précoce essentiel BU126 126 infC 132392 132931 540 31,01 Précoce essentiel BU127 127 rpmI 133018 133215 198 29,23 Précoce essentiel BU128 128 rplT 133258 133614 357 32,49 Précoce essentiel BU129 129 pheS 133809 134798 990 25,33 Précoce essentiel BU130 130 pheT 134808 137195 2388 24,57 Précoce essentiel BU131 131 himA 137200 137508 309 26,8 Précoce non essentiel

Annexes

BU132 132 queA 137550 138623 1074 27,73 Précoce non essentiel BU133 133 tgt 138664 139776 1113 26,85 Précoce non essentiel BU134 134 yajC 139801 140136 336 25,83 Précoce non essentiel BU135 135 glyS 140188 142260 2073 23,43 Tardif essentiel BU136 136 glyQ 142235 143203 969 27,23 Tardif essentiel BU137 137 nfo 143868 144713 846 28,11 Précoce non essentiel BU138 138 rplY 144748 145035 288 26,67 Précoce essentiel BU139 139 yabI 145105 145875 771 28,59 Tardif non essentiel BU140 140 surA 146062 147354 1293 21,47 Précoce non essentiel BU141 141 ksgA 147408 148229 822 21,97 Précoce non essentiel BU142 142 apaH 148274 149098 825 29,08 Précoce non essentiel BU143 143 folA 149125 149610 486 23,81 Tardif non essentiel BU144 144 carB 149700 152939 3240 32,13 Tardif non essentiel BU145 145 carA 152953 154116 1164 30 Tardif non essentiel BU146 146 dapB 154326 155135 810 29 Tardif non essentiel BU147 147 lytB 155139 156098 960 26,33 Tardif essentiel BU148 148 lspA 156163 156645 483 25,19 Tardif essentiel BU149 149 ileS 156645 159467 2823 26,63 Tardif essentiel BU150 150 ribF 159484 160425 942 23,54 Tardif non essentiel BU151 151 rpsT 160640 160909 270 27,34 Précoce non essentiel BU152 152 dnaJ 160960 162093 1134 33,51 Tardif non essentiel BU153 153 dnaK 162206 164119 1914 31,92 Tardif non essentiel BU154 154 nuoA 164454 164858 405 27,86 Précoce non essentiel BU155 155 nuoB 164892 165566 675 32,89 Précoce non essentiel BU156 156 nuoCD 165657 167459 1803 30,35 Précoce non essentiel BU157 157 nuoE 167482 167970 489 28,19 Précoce non essentiel BU158 158 nuoF 167967 169301 1335 32,58 Précoce non essentiel BU159 159 nuoG 169395 172115 2721 28,81 Précoce non essentiel BU160 160 nuoH 172127 173095 969 28,26 Précoce non essentiel BU161 161 nuoI 173120 173662 543 30,37 Précoce non essentiel BU162 162 nuoJ 173672 174184 513 24,71 Précoce non essentiel BU163 163 nuoK 174215 174517 303 26,67 Précoce non essentiel BU164 164 nuoL 174514 176358 1845 25,62 Précoce non essentiel BU165 165 nuoM 176455 177972 1518 25,81 Précoce non essentiel

Annexes

BU166 166 nuoN 178030 179439 1410 25,24 Précoce non essentiel BU167 167 folC 180565 181800 1236 27,09 Précoce non essentiel BU168 168 cvpA 181820 182301 174 15,64 Précoce non essentiel BU169 169 prsA 182379 183317 939 34,81 Tardif essentiel BU170 170 ychB 183446 184330 885 28 Tardif essentiel BU171 171 prfA 184538 185623 1086 30,84 Précoce essentiel BU172 172 hemK 185620 186453 834 25,99 Précoce non essentiel BU173 173 ychA 186613 187422 810 29 Précoce inconnue BU174 174 nadE 187430 188236 807 29,6 Tardif essentiel BU175 175 ackA 188320 189537 1218 25,02 Précoce non essentiel BU176 176 pta 189582 191708 2127 24,16 Précoce non essentiel BU177 177 yfaE 191740 192003 264 24,9 Tardif inconnue BU178 178 nrdB 192006 193136 1131 26,68 Tardif essentiel BU179 179 nrdA 193204 195489 2286 29 Tardif essentiel BU180 180 gyrA 195562 198054 2493 29,72 Tardif essentiel BU181 181 yba2 198321 199037 717 26,15 Précoce inconnue BU182 182 ahpC 199160 199753 594 30,63 Tardif non essentiel BU183 183 ung 199831 200493 663 24,89 Précoce non essentiel BU184 184 grpE 200569 201135 567 21,53 Tardif essentiel BU185 185 yfjB 201252 202130 879 30,25 Précoce inconnue BU186 186 smpA 202263 202571 309 20,59 Précoce non essentiel BU187 187 ydhD 203108 203434 327 28,95 Précoce non essentiel BU188 188 rnt 203578 204243 666 31,53 Tardif non essentiel BU189 189 sodA 204463 205074 612 25,94 Précoce non essentiel BU190 190 pth 205262 205795 534 24,91 Précoce essentiel BU191 191 ychF 205836 206924 1089 23,1 Précoce non essentiel BU192 192 thrC 207000 208289 1290 27,66 Tardif non essentiel BU193 193 thrB 208296 209225 930 29,99 Tardif non essentiel BU194 194 thrA 209246 211696 2451 25,9 Tardif non essentiel BU195 195 hpt 212355 212855 501 27,91 Précoce non essentiel BU196 196 panC 212899 213756 858 22,69 Tardif non essentiel BU197 197 panB 213771 214562 792 29,02 Tardif non essentiel BU198 198 dksA 214678 215133 456 29,14 Tardif non essentiel BU199 199 truA 215390 216190 801 29,7 Précoce non essentiel

Annexes

BU200 200 mrcB 216262 218544 2283 27,46 Précoce non essentiel BU201 201 secA 218774 221401 2628 27,31 Précoce essentiel BU202 202 mutT 221477 221851 375 22,85 Précoce non essentiel BU203 203 yacE 221834 222487 654 22,89 Tardif essentiel BU204 204 guaC 222543 223592 1050 31,52 Précoce non essentiel BU205 205 aceE 223819 226482 2664 30,59 Précoce non essentiel BU206 206 aceF 226513 227703 1191 24,94 Précoce non essentiel BU207 207 lpdA 227748 229169 1422 29,03 Précoce non essentiel BU208 208 speD 229342 230139 798 27,17 Tardif non essentiel BU209 209 speE 230158 231018 861 26,46 Tardif non essentiel BU210 210 pfs 231294 231992 699 24,28 Tardif non essentiel BU211 211 yadR 232056 232400 345 27,78 Tardif inconnue BU212 212 ftsZ 232634 233788 1155 34,03 Tardif essentiel BU213 213 ftsA 233846 235102 1257 27,03 Tardif essentiel BU214 214 ddlB 235298 236220 923 29,46 Tardif non essentiel BU215 215 murC 236217 237671 1455 25,07 Tardif essentiel BU216 216 murG 237714 238778 1065 29,28 Tardif essentiel BU217 217 ftsW 238775 239974 1200 26,57 Tardif essentiel BU218 218 murD 239971 241293 1323 25,49 Tardif essentiel BU219 219 mraY 241293 242366 1074 24,37 Tardif essentiel BU220 220 murF 242360 243727 1368 26,81 Tardif essentiel BU221 221 murE 243724 245217 1494 27,43 Tardif essentiel BU222 222 ftsI 245218 246957 1740 28,79 Tardif essentiel BU223 223 ftsL 247072 247275 204 21,39 Tardif essentiel BU224 224 yabC 247278 248216 939 27,14 Tardif inconnue BU225 225 ilvH 248338 248814 477 29,42 Tardif non essentiel BU226 226 ilvI 248819 250534 1716 33,98 Tardif non essentiel BU227 227 apbE 250805 251880 1076 23,72 Tardif non essentiel BU228 228 htrA 252152 253588 1437 29,38 Précoce non essentiel BU229 229 dapD 253632 254456 825 27,01 Tardif non essentiel BU230 230 map 254517 255311 795 27,4 Tardif essentiel BU231 231 rpsB 255574 256308 735 28,69 Précoce essentiel BU232 232 tsf 256385 257191 807 28,98 Précoce inconnue BU233 233 pyrH 257242 257970 729 29,93 Précoce essentiel

Annexes

BU234 234 frr 258051 258608 558 27,03 Précoce essentiel BU235 235 dxr 258691 259887 1197 29,9 Précoce essentiel BU236 236 uppS 259980 260735 756 26,29 Précoce essentiel BU237 237 yaeT 260969 262822 1854 21,5 Précoce inconnue BU238 238 dnaE 262859 266344 3486 26,16 Précoce essentiel BU239 239 proS 266472 268190 1719 25,47 Tardif essentiel BU240 240 flhB 268530 269681 1152 26,63 Précoce non essentiel BU241 241 flhA 269665 271764 2100 28,85 Précoce non essentiel BU242 242 argS 271888 273612 1725 26,42 Tardif essentiel BU243 243 rrs 274065 275524 1460 50,14 Précoce inconnue BU244 244 tRNA-Ile 275640 275716 77 54,55 Précoce inconnue BU245 245 tRNA-Ala 275731 275803 73 63,01 Précoce inconnue BU246 246 gloB 275795 276550 756 27,09 Tardif inconnue BU247 247 rnhA 276591 277060 470 29,82 Tardif non essentiel BU248 248 dnaQ 277113 277826 714 23,63 Précoce non essentiel BU249 249 tRNA-Asp 277898 277971 74 64,86 Précoce inconnue BU250 250 lpcA 278052 278633 582 26,08 Précoce non essentiel BU251 251 gpt 278770 279216 447 31,22 Précoce non essentiel BU252 252 grpE1 279317 279901 585 19,93 Précoce inconnue BU253 253 yfjF 279980 280279 300 23,23 Tardif inconnue BU254 254 smpB 280373 280861 489 23,05 Précoce non essentiel BU255 255 yfhC 280870 281355 486 28,78 Précoce inconnue BU256 256 acpS 281356 281736 381 25,93 Tardif essentiel BU257 257 era 281861 282712 852 21,2 Tardif essentiel BU258 258 rnc 282709 283389 681 30,24 Tardif non essentiel BU259 259 lepB 283520 284464 945 24,42 Tardif essentiel BU260 260 lepA 284480 286312 1833 27,87 Tardif non essentiel BU261 261 trmU 286436 287614 1179 25,21 Précoce essentiel BU262 262 ycfC 287650 288285 636 24,66 Précoce non essentiel BU263 263 purB 288324 289694 1371 26,46 Précoce non essentiel BU264 264 mltE 289718 290383 666 25,79 Précoce inconnue BU265 265 fabI 290497 291279 783 27,31 Précoce essentiel BU266 266 rnb 291466 293415 1950 28,03 Précoce non essentiel BU267 267 ychE 293524 294171 648 25,43 Précoce inconnue

Annexes

BU268 268 lipB 294209 294844 636 24,17 Précoce non essentiel BU269 269 lipA 294963 295934 972 26,11 Précoce non essentiel BU270 270 pyrF 296039 296749 711 25,99 Précoce non essentiel BU271 271 ribA 296797 297381 585 31,27 Précoce non essentiel BU272 272 hns 297485 297892 408 25,93 Tardif non essentiel BU273 273 cls 298238 299698 1461 27,91 Tardif non essentiel BU274 274 yciA 300079 300486 408 29,76 Tardif non essentiel BU275 275 yciB 300523 301056 534 17,84 Tardif non essentiel BU276 276 yciC 301084 301827 744 20,33 Tardif non essentiel BU277 277 trpA 301932 302741 810 24,29 Tardif non essentiel BU278 278 trpB 302760 303926 1167 32,22 Tardif non essentiel BU279 279 trpC 303964 305325 1362 24,43 Tardif non essentiel BU280 280 trpD 305306 306334 1029 24,85 Tardif non essentiel BU281 281 yedA 306569 307492 924 25,52 Précoce non essentiel BU282 282 yciL 307521 308273 753 26,13 Précoce non essentiel BU283 283 sohB 308270 309358 1089 24,31 Précoce non essentiel BU284 284 topA 309445 312030 2586 27,6 Précoce essentiel BU285 285 suhB 312083 312883 801 24,44 Tardif non essentiel BU286 286 yfgB 313130 314221 1092 25,34 Précoce inconnue BU287 287 gcpE 314272 315378 1107 28,08 Précoce essentiel BU288 288 hisS 315404 316675 1272 24,98 Précoce essentiel BU289 289 glyA 316735 317988 1254 29,02 Précoce non essentiel BU290 290 bioD 318076 318750 675 27,38 Tardif non essentiel BU291 291 bioB 319115 320146 1032 28,38 Tardif non essentiel BU292 292 bioA 320225 321511 1287 29,98 Précoce non essentiel BU293 293 ybhE 318921 317917 1005 24,45 Tardif non essentiel BU294 294 mfd 317793 315355 2439 24,71 Tardif non essentiel BU295 295 ycfU 314880 313681 1200 22,06 Précoce essentiel BU296 296 ycfV 313688 313002 687 24,85 Précoce essentiel BU297 297 ycfW 312984 311747 1238 21,57 Précoce essentiel BU298 298 gapA 311677 310667 1011 30,65 Précoce non essentiel BU299 299 fldA 310336 309821 516 25,93 Tardif essentiel BU300 300 phrB 309614 308163 1452 25,81 Précoce non essentiel BU301 301 ybgI 308166 307423 744 28,74 Précoce non essentiel

Annexes

BU302 302 sucA 307298 304569 2730 26,11 Précoce non essentiel BU303 303 sucB 304553 303291 1263 26,35 Précoce non essentiel BU304 304 gpmA 303193 302498 696 28,86 Précoce non essentiel BU305 305 pfkA 302314 301352 963 33,75 Tardif non essentiel BU306 306 glpF 301286 300495 792 27,12 Tardif non essentiel BU307 307 tpiA 300486 299719 768 25,88 Précoce non essentiel BU308 308 himD 299620 299336 285 29,08 Précoce non essentiel BU309 309 rpsA 299240 297564 1677 30,47 Précoce essentiel BU310 310 cmk 297436 296781 656 29,43 Précoce non essentiel BU311 311 aroA 296725 295442 1284 29,82 Précoce non essentiel BU312 312 serC 295375 294290 1086 28,44 Précoce non essentiel BU313 313 serS 294251 292968 1284 27,79 Précoce essentiel BU314 314 trxB 292620 291661 960 30,83 Tardif non essentiel BU315 315 infA 291554 291336 219 30,56 Tardif essentiel BU316 316 aspS 291167 289407 1761 24,8 Tardif essentiel BU317 317 znuB 289396 288608 789 28,43 Précoce inconnue BU318 318 znuC 288550 287834 717 26,75 Précoce inconnue BU319 319 pykA 286516 285074 1443 30,69 Précoce non essentiel BU320 320 zwf 284791 283316 1476 27,16 Tardif non essentiel BU321 321 htpX 283131 282253 879 31,16 Tardif non essentiel BU322 322 cspC 281904 281695 210 34,3 Tardif non essentiel BU323 323 yoaE 281392 279827 1566 30,45 Tardif inconnue BU324 324 yeaZ 279797 279132 666 23,83 Tardif inconnue BU325 325 minE 278986 278735 252 26,51 Précoce non essentiel BU326 326 minD 278731 277919 813 32,35 Précoce non essentiel BU327 327 minC 277892 277179 714 27,29 Précoce non essentiel BU328 328 yjjT 276778 275936 843 25 Tardif non essentiel BU329 329 tRNA-Leu 275914 275831 84 54,76 Précoce inconnue BU330 330 tRNA-Cys 275819 275746 74 54,05 Précoce inconnue BU331 331 tRNA-Ser 275575 275491 85 57,65 Tardif inconnue BU332 332 ompA 275385 274336 1050 29,37 Précoce non essentiel BU333 333 mviN 274199 272664 1536 25,63 Précoce inconnue BU334 334 pyrC 272389 271337 1053 26,95 Tardif non essentiel BU335 335 flgN 271317 270910 408 17,34 Précoce non essentiel

Annexes

BU336 336 flgA 270837 270157 681 26,06 Précoce non essentiel BU337 337 flgB 269820 269473 348 20 Tardif non essentiel BU338 338 flgC 269464 269054 411 29,66 Tardif non essentiel BU339 339 flgD 269042 268332 711 27,97 Tardif non essentiel BU340 340 flgE 268282 267065 1218 27,45 Tardif non essentiel BU341 341 flgF 267014 266280 735 24,21 Tardif non essentiel BU342 342 flgG 266262 265480 783 31,34 Tardif non essentiel BU343 343 flgH 265396 264680 717 29,55 Tardif non essentiel BU344 344 flgI 264499 263342 1158 27,88 Tardif non essentiel BU345 345 flgJ 263342 263043 300 23,23 Tardif non essentiel BU346 346 flgK 262941 261310 1632 25,48 Tardif non essentiel BU347 347 rne 261145 258437 2709 26,27 Précoce essentiel BU348 348 rluC 258102 257158 945 25,9 Tardif inconnue BU349 349 rpmF 257112 256948 165 31,48 Tardif essentiel BU350 350 fabD 256527 255569 959 28,07 Tardif essentiel BU351 351 fabG 255582 254848 735 27,73 Tardif essentiel BU352 352 acpP 254771 254529 243 23,75 Tardif essentiel BU353 353 tmk 254458 253820 639 23,59 Tardif essentiel BU354 354 holB 253823 252843 981 25,87 Tardif essentiel BU355 355 ycfH 252809 252015 795 25,76 Tardif inconnue BU356 356 ptsG 251870 250485 1386 30,68 Tardif non essentiel BU357 357 ycfF 250465 250121 345 23,1 Tardif inconnue BU358 358 ycfM 250044 249535 510 19,43 Tardif inconnue BU359 359 ompF 249286 248138 1149 29,49 Précoce non essentiel BU360 360 asnS 247998 246598 1401 28,97 Précoce essentiel BU361 361 pncB 246450 245251 1200 26,23 Précoce non essentiel BU362 362 pyrD 244829 243966 864 26,13 Tardif non essentiel BU363 363 ycbY 243790 241685 2106 25,01 Tardif non essentiel BU364 364 uup 241665 239875 1791 22,37 Tardif non essentiel BU365 365 yceA 239871 238897 975 25,1 Précoce inconnue BU366 366 valS 238840 235973 2868 25,2 Précoce essentiel BU367 367 pepA 235896 234397 1500 27,86 Précoce non essentiel BU368 368 argF 234137 233121 1017 27,51 Tardif non essentiel BU369 369 pyrB 233002 232070 933 28,17 Tardif non essentiel

Annexes

BU370 370 pyrI 232062 231598 465 25,32 Tardif non essentiel BU371 371 yhaR 231552 231166 387 23,7 Tardif non essentiel BU372 372 deaD 231079 229274 1806 33,06 Précoce non essentiel BU373 373 pnp 228893 226770 2124 32,77 Précoce non essentiel BU374 374 rpsO 226568 226299 270 25,53 Précoce essentiel BU375 375 truB 226194 225256 939 26,92 Précoce non essentiel BU376 376 rbfA 225218 224856 363 23,73 Précoce non essentiel BU377 377 infB 224810 222216 2595 28,55 Précoce essentiel BU378 378 nusA 222198 220708 1491 33,07 Précoce essentiel BU379 379 tRNA-Leu 220306 220281 86 56,98 Précoce inconnue BU380 380 secG 220235 219906 330 18,65 Précoce non essentiel BU381 381 mrsA 219644 218310 1335 27,03 Précoce essentiel BU382 382 hflB 218090 216300 1791 33,93 Précoce essentiel BU383 383 ftsJ 216189 215569 621 27,51 Précoce essentiel BU384 384 greA 215495 215016 480 28,09 Précoce non essentiel BU385 385 yrbA 214492 214250 243 24,58 Tardif inconnue BU386 386 murA 214188 212938 1251 30,61 Tardif essentiel BU387 387 rplU 212799 212473 327 25,93 Tardif essentiel BU388 388 rpmA 212468 212214 255 32,54 Tardif essentiel BU389 389 yhbZ 212062 211058 1005 28,84 Tardif essentiel BU390 390 rpsI 210990 210598 393 35,38 Précoce essentiel BU391 391 rplM 210577 210149 429 28,64 Précoce essentiel BU392 392 pheA 209897 208740 1158 24,68 Tardif non essentiel BU393 393 ffh 208558 207203 1356 25,94 Tardif essentiel BU394 394 rpsP 207094 206855 240 31,65 Tardif essentiel BU395 395 rimM 206853 206323 531 18,61 Tardif non essentiel BU396 396 trmD 206308 205595 714 29,68 Tardif essentiel BU397 397 rplS 205496 205149 348 30,43 Tardif essentiel BU398 398 tldD 205065 203614 1452 32,51 Précoce inconnue BU399 399 aroD 203456 203004 453 26,44 Tardif non essentiel BU400 400 fis 202811 202515 297 24,15 Précoce non essentiel BU401 401 rluD 202346 201408 939 29,27 Précoce non essentiel BU402 402 yfiO 201243 200503 741 20,33 Tardif inconnue BU403 403 alaS 200338 197702 2637 24,67 Tardif essentiel

Annexes

BU404 404 csrA 197507 197334 482 36,26 Tardif non essentiel BU405 405 tRNA-Ser 197175 197084 92 56,52 Tardif inconnue BU406 406 tRNA-Arg 197066 196993 74 56,76 Tardif inconnue BU407 407 gshA 196876 195320 1557 24,77 Tardif non essentiel BU408 408 metK 195173 194037 1137 33,51 Précoce essentiel BU409 409 endA 193802 193050 753 28,61 Tardif non essentiel BU410 410 yggJ 193078 192317 762 23,72 Tardif inconnue BU411 411 rpiA 192243 191572 672 29,15 Précoce non essentiel BU412 412 tRNA-Gln 191385 191311 75 54,67 Précoce inconnue BU413 413 tRNA-Leu 191218 191137 82 56,10 Précoce inconnue BU414 414 tRNA-Met 191125 191049 77 57,14 Précoce inconnue BU415 415 glnS 190946 189231 1716 25,34 Tardif essentiel BU416 416 pyrG 189057 187420 1638 28,47 Tardif inconnue BU417 417 eno 187390 186086 1305 30,03 Tardif essentiel BU418 418 nlpD 185928 184924 1005 21,21 Précoce non essentiel BU419 419 ygbB 184833 184348 486 26,5 Précoce essentiel BU420 420 ygbP 184332 183619 714 26,86 Précoce essentiel BU421 421 ygbQ 183536 183321 216 18,78 Précoce essentiel BU422 422 cysC 183263 182643 621 27,99 Précoce non essentiel BU423 423 cysN 182642 181221 1422 28,19 Précoce non essentiel BU424 424 cysD 181202 180294 909 30,91 Précoce non essentiel BU425 425 cysG 180284 178863 1422 28,19 Précoce non essentiel BU426 426 cysH 178524 177790 735 27,6 Précoce non essentiel BU427 427 cysI 177774 176065 1710 27,42 Précoce non essentiel BU428 428 cysJ 176065 174260 1806 25,51 Précoce non essentiel BU429 429 mutS 174069 171661 2409 26,27 Précoce non essentiel BU430 430 dsbA 171504 170866 639 19,22 Tardif non essentiel BU431 431 polA 170745 169885 861 21,91 Tardif essentiel BU432 432 yihA 169822 169205 618 23,9 Précoce essentiel BU433 433 typA 168954 167131 1824 30,7 Tardif inconnue BU434 434 gmk 167008 166385 624 24,71 Précoce essentiel BU435 435 ygfZ 166285 165326 960 24,45 Précoce inconnue BU436 436 prfB 165107 164058 1050 28,46 Tardif essentiel BU437 437 lysS 164048 162528 1521 25,89 Tardif non essentiel

Annexes

BU438 438 lysA 162462 161215 1248 28,48 Tardif non essentiel BU439 439 lgt 161149 160304 846 25,86 Tardif essentiel BU440 440 thyA 160290 159496 795 29,92 Tardif non essentiel BU441 441 yleA 159429 158110 1320 27,41 Tardif inconnue BU442 442 ybeY 157955 157620 336 24,24 Tardif inconnue BU443 443 ybeX 157539 156664 876 27,38 Tardif inconnue BU444 444 leuS 156560 153981 2580 26,35 Tardif essentiel BU445 445 holA 153941 152946 996 17,32 Tardif essentiel BU446 446 ybeN 152923 152279 645 22,59 Tardif inconnue BU447 447 yhhP 152218 151988 231 22,37 Tardif non essentiel BU448 448 asd 151841 150726 1116 29,83 Précoce non essentiel BU449 449 yhgN 150388 149840 549 29,08 Tardif inconnue BU450 450 pgk 149726 148554 1173 27,52 Tardif non essentiel BU451 451 fba 148538 147462 1077 29,42 Tardif essentiel BU452 452 yggB 147398 146481 918 28,47 Tardif inconnue BU453 453 recC 146422 143210 3213 20,97 Tardif non essentiel BU454 454 recB 143193 139669 3525 21,72 Tardif non essentiel BU455 455 recD 139663 137855 1809 22,04 Tardif non essentiel BU456 456 argA 137816 136488 1329 31,45 Précoce non essentiel BU457 457 tRNA-Met 136305 136229 77 62,34 Précoce inconnue BU458 458 mltA 136120 135041 1080 22,4 Tardif non essentiel BU459 459 ribH 135002 134520 483 29,17 Tardif non essentiel BU460 460 thiL 134490 133519 972 26,11 Tardif inconnue BU461 461 ribD1 133463 133038 426 30,39 Tardif inconnue BU462 462 ribD2 132995 132372 624 25,93 Tardif Inconnue BU463 463 nusB 132335 131904 432 23,78 Tardif essentiel BU464 464 dxs 131849 130023 1827 30,92 Précoce essentiel BU465 465 ispA 129965 129117 849 24,09 Précoce essentiel BU466 466 yajR 129065 127893 1173 22,42 Précoce inconnue BU467 467 yccK 127819 127475 345 25,44 Tardif inconnue BU468 468 cyoE 127454 126597 858 23,86 Précoce non essentiel BU469 469 cyoD 126569 126252 318 22,86 Précoce non essentiel BU470 470 cyoC 126252 125635 618 22,95 Précoce non essentiel BU471 471 cyoB 125638 123650 1989 30,82 Précoce non essentiel

Annexes

BU472 472 cyoA 123645 122755 891 23,06 Précoce non essentiel BU473 473 bolA 122456 122142 315 18,91 Tardif non essentiel BU474 474 tig 122006 120678 1329 19,91 Tardif non essentiel BU475 475 clpP 120543 119917 627 29,33 Tardif non essentiel BU476 476 clpX 119818 118529 1290 27,51 Tardif non essentiel BU477 477 lon 118337 116004 2334 29,82 Tardif non essentiel BU478 478 ppiD 115862 113991 1872 19,21 Tardif inconnue BU479 479 mdl 113018 111249 1770 28,47 Tardif non essentiel BU480 480 mdlB 111277 109505 1773 25,97 Tardif non essentiel BU481 481 dnaX 109210 108125 1086 27,26 Tardif essentiel BU482 482 ybaB 107805 107476 330 36,39 Tardif inconnue BU483 483 htpG 107330 105456 1875 25,21 Tardif non essentiel BU484 484 adk 105383 104736 648 26,82 Tardif essentiel BU485 485 tRNA-Arg 104731 104658 74 51,35 Précoce inconnue BU486 486 folD 104505 103648 858 28,85 Tardif non essentiel BU487 487 cysS 103651 102257 1395 25,29 Précoce essentiel BU488 488 ybeD 101996 101733 264 26,82 Tardif inconnue BU489 489 cspE 101626 101417 210 34,78 Précoce non essentiel BU490 490 rrf 101129 101015 115 48,70 Précoce inconnue BU491 491 rrl 100902 97990 2913 47,03 Précoce inconnue BU492 492 tRNA-Glu 97826 97754 73 60,27 Précoce inconnue BU493 493 aroE 97603 96782 822 26,25 Précoce non essentiel BU494 494 yrdC 96789 96262 528 27,08 Précoce inconnue BU495 495 smg 96164 95691 474 24,42 Précoce non essentiel BU496 496 def 95447 94926 522 24,86 Tardif essentiel BU497 497 fmt 94918 93974 945 26,96 Tardif essentiel BU498 498 rplQ 93847 93455 393 30,41 Précoce essentiel BU499 499 rpoA 93410 92421 990 34,65 Précoce essentiel BU500 500 rpsD 92392 91772 621 30,58 Précoce essentiel BU501 501 rpsK 91746 91351 396 36,9 Précoce essentiel BU502 502 rpsM 91333 90977 357 31,07 Précoce essentiel BU503 503 rpmJ 90883 90767 117 32,48 Précoce essentiel BU504 504 secY 90741 89428 1314 28,45 Précoce essentiel BU505 505 rplO 89417 88983 435 33,1 Précoce essentiel

Annexes

BU506 506 rpmD 88978 88799 180 27,68 Précoce essentiel BU507 507 rpsE 88789 88286 504 34,93 Précoce essentiel BU508 508 rplR 88270 87902 369 32,79 Précoce essentiel BU509 509 rplF 87900 87328 573 31,77 Précoce essentiel BU510 510 rpsH 87353 86961 393 31,54 Précoce essentiel BU511 511 rpsN 86932 86627 306 35,97 Précoce essentiel BU512 512 rplE 86609 86070 540 32,41 Précoce essentiel BU513 513 rplX 86055 85741 315 25,96 Précoce essentiel BU514 514 rplN 85715 85347 369 34,43 Précoce essentiel BU515 515 rpsQ 85232 84981 252 29,72 Précoce essentiel BU516 516 rpmC 84981 84784 198 28,21 Précoce essentiel BU517 517 rplP 84784 84374 411 36,52 Précoce essentiel BU518 518 rpsC 84353 83652 702 34,91 Précoce essentiel BU519 519 rplV 83633 83301 333 33,94 Précoce essentiel BU520 520 rpsS 83265 82987 279 29,71 Précoce essentiel BU521 521 rplB 82967 82146 822 34,68 Précoce essentiel BU522 522 rplW 82131 81829 303 25,33 Précoce essentiel BU523 523 rplD 81832 81227 606 32,67 Précoce essentiel BU524 524 rplC 81209 80580 630 32,7 Précoce essentiel BU525 525 rpsJ 80549 80238 312 37,5 Précoce essentiel BU526 526 tufB 79906 78635 1272 34,99 Précoce non essentiel BU527 527 fusA 78654 76546 2109 33,38 Précoce essentiel BU528 528 rpsG 76431 75961 471 35,21 Précoce essentiel BU529 529 rpsL 75919 75545 375 36,02 Précoce essentiel BU530 530 yheL 75411 75139 273 25,17 Précoce inconnue BU531 531 yheM 75112 74753 360 26,61 Précoce non essentiel BU532 532 yheN 74734 74348 387 26,04 Précoce non essentiel BU533 533 fkpA 74265 73540 726 27,03 Précoce non essentiel BU534 534 argD 73077 71851 1227 28,84 Précoce non essentiel BU535 535 yhfC 71535 70369 1167 24,14 Tardif non essentiel BU536 536 trpS 70307 69300 1008 26,15 Précoce essentiel BU537 537 rpe 69277 68591 687 29,82 Précoce non essentiel BU538 538 aroB 67707 66616 1092 32,78 Précoce non essentiel BU539 539 aroK 66598 66077 522 31,35 Précoce non essentiel

Annexes

BU540 540 tRNA-Ser 65576 65492 85 51,76 Tardif inconnue BU541 541 deoD 65474 64770 705 27,92 Précoce non essentiel BU542 542 deoB 64726 63503 1224 30,06 Précoce non essentiel BU543 543 prfC 63445 61865 1581 28,05 Précoce non essentiel BU544 544 yhgI 60754 60176 579 28,82 Précoce non essentiel BU545 545 ssb 59563 59048 516 31,58 Précoce essentiel BU546 546 dnaB 58360 56981 1380 32,4 Tardif essentiel BU547 547 gshB 56734 55772 963 28,44 Tardif non essentiel BU548 548 yqgF 55761 55354 408 25,8 Tardif essentiel BU549 549 yggS 55236 54634 603 25,17 Tardif non essentiel BU550 550 yggW 54591 53461 1131 24,82 Tardif non essentiel BU551 551 yggH 53454 52735 720 24,41 Précoce non essentiel BU552 552 mutY 52637 51585 1053 24,95 Tardif non essentiel BU553 553 yggX 51613 51332 282 20,43 Tardif non essentiel BU554 554 murI 51238 50450 789 22,52 Tardif essentiel BU555 555 sbcB 50259 49018 1242 23,64 Précoce non essentiel BU556 556 yeeX 48938 48630 309 20,92 Tardif non essentiel BU557 557 tRNA-Asn 48621 48549 73 50,68 Précoce inconnue BU558 558 tRNA-Met 48414 48342 73 54,79 Tardif inconnue BU559 559 pyrE 48248 47607 642 27,39 Tardif non essentiel BU560 560 dut 47595 47131 465 31,17 Précoce essentiel BU561 561 cysQ 47087 46290 798 30,19 Précoce non essentiel BU562 562 rplI 46303 45851 453 28,26 Précoce essentiel BU563 563 rpsR 45802 45575 228 32 Précoce essentiel BU564 564 rpsF 45449 45108 342 26,57 Précoce essentiel BU565 565 vacB 44942 42705 2238 28,19 Précoce non essentiel BU566 566 purA 42617 41316 1302 28,95 Précoce non essentiel BU567 567 hflC 41266 40334 933 29,06 Précoce non essentiel BU568 568 hflK 40331 39111 1221 28,7 Précoce non essentiel BU569 569 miaA 38954 38046 909 25,94 Précoce non essentiel BU570 570 mutL 38008 36254 1755 21,69 Précoce non essentiel BU571 571 mtlD 36154 34997 1158 25,54 Précoce non essentiel BU572 572 mtlA 34955 33057 1899 28,24 Précoce non essentiel BU573 573 pgi 32882 31233 1650 26,29 Précoce non essentiel

Annexes

BU574 574 orn 30919 30365 555 26,99 Tardif inconnue BU575 575 tRNA-Gly 30277 30202 76 56,58 Tardif inconnue BU576 576 amiB 29913 29200 714 24,05 Tardif non essentiel BU577 577 rpmE 29092 28874 219 28,7 Précoce essentiel BU578 578 hslV 28268 27756 513 31,44 Tardif non essentiel BU579 579 hslU 27743 26412 1332 31,83 Tardif non essentiel BU580 580 ibpA 26205 25732 474 24,2 Tardif non essentiel BU581 581 fpr 25655 24897 759 26,32 Tardif non essentiel BU582 582 yjeA 24879 23905 975 24,67 Précoce inconnue BU583 583 kdtB 23833 23336 498 25,05 Tardif essentiel BU584 584 yba3 23249 22146 1104 25,04 Précoce inconnue BU585 585 yba4 22153 21815 339 20,54 Précoce inconnue BU586 586 yhiQ 21660 20920 741 25,88 Tardif non essentiel BU587 587 pitA 20837 19365 1473 27,21 Précoce non essentiel BU588 588 ynfM 19214 17982 1233 26,34 Précoce non essentiel BU589 589 dapF 17948 17031 918 26,23 Précoce non essentiel BU590 590 cyaY 16906 16556 351 20,98 Tardif non essentiel BU591 591 hemC 16427 15483 945 28,24 Tardif inconnue BU592 592 hemD 15486 14729 758 22,22 Tardif inconnue BU593 593 tRNA-Pro 14723 14647 77 55,84 Précoce inconnue BU594 594 tRNA-His 14610 14535 76 51,32 Précoce inconnue BU595 595 tRNA-Arg 14505 14432 74 55,41 Précoce inconnue BU596 596 rho 14245 12986 1260 34,29 Précoce essentiel BU597 597 trxA 12856 12530 327 26,85 Précoce non essentiel BU598 598 rep 12328 10391 1938 23,88 Précoce non essentiel BU599 599 ilvC 10321 8849 1473 28,5 Précoce non essentiel BU600 600 ilvD 8801 6948 1854 31,99 Précoce non essentiel BU601 601 tRNA-Trp 6705 6632 74 47,30 Précoce inconnue BU602 602 yfhO 6461 5247 1215 30,94 Tardif inconnue BU603 603 iscU 5216 4833 384 31,23 Tardif inconnue BU604 604 hscB 4738 4214 525 16,48 Tardif inconnue BU605 605 hscA 4202 2367 1836 25,1 Tardif non essentiel BU606 606 fdx 2367 2032 336 31,83 Tardif inconnue BU607 607 yfgK 2035 674 1362 25,09 Précoce inconnue BU608 608 yfgM 581 0 582 18,87 Précoce inconnue

Annexes

Tableau A2. Caractéristiques des opérons putatifs de Buchnera aphidicola issue du puceron Acyrthosiphon pisum.

Nom de l'opéron Rang Taille Nom (en gènes) des gènes

atpB atpE atpF atpH atpB 1 8 atpA atpG atpD atpC dnaN dnaN 2 2 dnaA rpmH rpmH 3 2 rnpA mopB mopB 4 2 mopA dnaC dnaC 5 2 dnaT glmS glmS 6 2 glmU rpoC rpoC 7 2 rpoB rplL rplJ rplL 8 4 rplA rplK nusG nusG 9 2 secE argE argC argE 10 5 argB argG argH crr ptsH 11 3 ptsI ptsH fliE fliF fliG fliH fliI fliJ fliE 12 13 yba1 fliK fliM fliN fliP fliQ fliR

Annexes

rpmG rpmG 13 2 rpmB dapE dapE 14 2 dapA hisG hisD hisC hisB hisG 15 8 hisH hisA hisF hisI rnfA rnfB rnfC rnfA 16 6 ydgO rnfG ydgQ thrS infC thrS 17 4 rpmI rplT pheS pheS 18 2 pheT tgt tgt 19 2 yajC glyS glyS 20 2 glyQ surA surA 21 3 ksgA apaH carB carA 22 2 carA lytB lspA ribF 23 4 ileS ribF dnaJ dnaJ 24 2 dnaK nuoA nuoB nuoCD nuoE nuoF nuoG nuoA 25 13 nuoH nuoI nuoJ nuoK nuoL nuoM nuoN

Annexes

nrdB nrdA 26 2 nrdA pth pth 27 2 ychF thrC thrC 28 3 thrB thrA panC panC 29 2 panB aceE aceE 30 3 aceF lpdA speD speD 31 2 speE ftsZ ftsA ddlB murC murG ftsW ftsZ 32 13 murD mraY murF murE ftsI ftsL yabC ilvH ilvH 33 2 ilvI rpsB rpsB 34 2 tsf flhB flhB 35 2 flhA era era 36 2 rnc lepB lepA 37 2 lepA ycfC ycfC 38 2 purB lipB lipA 39 2 lipA yciA yci 40 3 yciB yciC trpA trpB trp 41 4 trpC trpD bioD bioD 42 3 bioB bioA

Annexes

sucA suc 43 2 sucB himD himD 44 3 rpsA cmk aroA aroA 45 2 serC znuB znuB 46 2 znuC minE minE 47 3 minD minC flgN flgA flgB flgC flgD flgE flgN 48 12 flgF flgG flgH flgI flgJ flgK fabD fabD 49 3 fabG acpP ycfF ycfF 50 2 ycfM ycbY ycbY 51 2 uup pyrB pyrB 52 2 pyrI pnp rpsO truB pnp 53 6 rbfA infB nusA hflB hflB 54 2 ftsJ rplU rplU 55 2 rpmA rpsI rpsI 56 2 rplM rpsP rimM rpsP 57 4 trmD rplS

Annexes

cysC cysN cysD cysC 58 7 cysG cysH cysI cysJ prfB prfB 59 3 lysS lysA lgt lgt 60 2 thyA ybeY ybeX 61 2 ybeX recC recC 62 3 recB recD ribD1 rib 63 2 ribD2 dxs dxs 64 3 ispA yajR cyoE cyoD cyo 65 5 cyoC cyoB cyoA clpP clpP 66 2 clpX mdl mdl 67 2 mdlB rrf rrf 68 2 rrl rpoA rpsD rpsM 69 3 rpsK rpsM rpmJ secY rplO rpmD rpsE rplR rpmJ 70 12 rplF rpsH rpsN rplE rplX rplN

Annexes

rpsQ rpmC rplP rpsC rplV rpsQ 71 11 rpsS rplB rplW rplD rplC rpsJ tufB fusA rpsL 72 4 rpsG rpsL yheL yheL 73 3 yheM yheN trpS rpe aroK 74 4 aroB aroK deoD deoD 75 2 deoB rplI rpsF 76 3 rpsR rpsF hflC hflK hflC 77 4 miaA mutL mtlD mtlD 78 2 mtlA hslV hsl 79 2 hslU hemC hemC 80 2 hemD ilvC ilvC 81 2 ilvD hscB hscB 82 3 hscA fdx

FOLIO ADMINISTRATIF

THESE SOUTENUE DEVANT L'INSTITUT NATIONAL DES SCIENCES APPLIQUEES DE LYON

NOM : VIÑUELAS DATE de SOUTENANCE : 26/11/2008 Prénoms : José TITRE : Caractérisation des capacités de régulation génétique de la bactérie Buchnera aphidicola en liaison avec sa fonction symbiotique chez le puceron Acyrthosiphon pisum NATURE : Doctorat Numéro d’ordre : 2008-ISAL-0098 Ecole doctorale : Evolution, Ecosystèmes, Microbiologie, Modélisation (E2M2) Spécialité : Microbes et Interactions Code B.I.U. – Lyon : T 50/210/19 / et bis CLASSE : RESUME : Les pucerons, un fléau majeur dans le monde agricole, se nourrissent exclusivement de la sève phloémienne des plantes. Leur adaptation à ce milieu contraint a été possible grâce à une symbiose intracellulaire obligatoire avec la bactérie Buchnera aphidicola, qui fournit à son hôte les acides aminés essentiels dont il a besoin. Le premier volet de ce travail a consisté à savoir si, malgré l'importante réduction de la taille de son génome, il existe toujours chez Buchnera une influence réciproque entre la transcription des gènes et l’organisation du chromosome, comme il a été observé chez les bactéries de forme libre. Les résultats obtenus, à l'aide d'une puce à ADN dédiée au génome de la bactérie, ont révélé la conservation de relations entre l'expression des gènes et l'organisation de son chromosome. Chez Buchnera les gènes fortement exprimés sont de préférence des gènes essentiels, conservés et organisés en opérons. Inversement, aucune relation entre expressivité et distribution préférentielle des gènes sur le brin direct d'ADN n'a été détectée. Enfin, l'observation de signaux transcriptomiques périodiques liés à l'agencement des gènes le long du chromosome suggère la conservation de mécanismes de régulation transcriptionnels globaux via la conformation du nucléoïde chez cette bactérie. Le deuxième volet de cette thèse a eu comme objectif de déterminer les mécanismes moléculaires sous-jacents à la réponse de la bactérie aux besoins nutritionnels du puceron lorsque celui-ci est soumis à un stress en leucine. Une analyse basée sur des techniques de PCR quantitative nous a permis de mesurer l'amplification du plasmide pLeu contenant les gènes de biosynthèse de la leucine ainsi que les variations des niveaux d'expression de ces derniers , en réponse à une cinétique de stress. Les résultats obtenus ont révélé l'existence d'une réponse transcriptionnelle spécifique précoce de Buchnera dès douze heures de stress, et ceci aussi bien pour une carence que pour un excès de leucine. Cette réponse, dont l'intensité décroit dans le temps, est alors complétée par une réponse tardive, mettant en jeu le taux d'amplification du plasmide qui augmente ou diminue respectivement lorsque la carence ou l'excès de leucine perdure. Les données présentées ici suggèrent l'existence chez Buchnera, et ceci malgré son génome très réduit, de mécanismes de régulation génétiques essentiels à l'adaptation du puceron aux contraintes de son environnement. MOTS CLES : symbiose, Buchnera/Acyrthosiphon pisum, chromosome, transcriptome, plasmide, leucine Laboratoire(s) de recherches : Laboratoire de Biologie Fonctionnelle, Insectes et Interactions UMR 0203 INRA / INSA de Lyon (BF2I) Directeurs de thèse : Federica Calevro, Jean-Michel Fayard Composition du jury : Président : G. Febvay Rapporteurs : J. Geiselmann, J.-C. Simon Examinateurs : M. Poirié, E. Rocha Directeurs : F. Calevro, J.-M. Fayard