Les géants et l’origine des ARN polymérases des eucaryotes Patrick Forterre, Morgan Gaia

To cite this version:

Patrick Forterre, Morgan Gaia. Les virus géants et l’origine des ARN polymérases des eucaryotes. médecine/sciences, EDP Sciences, 2021, 37 (3), pp.230-233. ￿10.1051/medsci/2021007￿. ￿hal-03175318￿

HAL Id: hal-03175318 https://hal.archives-ouvertes.fr/hal-03175318 Submitted on 19 Mar 2021

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. NOUVELLE 1Département de microbiologie, Institut Pasteur, 25 rue du Docteur-Roux, 75015 Paris, France. 2Institut de biologie intégrative de la cellule Les virus géants et l’origine (I2BC), Département de microbiologie, CEA, CNRS, Université Paris-Saclay, des ARN polymérases 91198 Gif-sur-Yvette, France. des eucaryotes 3Génomique Métabolique, Genoscope, Patrick Forterre1, 2, Morgan Gaia3 Institut François Jacob, CEA, CNRS, Univ. Évry, Université Paris-Saclay, 91057 Évry, France. [email protected] [email protected] > La découverte en 2003 du premier virus les ARN pol I et II, sont probablement [email protected] géant, le , dont le génome a d’origine virale. une taille de 1,2 Mb, a soulevé de très tion des NCLDV : les et les nombreuses questions, en particulier sur Une phylogénie de référence pour les (dont les génomes sont l’origine de ces virus et leur place dans le NCLDV encore deux fois plus grands que ceux monde vivant [1, 2]. Bien que ces virus L’analyse phylogénétique de huit gènes des Mimivirus et qui font partie des puissent sembler fondamentalement marqueurs conservés chez presque tous Phycodnaviridae) sont devenus géants différents des autres, ce n’est pas le les NCLDV a permis d’organiser les diffé- indépendamment au cours de l’évolu- cas : Mimivirus et les autres virus géants rentes familles de NCLDV en deux grands tion des PAM, tandis qu’Orpheovirus (du font partie d’un même phylum grou- groupes, que nous avons désignés d’après groupe des Pitho-like ), un autre pant plusieurs familles de virus à ADN, les initiales de ces familles : les groupes virus géant, serait apparu au cours de les Nucleocytoviricota, communément MAPI (pour Marseilleviridae, Ascoviridae, l’évolution des MAPI (Figure 1). Les virus appelés NCLDV (nucleocytoplasmic large Pitho-like viruses, ) et PAM géants ne sont donc pas les descendants DNA viruses) [3]. Ces virus sont tous de (pour Phycodnaviridae, Asfarviridae, de cellules qui seraient devenues des grande taille, les plus petits correspon- Mimiviridae) [4] (Figure 1). Nous avons virus, mais ont évolué à partir de virus dant à la famille du virus de la variole, préféré exclure la famille des Poxviridae, plus petits, peut-être en même temps dont le génome est « seulement » dix comprenant les virus de la variole et de que la taille de leurs hôtes augmentait. fois plus petit que celui des géants. Les la vaccine, car les protéines de ces virus Ces derniers, des protistes unicellulaires différentes familles de NCLDV infectent évoluent trop rapidement pour pouvoir de grande taille, tels que les amibes les eucaryotes les plus divers (animaux, les placer avec certitude dans une phylo- du genre , ont en effet algues, protistes), ce qui suggère une génie. Nos analyses préliminaires avaient l’habitude de phagocyter des bactéries origine très ancienne dans l’évolution d’ailleurs suggéré que leur inclusion pou- pour se nourrir. En acquérant une taille des espèces. Nous avons récemment pu vait être source d’artéfacts. sensiblement identique à celle d’une le confirmer en réalisant des analyses petite bactérie, les virus géants pour- phylogénétiques approfondies de ces Trois apparitions indépendantes raient tromper leurs proies qui, agis- virus [4]. De plus, en analysant leurs du gigantisme chez les NCLDV sant en prédateurs, vont les ingérer ARN polymérases (ARN Pol) et les ARN Notre étude a montré que le gigan- et se faire infecter par la même occa- Pol cellulaires, notre étude a montré que tisme était apparu au moins trois fois sion [5]. Ces virus chercheraient donc deux des trois ARN Pol des eucaryotes, indépendamment au cours de l’évolu- à « mimer » une bactérie, justifiant le

230 m/s n° 3, vol. 37, mars 2021 https://doi.org/10.1051/medsci/2021007

Livre_EDKMars2021.indb 230 09/03/2021 10:15:02 Orpheovirus 250 kb 500 kb 750 kb 1 Mb 1,25 Mb 1,5 Mb 1,75 Mb 2 Mb 2,25 Mb sibericum Pitho-like virus Cedratvirus A11 Marseilleviridae

Iridoviridae I MAPI MAGAZINE Iridoviridae II & Ascoviridae Heterosigma akashiwo virus 01 Ostreococcus tauri virus 1 Paramecium bursaria Chlorella virus 1 Acanthocystis turfacea Chlorella virus 1 Feldmannia species virus Ectocarpus siliculosus virus Phycodnaviridae Emiliania huxleyi virus 86 Emiliania huxleyi virus 202 Mollivirus sibericum Pandoravirus salinus Pandoravirus dulcis Pandoravirus Asfarviridae Organic lake phycodnavirus 2

Organic lake phycodnavirus 1 NOUVELLES

Phaeocystis globosa virus PAM Chrysochromulina ericina virus Cafeteria roenbergensis virus Mimiviridae Catovirus Klosneuvirus Tupanvirus isolate soda lake Acanthamoeba polyphaga mimivirus Acanthamoeba polyphaga lentillevirus Acanthamoeba castellanii mamavirus Nombre moyen de Megavirus courdo7 0,1 Megavirus chiliensis substitutions par site Moumouvirus Monve Acanthamoeba polyphaga moumouvirus

Figure 1. Phylogénie des virus Nucleocytoviricota (NCLDV) fondée sur une analyse de la concaténation de 8 gènes marqueurs, présents chez la plupart des NCLDV, codant les deux grandes sous-unités de l’ARN polymérase, l’ADN polymérase, l’ADN primase/hélicase, la protéine majeure de capside, l’ATPase d’encapsidation, et les facteurs de TF2S et VLTF3. Les tailles moyennes des génomes des virus appartenant aux dif- férentes familles de NCLDV sont indiquées à droite. MAPI : groupe de virus NCLDV comportant les Marseilleviridae, les Ascoviridae, les Pitho-like viruses, et les Iridoviridae ; PAM : groupe de virus NCLDV comportant les Phycodnaviridae, les Asfarviridae, et les Mimiviridae.

nom de Mimivirus donné au premier de l’intérieur en cellules virales pouvant Deux des trois ARN polymérases des d’entre eux, ainsi que le nom Imiter- parfois bénéficier de l’apport de nou- eucaryotes auraient une origine virale virales attribué récemment par l’ICTV veaux gènes codés dans le génome du En plus de ces gènes impliqués dans la (international committee on taxonomy virus et qui vont augmenter la producti- formation des virions, tous les NCLDV of viruses) à l’ordre dans lequel se vité et l’efficacité du cycle viral. partagent un petit groupe de protéines trouve la famille des Mimiviridae. Tan- L’origine des NCLDV reste mystérieuse. impliquées dans la réplication et la dis que les bactéries ou les archées La plupart de ces virus possèdent des transcription de leurs génomes qui ont parasites intracellulaires évoluent tou- protéines de capside et des ATPases évolué en parallèle de façon verticale jours par régression, il semble donc que utilisées pour l’encapsidation qui sont (c’est-à-dire héritées), ce qui nous a les virus, bien qu’étant des parasites homologues aux protéines équivalentes permis d’établir la phylogénie de la obligatoires, peuvent parfois évoluer présentes chez plusieurs familles de Figure 1 [4]. En particulier, la plupart en devenant plus complexes. Toutes petits virus à ADN infectant les trois des génomes des NCLDV codent leur les familles et sous-familles de NCLDV domaines du vivant (archées, bactéries, propre ARN Pol, qui est homologue des possèdent en effet de nombreux gènes et eucaryotes). Ils ont donc été récem- ARN Pol cellulaires, ce qui permet de qui leur sont spécifiques et qui sont ment classés avec tous ces virus par produire des arbres phylogénétiques sans doute apparus après leur diversi- l’ICTV dans un même « domaine viral » comprenant à la fois ces virus, les fication, comme cela a été montré dans (realm en Anglais), celui des Varidna- archées, les bactéries, et les eucaryotes. le cas des Pandoravirus [6]. Cette com- viria [3]. Si l’on considère que l’histoire Une telle analyse n’en est pas moins plexification des virus, pourtant para- des virions représente celle des virus, les délicate : alors qu’une première étude sites, pourrait venir du fait qu’ils ne se Varidnaviria descendraient donc tous des ARN Pol avait situé les NCLDV dans contentent pas d’exploiter les cellules d’un ancêtre commun de type viral très un groupe monophylétique séparé des qu’ils infectent, mais les transforment ancien. domaines cellulaires, et conduisant à la

m/s n° 3, vol. 37, mars 2021 231

Livre_EDKMars2021.indb 231 09/03/2021 10:15:03 avaient commencé à diverger entre eux Archées avant l’apparition de LECA. Nos résul- Eucaryotes RNAP-III tats confirmaient donc l’ancienneté des Eucaryotes RNAP-I NCLDV. Toutefois, les NCLDV ne formaient pas un groupe à part (« un quatrième Asfarviridae domaine » du vivant), mais nos résul- Eucaryotes RNAP-II tats montraient également que plusieurs Mimiviridae familles et groupes monophylétiques MAPI conservaient les mêmes positions rela- Phycodnaviridae tives que dans la topologie obtenue avec 0,1 Nombre moyen de substitutions par site l’ensemble des marqueurs conservés chez les NCLDV : il apparaissait que c’étaient Figure 2. Représentation schématique de la phylogénie des archées, eucaryotes, et virus Nucleo- deux des ARN Pol des eucaryotes qui cytoviricota (NCLDV) fondée sur une analyse de la concaténation des deux grandes sous-unités branchaient entre les NCLDV plutôt que des ARN polymérases des archées, des cellules eucaryotes (triangles en trait plein), et des NCLDV l’inverse. Ainsi, les NCLDV auraient bien (triangles en pointillé). L’arbre phylogénétique a été « enraciné » en utilisant les archées comme recruté initialement leur ARN Pol à partir groupe extérieur. Les trois cercles rouges indiquent les trois positions de LECA, à la base des trois d’un hôte cellulaire. Toutefois, contrai- clades correspondant aux trois ARN polymérases (RNAP) des eucaryotes. MAPI : groupe de virus rement à l’hypothèse qui proposait de NCLDV comportant les Marseilleviridae, les Ascoviridae, les Pitho-like viruses, et les Iridoviridae. multiples recrutements à partir de diffé- rents groupes d’eucaryotes modernes, ce recrutement n’aurait eu lieu qu’une seule notion de quatrième domaine du vivant sèdent au moins trois ARN Pol : l’ARN fois, à partir d’un ancêtre très lointain [7], deux publications successives Pol I, qui transcrit principalement les de tous les eucaryotes actuels. La posi- avaient critiqué ces résultats [8, 9]. gènes codant les ARN ribosomiques, l’ARN tion de l’ARN Pol III, la plus proche des En utilisant les mêmes données, mais Pol II, qui produit les ARN messagers (et séquences d’archées, à la base des euca- en appliquant des modèles d’évolution est souvent considérée comme étant ryotes et des NCLDV suggérait que cette plus sophistiqués, les auteurs de ces l’homologue des ARN Pol des archées et ARN Pol, non seulement était l’homologue études obtenaient des phylogénies dans des bactéries), et l’ARN Pol III, qui trans- des ARN Pol des archées et des bactéries, lesquelles les ARN Pol des NCLDV émer- crit principalement les gènes codant les mais était également davantage similaire geaient des eucaryotes à différentes ARN de transfert. L’inclusion de ces trois à celle recrutée initialement par l’ancêtre positions. Selon eux, les NCLDV ne for- ARN Pol des eucaryotes et des séquences des NCLDV. Toutefois, outre la position maient donc pas un quatrième domaine, d’ARN Pol issues des NCLDV dans notre des ARN Pol III, les ARN Pol I et II émer- mais auraient recruté les gènes codant analyse phylogénétique nous a permis de geaient au milieu des NCLDV. Nous avons leurs ARN Pol à partir de leurs hôtes plu- proposer un scénario évolutif différent conclu que ces dernières avaient dû être sieurs fois indépendamment. Toutes ces des précédents [4]. recrutées par les ancêtres des eucaryotes phylogénies étaient toutefois assez mal Étonnamment, l’ARN Pol des euca- modernes à partir des NCLDV. La pré- résolues, et systématiquement fondées ryotes restée la plus proche de celles sence des trois ARN Pol des eucaryotes sur l’analyse de l’une des deux grandes des archées n’était pas l’ARN Pol II, mais indiquant la position relative de LECA, sous-unités de l’ARN Pol seulement. l’ARN Pol III. La présence des trois ARN Pol il est possible de conclure que tous ces Nous avions montré en 2017 qu’il était des eucaryotes dans notre jeu de données évènements ont eu lieu entre les ancêtres possible d’obtenir une phylogénie uni- permettait de virtuellement situer trois des NCLDV et les proto-eucaryotes, c’est- verselle du vivant très robuste en conca- fois dans notre arbre phylogénétique à-dire la lignée cellulaire précédant LECA, ténant les deux sous-unités des ARN la position relative du dernier ancêtre qui marque l’émergence des eucaryotes Pol des archées, des bactéries et des commun des eucaryotes (last eukaryotic modernes. eucaryotes [10]. Nous avons donc décidé common ancestor, LECA) (Figure 2). En Ces résultats remettent donc en question d’y ajouter les ARN Pol des NCLDV afin de effet, puisque ces trois ARN Pol sont pré- la vision traditionnelle sur l’origine des compléter notre arbre phylogénétique. sentes chez tous les eucaryotes actuels, trois ARN Pol des eucaryotes. On pensait De plus, dans la plupart des études elles devaient être déjà présentes chez jusque-là qu’elles étaient apparues par menées jusque-là, seule l’ARN Pol II des LECA. Or, les ARN Pol des NCLDV émer- duplication de gènes chez les proto- eucaryotes avait été utilisée comme geaient à des positions différentes entre eucaryotes. Or notre analyse montre que marqueur évolutif de ce domaine, alors les trois groupes d’ARN Pol des euca- ce n’est pas le cas, et que les NCLDV ont que toutes les cellules eucaryotes pos- ryotes, ce qui indiquait que les NCLDV joué un rôle majeur dans la formation

232 m/s n° 3, vol. 37, mars 2021

Livre_EDKMars2021.indb 232 09/03/2021 10:15:04 de la cellule eucaryote moderne. Il est à différentes périodes de l’évolution, 4. Guglielmini J, Woo AC, Krupovic M, et al. Diversification of giant and large eukaryotic dsDNA impressionnant de penser que l’ARN Pol II, apporter des éléments qui ont progressi- viruses predated the origin of modern eukaryotes. l’enzyme qui transcrit en ARN messagers vement conduit à l’émergence du noyau Proc Natl Acad Sci USA 2019 ; 116 : 19585-92. tous nos gènes codant des protéines, est cellulaire tel que nous le connaissons. 5. Gujgo E, Kartenbeck J, Lien P, et al. Amoebal pathogen mimivirus infects macrophages through d’origine virale. Plus généralement, on peut penser que phagocytosis. PLoS Pathog 2008 ; doi: 10.1371/ la coévolution et la « course aux arme- journal.ppat.1000087. 6. Legendre M, Fabre E, Poirot O, et al. Diversity and MAGAZINE L’hypothèse d’une origine virale ments » entre NCLDV et proto-euca- evolution of the emerging family. Nat du noyau des cellules eucaryotes à ryotes a dû jouer un rôle important dans Commun 2018 ; 9 : 2285. nouveau sur le devant de la scène la complexification croissante de ces 7. Colson P, de Lamballerie X, Fournous G, et al. Reclassification of giant viruses composing a Chez les bactéries, on a récemment derniers entre le dernier ancêtre commun fourth domain of life in the new order Megavirales. découvert des virus qui provoquent la aux archées et aux eucaryotes et LECA. ‡ Intervirology 2012 ; 55 : 321-32. formation d’un noyau au sein duquel le Giant viruses and the origin of euka- 8. Williams TA, Embley TM, Heinz E. Informational gene phylogenies do not support a fourth domain of life for génome viral est répliqué [11]. Cette ryotic RNA polymerases nucleocytoplasmic large DNA viruses. PLoS One 2011 ; observation renforce l’hypothèse selon 6 : e21080. 9. Moreira D, López-García P. Evolution of viruses and LIENS D’INTÉRÊT NOUVELLES laquelle le noyau des cellules eucaryotes cells: do we need a fourth domain of life to explain Les auteurs déclarent n’avoir aucun lien d’intérêt aurait évolué à partir des usines virales the origin of eukaryotes? Philos Trans R Soc B Biol Sci concernant les données publiées dans cet article. des NCLDV (pour revue, voir [12]). Ces 2015 ; 370 : 20140327. 10. Da Cunha V, Gaia M, Gadelle D, et al. Lokiarchaea are usines virales, qui se développent dans RÉFÉRENCES close relatives of Euryarchaeota, not bridging the le cytoplasme pour la production de gap between prokaryotes and eukaryotes. PLoS Genet virions, présentent en effet des simi- 1. La Scola B, Audic S, Robert C, et al. A in 2017 ; 13 : e1006810. amoebae. Science 2003 ; 299 : 2033. 11. Chaikeeratisak V, Nguyen K, Khanna K, et al. Assembly larités de taille et de structure avec le 2. Raoult D, Forterre P. Redefining viruses: lessons from of a nucleus-like structure during viral replication in noyau des cellules eucaryotes. Dans le mimivirus. Nat Rev Microbiol 2008 ; 6 : 315-9. . Science 2017 ; 355 : 194-7. 3. Koonin EV, Dolja VV, Krupovic M, et al. Global 12. Forterre P, Gaïa M. Giant viruses and the origin of cadre de cette hypothèse, nos résultats organization and proposed megataxonomy of the virus modern eukaryotes. Curr Opin Microbiol 2016 ; 31 : suggèrent que plusieurs NCLDV ont pu, world. Microbiol Mol Biol Rev 2020 ; 84 : e00061-19. 44-9.

m/s n° 3, vol. 37, mars 2021 233

Livre_EDKMars2021.indb 233 09/03/2021 10:15:04