Thesis Reference
Total Page:16
File Type:pdf, Size:1020Kb
Thesis A phylogenomic contribution to the eukaryotic tree of life BURKY, Fabien Abstract Depuis quelques années, la phylogénie moléculaire, c'est-à-dire l'étude des relations évolutives entre les êtres vivants en comparant des séquences d'ADN ou d'acides aminés, a profondément modifié notre vision de l'arbre des eucaryotes. Le schéma qui est actuellement accepté par le plus grand nombre voit cinq assemblages majeurs d'organismes regroupant toutes les espèces d'eucaryotes : ce sont les ‘super-groupes' (unikonts, excavates, Plantae, chromalveolates et Rhizaria). Si l'existence de ces super-groupes fait figure de consensus, les relations phylogénétiques qui les lient sont encore très incertaines. La phylogénomique est un nouvel outil de la biologie évolutive permettant d'adresser d'importantes questions qui étaient jusque-là restées sans réponse, faute d'information suffisante. Grâce à l'accumulation de données génomiques, il devient en effet possible d'utiliser un nombre toujours plus important de marqueurs moléculaires (gènes ou protéines) pour une diversité croissante d'organismes en vue de reconstruire les relations phylogénétiques à l'échelle des eucaryotes. Les [...] Reference BURKY, Fabien. A phylogenomic contribution to the eukaryotic tree of life. Thèse de doctorat : Univ. Genève, 2009, no. Sc. 4077 URN : urn:nbn:ch:unige-18450 DOI : 10.13097/archive-ouverte/unige:1845 Available at: http://archive-ouverte.unige.ch/unige:1845 Disclaimer: layout of this document may differ from the published version. 1 / 1 UNIVERSITÉ DE GENÈVE FACULTÉ DES SCIENCES Département de zoologie Professeur Jan Pawlowski et biologie animale A phylogenomic contribution to the eukaryotic tree of life THÈSE Présentée à la Faculté des sciences de l’Université de Genève pour obtenir le grade de Docteur ès sciences, mention biologie par Fabien BURKI de Genève (Suisse) Thèse No 4077 GENÈVE ReproMail: atelier d’impression à Uni Mail 2009 Remerciements Je tiens à exprimer ici ma plus profonde reconnaissance à toutes les personnes qui, de prés ou de loin, m’ont apporté leur soutient et leur confiance tout au long de cette aventure. Au Professeur Jan Pawlowski tout d’abord… Jan, que dire en particulier il y a tellement de pensées qui me viennent à l’esprit. Nous nous sommes rencontré il y a 8 ans, lorsque je suis venu frapper à ta porte pour un travail de diplôme. 8 ans ! Après une période d’incertitudes où je ne savais plus très bien quel chemin suivre, tu m’a à nouveau accordé ta confiance en m’acceptant comme doctorant, il y a 4 ans et demi. Depuis lors, ce ne fût que bonheur et découverte. Merci pour la liberté que tu m’as ac- cordée. Merci pour ta disponibilité, ton écoute, tes conseils. To Professor Kamran Shalchian-Tabrizi. Thank you so much for all your help, our countless discussions over skype, and the aquavit. You’re more than just a collea- gue ! Au Professeur Louisette Zaninetti, pour le souvenir merveilleux de mes années de diplôme qui m’a fait revenir frapper à la porte du labo. A Juan, pour ton dévouement, ta disponibilité et tes explications toujours telle- ment claires qu’en fait… on les comprend, même s’il s’agit de phylogénie… A Jackie, pour tes connaissances, ta contribution, et… nos discussions. J’espère de tout cœur que nos chemins se croiseront à nouveau. A José, merci pour ta disponibilité de chaque instant, ton enthousiasme et ton aide. A Loic… non je ne le dirai pas ici. Mais toi seul sais de quoi je parle. Simplement merci pour ces 2 années, t’es à jamais dans mon cœur… ouais mais bon… A Béa, même si ce couloir a été comme une barrière infranchissable… Que ton enthousiasme débordant ne s’éteigne jamais. A Thierry, eh gaillard c’est pas parce que t’es vaudois que t’as pas le droit de faire partie de la liste. T’es vaudois en fait ? C’est déjà où les Brenets ? Aux diplômants Michael et Cyril, avec qui le labo s’est d’ores et déjà assuré un avenir radieux. A Ignacio Bolivar, pour ton aide précieuse durant les balbutiements de ce tra- vail. Aux ex : Cédric, Ben, Xav, Patrick, Fred, Sasha et Yurika. Parce que vous avez bercé une partie de ma thèse de votre douce folie. Vos départs ont laissé un gros vide. Aux collaborateurs des divers projets : Kamran Shalchian-Tabrizi, Jon Brate, Asmund Skjaeveland, Marianne Minge, Dag Klaveness, Kjetill Jakobsen from Oslo ; John Archibald from Halifax ; Patrick Keeling, Ales Horak from Vancouver ; Yuji Inagaki, Tetsuo Hashimoto, Miako Sakaguchi from Tsukuba ; Hervé Philippe from Montréal ; Thomas Cavalier-Smith from Oxford ; Colomban de Vargas, Ian Probert from Roscoff ; Sergey Nikolaev from Geneva. Aux ordinateurs, aspect non-humain mais indispensable à ce genre travail, et à toutes les personnes qui permettent le fonctionnement de ces clusters. Le Vital-IT de l’Institut Suisse de Bioinformatique et le Bioportal de l’Université de Oslo ont permis pratiquement la réalisation de cette thèse en moins de 20 ans. Je tiens particulièrement à remercier Bruno Nyffeler, Jacques Rougemont et Volker Flegel au Vital-IT, ainsi que Asmund Skjaeveland et Pal Enger au Bioportal pour leur aide inestimable dans les in- nombrables debuggings. Je voudrais aussi remercier Lorenza Bordoli, Vassilios Ioannidid and Laurent Falquet pour leur précieux conseils dans les méandres de l’apprentis bioin- formaticien. To the Canadian consortium Protist EST Program (PEP) that has made publi- cly available several EST projects, allowing us to greatly improve the taxon-sampling of our alignments. Je suis infiniment reconnaissant au Fond National Suisse de la recherche scienti- fique, à l’état de Genève, au Département de zoologie et biologie animale et à la Fonda- tion Ernst & Lucie Schmidheiny pour leur soutient financier. I am very grateful to John Archibald, Kjetill Jakobsen and Michel Milinkovitch for accepting to evaluate my PhD. A ceux que j’oublie… j’espère peu nombreux. Enfin, un énorme, immense, gigantisme MERCI aux miens : ma mère, mon père, mon frère. C’est surtout grâce à vos inconditionnels encouragements depuis toujours que j’y suis arrivé. And… Thanks, Grazie, Merci à toi Babs pour… tout. Merci d’être toi, merci d’être là. Merci d’avoir supporté ces moments difficiles, lorsque le stresse devenait trop fort. Mer- ci pour ton soutient, tes encouragements. Merci, merci, merci. L’aventure continue, en- semble. Résumé en français Depuis quelques années, la phylogénie moléculaire, c’est-à-dire l’étude des relations évolutives entre les êtres vivants en comparant des séquences d’ADN ou d’acides aminés, a profondément modifié notre vision de l’arbre des eucaryotes. Le schéma qui est actuelle- ment accepté par le plus grand nombre voit cinq assemblages majeurs d’organismes regrou- pant toutes les espèces d’eucaryotes : ce sont les ‘super-groupes’ (unikonts, excavates, Plantae, chromalveolates et Rhizaria). Si l’existence de ces super-groupes fait figure de consensus, les relations phylogénétiques qui les lient sont encore très incertaines. La phylo- génomique est un nouvel outil de la biologie évolutive permettant d’adresser d’importantes questions qui étaient jusque-là restées sans réponse, faute d’information suffisante. Grâce à l’accumulation de données génomiques, il devient en effet possible d’utiliser un nombre toujours plus important de marqueurs moléculaires (gènes ou protéines) pour une diversité croissante d’organismes en vue de reconstruire les relations phylogénétiques à l’échelle des eucaryotes. Les récentes publications d’études relatant les analyses d’immenses alignements multigéniques (plus de 120 gènes concaténés) englobant tous les super-groupes ont montré qu’il était désormais possible de remonter toujours plus loin dans le temps et de résoudre des relations évolutives pour lesquelles seul un très grand nombre de données contient un signal suffisant. S’inscrivant complètement dans cette nouvelle approche génomique de la phylogé- nie, nous avons en premier lieu obtenu des librairies d’EST (Expressed Sequence Tag) pour 3 espèces appartenant au super-groupe Rhizaria : deux foraminifères, Reticulomyxa filosa et Quinqueloculina sp., et un Cercozoa Gymnophrys cometa (récemment renommé Limnofila borokensis). Un total de plus de 4500 séquences représentant des gènes exprimés au moment de l’extraction d’ARN ont été analysé, ce qui constitue à ce jour le plus vaste jeu de données disponibles pour cet assemblage majeur d’eucaryotes. Apparus à la fin des années 1990, les Rhizaria sont un groupe pour l’instant définis uniquement sur la base de séquences moléculaires. Bien que reconnus comme étant l’un des cinq super-groupes d’eucaryotes, il était jusqu’à notre étude restés en dehors de la discussion alimentée par la phylogénomique à cause de l’insuffisance des données. Notre objectif de départ était simple : utiliser des alignements multigéniques pour 1) confirmer la monophylie des Rhizaria et, surtout, 2) positionner ce super-groupe dans l’arbre des eucaryotes, autrement dit investi- guer les relations phylogénétiques existantes entre les divers super-groupes présumés. Nous avons donc commencé par obtenir environ 2000 ESTs pour R. filosa (chapi- tre 2) ce qui nous a permis, en utilisant également la seule librairie de Rhizaria publique de l’époque (Bigelowiella natans), de construire un alignement comprenant 85 protéines (environ 13'000 acides aminés) et 37 espèces (dont deux Rhizaria) (chapitre 3). Les Rhi- zaria faisaient ainsi leur entrée dans le domaine de la phylogénomique. Cette étude est ve- nue confirmer, en utilisant pour la première fois des dizaines de gènes, que ce groupe avait en effet un ancêtre commun. Elle n’a par contre pas pu établir de façon convaincante sa position dans l’arbre des eucaryotes, notre alignement ne contenant pas suffisamment de signal phylogénétique. Nous avons ensuite continué notre échantillonnage pour augmenter nos données, en séquençant plus de 2500 ESTs pour deux nouvelles espèces de Rhizaria (Quinqueloculina sp.