Étude De L'organisation Du Génome De Poulet À Travers Les Séquences
Total Page:16
File Type:pdf, Size:1020Kb
UNIVERSITÉ FRANÇOIS – RABELAIS DE TOURS ÉCOLE DOCTORALE : SSBCV Plasticité Génomique et Expression Phénotypique THÈSE présentée par : Sébastien Guizard soutenue le : 1er juillet 2016 pour obtenir le grade de : Docteur de l’université François – Rabelais de Tours Discipline/ Spécialité : Sciences de la Vie Étude de l’organisation du génome de poulet à travers les séquences répétées THÈSE dirigée par : Dr. Yves Bigot Directeur de Recherches CNRS, INRA Tours Benoît Piégu Ingénieur de Recherches CNRS, INRA Tours RAPPORTEURS : Dr. Richard Cordeaux Directeur de Recherches CNRS, Université de Poitiers Dr. Emmanuelle Lerat Chargée de Recherches CNRS, Université Claude Bernard - Lyon 1 JURY : Dr. Yves Bigot Directeur de Recherches CNRS, INRA Tours Dr. Florian Maumus Chargée de Recherches INRA, INRA Versailles Dr. Elisabeth Le Bihan-Duval Directrice de Recherches INRA, INRA Tours Pr. Alain Goudeau Professeur, Faculté de Médecine Tours Dr. Richard Cordeaux Directeur de Recherches CNRS, Université de Poitiers Dr. Emmanuelle Lerat Chargée de Recherches CNRS, Université Claude Bernard - Lyon 1 Remerciements Je voudrais commencer par remercier le Département PHASE (Physiologie Animale et Systèmes d’Élevage) et la Région Centre pour le financement de ces années de thèse. Je remercie également Florian Guillou et Thierry Magalon de m’avoir accueilli au sein de l’Unité Physiologie de la Reproduction et des Comportements de Tours. Je remercie les membres du jury qui m’ont fait l’honneur de consacrer du temps à l’évaluation de mon travail de thèse ; Emmanuelle Lerat et Richard Cordeaux d’avoir accepté d’en être les rapporteurs et Florian Maumus, Elisabeth Le Bihan-Duval et Alain Goudeau d’avoir bien voulu en être les examinateurs. Je remercie les membres de mon comité de thèse, Jérôme Salse, Claire Lemaitre et Hadi Quesnville, pour leurs critiques et conseils avisés sur mon travail. Je souhaite remercier ensuite Yves Bigot, mon directeur de thèse, de m’avoir offert la possibilité de réaliser cette thèse et de m’avoir fait confiance malgré les conditions particulières de l’oral pour l’attribution de la bourse thèse. Grâce à toi, j’ai réalisé des rêves qui me semblaient impossibles il y a encore quelques années. Merci pour toutes les discussions, que ce soit sur les éléments transposables, la biologie, les sciences, la recherche, la politique, le rugby, le basket, etc., qui ont toujours été plus enrichissantes. Surtout, je te remercie pour la dose quotidienne de jeux de mots capillotractés qui m’ont donné plus d’un fou rire. Encore merci de m’avoir poussé toujours plus loin dans mon travail et de m’avoir montré ce qu’est être un chercheur. Je remercie l’inventeur de la bambinolâtrie, Benoît Piégu, de m’avoir appris à devenir un vrai barbu de l’informatique. Merci de m’avoir appris comment installer, gérer les machines, comment dompter Linux, de m’avoir fait passer de « Intermediate » à « Expert » en Perl, m’avoir montré la parallélisation dans tous ses états, de m’avoir aidé à battre R… mais aussi d’avoir partagé tes connaissances en Bio en débattant sur le « fumier » pendant des heures. Par contre, je ne te remercie pas de m’avoir laissé gérer le serveur Galaxy pendant tes vacances alors que deux biologistes déchaînés s’acharnaient dessus et, surtout, j’attends toujours mon cluster de calculs que je te réclame depuis mes premiers pas dans le bureau ! :p J’ai vraiment passé de bons moments et je t’en remercie. Et j’espère que tu me donneras mon dernier « Achievement » ! ;) . Je souhaite aussi remercier les autres membres de l’équipe PGEP, qu’ils soient permanents, Florian Guillou, Linda Beauclair, Isabelle Gibert, ou non, Peter Arensburger et Sassan Asgari, ainsi que toutes les personnes que j’ai pu côtoyer à la PRC. Je tiens à remercier aussi Hadi Quesneville et l’équipe de développement de REPET, Véronique Jamilloux, Olivier Inizan, Florian Maumus, Timothée Chaumier, Mark Moissette, Joëlle Amselem, Mikaël Loaec, Isabelle Luyten, pour leur formidable accueil dans leur labo pendant trois semaines, et surtout pour toute l’aide et l’expertise qu’ils m’ont apportées dans l’utilisation et l’optimisation de REPET, et aussi pour l’initiation à la méthode AGILE tant redoutée depuis mon premier passage à l’URGI avec Florian Murat :p Je remercie mon médecin traitant de m’avoir prescrit des wagons d’antibio et de Derinox pour tous les rhumes et autres maladies que j’ai pu attraper en trois ans ! Je remercie aussi toute ma famille et ma belle-famille pour leur soutien inconditionnel quand la santé et le moral n’étaient pas au rendez-vous. Mais mes plus grands remerciements vont à ma femme qui a accepté de quitter sa région d’Auvergne pour me suivre en Touraine et qui m’a supporté et encouragé toutes ces années, ainsi qu’à ma fille qui, depuis le 1er avril 2014, m’apporte ma dose de bonheur quotidienne. Résumé Les génomes des espèces aviaires ont des caractéristiques particulières comme la structure des chromosomes et le contenu en séquences répétées. En effet, alors que dans les génomes vertébrés, la proportion de répétitions dans le génome varie de 30 à 55 %, dans les espèces aviaires, cette proportion est plus faible et varie de 8 à 10 %. L’annotation du contenu répété est le plus souvent réalisée avec le programme RepeatMasker qui s’appuie généralement sur la banque de séquences répétées Repbase. Ce genre de méthode repose uniquement sur la séquence des éléments transposables connus. De fait, ce programme n’est pas en mesure de détecter de nouvelles séquences répétées, et la qualité de l’annotation sera donc dépendante de la banque de séquences d’éléments transposables utilisée. De plus en plus d’études montrent que les éléments transposables jouent un rôle dans le fonctionnement du génome et peuvent influer sur l’expression des gènes. Il est donc primordial que l’annotation de ces séquences soit la plus complète possible. Il existe de nombreux programmes employant des méthodes permettant la détection de novo des éléments transposables, soit en recherchant des structures caractéristiques, soit en comparant le génome contre lui-même. Cependant, aucune stratégie globale d’annotation standard des séquences répétées n’a jusqu'à présent été définie. Au cours de ma thèse a été mise en place une stratégie d’annotation des séquences répétées que nous avons élaborée et appliquée à un génome de grande taille, celui de la poule rouge de jungle. L’annotation ainsi obtenue m’a permis d’étudier l’organisation du génome de cette espèce au travers de ses séquences répétées et éléments transposables. Résumé en anglais The genomes of avian species have special features such as the structure of chromosomes or their content in repeated sequences. Indeed, compared to vertebrate genomes in which the amount of repetitions varies from 30 to 55%, it is lower in avian species and varies from 8 to 10%. The annotation of repeated content is most often done with the RepeatMasker program that is generally use the Repbase database of repeated sequences. This kind of approach is based solely on the sequence of already known transposable elements. In fact, this program is not able to detect new repeats and in consequence produced annotations with a quality that depends on the sequences of transposable elements used. More and more studies show that transposable elements play a role in the functioning of the genome and can influence gene expression. It is therefore essential that the annotation of these sequences is as complete as possible. There are many programs using methods for detecting de novo transposable elements, either by searching for characteristic structures, or by comparing the genome against itself. However, no standard strategy of annotation for repeated sequences have been defined yet. My thesis aims to set-up a standard strategy of annotation for repeated sequences that was applied to a large genome, that of the red jungle fowl. The obtained annotation allowed me studying the genome organization in this species through its repeated sequences and transposable elements. Table des matières Avant-Propos..............................................................................................................................1 Introduction................................................................................................................................5 1. Les génomes aviaires..............................................................................................................6 1.1. Les oiseaux.......................................................................................................................6 1.2. Les génomes aviaires séquencés......................................................................................7 1.3. Les caractéristiques des génomes aviaires.......................................................................8 2. Le génome du poulet.............................................................................................................11 2.1. Le modèle.......................................................................................................................11 2.2. Taille du génome............................................................................................................12 2.3. Le contenu du génome...................................................................................................13 2.3.1. Les gènes.................................................................................................................13 2.3.2. Les séquences répétées............................................................................................14