Dynamique Des Hélitrons Dans Le Genome D'arabidopsis Thaliana: Développement De Nouvelles Stratégies D'analyse Des É
Total Page:16
File Type:pdf, Size:1020Kb
Dynamique des hélitrons dans le genome d’Arabidopsis thaliana : développement de nouvelles stratégies d’analyse des éléments transposables Sébastien Tempel To cite this version: Sébastien Tempel. Dynamique des hélitrons dans le genome d’Arabidopsis thaliana : développement de nouvelles stratégies d’analyse des éléments transposables. Biochimie [q-bio.BM]. Université Rennes 1, 2007. Français. tel-00185256 HAL Id: tel-00185256 https://tel.archives-ouvertes.fr/tel-00185256 Submitted on 5 Nov 2007 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. No d’ordre : 3558 THESE` pr´esent´ee DEVANT L’UNIVERSITE´ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L’UNIVERSITE´ DE RENNES 1 Mention Biologie PAR TEMPEL S´ebastien Equipe´ d’accueil 1 : projet Symbiose (IRISA, Rennes) Equipe´ d’accueil 2 : Expression gen´ etique´ et adaptation (Ecobio, Rennes) Ecole´ Doctorale : Vie-Agro-Sant´e Composantes universitaires : IFSIC, SVE TITRE DE LA THESE` : DYNAMIQUE DES HELITRONS´ DANS LE GENOME D’ARABIDOPSIS THALIANA : DEVELOPPEMENT´ DE NOUVELLES STRATEGIES´ D’ANALYSE DES EL´ EMENTS´ TRANSPOSABLES SOUTENUE LE 18 juin 2007 devant la commission d’examen COMPOSITION DU JURY : Yves Bigot Rapporteur Marie-France Sagot Rapporteur Pierre Capy Examinateur Pierre Rouz´e Examinateur Abdelhak El Amrani Directeur de th`ese Jacques Nicolas Co-Directeur de th`ese Remerciements Je tiens `aremercier en premier ma femme Laure, pour m’avoir accompagn´etout au long de ma th`ese,pour avoir corrig´emes nombreuses fautes d’orthographes et aussi pour m’avoir pouss´e`ame surpasser. Je remercie ma famille et en particulier ma m`ere, ma tante et ma marraine. Elles ont toujours ´et´e`ames cˆot´es,m’ont toujours soutenu dans mes d´ecisions et aid´e`afinancer mes ´etudes. Je remercie aussi la famille de Laure ; ils m’ont accueilli `abras ouverts. J’offre mes remerciements les plus sinc`eres `ames directeurs de th`ese: Jacques Nicolas, Abdelhak El Amrani et Ivan Cou´ee.Je remercie Jacques, responsable du projet Symbiose `al’IRISA, pour sa bonne humeur, ses conseils ´eclair´eset justes. Pour avoir essay´ede m’enseigner la rigueur scientifique, propre aux informaticiens. Je salue Abdel(hak), pour son enthousiasme pour mes travaux, son sens des relations humaines, et pour m’avoir choisi lors du stage de DEA qui est le tout d´ebut de cette th`ese. Et je remercie Ivan, pour sa pond´eration et sa justesse face `amon enthousiasme et pour ses remarques toujours pertinentes. Je rends hommage `al’´equipe Symbiose, l’´equipe de bioinformatique o`us’est d´eroul´ee ma th`ese.Ils m’ont parfaitement int´egr´edans leur ´equipe. Nous avons partag´eensemble des bons moments au sein mˆeme mais aussi en dehors des bureaux (les s´eminaires d’´equipe de juin, par exemple). Je les remercie encore de m’avoir donn´ede bons conseils tout au long de ce doctorat et aid´e`ar´ediger cette th`ese. Je veux envoyer aussi un grand merci `a tous les anciens membres de l’´equipe qui me manquent et `atous les membres actuels de l’´equipe qui me manqueront quand je partirai. Je remercie aussi les membres de l’UMR ECOBIO qui ont toujours r´epondu avec joie `atoutes les questions que j’ai pu leur poser. Je remercie aussi tous les membres de mon jury de th`esepour avoir accept´ede corriger ma th`ese et particuli`erement Yves Bigot pour tous ses conseils pendant ma th`eseet ce bon hamburger en Californie. Je remercie enfin tous mes amis, et en particulier ”les grumeaux” (Yannick et Nico- las), pour toutes les bonnes soir´ees pass´ees de jeux de soci´et´es,de rˆoles et les nombreux restaurants ... Table des mati`eres Glossaire 7 Introduction 9 Contexte de la th`ese . 9 1.1 M´ecanismes `al’origine d’une variabilit´edu g´enome . 12 1.1.1 M´ecanismes de variabilit´esp´ecifiques . 12 1.1.1.1 Variabilit´eli´ee`acertains types cellulaires : la recombinai- son VDJ . 12 1.1.1.2 Variabilit´eli´ee`acertains stades de d´eveloppement : les recombinaisons in´egales . 14 1.1.2 M´ecanismes de variabilit´eg´en´erale du g´enome . 15 1.1.2.1 Les microsatellites et les minisatellites . 16 1.1.2.2 Les virus . 16 1.1.2.3 Les transferts horizontaux . 17 1.2 Les ´el´ements transposables . 19 1.2.1 D´efinition des ´el´ements transposables . 19 1.2.1.1 Structure g´en´erale des ´el´ements transposables . 19 1.2.1.2 M´ecanismes de transposition et classification des ´el´ements transposables . 19 1.2.2 Les ´el´ements transposables de classe I ou r´etrotransposons . 20 1.2.2.1 R´etrotransposons `aLTR . 21 1.2.2.2 R´etrotransposons sans LTR ou r´etroposons . 22 1.2.3 Les ´el´ements transposables de classe II ou transposons . 24 1.2.3.1 Les transposons bact´eriens . 25 1.2.3.2 Les transposons eucaryotes . 26 1.2.4 Rˆoles et importance des ´el´ements transposables dans les g´enomes hˆotes................................... 29 1.2.4.1 Proportions et distributions des ´el´ements transposables dans les g´enomes . 29 1.2.4.2 Rˆoles des ´el´ements transposables dans le fonctionnement des g`enes . 30 1.2.4.3 Rˆoles des ´el´ements transposables dans la cr´eation de nou- veaux g`enes . 32 1.2.4.4 Rˆoles des ´el´ements transposables dans la structure du g´e- nome ............................. 32 1.2.4.5 Autres rˆoles . 33 1.2.5 D´etection in silico des ´el´ements transposables . 33 3 4 TABLE DES MATIERES` 1.2.5.1 D´etection par alignement de s´equences . 33 1.2.5.2 D´etection de novo des ´el´ements transposables . 34 1.2.5.3 Autres approches . 35 1.3 H´elitrons..................................... 36 1.3.1 Contexte historique . 36 1.3.2 D´efinition . 36 1.3.2.1 Caract´eristiques structurales . 36 1.3.2.2 Mode de transposition putatif des h´elitrons . 37 1.3.2.3 R´epartition des h´elitrons dans les g´enomes . 38 1.3.3 Relation Hˆote - H´elitron . 38 1.3.3.1 Effet des h´elitrons dans la cr´eation de g`enes . 38 1.3.3.2 H´elitron et structure du g´enome . 39 1.4 But de la th`ese . 40 1.4.1 Probl`emes pos´espour la d´etection in silico des h´elitrons . 40 1.4.2 Interaction des h´elitrons avec le g´enome d’Arabidopsis thaliana . 41 1.4.3 Variabilit´edes h´elitrons . 42 1.4.4 Effet des h´elitrons sur le g´enome d’Arabidopsis thaliana . 42 Mat´eriels et M´ethodes 43 2.1 Le g´enome d’Arabidopsis thaliana ....................... 43 2.2 Bases de donn´eesutilis´ees . 45 2.2.1 Bases de donn´eessur Arabidopsis . 45 2.2.2 Bases de donn´eesd’´el´ements transposables . 45 2.2.3 Bases de donn´eesdu transcriptome d’Arabidopsis . 47 2.3 Mod´elisation des s´equences . 49 2.3.1 Th´eorie des langages formels . 49 2.3.1.1 D´efinitions . 49 2.3.1.2 Hi´erarchie de Chomsky . 50 2.3.2 Recherche de motifs . 50 2.3.2.1 Pr´etraitement du texte : Arbre des suffixes . 52 2.3.2.2 Grammaires SVG . 53 2.3.3 Application de STAN `ala mod´elisation des s´equences . 54 2.3.3.1 Recherche exhaustive des ´el´ements transposables dans un g´enome entier . 54 2.3.3.2 Recherche des motifs de liaison aux facteurs de transcription 54 2.4 Classification des s´equences . 56 2.5 Optimisation combinatoire de donn´ees . 59 2.5.1 Algorithme de Munkres . 59 2.5.2 Probl`eme de couverture minimale . 60 R´esultats et Discussions 63 3.1 D´ecouverte d’un ´el´ement h´elitron dans le g`ene Arginine D´eCarboxylase 1 (ADC1) . 63 3.1.1 Analyse comparative des promoteurs des deux g`enes de l’ADC . 63 3.1.2 Analyse syst´ematique des r´egions flanquantes d’AtATE . 64 3.2 Conception d’un mod`ele syntaxique d’h´elitron `apartir de la famille AtREP3 65 3.2.1 Am´elioration du mod`ele de recherche des AtREP3s . 65 TABLE DES MATIERES` 5 3.2.2 Comparaison de la m´ethode syntaxique d´evelopp´eeavec la m´ethode traditionnelle de d´etection des ´el´ements transposables . 67 3.2.3 Mod`ele h´elitronique sans structure secondaire . 69 3.3 Analyse syst´ematique et classification des h´elitrons dans le g´enome d’Ara- bidopsis ..................................... 71 3.3.1 Analyse des termini h´elitroniques dans Arabidopsis . 71 3.3.1.1 Cr´eation de la matrice d’occurrences des h´elitrons . 71 3.3.1.2 Agr´egation des extr´emit´eset des couples d’extr´emit´es . 71 3.3.1.3 Analyse des occurrences des termini 5’ et 3’ : ´evidence de la pr´esence d’h´elitrons tronqu´es . 73 3.3.1.4 Distribution des combinaisons d’extr´emit´es h´elitroniques . 74 3.3.2 Analyse du mode de transposition des h´elitrons .