Introduction Au DNA-Barcoding Olivier Bouteleux
Total Page:16
File Type:pdf, Size:1020Kb
Introduction au DNA-Barcoding Olivier Bouteleux To cite this version: Olivier Bouteleux. Introduction au DNA-Barcoding : rapport d’étude bibliographique. [Stage] Autres régions du monde. Université François Rabelais (Tours), FRA. 2012, 17 p. hal-02802780 HAL Id: hal-02802780 https://hal.inrae.fr/hal-02802780 Submitted on 5 Jun 2020 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. Introduction au DNA-Barcoding Rapport d’étude bibliographique BOUTELEUX Olivier Janvier-Juin2012 Master II "Sciences de l'Insecte" Sommaire I) Introduction………………………………………… 1 II) DNA-Barcoding : Principe……………………………… 2 Le Barcode moléculaire………………………………………… 1 La bibliothèque de référence…………………………………….. 3 Les outils de la Bio-informatique…………………………………. 3 La délimitation des espèces……………………………………… 4 III) Des applications diverses et variées…………………….. 5 L'étude de la biodiversité……………………………………….. 5 La lutte contre les espèces invasives……………………………….. 6 Une implication à tous les niveaux………………………………… 7 IV) Le DNA-Barcoding : entre limites et innovations………. 7 Le gène COI………………………………………………… 8 La bibliothèque de référence…………………………………….. 9 Analyse, utilisation du DNA-Barcoding……………………………. 9 Le NGS : Next Generation Sequencing……………………………. 10 V) Conclusion……………………………………………... 11 VI) Bibliographie…………………………………………… 12 I) Introduction La biologie moléculaire est une discipline scientifique qui commença à se développer dès la deuxième moitié du XXème siècle. L'amorce de cette discipline a notamment été illustrée par la publication de James Watson et Francis Crick (Watson and Crick, 1953) dans laquelle fut présenté pour la première fois, le modèle de la structure de l’ADN. Cette découverte fut en effet considérée comme le pivot à l’établissement de la biologie moléculaire au sein des sciences de la vie (Halloran, 1984). Assurément, la biologie moléculaire a, par la suite, connu de nombreuses avancées et a permis la compréhension de certains mécanismes, notamment la réplication et l'expression des gènes (Lunardi, 2003). Elle est ainsi devenue un outil incontournable et s'est intégrée en fait dans toutes les disciplines s'intéressant au vivant. Aujourd’hui, la biologie moléculaire repose aussi sur des outils enzymatiques qui visent avant tout à manipuler et à caractériser l’ADN. En effet, il va pouvoir être possible de couper, lier, ou encore séquencer l’ADN (Laudenbach et al. 1999). Les applications de la biologie moléculaire sont ainsi devenues très diversifiées et ont permis des avancées considérables dans de nombreux domaines comme les sciences médicales, la biologie marine (Narsinh et al. 2008), etc. Dans ce contexte, une approche génomique proposée récemment par Paul Hebert (Hebert et al. 2003) a fait preuve d'un succès notoire dans les années qui lui ont précédé et est aujourd'hui on ne peut plus d'actualité. Cette technique récente, appelée DNA-Barcoding, a en effet rapidement pris une échelle mondiale au sein de l'univers scientifique, en trouvant notamment sa place dans de nombreux domaines d'application. Le "DNA-Barcoding" est finalement un outil taxonomique qui utilise un fragment standard de l'ADN pour déterminer à quelle espèce appartient un organisme (Hebert et al. 2003).En effet, tout comme les empreintes digitales permettent d'identifier chacun d'entre nous, la variabilité nucléotidique de ce fragment constitue des combinaisons uniques qui permettent d'identifier les espèces. Ce fragment d'ADN séquencé pour chaque organisme permet d'élaborer des données de références, lesquelles constituent un système global d'identification moléculaire des espèces (Hebert et al. 2003; Valentini et al. 2009; Casiraghi et al. 2010). Cette nouvelle approche moléculaire a été proposée en réponse aux insuffisances de la taxonomie conventionnelle, par laquelle l'identification des espèces peu constituer un véritable défi, notamment face à la perte constante de la biodiversité. En effet, bien qu'établie depuis plus de deux siècles, cette expertise taxonomique, basée notamment sur des critères morphologiques, n'est pas sans présenter un certain nombre de lacunes. Principalement, elle est très coûteuse en temps et requiert des connaissances hautement spécialisées (Costion et al. 2011; Raupach et al. 2010). Qui plus est, les experts taxonomiques sont très dispersés à travers le monde et leur nombre ne cesse de ~ 1 ~ décroître chaque année (Tanzler et al. 2012). Finalement, cette expertise est très souvent spécialisée à un taxon particulier et ne permet pas une identification exhaustive des espèces (Gaikwak et al. 2011). En 2003, Paul Hebert proposa donc le DNA-Barcoding comme un élément de réponse très prometteur qui viendrait compléter l'accès à l'identification du monde vivant (Hebert et al. 2003). Dès lors, cette approche a connu un nombre important d'applications comme la détection d'espèces invasives (Armstrong et al. 2005; Cross et al. 2010) ou encore la lutte contre le commerce illégal d'espèces menacées (Eaton et al, 2010). Il sera ainsi détaillé dans ce rapport d'étude bibliographique les réels bénéfices qu'apporte le Barcoding, tout en évoquant aussi quelles en sont les limites. Ceci nous permettra finalement d'interpréter comment est perçue le futur de cette nouvelle discipline. II) DNA-Barcoding : Principe L'utilisation de séquences ADN pour caractériser les organismes existait déjà plusieurs années avant la publication de l'article fondateur du DNA-Barcoding proposé par Paul Hébert. En effet, certains travaux parus il y a une voire deux décennies, mettaient déjà en évidence le fait que les variations nucléotidiques présentes au sein de l'ADN représentaient des combinaisons uniques permettant de caractériser les espèces et d'élaborer des phylogénies (Takeyama et al. 2000; Gibson et al. 1988). Le Barcode moléculaire Comme évoqué précédemment, l'originalité du concept proposé par Paul Hébert a été de proposer un fragment standard de l'ADN, lequel est commun à la plupart des organismes. Le fragment choisi est un gène appartenant au génome mitochondrial. Ce gène (648 pb) code pour la première sous-unité de la Cytochrome-Oxydase (COI), laquelle est une protéine intervenant dans la chaine respiratoire des mitochondries et est un élément clé dans le métabolisme aérobie. Le choix de ce gène dans l'identification du monde vivant est justifié par un certain nombre d'avantages (Hebert et al. 2003a; Hebert et al. 2003b): (1) Tout d'abord, ce gène a une vitesse d'évolution relativement élevé et permet une accumulation appréciable de mutations au sein des espèces. De ce fait, par comparaison de séquences ADN, il a été noté que ce gène COI divergeait suffisamment pour permettre de discriminer les espèces, voire même discriminer des populations au sein d'une même espèce (Cox and Hebert 2001; Wares and Cunningham 2001). (2) De plus, les mitochondries faisant partie intégrante de la majorité des types ~ 2 ~ Figure 1 : Outil d'identification présent sur BOLD systems Pour identifier un individu quelconque via l'outil d'identification, il suffit de soumettre sa séquence en faisant un copier/coller dans un champ prévu à cet effet. Cet outil nous retourne ensuite un résultat comportant plusieurs éléments : (ci-dessous) Il présente notamment un graphique (A) comportant en abscisses les 100 premiers individus référencés pour lesquels le pourcentage de similarité avec la séquence soumise est le plus important. En ordonnées est présentée la valeur de ce pourcentage de similarité. Ce graphique nous permet de déterminer si la séquence soumise est déjà plus ou moins représentée parmi la bibliothèque de référence. Un second élément (B) lui indique les éventuels noms d'espèces associés à chacun de ces individus de référence ainsi que leur pourcentage de similarité avec la séquence soumise. C'est cet élément qui va nous permettre d'attribuer un nom d'espèce à notre individu. Nous pouvons par exemple noter ici que l'espèce Moschoneura pinthous est une très bonne candidate car elle présente une similarité du gène COI de 100 % avec la séquence que nous avons soumis. cellulaires, le gène COI est de ce fait présent en très grande quantité dans les cellules ce qui facilite énormément son séquençage en laboratoire. (3) Enfin, les amorces nécessaires au séquençage de ce gène sont robustes et peuvent utilisables au sein d'un même grand groupe d'organismes comme les lépidoptères (Hébert et al, 2003a), coléoptères etc. La Bibliothèque de Référence L'objectif principal du Barcoding a été dans un premier temps de séquencer le gène COI pour un nombre très important d'espèces déjà connues, notamment par le biais des muséums et des taxonomistes, pour ensuite regrouper toutes ces séquences et élaborer ainsi une bibliothèque de référence (Ratnasingham and Hebert, 2006). Grace à cette bibliothèque présente en ligne (www.boldsystems.org), il devient possible pour un utilisateur d'identifier un individu d'une espèce qui lui est inconnue en réalisant le séquençage du gène COI et en le comparant avec les séquences présentes dans cette bibliothèque (Fig. 1). Cet outil est très novateur dans le sens où ici aucune