Thèse

En vue de l’obtention du

Diplôme de DOCTORAT

Spécialité : GÉNÉTIQUE

Présentée par : BEKADA Asmahan

Intitulé :

Caractérisation anthropogénétique d’un échantillon de la population algérienne : analyse des marqueurs parentaux

Soutenu le 12/ 04/ 2015

Devant le jury composé de :

Présidente du Jury : Mme El Kebir Fatima-Zohra. Professeur, Université d’Oran 1 (Ahmed Ben Bella).

Directrice de thèse : Mme Benhamamouch Soraya. Professeur, Université d’Oran 1 (Ahmed Ben Bella).

Examinateur : Mme Mediene-Benchekor Sounnia. Professeur, Université d’Oran 1 (Ahmed Ben Bella).

Examinateur : Mme Aouar-Metri Amaria. Professeur, Université Abou Bekr Belkaid de Tlemcen.

Examinateur : Mr Comas-Martinez David. Professeur, Université Pompeu Fabra de Barcelone.

Examinateur : Mr Hamza Cherif Ali. Professeur, Université Abou Bekr Belkaid Tlemcen.

Membre d’honneur : Mr Hadjouis Djillali. Professeur, Directeur du Centre National de Recherche Préhistorique, Anthropologique et Historique (CNRPAH) de Tlemcen.

Année universitaire : 2014-2015

Ce travail a été réalisé sous la direction du professeur Benhamamouch Soraya

§ au Laboratoire de Biologie Moléculaire et Cellulaire de l’Université des Sciences et de la Technologie (Mohamed Boudiaf) Oran (USTO).

§ au Laboratoire des Sciences Criminalistiques, section de génétique médico-légale sous la direction des professeurs Carlo Robino et Carlo Torre au Département d’Anatomie, pharmacologie et médecine légale, Université de Torino, Italie.

§ au Laboratoire du Département de Génétique, Faculté de Biologie, Université de La Laguna, La Laguna, Tenerife, en Espagne, sous la direction des professeurs Vicente M. Cabrera, José M. Larruga et Ana M. González.

§ au Laboratoire de génétique Forensique, Institut de Médecine Légale de Las Palmas, Las Palmas de Gran Canaria, Gran Canaria, Espagne, sous la direction du professeur José Pestano et en collaboration avec Dr. Rosa Fregel.

Ce travail a bénéficié de l’appui § d’un programme de mobilité scientifique internationale World Wide Style (WWS) de l’Université de Torino, en Italie § d’une bourse Algérienne du programme boursier de formation à l’étranger au titre de l’année Universitaire 2010–2011 pour la catégorie « PNE» à l’Université de La Laguna, en Espagne § et de plusieurs stages scientifiques accordés aux enseignants-chercheurs du Département de Biotechnologie, Université d’Oran

Ce travail a fait l’objet des communications et publications scientifiques suivantes :

Les communications:

- Participation avec poster au 23ème congrès de l’ISFG (International Journal of Forensic Genetics) à Buenos Aires, Argentine. 14-18 Septembre 2009 : Bekada A., Benhamamouch S., Boudjema A., Fodil M., Menegon S., Torre C., Robino C. (2009). Analysis of 12 X-chromosomal STRs in an Algerian population sample. Forensic Science International: Genetics Supplement 2 : 400-401

- Participation avec poster à la 8ème conférence ISABS (International Society for Applied Biological Sciences) à Split, Croatie. 24-28 Juin 2013 : Bekada A., Benhamamouch S., Fregel R., Cabrera V., Larruga J., Pestano J., González A. (2013). Maternal genetic profile of a Northwest Algerian population. ISABS: Program and abstracts: 212.

Les publications:

Bekada A., Benhamamouch S., Boudjema A., Fodil M., Menegon S., Torre C., Robino C (2010). Analysis of 21 X-chromosomal STRs in an Algerian population sample. International Journal of Legal Medecine, 124(4), 287-94.

Bekada A., Fregel R., Cabrera V. M., Larruga J. M., Pestano J., Benhamamouch S., González A. M. (2013). Introducing the Algerian mitochondrial DNA and Y- chromosome profiles into the North African landscape. PloS one, 8(2), e56775.

Remerciements

Tout d’abord, je tiens à remercier chaleureusement ma directrice de thèse, madame le Professeur BENHAMAMOUCH SORAYA, pour la confiance qu’elle m’a accordée en acceptant de diriger ce travail. Je tiens à lui exprimer toute ma reconnaissance et ma gratitude pour son encadrement et ses précieux conseils, pour sa patience et sa compréhension, et surtout pour son soutien dans toutes mes ambitions. Le Pr. BENHAMAMOUCH a d’abord été mon enseignante en laquelle j’ai énormément d’admiration. Elle m’a transmis sa passion et sa rigueur pour l’enseignement puis pour la recherche scientifique. Qu’elle trouve dans ce travail l’expression de mon profond respect, mon estime et mes sincères et tendres pensées.

Je tiens à exprimer toute ma reconnaissance aux membres du jury, qui ont accepté de consacrer une partie de leurs temps précieux à l’évaluation de ce travail de thèse: À Mme EL KEBIR FATIMA-ZOHRA, Professeur à l’Université Ahmed Ben Bella d’Oran, pour avoir accepter de présider le jury de cette thèse. Veuillez trouver l’expression de mon profond respect et ma sincère gratitude.

À Mme MEDIENE-BENCHEKOR SOUNNIA, Professeur à l’Université Ahmed Ben Bella d’Oran, pour avoir accepter d’examiner ce travail de thèse et pour sa disponibilité à lire et à corriger attentivement des parties de ce manuscrit. Merci pour le temps que vous m’avez consacré, pour vos précieux conseils, pour votre joie de vivre et pour vos encouragements de tout ordre.

À Mme AOUAR-METRI AMARIA et Mr HAMZA CHERIF ALI, Professeurs à l’Université Abou Bekr Belkaid de Tlemcen, pour avoir accepter sans hésitation à juger ce travail. Veuillez y trouver l’expression de mes remerciements les plus sincères.

À Mr. COMAS-MARTINEZ DAVID, Professeur à l’Université Pompeu Fabra de Barcelone, qui me fait l’honneur d’examiner ce travail de thèse. Je tiens, également, à le remercier sincèrement, de m’avoir accueilli dans son laboratoire et de m’avoir intégrer dans ses projets de recherche qui me permettent de continuer ce travail. Veuillez trouver ici ma profonde gratitude pour votre disponibilité, vos précieux conseils et votre compréhension.

Je remercie également le Professeur HADJOUIS DJILLALI, directeur du Centre National de Recherche Préhistorique, Anthropologique et Historique (CNRPAH) de Tlemcen, de me faire l’honneur d’accepter cette invitation à apporter son regard scientifique à ce travail.

Ce travail de thèse a bénéficié de collaborations scientifiques avec des équipes de recherche des Universités de Torino (Italie) et de La Laguna (Espagne). Je tiens essentiellement à remercier toutes les personnes que j’ai rencontré durant mes séjours. Ces personnes qui m’ont accueillie, soutenue, encouragée et conseillée, j’en garde de très beaux souvenirs que ça soit sur le plan scientifique ou humain. Sans eux ce travail n’aurait jamais vu le jour. Particulièrement, je tiens à remercier les Professeurs Carlo Torre et Alberto Piazza de l’Université de Torino, qui ont accepté de m’accueillir dans leurs laboratoires de recherche, en 2006. Je tiens à exprimer toute ma reconnaissance à CORNELIA DI GAETANO, FRANCESCA CROBU, SERENA INTURRI et particulièrement à CARLO ROBINO. C’est avec eux que cette aventure a commencé, dans cette thématique encore nouvelle pour moi à l’époque. En obtenant une bourse pour les Iles Canaries en 2011, j’ai pu rencontrer de brillants professeurs, gentils et attentionnés qui m’ont traité comme leur propre fille. Mes plus sincères remerciements vont au Pr. JOSÉ MARIA LARRUGA, pour son accueil, sa disponibilité sans égal et son aide précieuse, sans lesquels mon séjour à Tenerife n'aurait pas été aussi mémorable. Aux Professeurs VICENTE CABRERA et ANNA MARIA GONZÁLEZ, je tiens à exprimer toute ma gratitude pour leur attention, leur encouragements, leur rigueur scientifique et surtout pour tout ce que j’ai pu apprendre à leurs cotés. À ces trois personnes, je souhaiterai adresser ma profonde reconnaissance pour m’avoir permis da passer un séjour inoubliable, dont les souvenirs sont les plus chers à mon cœur. Aussi, je retiendrai de Gran Canaria, ma rencontre avec le professeur JOSÉ PESTANO et l’adorable Docteur ROSA FREGEL qui m’ont accueilli dans leur laboratoire et m’ont permis de compléter une partie de ce travail dans une ambiance chaleureuse et très humaine. Mes sincères remerciements vont aussi à toutes les personnes que j’ai rencontrées durant mes séjours en Italie, puis en Espagne. À tous ceux qui m’ont permis de garder les meilleurs souvenirs de cette aventure.

Enfin, je tiens également à remercier Docteur MEGHOUFEL NAIMA DJEBARIA pour ses encouragements, sa sympathie et pour les corrections qu’elle a apporté à une partie de ce manuscrit. Merci aussi à tous mes amis et collègues qui se reconnaitront ici.

Au final, et pas des moindres, j’aimerai remercier toutes les personnes qui ont accepté de participer à notre étude, sans qui, rien n’aurait pu se faire.

Je dédie ce travail à ma famille qui n’a jamais cessé de m’encourager à persévérer quand mes forces me lâchaient. Particulièrement et tendrement, à ma mère et mon père.

À la mémoire de mes grands parents, spécialement ma défunte grand mère « Hbiba » qui a fait de moi ce que je suis aujourd’hui.

Ce travail se veut sincèrement dédié à mon défunt oncle le Professeur HADJ BELMHEL BEKADA, médecin chirurgien d'un rare dévouement aux personnes dont il a eu la santé en charge. Il a donné sa vie à la médecine et à la recherche scientifique. Que dieu l’accueille dans son vaste paradis.

Je dédie également ce mémoire à mon oncle, Mr BEKADA AHMED.

Enfin, à toutes les personnes chères à mon cœur qui m’ont soutenue et m’ont encouragé et à toutes les personnes qui ne sont plus là aujourd’hui pour partager mon soulagement et ma satisfaction.

Résumé:

Grâce à leur position stratégique dans le bassin méditerranéen, les populations du ont fait l’objet de plusieurs études qui témoignent de la complexité de leur structure génétique. La caractérisation génétique de ces populations a été effectuée par de nombreux marqueurs génétiques dont l’ADN mitochondrial (ADNmt) et le chromosome Y qui permettent de déterminer les origines géographiques des populations ancestrales et la composition révélée par le taux de métissage. Des influences eurasiatiques datant du Paléolithique et du Néolithique et de récentes contributions de l'Afrique subsaharienne et de l’Europe méditerranéenne ont été, ainsi, démontré. Cependant, ce scénario génétique est investi avec un écart notable, qui est le manque d'informations consistantes pour l'Algérie, le plus grand pays du Maghreb. La présente étude décrit la distribution de ces marqueurs uniparentaux et des microsatellites STR du chromosome X dans un échantillon de la population urbaine nord-ouest algérienne (n>200). L’analyse de 21 marqueurs X-STRs a été réalisée par PCR multiplex. Les séquences de la région HVSI de l’ADNmt obtenues ont été comparées avec la séquence de référence rCRS (Revised Cambridge Sequence Reference) afin d’identifier les polymorphismes caractérisant les haplogroupes. Pour approfondir cette détermination nous avons analysé les polymorphismes RFLP et SNP, par PCR-RFLP et par miniséquençage SNapShot, respectivement. Concernant l’analyse du chromosome Y, nous avons affiné les résultats, d’une étude précédente dans notre population, par séquençage et détection de 12 polymorphismes SNPs déterminant des sous-groupes des haplogroupes E et R, très répandus en Afrique du Nord et en Europe, respectivement. L’analyse statistique des résultats a été réalisée par les logiciels Arlequin (pour le calcul de l’indice de fixation FST, la diversité génétique (h) et pour l’analyse de la variance moléculaire AMOVA), Network et Phylip (pour la réalisation des arbres phylogénétiques), SPSS (pour les analyses en composantes principales ACP). L’évaluation de la distance génétique sur la base des haplotypes X-STR indique que les Algériens sont proches génétiquement des populations eurasiatiques mais restent assez éloignés des populations de l'Afrique subsaharienne. L’analyse de l’ADN mitochondrial a permis de définir plus de 40 haplogroupes majeurs dont la plus forte fréquence a été observé pour les haplogroupes d’origine eurasiatique : H/HV M1, U6a (30.83%, 7.08%, 6.67%, respectivement). En effet, le composant eurasiatique en Algérie a atteint plus de 80 % pour les deux marqueurs uniparentaux et se traduit par des fréquences élevées (70 %) des haplogroupes du chromosome Y : E-M81 et E-V65. La présence inattendue des dérivées de l’haplogroupe R européen du chromosome Y: R-M412, R-S116, R-U152 et R-M529 en Algérie et le reste du Maghreb semblent constituer les contreparties des sous-groupes de l’ADNmt H1, H3 et HV0. Ceci traduirait les contacts maritimes entre les côtes européennes et nord-africaines de l’ouest de la Méditerranée. Malgré les asymétries sexuelles observées, les profils génétiques uniparentaux des Algériens corrèlent fidèlement entre eux et correspondent parfaitement aux gradients de fréquence des haplogroupes est-ouest et nord- sud observés au nord de l’Afrique. Les résultats de l’analyse du chromosome X sont en accord avec ceux des marqueurs uniparentaux qui estime la contribution féminine et masculine subsaharienne à 20 et 10%, respectivement. Finalement, cette étude devrait être étendue à d’autres échantillons de population, notamment des ethnies berbères, nombreuses sur le grand territoire national algérien, et d’avoir plus de données sur plus de marqueurs de différents loci. C’est bien l’étude de différents marqueurs génétiques croisés à des éléments archéologiques, linguistiques, ethnologiques et démographiques qui permettront d’obtenir une meilleure compréhension de l’histoire des populations d’Algérie et de leurs relations avec d’autres populations nord africaines, eurasiatiques et subsahariennes.

Mots clés : Maghreb, caractérisation génétique, populations ancestrales, Algérie, marqueurs uniparentaux, chromosome X, haplogroupe.

Abstract:

Due to their strategic position in the Mediterranean Basin, the Maghreb populations have been subject of several studies that testifies the complexity of their genetic structure. The genetic characterization of these populations was made by numerous genetic markers among which mitochondrial DNA (mtDNA) and Y chromosome. These markers allow determining the geographical origins of the ancestral populations and the composition revealed by the rate of interbreeding. Eurasian influences dating from the Paleolithic and the and recent contributions from Sub-Saharan Africa and Mediterranean Europe were demonstrated. However, this genetic scenario is invested with a notable gap, which is the lack of substantial information for , the biggest country in the Maghreb. The present study describes the distribution of these uniparental markers and X chromosome microsatellites STRs in a sample of northwest Algerian urban population (n > 200). The analysis of 21 X-STR markers was realized by multiplex PCR. The obtained sequences of the mtDNA HVSI region were compared with the rCRS reference sequence (Revised Cambridge Sequence Reference) to identify polymorphisms characterizing . To refine this genotyping, we analyzed RFLP and SNP polymorphisms by PCR-RFLP and by minisequencing SNapShot, respectively. Concerning the Y chromosome analysis, we refined the results of a previous study in our population, by sequencing and detection of 12 SNP polymorphisms determining sub-groups of North African and European widespread haplogroups E and R, respectively. The statistical analysis of the results was realized by

Arlequin software (to calculate pairwise FST distances, genetic variety (h) and analysis of molecular variance AMOVA), Network and Phylip (to realize phylogenetic trees), SPSS (for Principal Component Analysis PCA). The evaluation of the genetic distance, based on X-STR haplotypes, indicates that the Algerians are genetically close to Eurasian populations but remain distant enough from Sub- Saharan African populations. Mitochondrial DNA (mtDNA) analysis allowed us to define more than 40 major haplogroups: the strongest frequency of which was observed for the Eurasian haplogroups: H/HV M1, U6a (30.83%, 7.08%, 6.67%, respectively). Indeed, the Eurasian component in Algeria reached more than 80 % for both uniparental markers and is translated by high frequencies (70 %) of Y chromosome haplogroups: E-M81 and E-V65. The unexpected presence of the European Y chromosome R subdivision: R- M412, R-S116, R-U152 and R-M529 in Algeria and the rest of the Maghreb seem to constitute the counterparties of the mtDNA subgroups H1, H3 and HV0. This would translate the maritime contacts between the European and North African western sides of the Mediterranean Sea. In spite of the observed sexual asymmetries, the genetic uniparental profiles of Algerians correlate faithfully between them and correspond perfectly to east-west and north-south gradients of the observed haplogroups frequency in North Africa. The X chromosome analysis results are in agreement with those of uniparental markers that consider the female and male Sub-Saharan contribution in 20 and 10 %, respectively. Finally, this study should be spread to other population samples, in particular Berber ethnic groups that are numerous on the wide Algerian national territory, and to have more data on further markers of different loci. In fact, the study of various genetic markers crossed to archaeological, linguistic, ethnological and demographic elements will allow to obtain a better understanding of Algerian populations history and their relations with other North African, Eurasian and Sub-Saharan populations.

Keywords: Maghreb, genetic characterization, ancestral populations, Algeria, uniparental markers, X chromosome, haplogroup.

اﻟﻤﻠﺨﺺ ﺑﻔﻀﻞ وﺿﻌﮭﻢ اﻻﺳﺘﺮاﺗﯿﺠﻲ ﻓﻲ ﺣﻮض اﻟﺒﺤﺮ اﻷﺑﯿﺾ اﻟﻤﺘﻮﺳﻂ، ﺳﻜﺎن اﻟﻤﻐﺮب اﻟﻌﺮﺑﻲ ﻣﻮﺿﻮع اﻟﻌﺪﯾﺪ ﻣﻦ اﻟﺪراﺳﺎت اﻟﺘﻲ ﺗﻌﻜﺲ اﻟﻄﺎﺑﻊ اﻟﻤﻌﻘﺪ ﻟﺘﺮاﺛﮭﺎ اﻟﺠﯿﻨﻲ. اﻟﺘﻮﺻﯿﻒ اﻟﻮراﺛﻲ ﻟﮭﺆﻻء اﻟﺴﻜﺎن اﺳﺘﺨﺪم اﻟﻌﺪﯾﺪ ﻣﻦ اﻟﺒﺼﻤﺎت اﻟﺠﯿﻨﯿﺔ اﻟﻨﺼﻒ اﻻﺑﻮﯾﺔ ﺑﻤﺎ ﻓﻲ ذﻟﻚ اﻟﺤﻤﺾ اﻟﻨﻮوي اﻟﻤﯿﺘﻮﻛﻨﺪري (ADNmt) واﻟﻜﺮوﻣﻮﺳﻮم Y اﻟﻠﺬان ﯾﺤﺪدا اﻷﺻﻮل اﻟﺠﻐﺮاﻓﯿﺔ ﻟﻠﺴﻜﺎن اﻷﺟﺪاد واﻟﺘﻜﻮﯾﻦ اﻟﺠﯿﻨﻲ اﻟﻤﺤﺪد ﺑﻤﻌﺪل اﻟﺘﮭﺠﯿﻦ. وھﻜﺬا، أظﮭﺮت اﻟﺘﺄﺛﯿﺮات اﻵﺳﯿﻮﯾﺔ اﻻورﺑﯿﺔ اﻟﺘﻲ ﯾﺮﺟﻊ ﺗﺎرﯾﺨﮭﺎ اﻟﻰ اﻟﻌﺼﺮ اﻟﺤﺠﺮي اﻟﻘﺪﯾﻢ و اﻟﺤﺪﯾﺚ وﻛﺬﻟﻚ ﺳﻠﻂ اﻟﻀﻮء ﻋﻠﻰ اﻟﻤﺴﺎھﻤﺎت اﻷﺧﯿﺮة ﻓﻲ ﺟﻨﻮب ﺻﺤﺮاء أﻓﺮﯾﻘﯿﺎ وأوروﺑﺎ اﻟﻤﺘﻮﺳﻄﯿﺔ. وﻣﻊ ذﻟﻚ، ﯾﺘﻢ اﺳﺘﺜﻤﺎر ھﺬا اﻟﺴﯿﻨﺎرﯾﻮ اﻟﻮراﺛﻲ ﻣﻊ ﻓﺠﻮة ﻣﻠﺤﻮظﺔ، وھﻲ اﻻﻓﺘﻘﺎر إﻟﻰ ﻣﻌﻠﻮﻣﺎت ﻛﺎﻣﻠﺔ ﻋﻦ اﻟﺠﺰاﺋﺮ، أﻛﺒﺮﺑﻠﺪان اﻟﻤﻐﺮب اﻟﻌﺮﺑﻲ. ھﺬه اﻟﺪراﺳﺔ ﺗﻮﺿﺢ ﺗﻮزﯾﻊ اﻟﺒﺼﻤﺎت اﻟﺠﯿﻨﯿﺔ اﻟﻨﺼﻒ اﻻﺑﻮﯾﺔ و ﻛﺬﻟﻚ ﻗﻄﻊ اﻟﺤﻤﺾ اﻟﻨﻮوي اﻟﻤﺘﻜﺮرة (microsatellites STR) ﻟﻠﻜﺮوﻣﻮﺳﻮم X ﻓﻲ ﻋﯿﻨﺔ ﻣﻦ اﻟﺴﻜﺎن اﻟﺤﻀﺮﯾﯿﻦ ﻓﻲ اﻟﺸﻤﺎل اﻟﻐﺮﺑﻲ اﻟﺠﺰاﺋﺮي - (n > 200). ﺣﻠﻠﺖ21 ﻋﻼﻣﺎت X-STR ﺑﺘﻘﻨﯿﺔ ﺗﻔﺎﻋﻞ اﻟﺒﻮﻟﯿﻤﯿﺮاز اﻟﻤﺘﺴﻠﺴﻞ اﻟﻤﺘﻌﺪد PCR multiplex. ﻗﻮرﻧﺖ ﺳﻠﺴﻠﺔ ﻣﻨﻄﻘﺔ HVSI ﻟﻠﺤﻤﺾ اﻟﻨﻮوي اﻟﻤﯿﺘﻮﻛﻨﺪري (ADNmt) اﻟﻤﺘﺤﺼﻞ ﻋﻠﯿﮭﺎ ﻣﻊ اﻟﺴﻠﺴﻠﺔ اﻟﻤﺮﺟﻊ Revised Cambridge Sequence Reference) rCRS) و ذﻟﻚ ﻻﯾﺠﺎد و ﺗﺤﺪﯾﺪ ﻣﺠﻤﻊ اﻷﺷﻜﺎل اﻟﻤﺘﻌﺪدة اﻟﺘﻲ ﺗﻤﯿﺰاﻧﻮاع اﻟﮭﺎﺑﻠﻮﻏﺮوب haplogroupes. ﻟﺘﻌﻤﯿﻖ ھﺬا اﻟﺘﺼﻤﯿﻢ ﻗﻤﻨﺎ ﺑﺘﺤﻠﯿﻞ ﻣﺠﻤﻊ اﻷﺷﻜﺎل اﻟﻤﺘﻌﺪدة ﻣﻦ ﻧﻮع ال SNP و ال RFLP ﺑﺘﻘﻨﯿﺔ ال PCR-RFLP وﺗﻘﻨﯿﺔ ﺗﺤﺪﯾﺪ ﺗﺴﻠﺴﻞ اﻟﺤﻤﺾ اﻟﻨﻮوي miniséquençage SNapShot ،ﻋﻠﻰ اﻟﺘﻮاﻟﻲ. ﻓﯿﻤﺎ ﯾﺘﻌﻠﻖ ﺑﺘﺤﻠﯿﻞ ﻛﺮوﻣﻮﺳﻮم Y، ﻟﻘﺪ ﺻﻘﻠﻨﺎ ﻧﺘﺎﺋﺞ دراﺳﺔ ﺳﺎﺑﻘﺔ ﻓﻲ ﻋﯿﻨﺔ ﻣﻦ ﺳﻜﺎن اﻟﺸﻤﺎل اﻟﻐﺮﺑﻲ اﻟﺠﺰاﺋﺮي ﺑﺘﻘﻨﯿﺔ ﺗﺤﺪﯾﺪ ﺗﺴﻠﺴﻞ اﻟﺤﻤﺾ اﻟﻨﻮوي وﺑﺎﻟﻜﺸﻒ ﻋﻦ 12 ﻣﺠﻤﻊ اﻷﺷﻜﺎل اﻟﻤﺘﻌﺪدة SNP اﻟﻠﺘﻲ ﺗﺤﺪد أﻓﺮﻗﺔ ﻓﺮﻋﯿﺔ ﻣﻦ الE haplogroupes و R اﻟﻤﻮﺟﻮدان ﻋﻠﻰ ﻧﻄﺎق واﺳﻊ ﻓﻲ ﺷﻤﺎل أﻓﺮﯾﻘﯿﺎ وأوروﺑﺎ، ﻋﻠﻰ اﻟﺘﻮاﻟﻲ. أﺟﺮى اﻟﺘﺤﻠﯿﻞ اﻹﺣﺼﺎﺋﻲ ﻟﻠﻨﺘﺎﺋﺞ

ﺑﺎﺳﺘﻌﻤﺎل ﺑﺮﻣﺠﯿﺔ Arlequin (ﻟﺤﺴﺎب اﻷرﻗﺎم اﻟﻘﯿﺎﺳﯿﺔ ﻟﻠﺘﺜﺒﯿﺖ FST ، اﻟﺘﻨﻮع اﻟﻮراﺛﻲ (h)، ﻟﺘﺤﻠﯿﻞ اﻟﺘﺒﺎﯾﻦ اﻟﺠﺰﯾﺌﯿﺔ أﻣﻮﻓﺎ (AMOVA)، ﺑﺮﻣﺠﯿﺔ ﻓﯿﻠﯿﺐ (Phylip)، وﺷﺒﻜﺔ الNetwork (ﻟﺮﺳﻢ اﺷﺠﺎر اﻟﻨﺸﻮء و اﻟﺘﻄﻮر) وﺑﺮﻣﺠﯿﺔ الSPSS (ﻟﺮﺳﻢ ﺗﺤﻠﯿﻼت اﻟﻤﻜﻮن اﻟﺮﺋﯿﺴﻲ ACP). ﺗﻘﯿﯿﻢ اﻟﻤﺴﺎﻓﺔ اﻟﻮراﺛﯿﺔ ﻋﻠﻰ اﺳﺎس اﻟﻨﻤﻂ اﻟﻔﺮداﻧﻲ X-STR haplotypes ﺗﺒﯿﻦ أن اﻟﺠﺰاﺋﺮﯾﯿﻦ ﻗﺮﯾﺒﻮن وراﺛﯿﺎ ﻣﻦ ﺳﻜﺎن اﻟﻤﻨﻄﻘﺔ اﻷوروﺑﯿﺔ اﻵﺳﯿﻮﯾﺔ وﻟﻜﻦ ﯾﻈﻠﻮن ﺑﻌﯿﺪﯾﻦ إﻟﻰ ﺣﺪ ﻣﺎ ﻣﻦ ﺳﻜﺎن ﺟﻨﻮب ﺻﺤﺮاء أﻓﺮﯾﻘﯿﺎ. ﺗﺤﻠﯿﻞ اﻟﺤﻤﺾ اﻟﻨﻮوي اﻟﻤﯿﺘﻮﻛﻨﺪري ﺣﺪد أﻛﺜﺮ ﻣﻦ haplogroupes 40 رﺋﯿﺴﻲ و اﻟﺬي ﻟﻮﺣﻆ أﻋﻠﻰ ﺗﺮدد ﻟﮫ ﺑﺎل haplogroupes اﻷوروﺑﻲ اﻵﺳﯿﻮي اﻟﻨﺸﺄة: U6a، M1، H\ HV(30.83 ٪، ٪7.08، 6.67 ٪، ﻋﻠﻰ اﻟﺘﻮاﻟﻲ.). ﻓﻲ اﻟﻮاﻗﻊ، اﻟﻤﻜﻮن اﻷوراﺳﻲ ﻓﻲ اﻟﺠﺰاﺋﺮ ﻗﺪ ﺑﻠﻎ أﻛﺜﺮ ﻣﻦ 80٪ ﻟﻠﻤﺤﺪدﯾﻦ اﻟﺠﯿﻨﯿﯿﻦ اﻻﺑﻮﯾﯿﻦ واﻟﻠﺬي ﯾﺘﺮﺟﻢ إﻟﻰ ﺗﺮددات ﻋﺎﻟﯿﺔ (70%) ﻣﻦ haplogroupes اﻟﻜﺮوﻣﻮﺳﻮم Y: و E-M81 E-V65. اﻟﻮﺟﻮد اﻟﻐﯿﺮ ﻣﺘﻮﻗﻊ ﻟﻤﺸﺘﻘﺎت اﻟﮭﺎﺑﻠﻮﻏﺮوب R اﻷوروﺑﻲ ﻟﻠﻜﺮوﻣﻮﺳﻮم R-M412, :Y R-S116, R-U152 و R-M529 ﻓﻲ اﻟﺠﺰاﺋﺮ وﺑﻘﯿﺔ ﺑﻠﺪان اﻟﻤﻐﺮب اﻟﻌﺮﺑﻲ ﯾﺒﺪو أﻧﮫ ﯾﺤﺪد اﻷطﺮاف اﻟﻤﻘﺎﺑﻠﺔ ﻟﻠﻤﺠﻤﻮﻋﺎت اﻟﻔﺮﻋﯿﺔ ﻟﻠﺤﻤﺾ اﻟﻨﻮوي اﻟﻤﯿﺘﻮﻛﻨﺪري H3, H1 وHV0. وھﺬا ﻣﺎ ﯾﺘﺮﺟﻢ ﺑﺎﻻﺗﺼﺎﻻت اﻟﺒﺤﺮﯾﺔ ﺑﯿﻦ اﻟﺠﮭﺎت اﻷوروﺑﯿﺔ و اﻟﺸﻤﺎل أﻓﺮﯾﻘﯿﺔ ﻋﻠﻰ ﻣﺴﺘﻮى ﻏﺮب اﻟﺒﺤﺮ اﻷﺑﯿﺾ اﻟﻤﺘﻮﺳﻂ. رﻏﻢ ﻋﺪم اﻟﺘﻤﺎﺛﻞ اﻟﺠﻨﺴﻲ اﻟﻤﻠﺤﻮظ، اﻟﻤﻼﻣﺢ اﻟﺠﯿﻨﯿﺔ اﻟﻨﺼﻒ اﻻﺑﻮﯾﺔ ﻟﻠﺠﺰاﺋﺮﯾﯿﻦ ﺗﺮﺗﺒﻂ ﻓﯿﻤﺎ ﺑﯿﻨﮭﺎ ﺑﺪﻗﺔ وﺗﺘﻮاﻓﻖ ﺗﻤﺎﻣﺎ ﻣﻊ ﺗﺪرﺟﺎت ﺗﺮدد اﻟﮭﺎﺑﻠﻮﺟﺮوب، ﻣﻦ اﻟﺸﺮق اﻟﻰ اﻟﻐﺮب وﻣﻦ اﻟﺸﻤﺎل اﻟﻰ اﻟﺠﻨﻮب، اﻟﻤﻼﺣﻈﺔ ﺷﻤﺎل أﻓﺮﯾﻘﯿﺎ. ﻧﺘﺎﺋﺞ ﺗﺤﻠﯿﻞ اﻟﻜﺮوﻣﻮﺳﻮم X ﺗﺘﻤﺎﺷﻰ ﻣﻊ ﺗﻠﻚ ﻣﻦ اﻟﺒﺼﻤﺎت اﻟﺠﯿﻨﯿﺔ اﻟﻨﺼﻒ اﻻﺑﻮﯾﺔ اﻟﺘﻲ ﺗﻌﺘﺒﺮ ﻣﺴﺎھﻤﺔ اﻟﺮﺟﺎل واﻟﻨﺴﺎء ﻣﻦ اﻟﺼﺤﺮاء إﻟﻰ 20 ﻓﻲ اﻟﻤﺎﺋﺔ و 10 ﻓﻲ اﻟﻤﺎﺋﺔ، ﻋﻠﻰ اﻟﺘﻮاﻟﻲ. و أﺧﯿﺮا ﯾﻨﺒﻐﻲ أن ﺗﻤﺘﺪ ھﺬه اﻟﺪراﺳﺔ إﻟﻰ ﻋﯿﻨﺎت أﺧﺮى ﻣﻦ اﻟﺴﻜﺎن، ﺧﺎﺻﺔ ﻋﺮق اﻟﺒﺮﺑﺮ اﻟﻤﻮﺟﻮد ﺑﻜﺜﺮة ﻓﻲ اﻷراﺿﻲ اﻟﻮطﻨﯿﺔ اﻟﺠﺰاﺋﺮﯾﺔ اﻟﻜﺒﯿﺮة، وأن ﯾﻜﻮن اﻟﻤﺰﯾﺪ ﻣﻦ اﻟﺒﯿﺎﻧﺎت ﻋﻠﻰ أﻛﺜﺮ ﻋﺪد ﻣﻦ اﻟﻌﻼﻣﺎت اﻟﺠﯿﻨﯿﺔ ﻓﻲ ﻣﻮاﺿﻊ وراﺛﯿﺔ ﻣﺨﺘﻠﻔﺔ. ﻓﺎﻧﮭﺎ دراﺳﺔ اﻟﺒﺼﻤﺎت اﻟﺠﯿﻨﯿﺔ اﻟﻤﺨﺘﻠﻔﺔ ﻣﻘﺘﺮﻧﺔ ﺑﺎﻟﺪراﺳﺎت اﻟﻼﺛﺮﯾﺔ، اﻟﻠﻐﻮﯾﺔ، اﻹﺛﻨﻮﻟﻮﺟﯿﺔ واﻟﺪﯾﻤﻐﺮاﻓﯿﺔ اﻟﺘﻲ ﺳﺘﺴﺘﻌﻤﻞ ﻟﻔﮭﻢ أﻓﻀﻞ ﻟﺘﺎرﯾﺦ اﻟﺸﻌﺐ اﻟﺠﺰاﺋﺮي وﻋﻼﻗﺎﺗﮭﻢ ﻣﻊ اﻟﺴﻜﺎن اﻵﺧﺮﯾﻦ ﻣﻦ ﺷﻤﺎل أﻓﺮﯾﻘﯿﺎ وأوروﺑﺎ وآﺳﯿﺎ و ﺟﻨﻮب اﻟﺼﺤﺮاء اﻓﺮﯾﻘﻲ. اﻟﻜﻠﻤﺎت اﻟﺮﺋﯿﺴﯿﺔ: اﻟﻤﻐﺮب اﻟﻌﺮﺑﻲ، اﻟﺘﻮﺻﯿﻒ اﻟﻮراﺛﻲ، اﻟﺴﻜﺎن اﻻﺟﺪاد، اﻟﺠﺰاﺋﺮ، اﻟﺒﺼﻤﺎت اﻟﺠﺠﯿﻨﺔ اﻟﻨﺼﻒ اﻻﺑﻮﯾﺔ، اﻟﻜﺮوﻣﻮﺳﻮم X، ھﺎﺑﻠﻮﻏﺮوب haplogroupe.

TABLE DES MATIÈRES

Liste des figures Liste des tableaux Liste des abréviations et acronymes

INTRODUCTION GÉNÉRALE Page 1

EXPOSÉ BIBLIOGRAPHIQUE

I. ORIGINE GÉOGRAPHIQUE DE L’HOMME ET PEUPLEMENT DU MONDE 5 I.1 Avant propos 5 I.2 Origine géographique et histoire de l’homme 5 I.2.1 Du point de vue paléontologique 5 I.2.1.1 Théories majeures sur l’origine géographique de l’homme 7 I.2.2 Du point de vue génétique : Apport du chromosome Y et de l’ADN mitochondrial à la compréhension de l’origine de l’homme 8 I.3 Homo sapiens et la conquête du monde 9 I.3.1 Les populations humaines durant les deux grandes périodes de la préhistoire 9 I.3.1.1 Le Paléolithique « âge de la pierre ancienne » 9 I.3.1.2 Le Néolithique « âge de la pierre polie » 10

II. LE PEUPLEMENT DE L’AFRIQUE DU NORD 12 II.1 Données Paléontologiques : les populations Préhistoriques 12 II.1.1 Au Paléolithique inférieur 12 II.1.2 Au Paléolithique supérieur 12 II.1.3 L’origine du premier Homo sapiens du Maghreb 13 II.1.4 La révolution Néolithique au Maghreb 14 II.2 Données historiques 15 II.2.1 Les royaumes de la Numidie 16 II.2.2 Les phéniciens et les carthaginois 17 II.2.3 Les Romains (de 146 avant J.-C. à 429 après J.-C.) 17 II.2.4 Les Vandales (429-534 après J.-C.) 18 II.2.5 Les Byzantins (534-647 après J.-C.) 19 II.2.6 La conquête Arabe (647-776 après J.-C.) (27 – 160 Hijir) 20 II.2.7 Les Espagnols et les Ottomans 20 II.2.8 La domination Française 21 II.3 L’Algérie (El-Djazaïr) 21 II.3.1 Données étymologiques 21 II.3.2 Données géographiques 22 II.3.3 Données démographiques 23 II.4 Le Nord-Ouest algérien 24

III. GÉNÉTIQUE DES POPULATIONS, PARAMÈTRES ÉVOLUTIFS ET ÉTUDE DE LA DIVERSITÉ GÉNÉTIQUE 25

III.1 Paramètres de l’analyse des variations génétiques 26 III.1.1 Équilibre d’Hardy Weinberg 26 III.1.2 Forces évolutives et variations du génome humain 27 III.1.2.1 Mutations 27 III.1.2.2 Sélection naturelle 28 III.1.2.3 Dérive génétique 29 III.1.2.3.1 Goulot d'étranglement génétique (genetic bottleneck) 30 III.1.2.3.2 Effet fondateur 31 III.1.2.4 Migrations et le flux génique (gene flow) 31 III.1.3 Relation entre les différents paramètres influençant l’évolution 31 III.2 Déduction de l’histoire démographique en se basant sur les variations génétiques 32 III.2.1 Arbre phylogénétique 32 III.2.2 Théorie de coalescence 33 III.2.3 Application à la phylogénétique 34

IV. ÉTUDES ANTHROPOGÉNÉTIQUES ET MARQUEURS PARENTAUX 35

IV.1 Le chromosome X 37 IV.1.1 Caractéristiques du chromosome X 37 IV.1.1.1 Inactivation du chromosome X 37 IV.1.1.2 Maladies liés à l’X 38 IV.1.2 Marqueurs polymorphes du chromosome 38 IV.1.2.1 Polymorphismes STRs du chromosome X 38 IV.1.2.2 Polymorphismes Alu du chromosome X 40 IV.1.3 Analyse du chromosome X en génétique médico-légale 41 IV.1.4 Analyse du chromosome X appliquée à la génétique des populations 41 IV.1.5 Propriétés des marqueurs du chromosome X en anthropogénétique 42 IV.1.5.1 Haplotypes et recombinaison génétique 42 IV.1.5.2 Diversité et dérive génétique 43 IV.1.5.3 Sélection naturelle et flux migratoires 44 IV.1.5.4 Importance des marqueurs en déséquilibre de liaison 45

IV.2 Mitochondrie et génome mitochondrial 47 IV.2.1 Généralités sur la mitochondrie 47 IV.2.2 Découverte et séquençage du génome mitochondrial 47 IV.2.3 Structure de l’ADN mitochondrial 47 IV.2.4 Propriétés de l’ADN mitochondrial 49 IV.2.4.1 Grand nombre de copies 49 IV.2.4.2 Transmission maternelle 49 IV.2.4.3 Absence de recombinaison 50 IV.2.4.4 Taux de mutation 50 IV.2.5 Analyse phylogénétique de l’ADN mitochondrial 51 IV.2.5.1 Construction de l’arbre phylogénétique de l’ADNmt 51 IV.2.5.2 Théorie de l’Ève mitochondriale 53 IV.2.5.3 Phylogénie et distribution géographique des haplogroupes l’ADNmt 54 IV.2.6 ADN mitochondrial et archéogénétique (ou paléogénétique) 58 IV.2.7 ADN mitochondrial et sciences génétiques médico-légales et criminalistiques 59 IV.2.8 ADN mitochondrial et pathologies humaines 59

IV.3 Le chromosome Y 61 IV.3.1 Propriétés du chromosome Y 61 IV.3.2 Avantages de l’analyse du chromosome Y 62 IV.3.3 Marqueurs polymorphes du chromosome Y 62 IV.3.3.1 Polymorphismes bialléliques du chromosome Y 63 IV.3.3.2 Marqueurs multialléliques du chromosome Y 64 IV.3.3.3 Pourquoi analyser les Y-SNP et Y-STR ? 65 IV.3.4 Analyse phylogénétique du chromosome Y 65 IV.3.4.1 La racine de l’arbre phylogénétique du chromosome Y 67 IV.3.4.2 Les haplogroupes qui caractérisent la sortie de l’Afrique « Out of Africa » 68 IV.3.4.3 Phylogéographie des haplogroupes du chromosome Y 68

IV.4 Données bibliographiques sur l’analyse des marqueurs parentaux en Algérie 71

V. OBJECTIFS DES TRAVAUX DE THÈSE 72

POPULATIONS ET MÉTHODES

I. OBTENTION ET DESCRIPTION DE L’ÉCHANTILLON DE LA POPULATION ANALYSÉE 74 I.1 Prélèvements et extraction d’ADN 74 I.2 Quantification de l’ADN 75

II. TECHNIQUES D’IDENTIFICATION DES POLYMORPHISMES ÉTUDIÉS 78

III ANALYSE DE 21 MARQUEURS STRS DU CHROMOSOME X 79 III.1 Analyse par PCR multiplex 79 III.1.1 PCR multiplex A, B et C 80 III.1.2 PCR multiplex du kit Mentype® Argus X-8 81 III.1.3 Analyse des produits PCR par électrophorèse capillaire 81 III.1.3.1 Principe de l’électrophorèse capillaire 82 III.1.3.2 Marqueur de taille et marqueurs alléliques de référence 82 III.2 Analyse du marqueur STR (DXS10148) par séquençage 85 III.2.1 Principe de la réaction de séquençage 85 III.2.2 Étapes du protocole de séquençage employé 87 III.3 Analyse statistique des données génétiques du chromosome X 90

IV. ANALYSE DES MARQUEURS UNIPARENTAUX (L'ADN MITOCHONDRIAL ET LE CHROMOSOME Y) 93 IV.1 Analyse des séquences de l’ADNmt 93 IV.1.1 Séquençage de la région HVS-1 93 IV.1.2 Analyse des polymorphismes de l’ADNmt 96 IV.1.2.1 Analyse par PCR-RFLP 97 IV.1.2.2 Analyse par miniséquençage SNapShot 98 IV.1.3 Classification des haplotypes de l’ADNmt en haplogroupes 104 IV.2 Analyse du chromosome Y 104 IV.2.1 Analyse de la subdivision de l’haplogroupe E1b (M78) 105 IV.2.2 Analyse de la subdivision de l’haplogroupe R1b (M343) 105 IV.2.3 Conditions d’amplification et de digestion enzymatique 105 IV.2.4 Classification et nomenclature des haplogroupes du chromosome Y 106 IV.3 Analyse statistique des résultats des marqueurs uniparentaux 106 IV.3.1 Analyse de la variation génétique des marqueurs uniparentaux 108 IV.3.2 Méthodes de réduction dimensionnelles 110 IV.3.3 Méthode median-joining Network appliquée aux sous-groupes M1 de l’ADNmt 110 RÉSULTATS ET DISCUSSION

I ANALYSE DU CHROMOSOME X 111 I.1 Résultats des essais PCR 111 I.2 Analyse génétique des 21 X-STRs 111 I.3 Séquençage du marqueur STR (DXS10148) 114 I.4 Analyse statistique 116 I.4.1 Analyse du déséquilibre de liaison 116 I.4.2 Analyse des paramètres statistiques d’intérêt médico-légal 120 I.4.3 Analyse comparative avec d’autres populations 122 I.4.3.1 Comparaison entre les populations italienne et nord-ouest algérienne 125 I.4.4 Correspondance entre l’analyse des deux chromosomes X et Y 125 I.5 Discussion générale des résultats de l’analyse du chromosome X 127 I.6 Conclusion de l’analyse du chromosome X 128

II ANALYSE DES MARQUEURS UNIPARENTAUX 129

II.1 Analyse de l’ADNmt 129 II.1.1 Les lignées mitochondriales observées dans la population nord-ouest algérienne 129 II.1.2 Analyse de la distribution des haplogroupes mitochondriaux dans les populations nord africaines et eurasiatiques 131 II.1.2.1 Analyse des fréquences de l’haplogroupe et sous-groupes H 131 II.1.2.2 Comparaison de la distribution des haplogroupes mitochondriaux entre les échantillons analysés dans la population algérienne 135 II.1.2.3 Analyse des fréquences des haplogroupes majeurs 137 II.1.2.3.1 Les lignées eurasiatiques 137 II.1.2.3.2 Les lignées subsahariennes 140 II.1.3 Analyse de la variation génétique mitochondriale 142 II.1.4 Analyse en composantes principales de l’ADNmt 144 II.1.5 Analyse des sous-groupes M1 de l’ADNmt 146 II.1.6 Discussion des résultats: les contributions génétiques maternelles eurasiatiques et subsahariennes 149 II.1.6.1 Contribution européenne dans le pool génétique nord africain 150 II.1.6.2 Contribution eurasiatique typiquement nord africaine 151 II.1.6.3 Composante génétique subsaharienne en Afrique du Nord 153

II.2 Analyse du chromosome Y 154 II.2.1 Subdivision de l’haplogroupe E1b (M78) et R1b (M343) 154 II.2.1.1 Subdivision de l’haplogroupe E1b (M78) 155 II.2.1.2 Subdivision de l’haplogroupe R1b (M343) 155 II.2.2 Analyse de la distribution des haplogroupes du chromosome Y 156 II.2.2.1 Les haplogroupes du chromosome Y observés en Algérie 156 II.2.2.2 Distribution des haplogroupes du chromosome Y dans les populations nord africaines et eurasiatiques 158 II.2.3 Analyse de la variation génétique du chromosome Y 165 II.2.4 Analyse en composantes principales du chromosome Y 167 II.2.5 Discussion des résultats: les contributions génétiques paternelles 168

II.3 Discussion générale: Contribution et concordance entre les marqueurs uni parentaux 171 II.4 Conclusion de l’Analyse des marqueurs uniparentaux 180

CONCLUSION GÉNÉRALE ET PERSPECTIVES 181

RÉFÉRENCES BIBLIOGRAPHIQUES 186

ANNEXES 222

PUBLICATIONS

LISTE DES FIGURES

Liste des figures

Figure 1: Carte géographique représentant le croissant fertile 11

Figure 2 : Les royaumes numides 16

Figure 3 : L’occupation romaine des territoires nord africains 18

Figure 4 : Position géographique de l’Algérie dans le bassin méditerranéen 22

Figure 5 : Quelques principales villes algériennes 23

Figure 6 : Les trois types de sélection naturelle 29

Figure 7 : Influence de la taille de population sur la dérive génétique 30

Figure 8 : Modèle de Wright-Fisher et le coalescent de Kingman 34

Figure 9 : Analyse du chromosome X en génétique des populations 43

Figure 10 : Idiogramme du chromosome X 46

Figure 11 : Carte schématique de l’ADN mitochondrial humain 48

Figure 12 : Phylogénie de l’ADN mitochondrial simplifié, illustrant la nomenclature des haplogroupes par les lettres de l’alphabet 52

Figure 13 : Distribution continentale des haplogroupes de l’ADN mitochondrial simplifié 54

Figure 14 : Les grandes migrations des haplogroupes majeurs de l’ADN mitochondrial 56

Figure 15 : Phylogénie basale des haplogroupes mitochondriaux européens 57

Figure 16 : Structure et organisation du chromosome Y 61

Figure 17 : Structure de l’arbre phylogénétique du chromosome Y 66

Figure 18 : Distribution géographique des haplogroupes du chromosome Y 69

Figure 19 : Origine géographique des sujets prélevés de la population nord-ouest algérienne 75

Figure 20 : Principe de la technologie TaqMan (Applied Biosystems) 77

Figure 21 : L’analyseur génétique ABI PRISM® 310 Genetic Analyzer (Applied Biosystems) 83

Figure 22 : Profil des allèles de références (allelic ladder) des 8 marqueurs STRs analysés par le kit

Argus X-8 (Biotype GE, Dresden Germany) 84

Figure 23 : Principe de la réaction de séquençage d’ADN 86

LISTE DES FIGURES

Figure 24 : Protocole de purification des produits de PCR avec le kit (QIAquick PCR Purification Kit,

Qiagen) 88

Figure 25 : Position des marqueurs X-STRs étroitement liés dans les 6 clusters (DL) 90

Figure 26 : Protocole de séquençage de l’ADNmt 94

Figure 27 : Principe de la réaction de miniséquençage SNaPshot 99

Figure 28 : Réaction multiplex pour l’analyse simultanée de plusieurs SNPs par miniséquençage

SNaPshot 100

Figure 29 : Protocole de l’analyse SNaPshot 102

Figure 30 : Représentation phylogénétique simplifiée des polymorphismes et haplogroupes du chromosome Y recherchés 105

Figure 31 : Carte géographique montrant les pays et populations considérées dans l’analyse des marqueurs uniparentaux 108

Figure 32 : Histogrammes des fréquences alléliques des X-STRs dans la population nord-ouest algérienne 112

Figure 33 : Arbre Neighbor-Joining reliant les 8 populations comparées à l’échantillon nord-ouest algérien 123

Figure 34 : Analyse en Composantes Principales de la distribution des fréquences alléliques de

4 X-STRs 124

Figure 35 : Fréquences des haplogroupes majeurs observées dans l’échantillon nord-ouest algérien 130

Figure 36 : Histogramme des fréquences de l’haplogroupe H dans les populations nord africaines et eurasiatiques 131

Figure 37 : Fréquences des sous-groupes H dans la population nord-ouest algérienne 132

Figure 38 : Analyse en composantes principales (ACP) de l’ADNmt 145

Figure 39 : Reduced median-joining network reliant les séquences du sous-groupe mitochondrial M1 148

Figure 40 : Carte géographique des routes du commerce des esclaves transsahariens 153

Figure 41 : Arbre phylogénétique simplifié des sous-haplogroupes du chromosome Y analysés 154

Figure 42 : Fréquences des haplogroupes majeurs du chromosome Y dans la population algérienne 157

Figure 43 : Fréquences des haplogroupes E-M81 et E-M78 dans les populations analysées 161

LISTE DES FIGURES

Figure 44 : Fréquences des sous-groupes E-M78 dans les populations analysées 162

Figure 45 : Fréquences des sous-groupes R1b1 dans les populations analysées 163

Figure 46 : Fréquences des haplogroupes I, J1 et J2 dans les populations analysées 164

Figure 47 : Analyse en composantes principales (ACP) du chromosome Y 167

Figure 48 : Représentation de la distribution des composants phylogéographiques de l’ADNmt 176

Figure 49 : Représentation de la distribution des composants phylogéographiques du chromosome Y 177

LISTE DES TABLEAUX

Liste des tableaux

Tableau 1: Quelques exemples de polymorphismes STRs du chromosome X 39

Tableau 2: Caractéristiques des 21 marqueurs X-STRs analysés 80

Tableau 3: Les polymorphismes de l’ADNmt analysés par PCR-RFLP 97

Tableau 4: Caractéristiques des polymorphismes de l’ADNmt identifiés par miniséquençage

SNaPshot 101

Tableau 5: Populations considérées dans l’analyse des marqueurs uniparentaux 107

Tableau 6: Structure de l’unité de répétition du locus DXS10148 analysée dans l’échantillon nord ouest algérien 115

Tableau 7: Nombre total et combinaison allélique des haplotypes STRs du chromosome X observés dans les 6 clusters 118

Tableau 8: Paramètres statistiques d’intérêt médico-légal 121

Tableau 9: Proportion de variance (FST) locus par locus entre l’échantillon nord-ouest algérien et différentes populations 122

Tableau 10: Analyse des clusters X-STR parmi les haplogroupes du chromosome Y dans la population nord-ouest algérienne 126

Tableau 11: Fréquences des haplogroupes observées dans l’échantillon nord-ouest algérien 129

Tableau 12: Distribution des fréquences (%) des sous-groupes H de l’ADNmt entre les populations

étudiées 134

Tableau 13: Fréquences en pourcentages des haplogroupes de l’ADNmt dans trois populations algériennes 136

Tableau 14: Comparaison des fréquences (%) des lignées eurasiatiques de l’ADNmt entre les populations

étudiées 138

LISTE DES TABLEAUX

Tableau 15: Comparaison des fréquences (%) des lignées subsahariennes de l’ADNmt entre les populations étudiées 141

Tableau 16: Proportion de variance (FST) dans l’analyse de l’ADNmt 143

Tableau 17: Nombre d’individus porteurs de l’un des 6 haplotypes du sous-groupe M1 observés dans les populations étudiées 147

Tableau 18: Comparaison des fréquences (%) des haplogroupes du chromosome Y entre les populations

étudiées 159

Tableau 19: Proportion de variance (FST) dans l’analyse du chromosome Y 166

LISTE DES ABRÉVIATIONS ET ACRONYMES

Liste des abréviations et acronymes

%: pourcent µg: microgramme µl: microlitre µm: micromètre µM: micromolaire ADN: Acide Désoxyribonucléique AMHs: Anatomically modern humans AMOVA: Analysis of Molecular Variance AZF: AZoospermia Factor B.P.: Before Present BSA: Bovine Serum Albumine ChrX: Chromosome X ChrY: Chromosome Y CHUO: Centre Hospitalo-Universitaire d’Oran cm: centimètre CMH : Complexe Majeur d’Histocompatibilité CRS: Cambridge Reference Sequence D-loop: Displacement Loop dNTP: Désoxyribonucléotide ddNTP: Didésoxyribonucléotide DHPLC: Denaturing High Performance Liquid Chromatography (Chromatographie Liquide à Haute Pression en condition Dénaturante) DL: Déséquilibre de Liaison DMG : Dernier Maximum Glaciaire dNTP: Désoxyribonucléotide DXS: DNA X chromosome DNA Segment DYS: DNA Y chromosome DNA Segment EDTA: Acide Éthylène Diamine Tétra Acétique HapMap: Haplotype Map

LISTE DES ABRÉVIATIONS ET ACRONYMES

HGDP-CEPH: Human Genome Diversity Panel - Centre d’Étude du Polymorphisme Humain HV: Hypervariable HVS-I: Hypervariable Segment I INCC : Institut National de Criminologie et de Criminalistique Indels: insertions/ délétions ISFH: The International Society of Forensic Haemogenetics ISOGG: The International Society of J.C.: Jésus Christ ka: kilo ans kb: kilobase km: kilomètre kV: kilo Volts kya: kilo years ago M: Molaire (nombre de moles par litre) Ma: Million d’années Mb : Méga base MDS: Multidimensional Scaling MEC: Mean Exclusion Chance

MgCl2: Chlorure de Magnésium min: minute ml: millilitre mM: millimolaire MRCA: Most Recent Commun Ancestor MSY: Male Specific Y Chromosome NaCl: Chlorure de sodium ng: nanogramme NJ: Neighbor-Joining NRY: Non Recombining Y chromosome ONS: Office National des Statistiques PAR: Pseudo Autosomal Region pb: paire de base PCR: Polymerase Chain Reaction PCR-RFLP: Polymerase Chain Reaction- Restriction Fragment Length Polymorphism

LISTE DES ABRÉVIATIONS ET ACRONYMES

PD : Pouvoir de Discrimination pg: picogramme pmol: picomole rCRS: revised Cambridge Reference Sequence RFLP: Restriction Fragment Length Polymorphism rpm: rotation par minute RT-PCR: Real Time- Polymerase Chain Reaction SAP : Shrimp Alkaline Phosphatase (phosphatase alcaline de crevette) SBE : Single Base Extension SDS: Sodium Dodecyl Sulfate sec: seconde SNP : Single Nucleotide Polymorphism (Polymorohisme d’un Seul Nucléotide) SRY: Sex Determining Region Y STR : Short Tandem Repeat TE : solution de Tris EDTA TMRCA : Time to Most Recent Commun Ancestor (le temps à l’ancêtre commun le plus récent) U: Unité USTHB : Université des Sciences et de la Technologie Houari-Boumediene USTO : Université des Sciences et de la Technologie (Mohamed Boudiaf) d’Oran X-STR : X chromosome Short Tandem Repeat Xp : bras court du chromosome X Xq : bras long du chromosome X Y-STR : Y chromosome Short Tandem Repeat YAP : Y-Alu Polymorphism YCC : Y Chromosome Consortium YHRD : Y Chromosome Haplotype Reference Database

INTRODUCTION GÉNÉRALE INTRODUCTION GÉNÉRALE

Introduction générale :

L’anthropologie est la science qui étudie les populations humaines en se basant sur plusieurs disciplines. Celles permettant d'écrire l'histoire de l'humanité sont nombreuses. À titre d’exemple, la paléontologie et l’archéologie permettent de formuler des hypothèses sur l’apparition de l’homme moderne. La linguistique a conduit à montrer les étroites relations entre les peuples. L’anthropobiologie, qui par sa nouvelle discipline : l’anthropologie génétique, permet d'explorer les génomes et de décrire les diversités génétiques des populations. Ceci permet de confirmer les hypothèses faites sur les évènements survenus au cours de leurs histoires, ou d'en formuler de nouvelles.

La plupart des études sur la diversité génétique des populations humaines en Afrique se sont concentrées sur l’origine de notre espèce et les différents modèles de leurs expansions en dehors de l’Afrique « Out of Africa ». Un processus durant lequel le nord de l’Afrique semble avoir eu un rôle marginal. Néanmoins, grâce à leurs situations géographiques stratégiques dans le bassin méditerranéen, les populations du Maghreb ont fait l’objet de plusieurs études pluridisciplinaires.

Les données anthropo-archéologiques indiquent que la plus ancienne présence hominide en Afrique du Nord date d’il y a 700 000 ans B.P. (Before Present) et fût découverte en Algérie : à Ternifine (près de Mascara) et à Aïn Hanech (près d’El Eulma). L’émergence des Homo sapiens au Maghreb date d’il y a 160 000 ans et leurs établissements correspond à la succession des industries : Atérienne (70 000 ans B.P.), puis Ibéromaurusienne (20 000 ans B.P.), et enfin l’industrie Capsienne (10 000 ans B.P.). Cette dernière a persisté durant la période néolithique, témoignant d’un remplacement culturel et d’un mélange avec les populations d’agriculteurs originaires du Moyen Orient.

Du fait des barrières naturelles imposées par la mer Méditerranée au Nord et le désert du Sahara au Sud, on pourrait penser que l’histoire démographique de l’Afrique du Nord a été en général limitée à un axe est-ouest. Néanmoins, les documents historiques indiquent, qu’en plus de l’expansion Islamique, il y a 1 400 ans, des routes de commerce à travers le désert du Sahara et un contact entre les deux rives de la Méditerranée sont évidents. En effet, la position géographique stratégique des pays du Maghreb, notamment l’Algérie (la porte de l’Afrique), leur a valu leurs statuts convoités. Le peuple Berbère autochtone a fait face aux

1 INTRODUCTION GÉNÉRALE différentes invasions et colonisations qui se sont succédés sur le territoire maghrébin : les Phéniciens, les Romains, les Vandales, les Byzantins, les Arabes musulmans, les Espagnols, les Ottomans, et les Français. L’Afrique du Nord est donc caractérisée par une histoire complexe d’évènements démographiques, dont l’impact génétique sur les populations humaines actuelles reste dans sa majorité peu connu. C’est la où intervient l’anthropologie génétique qui permet de décrire la diversité génétique des populations actuelles.

Le génome humain présente des variations appelées polymorphismes génétiques qui différent à la fois entre les individus et entre les populations. L’analyse des gènes polymorphes, comme le système ABO, fut parmi les premiers travaux sur la diversité génétique des populations humaines (Hirszfeld et Hirszfeld 1919 ; Coca et Deibert 1923). Le développement des techniques de biologie moléculaire, à partir des années 1970, a permis à l’équipe de Cavalli-Sforza, de constater que le patrimoine génétique d’une population reflète son histoire (Cavalli-Sforza et Bodmer 1971). Depuis, l’analyse de la diversité génétique des populations contemporaines, dans le but de comprendre l’histoire biologique d’un peuplement, suscite l’intérêt de nombreux chercheurs. Les études qui examinent la diversité génétique d’une population s’appuient sur différents marqueurs génétiques dont les marqueurs autosomiques tels que les variants du gène de l’hémoglobine, les allèles des marqueurs érythrocytaires (ABO et Rhésus…), les allèles du CMH (Complexe Majeur d’Histocompatibilité), les microsatellites… Mais les marqueurs les plus précis sont ceux transmis par les deux parents : l’ADN mitochondrial (ADNmt) transmis par la mère et le chromosome Y transmis par le père. En effet, l’analyse phylogénétique de ces marqueurs permet de décrire les lignées paternelles et maternelles observées dans une population. Ainsi, les affinités génétiques entre différentes populations peuvent être définies, permettant de déterminer leurs origines communes et de retracer les voies de migrations qui ont été empruntées pour leurs mises en place. Grâce aux marqueurs uniparentaux, l’histoire des peuplements de nombreuses régions du globe a pu être décrite.

Il est maintenant admis que l’anthropogénétique permet de proposer, à la lumière des autres disciplines comme l’archéologie, la paléontologie, la linguistique et l’ethnologie, des hypothèses de reconstruction de l’histoire du peuplement humain ainsi que des interactions Homme-Milieu (sélection naturelle, influence culturelle…..). Au cours des dernières décennies, l’anthropologie génétique a produit de nombreux travaux. Depuis, les données se

2 INTRODUCTION GÉNÉRALE sont accumulées avec le développement des techniques de biologie moléculaire puissantes, fournissant de nouveaux outils pour l’analyse génétique. À cela s’ajoute les analyses bio- informatiques qui s’appuient sur des modèles théoriques d’évolution fidèles et robustes, nécessaires à l’interprétation des résultats dans un contexte historique.

Cependant, en dépit de la multitude des études menées sur la diversité génétique des populations humaines, on assiste à un manque flagrant de données sur certaines populations du bassin méditerranéen et en particulier la population algérienne qui témoigne d’une importance historique. Nous proposons donc, de décrire le profil génétique de la population nord-ouest algérienne, par l’analyse des trois marqueurs génétiques parentaux (le chromosome X, le chromosome Y et l’ADNmt). Ceci permettra, par la suite, de comparer nos résultats à ceux des populations historiquement impliquées dans le peuplement de l’Algérie et du nord de l’Afrique afin de détecter et éventuellement quantifier leurs affinités et leurs contributions. Par ailleurs, l’étude de ces principaux marqueurs (chromosome X, chromosome Y et ADNmt) croisée à des éléments archéologiques, linguistiques, ethnologiques et démographiques, permet d’enrichir les connaissances sur les origines des populations.

À l’heure actuelle et à notre connaissance, aucune étude sur les marqueurs du chromosome X n’a été effectuée en Algérie. Malgré sa contribution minimale dans les études anthropogénétiques, le chromosome X a un potentiel énorme pour ce type de travaux. Sa présence en une seule copie chez les hommes permet de fournir des haplotypes nécessaires aux analyses phylogénétiques. Un avantage qu’il partage avec le chromosome Y et l’ADNmt, contrairement aux autosomes.

L’ADNmt et le chromosome Y se sont révélés des marqueurs utiles dans l’étude de l’évolution humaine à travers l’analyse des lignées paternelles et maternelles. Ils ont, également, différentes applications en génétique humaine incluant : les examens d'expertise médico-légale, les études archéogénétiques, les enquêtes historiques et les études de diversité génétique des populations humaines révélant des modèles de migration des populations à travers l’histoire.

Mis à part, la population M’Zab de Ghardaïa (Côrte-Real et al. 1996), très peu d’études génétiques ont été effectuées en Algérie sur les marqueurs uniparentaux (le chromosome Y et l’ADNmt), incluant pour la plupart, un petit effectif des populations d’Alger et de Tizi

3 INTRODUCTION GÉNÉRALE

Ouzou (Arredi et al. 2004). L’analyse du chromosome Y dans la population nord-ouest algérienne a débuté en 2006 dans le cadre d’un projet de collaboration entre le Pr. Benhamamouch et le Pr. Piazza (directeur du Laboratoire de Génétique humaine, Université de Torino, Italie). Ce travail publié (Robino et al., 2008a) a été complété dans le cadre de ces travaux de thèse par une analyse approfondie des polymorphismes du chromosome Y et une analyse des séquences de l’ADN mitochondrial dans cette population.

4

EXPOSÉ BIBLIOGRAPHIQUE EXPOSÉ BIBLIOGRAPHIQUE

I. Origine géographique de l’homme et peuplement du monde

I.1 Avant propos : Avant de présenter un aperçu de l’Algérie préhistorique et des différentes conquêtes et flux migratoires historiques, il est important de faire un bref rappel de l’origine géographique de l’homme et des différentes périodes de la préhistoire qui ont permis son établissement et surtout son expansion à travers le monde. Cette partie est importante dans le sens ou elle permet de comprendre plus tard, la diversité génétique et la distribution phylogéographique des deux marqueurs uniparentaux : le chromosome Y et l’ADN mitochondrial (ADNmt). Ces marqueurs ont pu apporter quelques réponses aux différentes questions que nous nous posons : À quand est daté notre ancêtre commun? Que nous a t-il transmis « génétiquement » ? Quels sont les liens que nous avons avec les autres peuplements du monde ? Comment les descendants de notre ancêtre commun sont ils arrivés sur les terres nord africaines ? La science ne peut, certainement, pas répondre à toutes ces questions avec exactitude mais nous tenterons dans cette partie du manuscrit de faire une synthèse bibliographique qui traitera donc, essentiellement, les données paléontologiques, les différentes théories de l’origine de l’homme moderne et de présenter succinctement les grandes périodes de la préhistoire. Seront ensuite envisagés les données sur les populations de l’Afrique du Nord et l’Algérie en particulier.

I.2 Origine géographique et histoire de l’homme : Des approches parfois cohérentes, parfois contradictoires, de disciplines aussi diverses que la paléontologie, l’archéologie, l’anthropologie, la chimie-physique (pour les méthodes de datation), la génétique des populations et la linguistique, tentent de déterminer l’origine et l’histoire de l’homme.

I.2.1 Du point de vue paléontologique : La reconstruction de l’histoire de la lignée humaine s’appuie essentiellement sur les études ostéologiques menées sur les fossiles issus des différentes zones explorées par les paléontologues et complétées depuis peu par des investigations génétiques. Dans cette partie nous essayerons de rapporter les données paléontologiques sur les premiers Hominidés et les principales différentes formes d’Homo et leurs successions jusqu’à Homo sapiens.

5 EXPOSÉ BIBLIOGRAPHIQUE

Selon les données actuelles, le début de la lignée humaine pourrait se situer au miocène supérieur1, à la fin de l’ère tertiaire, en Afrique Orientale et dans la zone du Sahel. En 2001, une équipe franco-tchadienne (Brunet et al. 2002) découvre dans le désert au nord du Tchad plusieurs mandibules et un crâne baptisé Toumaï Sahelanthropus tchadensis, (« espoir de vie » en langage Goran), daté de 7 millions. Une polémique s’ensuit, cependant, sur son appartenance, à la lignée des Hominidés (Harry 2008, Bauduer 2013). Plusieurs fossiles découverts ont été classés par ordre chronologique du temps, et il est désormais clairement admis que les formes les plus anciennes d’hominidés sont apparues en Afrique avec, entre autre, la lignée de l’australopithèque (4 millions d’années dont la célèbre Lucy2), de l’Homo habilis (3 millions d’années) et de l’Homo erectus (1,8 million d’années) dont on suit l’évolution morphologique et culturelle (objets, maîtrise du feu,...) (Serre 2006). La question fondamentale est de savoir quand apparaît le genre Homo ? La tendance est de considérer qu’il n’apparaît qu’avec l’émergence de l’Homo erectus. Ce dernier se différencie en Asie à partir d’Homo ergaster africain, ce qui est renforcé par la mise en évidence de l’origine africaine de l’homme moderne (Harry 2008). Il est également admis que l’absence, hors d’Afrique, de tout squelette d’hominidés antérieurs à l’Homo erectus n’est pas le résultat de fouilles encore infructueuses mais la conséquence d’une véritable absence. En d’autres termes l’homme a conquis l’ancien monde à partir de l’Afrique et sous sa forme erectus (Serre 2006). En Afrique, Homo ergaster serait à l’origine de deux lignées, celle de l’homme moderne et celle des Néandertaliens.

L’homme Neandertal (Homo neanderthalensis): Les données paléontologiques indiquent que les Néandertaliens ont vécu en Europe, au Moyen Orient et au sud-ouest de l’Asie. Ils sont apparus il y a 250 000 ans et ont survécu jusqu’au début du paléolithique supérieur, il y a environ 29 000 ans. Ils pourraient représenter le produit évolutif d’individus du genre Homo arrivés dans la zone européenne il y a plus d’un million d’années et qui ont été soumis à un isolement associé aux différentes périodes de glaciation. Néandertaliens et hommes modernes (l’homme de Cro-Magnon3) ont coexisté

1 Période géologique située il y a environ 7.2 et 5.3 millions d’années (Ma) 2 Lucy est le squelette partiel d’un individu daté entre 3.4 et 3 Ma, découvert en 1974 en Éthiopie par les 2 Lucy est le squelette partiel d’un individu daté entre 3.4 et 3 Ma, découvert en 1974 en Éthiopie par les chercheurs qui écoutait à ce moment-là la célèbre chanson des Beatles « Lucy in the sky with diamons », (Bauduer 2013) 3 L'homme de Cro-Magnon est un Homo sapiens identifié sur une période particulière (l’Aurignacien) et dont le nom provient de l’abri de Cro-Magnon sous lequel on a retrouvé ses premiers vestiges...

6 EXPOSÉ BIBLIOGRAPHIQUE

pendant au moins 30 000 ans dans de nombreuses régions, et des preuves de cohabitation ont été retrouvées au moyen Orient (Mellars 2004 ; Klug et al. 2006 ; Bauduer 2013). L’analyse génétique du génome de Neandertal a montré qu’il était différent de celui d’Homo sapiens, en dépit des similitudes de certains gènes qui ont servis d’hypothèses de croisements entre Homo sapiens et l’homme Neandertal (Zimmer 2011).

Enfin, les deux crânes découverts en 1967 au sud-ouest de l’Éthiopie et datés d’il y a 195 000 ans représentent les témoignages fossiles les plus anciens à ce jour d’Homo sapiens ou « Hommes anatomiquement modernes ». Jusqu’au début des années 2000, deux principaux scénarios s’opposaient quant à leur mode d’émergence : celui « de l’évolution multirégionale » et celui du «remplacement rapide » (Harry 2008, Bauduer 2013).

I.2.1.1 Théories majeures sur l’origine géographique de l’homme : Le débat sur l’ancienneté de la divergence entre les populations humaines s’est prolongé et rejaillit depuis quelques années, quant à la date et surtout au lieu de l’émergence de l’homme moderne (Homo sapiens). Deux principaux modèles sur l’origine de l’homme moderne s’affrontent : celui « de l’évolution multirégionale » (concept polycentrique ou « du candélabre ») et celui du «remplacement rapide » (« Out of Africa » ou « de l’arche de Noé »). La grande différence, entre les deux modèles, porte sur l’identification de notre ancêtre commun le plus récent.

• Le modèle « d’évolution multirégionale » propose que l’homme moderne aurait émergé de façon parallèle et indépendante de plusieurs populations d’Homo erectus, dans différentes régions du monde. Plusieurs variantes de ce modèle existent, faisant intervenir des croisements entre les différentes lignées pour obtenir les hommes modernes. • Le modèle de « remplacement rapide » considère que notre ancêtre commun est beaucoup plus récent (100 000 - 200 000 ans) et originaire d’Afrique. Selon ce second modèle il y aurait eu une sortie de notre ancêtre commun d’Afrique subsaharienne vers l’Asie et le reste du monde, et un remplacement des autres populations autochtones primitives (Thomas et al. 2010).

Actuellement, la première hypothèse a toujours la faveur d’une minorité de spécialistes alors que la deuxième a considérablement évolué. Il n y a probablement pas eu une mais plusieurs vagues de sorties de l’Afrique de l’homme moderne (« Out of Africa again and again ») qui

7 EXPOSÉ BIBLIOGRAPHIQUE

à chaque fois s’est métissé avec les populations antérieurement installées. Ainsi est née une troisième théorie connue sous le nom du modèle réticulé. Elle admet l’origine africaine unique mais insiste sur les mélanges génétiques répétitifs précoces entre populations de différentes zones géographiques. Les Homo sapiens auraient ici une ancienneté bien supérieure à celle du scénario « Out of Africa ». Ces différents modèles sont testés en évaluant la divergence moléculaire qui existe entre les populations actuelles (Bauduer 2013).

I.2.2 Du point de vue génétique : Apport du chromosome Y et de l’ADN mitochondrial à la compréhension de l’origine de l’homme L’étude de la diversité du chromosome Y et de l’ADN mitochondrial (ADNmt) a apporté une contribution majeure à la compréhension de l’origine de notre espèce et à l’origine démographique des populations. Ces données, qui seront développées dans la deuxième partie de ce manuscrit, ont notamment permis de résoudre le conflit entre les deux modèles phares dits « d’évolution multirégionale » et de « remplacement rapide » (ou « Out of Africa ») (Cavalli-Sforza et Feldman 2003).

Les données provenant des marqueurs uniparentaux soutiennent le modèle de «remplacement rapide » et indiquent que tous les hommes modernes descendent d’une population ancestrale africaine de taille limitée, qui se serait répandue à travers les autres continents en remplaçant les espèces humaines archaïques, avec un mélange nul ou réduit. Ce scénario contesté a d’abord été suggéré par les données de l’ADNmt (Cann et al. 1987), puis confirmé par de nouvelles données mitochondriales et du chromosome Y (Quintana- Murci et al. 1999; Cavalli-Sforza et Feldman 2003 ; Jobling et Tyler-Smith 2003). Les marqueurs uniparentaux montrent en effet une plus grande diversité dans les populations africaines que dans les autres populations et placent la première branche de l’arbre phylogénétique de l’homme moderne entre des populations exclusivement africaines et des populations mixtes.

Plus récemment les données des polymorphismes obtenues à l’échelle du génome entier ont confirmé les premières observations basées sur des études mono-locus, et démontrent que la majorité des loci du génome humain présente plus de diversité en Afrique qu’en dehors de l’Afrique (The International HapMap Consortium 2005 ; Thomas et al. 2010). Le modèle « Out of Africa » a été également supporté par les analyses effectuées sur le chromosome X (Harris et Hey 1999; Yu et al. 2002; Santos-Lopes et al. 2007).

8 EXPOSÉ BIBLIOGRAPHIQUE

I.3 Homo sapiens et la conquête du monde :

L’homme moderne a voyagé à travers l’Afrique pour quitter ce continent et gagner l’Eurasie probablement par divers itinéraires, via la presqu’île du Sinaï4 ou le sud de la Péninsule Arabique. Il a ensuite gagné l’Océanie pour arriver en Australie, il y a environ 55 000 ans. La conquête de l’Amérique s’est produite à une période de glaciation (il y a environ 15 000 ans), par le détroit de Béringie qui sépare la Sibérie Orientale de l’Alaska (Bauduer 2013).

I.3.1 Les populations humaines durant les deux grandes périodes de la préhistoire :

Les deux grandes périodes de la préhistoire sont le Paléolithique et le Néolithique qui s’étalent sur deux périodes géologiques : le Pléistocène et l’Holocène5, successivement.

I.3.1.1 Le Paléolithique “âge de la pierre ancienne” est l'une des grandes périodes de la préhistoire. Il commence il y a 3 millions d'années lorsque les premiers Hommes apparaissent et travaillent des pierres pour en faire des outils (Homo habilis), et s’achève avec la dernière glaciation, il y a environ 10 000 ans. Le paléolithique inclut l'apparition d’Homo sapiens, il y a environ 200 000 ans, son expansion et le déclin des autres espèces du genre Homo. Il est caractérisé par des populations nomades chasseurs-cueilleurs. Cette période est divisée chronologiquement en trois phases: le paléolithique inférieur, moyen et supérieur qui correspondent à la période géologique Pléistocène. Toutefois ces séparations sont générales, applicables surtout en Europe (France), et ne sont pas identiques dans toutes les régions du monde mais servent particulièrement de référence.

Vers la fin du paléolithique se produit le Dernier Maximum Glaciaire (DMG), il y a environ 15 000 à 20 000 ans : le nord et le centre de l’Europe sont recouverts par des glaciers. La présence humaine est restreinte à des zones refuges au climat plus tempéré (Acquitano-Ibérique, Balkanique, Ukrainienne). Un processus de recolonisation calqué sur le retrait des glaciers se produira ensuite à partir de ces refuges à la période Mésolithique (ou épipaléolithique : période de transition entre la paléolithique et le néolithique) qui débute il y a environ 12 000 ans (Bauduer 2013).

4 Le site Qafzeh, en Israël, a fourni, pour l’instant, l’un des plus vieux fossiles d’homme moderne extra-Africain daté à environ 100 000 ans. 5 L'Holocène est une époque géologique interglaciaire, chaude, qui suit le dernier glaciaire du pléistocène. Il correspond à l'avènement du mésolithique, du néolithique et des cultures ultérieures.

9 EXPOSÉ BIBLIOGRAPHIQUE

I.3.1.2 Le Néolithique « l’âge de la pierre polie » : Le polissage des outils en pierre caractérise cette période, mais pas seulement, des modifications profondes, jugées rapides, se sont emparées du monde. La littérature a souvent utilisé le terme de "révolution néolithique" (Childe 1925). Il s’agit, plutôt, d’une évolution lente, géographiquement disparate, et suivant les régions, ces changements ne se sont pas tous déroulés dans le même ordre. C'est tout d'abord au Moyen-Orient que nous retrouvons les premières traces du néolithique. Le croissant fertile, aux confins de l’Anatolie, de la Syrie et de l’Irak, et descendant jusqu’en Israël, correspond à la zone qui a donné naissance à l’agriculture il y a 10 000 à 20 000 ans et à partir de laquelle cette pratique a gagné la zone européenne (Figure 1). Les premières traces de sédentarisation des chasseurs-cueilleurs y sont principalement dues aux caractéristiques locales favorables : climat propice, céréales sauvages (blé et orge), des légumineuses poussant à profusion et de nombreux ongulés (chèvre, mouton…), d’où la domestication des plantes et des animaux qui aurait précédé l’agriculture. Le néolithique est également caractérisé par une croissance globale de la population humaine due à la sédentarisation. Des premières traces de maisons groupées datant de 12 000 ans ont été retrouvées à Aïn Mallaha (ou Eynane) en Israël. Leurs habitants sont les Natoufiens. Le site éponyme est Ouadi en-Natouf en Cisjordanie. Puis, l’apparition des premières “villes” comme Jéricho (en Arabe : Ariha) en Palestine ou Çatal Höyük en Turquie (Bauduer 2013).

C’est aussi en Mésopotamie (croissant fertile), littéralement « le pays entre les fleuves » du Tigre et de l'Euphrate, que l'écriture est apparue pour la première fois, au sein de la civilisation Sumer (l’actuel Irak) au quatrième millénaire avant notre ère, ce qui va faire entrer l’humanité dans la période “ historique”. En effet, grâce à l’écriture, les connaissances, le patrimoine culturel et l’histoire des peuples pourront être “enregistrés” et transmis au fil des générations (Bauduer 2013). Un phénomène qui malheureusement n’est toujours pas universel d’une part, et d’autre part, plusieurs textes historiques ont été détruits et ont disparus durant les guerres et les dominations de différents peuples. C’est pourquoi le développement des sciences anthropologiques ces dernières décennies, et particulièrement celles qui utilisent les outils de biologie moléculaire, ont été d’un grand intérêt dans la connaissance du patrimoine génétique de nombreuses populations. Ceci représente un atout précieux pour une meilleure compréhension de l’origine de l’homme dit « moderne », de son expansion et de la mise en place de certaines civilisations et la connaissance de leur histoire.

10 EXPOSÉ BIBLIOGRAPHIQUE

Figure 1: Carte géographique représentant le croissant fertile (Houot 2014)

11 EXPOSÉ BIBLIOGRAPHIQUE

II. Le peuplement de l’Afrique du Nord

II.1 Données Paléontologiques : les populations Préhistoriques

II.1.1 Au Paléolithique inférieur :

Le site archéologique de Aïn Hanech (à 6 km d’El Eulma) évoque la présence (galets aménagés) des premiers hommes ayant vécu en Algérie il y a 2 millions d’années et témoignant d’une industrie Paléolithique archaïque (pré-acheuléen). Des restes osseux d’un Homo erectus (Atlanthropus maurétanicus), datant de 700 000 ans B.P, ont été aussi découvert à Ternifine en Algérie (à 20 km de Mascara), il s’agit de l’industrie Acheuléenne du paléolithique inférieur au Maghreb (Arambourg 1963 ; Sahnouni 1998). Des outils formés à partir de pierres de cette industrie ont été trouvés partout en Algérie (au nord comme au sud : la Saoura, Ouargla, Tébessa, Tlemcen, Annaba, Biskra, Adrar, Timimoun…) (Aumassip 2001 ; Derradji 2005).

II.1.2 Au Paléolithique supérieur : L'apparition des Homo sapiens date d’il y a 160 000 ans au nord de l’Afrique (Smith et al. 2007). L’établissement humain date entre 140 000 et 40 000 ans B.P. (Barton et al. 2009 ; Garcea 2010). Il correspond à l’industrie Atérienne, spécifique du Maghreb (Maroc, Algérie et Tunisie). Une industrie du nom du gisement de l’Oued Djebbana, près de Bir el-Ater, loin au sud de Tébessa (Chastagnol et Balout 1960). L’Atérien est contemporain à l’Aurignacien Européen. Il a été mis en évidence également sur le site de Dar Es-Soltan au Maroc (daté à 110 000 ans B.P., récemment). L'homme Atérien de Dar Es-Soltan présente des caractères morphologiquement modernes mais conserve également des caractères plus archaïques que ceux des hommes de Cro-Magnon. Il présente aussi suffisamment d'homologie avec l'homme moustérien de Djebel Irhoud au Maroc (daté de 160 000 ans B.P.), pour qu'on puisse considérer une filiation entre eux. Enfin, cet Homme Atérien pourrait être l'ancêtre de l'Homme de Mechta el-Arbi (son successeur géographique il y a environ 20 000 ans B.P.) (Smith et al. 2007 ; Barton et al. 2009 ; Garcea 2010 ; Aumassip 2011). L’Homme de Mechta el-Arbi, dit aussi l'Homme de Mechta-Afalou, est l’auteur de l’industrie Ibéromaurusienne au Maghreb durant le Dernier Maximum Glacier (DMG). Ce sont des restes d’individus recueillis dans trois grandes nécropoles, Afalou bou Rhummel (Bejaïa, Algérie), (Maroc), Columnata (Tiaret, Algérie), et dans 25 autres sites préhistoriques tout au long de la partie nord africaine (de Rabat à Tunis) (Camps 1969 ; 1974 ; Hachi 2005).

12 EXPOSÉ BIBLIOGRAPHIQUE

II.1.3 L’origine du premier Homo sapiens du Maghreb : La question qui se pose, justement, est ce que l’homme de Mechta el-Arbi est le dernier ancêtre de l’Atlanthrope ou bien un intrus venu se fixer au Maghreb ? Plusieurs anthropologues (dont G. Camps, D. Ferembach et M.C. Chamla) pensent que l’apparition de l’homme moderne au Maghreb a suivie l’évolution des porteurs de la culture Atérienne ou a eu lieu, l’homme de Djbel Irhoud suivie par l’homme de Dar-es-Soltan, puis l’Homme de Mechta el-Arbi. Néanmoins, d’autres hypothèses ont été établies stipulant que l’homme de Mechta el-Arbi avait une origine extérieure : Les uns l’imaginaient venus d’Europe, traversant l’Espagne et le détroit de Gibraltar pour se répandre à la fois au Maghreb et aux îles Canaries ; et d’autres pensaient que l’Homme de Mechta el-Arbi descendait de l’Homo sapiens apparu en Orient (homme de Palestine) et que de ce foyer originel s’étaient développées deux migrations : une branche européenne aurait donné l’homme de Cro- Magnon et une branche africaine aurait mis en place l’Homme de Mechta el-Arbi (Cejas et Casanas 2013). D’après le préhistorien Gabriel Camps, l’une et l’autre des hypothèses présentaient des anomalies qui les rendaient difficilement acceptables. L’homme de Cro-Magnon a des caractères moins accusés que son prétendu successeur maghrébin. Quant à l’origine proche- orientale : aucun document anthropologique entre la Palestine et la Tunisie ne peut l’appuyer. De plus, les habitants du proche orient à la fin du paléolithique supérieur sont les Natoufiens, de type proto-méditerranéen, qui diffèrent considérablement des hommes de Mechta el-Arbi (Cejas et Casanas 2013).

D'autres écoles d’anthropologues suggèrent une origine, de l'homme de Mechta El-Arbi, en Nubie (Soudan et le sud de l’Egypte). En effet, l'industrie nubienne de la fin du Pléistocène est similaire à l'industrie Ibéromaurusienne du Maghreb. De plus, de nombreux squelettes Ibéromaurusiens présentent des ressemblances avec les individus de Wadi Halfa et Jebal Sahaba au Soudan. Des similitudes sont également observées avec les individus de Nazlet Khater et ceux de Wadi Kubbaniya en Egypte, datant de 25 000 ans B.P. (Wendorf 1968). L’analyse de l’ADNmt sur des sépultures d’Ibéromaurusiens, datées de 12 000 ans, dans le site archéologique de Taforalt (Maroc Oujda), a rejeté l'hypothèse d'une origine sub- soudanaise. Leur résultats vont dans le sens d'une origine locale de la population de Taforalt et d'une continuité génétique en Afrique du Nord (Kefi et al. 2005).

13 EXPOSÉ BIBLIOGRAPHIQUE

II.1.4 La révolution Néolithique au Maghreb :

À un stade ultérieur, la révolution néolithique au Maghreb est partagée entre deux civilisations correspondant à deux groupes différentes de l’Homo sapiens : l’Industrie Ibéromaurusienne au Tell, qui est assez pauvre, et une nouvelle industrie Capsienne, du nom antique de Gafsa (Capsa en Tunisie). Cette dernière apparaît dans la partie orientale du territoire berbère, il y a 8 000 à 6 000 ans B.P. (Cejas et Casanas 2013). Ce nouveau type d’Homo sapiens possède déjà les caractères de certaines populations méditerranéennes actuelles et se distingue de Mechta el-Arbi par une moindre robustesse, un crâne mieux proportionné, des orbites plus carrées et un nez plus étroit. Les hautes plaines constantinoises sont le domaine de l’homme Capsien, mangeur d’escargots. Il ne connaît pas encore l’agriculture mais s’ouvre aux balbutiements de l’art (Chastagnol et Balout 1960). Le capsien représente l’apogée de l’épipaléolithique et couvre une période qui s’étend de 8 000 à 4 000 ans B.P. C’est à cette époque que l’on peut parler de paléo-berbère (Aumassip 2001; Cejas et Casanas 2013). Les Ibéromaurusiens reçoivent au même temps des influences Capsiennes, puis, à une époque difficile à préciser mais tardive, l’Homme Capsien, c’est-à-dire probablement, le Berbère, occupe tout le Maghreb et élimine les Ibéromaurusiens qui ont seulement survécu dans les Guanches des îles canaries (Chastagnol et Balout 1960).

Il est important de noter que le néolithique maghrébin du littoral est frustre et retardataire par rapport à son voisin saharien. Les plus étonnants vestiges du néolithique saharien sont des œuvres d’art : idoles bétyliques trouvées à Tabelbalet (à 145km sud-ouest de Béni Abbés) ; animaux sculptés digne de l’art moderne (le bélier de Tamentit à Adrar, l’antilope de Fort- Gardel à Djanet ou la tête de gazelle de l’Imakassen au Tassili n’Ajjer sud-est de l’Algérie) ; ainsi que des gravures et peintures rupestres (dont le fameux char de guerre de Tamadjert à Illizi) (Chastagnol et Balout 1960). La poterie y voyait le jour un millénaire et demie avant le Proche Orient (Aumassip 2001). Cette civilisation qui a évolué nous met en présence d’un Sahara parsemé de lacs et pourvu d’une faune et d’une flore tropicale (Chastagnol et Balout 1960).

En somme, la néolithisation de l’Algérie est d’une richesse créatrice et d’une adaptation pleinement réussie dans l’évolution du Sahara et du Maghreb. Intégrant influx originaires d’Europe ou du royaume des pharaons, le Maghreb et le Sahara ont basculé progressivement vers la protohistoire (Aumassip 2001).

14 EXPOSÉ BIBLIOGRAPHIQUE

II.2 Données historiques :

L’Afrique du Nord qui comprend essentiellement, l’Algérie, la Tunisie et le Maroc était appelée par les Grecs Libye (Lebou). Il s’agit de cette partie de l’Afrique septentrionale habitée par les blancs. Avant d’avoir le même sens, l’adjectif « Africa » fut appliqué par Rome à la Tunisie. Plus tard, les mots d’Afrique et Libye désignèrent le continent entier. Les Arabes, qui vinrent de l’Est, baptisèrent Djezira el-Maghreb, « l’île de l’occident ou du couchant », tous les pays à l’ouest de l’Égypte. Les géographes créèrent le termes d’Afrique mineure, pour marquer qu’il s’agit d’un petit continent engagé dans un grand, et de Pays de l’Atlas, pour insister sur l’importance de la tectonique. Le moyen Age et les Temps modernes connurent les Etats Barbaresques ou Barbarie (Julien 1975).

Les Berbères ne se donnèrent pas eux-mêmes ce nom. Ils le reçurent, sans vouloir s’en servir, des Romains qui les jugeaient étrangers à leur civilisation et les qualifiaient de Barbares (Barbari) !!!. L’origine de l’appellation du terme « Berbère », mais aussi son acceptation n’ouvrent pas les mêmes discours chez tous les locuteurs. Les Romains étendirent, ensuite, à tous les habitants de la Berbèrie, le nom de Maures, réservé d’abord aux populations du Maroc septentrional. Quand aux autochtones, ils se désignèrent souvent du nom d’Amazigh (Tamazight au féminin, Imazighen au pluriel) qui signifiait les « hommes libres » (Julien 1975). On a aussi attribué, aux Berbères, une origine yéménite. Ibn Khaldoun, qui a développé cet aspect, écrit dans son livre (Histoire des Berbères) : « les Berbères sont les fils de Canaan, fils de Cham, fils de Noé…. Leur aïeul se nommait Mazighi… »; Plus tard El Idrissi reprend cette théorie et dès lors l’hypothèse d’une origine yéménite paraît confirmée (Aumassip 2001). Il semblerait que le Sahara (partie sud dans l’Afrique du Nord) était habité par des hommes à la peau foncée qu’on attribuait aux Ethiopiens et c’est à eux que revient cet outillage néolithique dont l’abondance et la perfection étonnent, puis le Sahara a été peuplé par les Berbères (Gsell 1927).

En effet, les dynasties berbères occupaient, à une certaine époque, un large territoire qui allait de l'ouest de la vallée du Nil jusqu'à l'Atlantique et l'ensemble du Sahara. De ce temps, les Berbères, étaient formés de plusieurs confédérations dont les Gétules (descendant direct de la civilisation Capsienne), les Garamantes (un ancien peuple nomade libyen-berbère), et les Harratins (un groupe ethnique connu dans l’ensemble du Sahara pour sa spécialisation dans l’agriculture oasienne) (Trousset 1998 ; Bellil 1999).

15 EXPOSÉ BIBLIOGRAPHIQUE

II.2.1 Les royaumes de la Numidie :

La Numidie est un ancien royaume berbère qui se trouvait dans le nord de l'Algérie, débordant jusqu'à l'extrémité ouest de la Tunisie et l'est du Maroc. La Numidie a eu plusieurs rois, les plus célèbres étant, Syphax, Gaia, Massinissa, Micipsa, Jugurtha, Juba Ier, Juba II et Ptolémée. Berbères sédentaires ou semi-nomades, les Numides étaient répartis en différentes tribus indépendantes qui se sont structurés en républiques villageoises. Des vastes royaumes dotés d'un pouvoir fort se substituaient aux structures tribales. Quand la Numidie réapparut au IVème siècle avant J.C., elle formait au couchant; le royaume des Massaesyles limité par l'Ampsaga (Rhumel6) à l'est et par la Moulouya7 à l'ouest, avec Siga8 pour capitale ; et le royaume des Massyles dans la partie orientale du Constantinois, avec pour capitale Cirta (l'actuelle Constantine) (Figure 2). Depuis l’Antiquité, ce royaume des berbères, ayant un rôle historique très important dans la région méditerranéenne, fut l’objet de différentes invasions et conquêtes. Ainsi, se sont succédés les Phéniciens, les Romains et les Vandales jusqu’à la conquête arabe (la conversion à l’Islam), espagnole, ottomane et en dernier l’occupation française.

Figure 2 : Les royaumes numides (Lancel 2003)

6 Oued-Rhumel est le plus important cours d'eau de Constantine en Algérie, appelé également : l’Oued el Kebir. 7 Moulouya est un fleuve qui dessert une partie du Maroc oriental et se jette dans la Méditerranée près de la ville de Saïdia.

8 Siga est une ville située à deux kilomètres au sud de l’embouchure de l’Oued Tafna, en face de l’ile de Rachgoun.

16 EXPOSÉ BIBLIOGRAPHIQUE

II.2.2 Les phéniciens et les carthaginois :

Les phéniciens sont un peuple sémitique qui habitait la péninsule arabe avant de s’installer en Phénicie (l’actuel Liban et certaines parties de la Syrie et de la Palestine). Cette région est appelée également le grand Sham ou encore la Terre des Cananéens. Dès la fin du IIème millénaire avant J.C., les Phéniciens établissent des escales et des bases portuaires dans le Maghreb central. Après la fondation de Carthage par les Tyriens9 (814-813 avant J.-C.), les rivages de l'Algérie passent sous la domination des Carthaginois. La plupart des historiens sont d’avis que les relations politiques entre Carthage et les Berbères d’Algérie étaient assez cordiales. Hérodote rapporte que des relations commerciales se développèrent très tôt entre Phéniciens et Numides, favorisant ainsi la pénétration de la langue et de la culture puniques assez profondément dans le pays. Les Numides apprirent des Phéniciens les procédés agricoles et industriels de la fabrication de l'huile d'olive et du vin, l'exploitation et le travail du cuivre (Gsell, 1927).

II.2.3 Les Romains (de 146 avant J.-C. à 429 après J.-C.) :

La rivalité entre Rome et la ville phénicienne de Carthage se traduit par trois guerres puniques (de 246 à 146 avant J.-C). C'est alors que Massinissa, au IIIème siècle av. J.C., unifie les royaumes numides (Berbères) des Massyles et des Massaesyles qui témoignait d’une prospérité économique remarquable. Après la destruction de Carthage en 146 avant J.-C et la mort de Massinissa en 148 av. J.-C., les Romains entreprennent d’étendre leur domination politique et militaire à l’ensemble du Maghreb et particulièrement en Algérie. Pour y parvenir, ils attisent d’abord la dissension et les conflits entre les princes de la Berbèrie. L’occupation Romaine n’apporte à la Berbèrie qu’ignorance, pauvreté, oppression et esclavage et la culture Romaine n’exerce pratiquement aucun effet puisque même la langue a été rejetée par les Berbères (Kaddache 2003 ; Ferkous 2007).

Sous l’impérialisme Romain, le Maghreb était subdivisé en plusieurs royaumes : la Maurétanie Tingitane (à l'ouest avec pour capitale Tingis, Tanger), la Maurétanie Césarienne (la région correspondant au centre et à l'ouest de l'Algérie actuelle entre l’Oued el Kebir et la Moulouya), la Numidie (à l’est : la région qui s’étendait d’Hippo-Regius (ou Hippone :

9 Les Tyriens sont les habitants de Tyr: une ville phénicienne au sud de l’actuel Beyrouth.

17 EXPOSÉ BIBLIOGRAPHIQUE

Annaba) à Theveste (Tébessa) jusqu’à l’Ampsaga), Africa proconsulaire (à l'extrême Est : Tunisie) et la Gétulie au sud (Kaddache 2003) (Figure 3).

Figure 3 : L’occupation romaine des territoires nord africains (Sennequier et Colonna 2003)

II.2.4 Les Vandales (429-534 après J.-C.) :

Les Vandales sont des tribus germaniques originaires de la région de la mer Baltique au nord de l’Europe. En l’an 429 après J.-C., dirigés par le fameux roi Genséric, les Vandales traversent le détroit de Gibraltar et débarquent sur les côtes marocaines. Ces tribus réputées barbares marchent aussitôt vers l’est, dévastant sur leur chemin les champs agricoles et massacrant femmes, enfants, vieillards et religieux. Les vandales atteignent Altava (une cité Romaine située sur la commune de Ouled Mimoun dans la wilaya de Tlemcen) en Août 429 et se présentent devant Hippone (Annaba) en Mai ou Juin 430. En l’an 437, Genséric fit d’Hippone sa capitale qui sera transféré à Carthage après sa chute en 439. Les vandales se rendent maîtres du pays et c'est tout l'Empire Romain qui se retire de l'Algérie sous leur pression. Trop peu nombreux, les Vandales n'occupent jamais véritablement l'ensemble des terres conquises ou abandonnées. Ils créent ainsi un vide rapidement occupé par les tribus berbères qui enfin libérées de Rome, reconstituent des royaumes indigènes. Le premier royaume fut celui de l’Oranie : connu grâce a une inscription d’Altava (Ouled Mimoun), sous la domination d’un certain Masuna (Kaddache 2003).

18 EXPOSÉ BIBLIOGRAPHIQUE

II.2.5 Les Byzantins (534-647 après J.-C.) :

À partir de l’an 330, le centre de l’empire Romain bascule vers l’orient, où Constantin transforme l’ancienne citée Grecque de Byzance en « une nouvelle Rome » à qui il donne son nom de Constantinople (Istanbul actuellement). L'Empire Byzantin est à son apogée, sous le règne de Justinien, et fut marqué par l'ambitieux projet de « restauration de l’empire » en recouvrant les anciens territoires romains dont, en premier, le Maghreb. En l’an 533, Justinien confie à son général Bélisaire une armée qui réussit à prendre Tunis et Carthage. En se dirigeant vers la Numidie, il soumet les villes de Annaba, Constantine, Guelma, Cherchell, Ténès, Bejaia, en plus des régions côtières, celles du Hodna10 et des Aurès. La politique Byzantine calque pratiquement celle de leurs prédécesseurs Romains : contrôle des meilleurs terres, exploitation des populations et encouragement des rivalités tribales. Dès 534, de l’est à l’ouest, les chefs Berbères se préparèrent à combattre les nouveaux envahisseurs. La région correspondant à la Maurétanie Césarienne échappa au contrôle des Byzantins qui n’ont possédé que Caesarea (Cherchell) et quelques ports (Ferkous 2007).

Les tribus berbères à la veille de la conquête arabe :

Vers le milieu du VIIe siècle, les populations étaient maitresses d’une grande partie du territoire maghrébin et de puissants états berbères s’organisèrent. Les Zénata, qui en constituaient le groupement le plus important, habitaient le Maghreb depuis une époque bien reculée. Ils occupaient le pays qui s’étendait depuis Tripoli jusqu’à la Moulouya. Les ramifications de la souche zénatienne sont très nombreuses : on y remarque particulièrement les Maghraoua, les Beni-Ifren et les Djeraoua qui étaient les tribus les plus puissantes. Les Djeraoua se trouvaient dans les monts de l’Aurès. Les Maghraoua nomadisaient, rapporte Ibn Khaldoun, dans les hautes plaines de l’Oranie ; ils s’appuyaient sur Tiaret, Tlemcen et Fès. Les Beni-Ifren se partageaient en un grand nombre de tribus, dont les plus importantes étaient les Beni-Ouargou et les Merendjisa. Ils nomadisaient dans les régions situées au sud de Tlemcen, la ville qu’ils fondèrent. Les Aurebas, des non Zénètes, occupaient le premier rang parmi les tribus berbères, par leur nombre et leur bravoure. Ils avaient pour chef au moment de l’arrivée des Arabes Sekerdis Ibn-Zoufi dont le successeur était Koussayla el- Aurebi qui fut le chef de toutes les tribus descendues des Branés (les descendants de Mazigh) (Kaddache 2003).

10 Le Hodna est la région située au sud des hauts plateaux dans le centre de l'Algérie.

19 EXPOSÉ BIBLIOGRAPHIQUE

II.2.6 La conquête Arabe (647-776 après J.-C.) (27 – 160 Hijir) :

Il est connu que l’Islam se répandit assez rapidement pour établir un gigantesque empire. Depuis le Califat de Othmane Ibn Afane, les arabes ont essayé de conquérir le Maghreb (depuis l’an 647). Cependant, ce n’est qu’en l’an 670 que Okbah-Ben-Nafaa défait en plusieurs rencontres les Grecs, s’empare de la Numidie et de la Mauritanie et parvient jusqu’à l’Atlantique. Une résistance s’est engagé en Numidie et dans l’Aurès sous le commandement de Koussayla, puis de la Dihya (dite El-Kahina), qui règnera pendant plus de cinq années. Après sa mort, les berbères se sont ensuite, peu à peu, familiarisé avec les préceptes et les valeurs du système islamique en cohabitant en symbiose avec les musulmans conquérants. S’ensuit alors une unification islamique, nationale et linguistique (Arabisation) en Afrique du Nord (Kaddache 2003; Ferkous 2007).

Les berbères en Andalousie : Après la conquête musulmane de l’Andalousie, menée en 711 par Tariq Ibn Ziyad, d'où le nom de la colline de Gibraltar (Jabel Tariq, en Arabe), les musulmans composés en partie de Berbères islamisés ont régné près de huit siècles (de 711 à 1492).

Les Juifs et les Maures : L’affaiblissement de la puissance Arabe en Espagne face à la conquête des catholiques (La Reconquista), ramena plusieurs juifs de l'Andalousie en Algérie et particulièrement à Oran où la communauté juive est structurée depuis l’an 1000. Il en est de même au moment de l’expulsion définitive des arabes andalous en 1492. Ces derniers seront appelés Morisques ou Maures, qui s’étaient établis, en assez grand nombre, dans quelques villes du littoral : Cherchell, Oran, Bougie, Alger (Kaddache 2003; Ferkous 2007).

II.2.7 Les Espagnols et les Ottomans : Les Espagnols se décidèrent à occuper quelques villes nord africaines : Melilla en 1497, Mers-el-Kebir en 1505, Oran en 1509, Bejaïa en 1510, Mostaganem en 1511 et Dellès et Annaba en 1531. Ils assiégèrent le port d'Alger, également en 1531, en s'emparant de l'îlot du Peñon qu'ils fortifient. L’arrivée des Turcs en Algérie a le mérite de sauver le pays d’une occupation Espagnole imminente. Les habitants du pays persécutés par les espagnols acceptent sans réticence de passer sous l’autorité du califat Ottoman d’Istanbul. Trois siècles durant (de 1513 à 1830), les Turcs Ottomans constituent un barrage infranchissable qui maintient l’Algérie à l’abri des appétences colonialistes occidentales. La conquête ottomane de la région d'Alger commença

20 EXPOSÉ BIBLIOGRAPHIQUE en 1518. Pendant ce temps là, Oran était encore gouvernée par les Espagnols avec le service de quelques tribus Maghzen (elle fut annexée à l'empire ottoman de 1708 à 1732, puis à partir de 1792). L’Algérie devient alors une régence dépendante de l’Empire Ottoman. De 1515 à 1830, 76 pachas ou deys se succèdent à Alger. La région de l’Algérois, appelée Dar el Sultan, était le siège de la Régence. Le reste du pays était divisé en 3 provinces nommées « Beylics » administrées chacune de manière autonome par un Bey nommé par le Dey d'Alger. On distinguait : le Beylic de l’Ouest (avec pour capitale Mazouna, puis Mascara, ensuite Oran après le départ des Espagnols) ; le Beylic de Titri du Centre (avec pour capitale Médéa) et le Beylic de l‘Est (avec pour capitale Constantine), le plus puissant des trois (Chaïla 2002 ; Ferkous 2007).

II.2.8 La domination Française : Tout d'abord, les relations entre la France et la Régence d’Alger étaient bonnes, mais le 29 avril 1827, à la suite d’une dispute au sujet d’une dette française impayée, le Dey d’Alger convoque le consul de France. Une crise diplomatique franco-algérienne s’en suit et avec le débarquement des troupes françaises à Sidi-Ferruch, la France s’empare de l’Algérie le 5 juillet 1830. Les différentes révoltes menées par l’émir Abd El-Kader, Lalla Fatma N’Soumer, Cheikh Bouamama, Cheikh El Mokrani…etc, jusqu’à la révolution du 1er Novembre 1954, aboutit à l’indépendance de l’Algérie en Juillet 1962.

II.3 L’Algérie (El-Djazaïr) II.3.1 Données étymologiques : L'appellation (Algérie) provient du nom de la ville d’Alger qui dérive du catalan Aldjère lui- même tiré de l’arabe El-Djazaïr. Ce nom a été donné par Bologhine Ibn Ziri, fondateur de la dynastie berbère (Ziride), lorsqu'il bâtit la ville en 960 sur les ruines de l'ancienne ville au nom romain Icosium (Alger): « Djzayer Beni Mezghenna». Le nom en français, Algérie, utilisé pour la première fois en 1686 par Fontenelle pour qualifier la Régence d’Alger, est officiellement adopté le 14 octobre 1839.

21 EXPOSÉ BIBLIOGRAPHIQUE

II.3.2 Données géographiques : De par sa superficie de 2 381 741 km², soit quatre fois la France ou 60 fois la Suisse, l’Algérie est le pays le plus grand en Afrique. Au nord, il est bordé par la mer Méditerranée sur une distance de 1622 Km. L'Algérie partage ses frontières avec 7 pays voisins : la Tunisie, la Libye, le Niger, le Mali, la Mauritanie, le Sahara Occidental et le Maroc (Figure 4).

Figure 4 : Position géographique de l’Algérie dans le bassin méditerranéen

Le relief de l’Algérie est très diversifié et se compose de trois grandes unités structurales :

• Le Tell, est un ensemble constitué par une succession de massifs montagneux, côtiers et sublittoraux, et de plaines. Il abrite la grande majorité des terres agricoles du pays. Dans sa partie nord-ouest, on retrouve un bon nombre de villes importantes, notamment, Oran, Sidi Bel Abbés, Tiaret et Tlemcen (Figure 5). • Les Hauts Plateaux, sont une zone steppique localisée entre l'Atlas Tellien au nord et l'Atlas Saharien au sud, à des altitudes plus ou moins importantes de 900 à 1200 mètre. • Le Sahara Algérien est un immense désert qui s'étend au sud et représente 80 % de la superficie du pays.

22 EXPOSÉ BIBLIOGRAPHIQUE

Sur le plan administratif, 48 wilayas composent l’Algérie. Ces sortes de préfectures sont divisées en daïras, lesquelles sont divisées à leur tour, en communes.

Figure 5 : Quelques principales villes algériennes

(En rouge : la partie nord-ouest algérienne)

II.3.3 Données démographiques : Sur ce vaste territoire, qui s’étend du milieu méditerranéen au nord au milieu saharien au sud, des groupes humains qui utilisent un même langage, le berbère, traduisent dans leurs cultures de profondes et lointaines identités (Aumassip 2001). De nombreuses hypothèses ont été avancées quant à l’origine des Berbères. Mais quoi qu’il en soit, un fait historique dont l’évidence est incontestable reste que Arabes et Berbères ont fusionné dans l’islam pour constituer une seule nation et un seul peuple Algérien. D’après l’office nationale des statistiques, l’Algérie compte 38,7 Millions d’habitants au 1er Janvier 2014 (ONS : Office National des Statistiques 2014).

23 EXPOSÉ BIBLIOGRAPHIQUE

II.4 Le Nord-Ouest Algérien :

La région nord-ouest algérienne a eu une part notable dans l’histoire et même la préhistoire de l’Algérie. On y trouve des villes comme Mascara, où on découvrit la plus ancienne présence humaine en Afrique du Nord ; Rechgoun, où fut, Siga, l’ancienne capitale du grand royaume berbère des Massaesyles de la Numidie occidentale ; Oran, Tiaret et Tlemcen qui ont été des capitales des royaumes berbères musulmans et puis Turcs. Dans l’Algérie contemporaine, Oran, capitale de l’Ouest Algérien, a été la ville la plus européenne. En 1954, les habitants algériens musulmans représentaient seulement le tiers de la population oranaise dont une grande partie était espagnole. Grâce à son port portuaire abrité des vents et de la houle, l’attraction vers Oran s’exerçait de toute part. La richesse de la ville, en plus de sa position géographique, ont suscité la convoitise de nombreux peuples. Elle a été, tour à tour, utilisée par les Phéniciens, les Romains, les Arabes, les Espagnols, les Turcs, les Français et enfin par les Algériens (Chaïla 2002 ). Ce sont les paléontologues et les historiens qui nous ont exposé l’histoire de cette région de l’Algérie. Quelle sera la contribution de l’étude génétique des populations actuelles à ces données historiques?

24 EXPOSÉ BIBLIOGRAPHIQUE

III. Génétique des populations, paramètres évolutifs et étude de la diversité génétique

La génétique des populations humaines s’intéresse aux mécanismes et aux causes de l’évolution des fréquences alléliques au cours du temps au sein des espèces vivantes et des populations et à la diversité génétique de ces dernières. Pendant des décennies, les os fossiles et les témoignages archéologiques ont été les seuls outils pour reconstituer l’histoire de la lignée humaine. Depuis une vingtaine d’année, l’étude de l’ADN des populations contemporaines constitue une source supplémentaire de connaissances. Les résultats génétiques obtenus doivent, bien sûr, être confrontés aux approches historiques, paléontologiques, archéologiques, paléoclimatologiques et linguistiques (Bauduer 2013).

L’étude de la génétique des populations commence par l'essence même de la discipline: la définition de la population et la constitution de l'échantillon de référence (ou d'analyse) à partir de celle-ci. La définition de la population en tant que sujet d'étude anthropologique va dépendre de la discipline et des questions posées. Une population est définie par un groupe d’individus des deux sexes et de tous âges qui partagent un même territoire, qui échangent des conjoints, qui observent des règles communes de comportement social et qui ont, par conséquence, un patrimoine génétique commun (Crubézy et al. 2002). Le choix des partenaires se fait alors au hasard au sein de ce “pool génétique”, c’est ce qu’on appelle la panmixie. La population peut donc être individualisée et choisie en termes géographiques (pays, île, vallée…), culturelles (communautés religieuses…), ou historique (populations aujourd’hui disparues).

Du fait de l’intensification des flux migratoires, rares sont les populations qui demeurent “hermétiques” sur le plan génétique. Une population n’est pas une structure figée car ses caractéristiques vont se modifier continuellement au fil du temps et des générations. L’endogamie (reproduction entre individus d’une même population) diminue la variabilité alors que l’exogamie (caractérisée par le fait que les deux partenaires sont issus de populations distinctes) l’augmente. Ainsi, ces comportements démographiques ont des effets significatifs sur la composition génétique de la population (Bauduer 2013).

25 EXPOSÉ BIBLIOGRAPHIQUE

La diversité génétique des populations a d’abord été étudiée par des marqueurs phénotypiques (groupes sanguins, polymorphismes enzymatiques…), puis grâce à l’avancement et la mise au point des outils de biologie moléculaire : les enzymes de restriction (analyse des polymorphismes de restriction), PCR (Polymerase Chain Reaction), séquençage… L’analyse des variations génétiques s’est étendue sur différents marqueurs dont les marqueurs autosomiques tels que les variants du gène de l’hémoglobine, les allèles des marqueurs érythrocytaires (ABO et Rhésus…), les allèles du CMH (Complexe Majeur d’Histocompatibilité), les microsatellites… Mais l’approche génomique uniparentale, utilisant l’ADN mitochondrial transmis par la mère et le chromosome Y transmis par le père, reste la plus appréciable puisqu’elle permet d’effectuer une analyse phylogénétique patrilinéaire et matrilinéaire et de remonter plus loin dans l’histoire génétique des populations.

III.1 Paramètres de l’analyse des variations génétiques III.1.1 Équilibre d’Hardy Weinberg: L'équilibre d’Hardy-Weinberg est le modèle fondamental de la génétique des populations. Celui-ci, exposé indépendamment en 1908 par le mathématicien G.H. Hardy et le biologiste W. Weinberg, s’applique pour une population théorique de taille infinie (effectif important pour minimiser les variations d'échantillonnage et équilibrer le sex-ratio). Il stipule que de générations en générations et dans des conditions stables, les fréquences des allèles à un locus donné restent constantes, de la même manière que les fréquences génotypiques qui y sont liés. L'équilibre de Hardy-Weinberg correspond donc à un équilibre des fréquences génotypiques attendues dans une descendance (génération n+1) en fonction des fréquences alléliques parentales (génération n). Lorsque deux allèles existent pour le même locus, les fréquences génotypiques et alléliques sont liées par la relation: p2 + 2pq + q2 = 1, où p et q sont les fréquences alléliques. Dans une étude génétique, les fréquences observées dans une population sont comparées avec celles qui sont calculées par le modèle d’Hardy Weinberg. Si ces deux résultats sont significativement différents, la population n’est donc pas en équilibre. Ceci peut s’expliquer par deux phénomènes : 1- Le choix non-panmictique du partenaire au sein de la population, souvent du fait de contingences phénotypiques (similarité ou non phénotypique) ou culturelles (consanguinité).

26 EXPOSÉ BIBLIOGRAPHIQUE

2- Une ou des force(s) évolutive(s) suivante(s) modifie(nt) de façon sensible la structure génétique de la population au fil du temps: mutations, sélection naturelle, dérive génétique et/ ou flux migratoires (géniques). L’écart d’Hardy-Weinberg permet donc de mesurer l’impact de ces forces évolutives sur la variabilité génétique au sein d’une population.

III.1.2 Forces évolutives et variations du génome humain:

III.1.2.1 Mutations : Les mutations correspondent aux modifications aléatoires de séquences de l’ADN transmises aux descendants, lorsqu’elles se produisent au niveau des cellules germinales. Elles constituent la source primaire de variabilité car représentant le seul mécanisme évolutif produisant de nouveaux allèles. Ce changement peut affecter la séquence d’un gène et altérer sa fonction, mais une mutation peut aussi n’induire qu’un polymorphisme sans conséquence fonctionnelle immédiate, que cette mutation touche ou non la séquence d’un gène. Le taux global de mutation est relativement bas (10-4 à 10-6/ gène/ génération) mais parfois plus élevé dans certaines parties du génome (Bauduer 2013).

Le concept de polymorphisme génétique désigne la coexistence de plusieurs allèles pour un gène ou locus donné dans une population. Le polymorphisme est lié à des variations induites par les mutations génétiques. On dit qu'un gène est polymorphe, s'il possède au moins deux allèles ayant une fréquence supérieure ou égale à 1 %. Il est polyallélique lorsqu’il existe en plusieurs exemplaires. L'indice du contenu informatif du polymorphisme PIC « Polymorphism Information Content » permet de mesurer le taux d’informativité d'un marqueur génétique ou d’un gène en fonction des fréquences de chaque allèle dans une population. La valeur de PIC s’approche de zéro quand il n'y a aucune variation allélique et elle peut atteindre une valeur maximale de 1 si un génotype a seulement de nouveaux allèles, ce qui est un phénomène rare. Ceci doit principalement évaluer la diversité d'un gène ou un segment d'ADN dans une population qui éclairera la pression évolutionnaire sur l'allèle et les mutations qu’un locus pourrait avoir subi sur une période de temps.

27 EXPOSÉ BIBLIOGRAPHIQUE

Les remaniements génétiques peuvent être : - des SNPs (Single Nucleotide Polymorphisms), ou polymorphisme d’un seul nucléotide, qui est une substitution d’une paire de base par une autre paire de base dans un site du génome. Il s’agit de polymorphismes bi-allélique identifiables par diverses méthodes de biologie moléculaire (la méthode d’amplification génique (PCR : Polymerase Chain Reaction), les réactions de discrimination alléliques par extension d’amorces, la technologie Taqman en RT-PCR (Real Time-PCR), le séquençage de l’ADN …) - des RFLPs (Restriction Fragment Length Polymorphisms), ou polymorphisme de longueur de fragments de restriction. C’est un SNP qui fait apparaître ou disparaître, en un locus du génome, un site de reconnaissance spécifique d’une endonucléase. Les RFLPs sont des marqueurs bi-alléliques (présence ou absence du site), dont le génotype est identifiable par PCR-RFLP (amplification de l’ADN suivie d’une digestion enzymatique). - des Indels, ou polymorphismes d’insertion-délétion d’une séquence d’ADN en un site du génome (exemple : insertion Alu). Ils forment le plus souvent un polymorphisme bi- allélique, repérable par étude de la longueur du fragment d’ADN amplifié par PCR. - des STRs (Short Tandem Repeats), ou polymorphismes de courtes séquences, de deux á six nucléotides, répétées en tandem, appelées aussi « séquences microsatellites ». Contrairement aux marqueurs précédents, les STRs sont multialléliques, le nombre d’allèles étant égal au nombre de répétitions existant au locus considéré. - des mini-satellites ou VNTRs (Variable Numbers of Tandem Repeats) correspondent à des motifs répétés en tandem, de 15 à 40 paires de bases. Le nombre de ces répétitions est variable d'un individu à l'autre, constituant une série allélique. - ou des remaniements chromosomique (recombinaison) : translocation, aneuploïdie (monosomie, trisomie)…

III.1.2.2 Sélection naturelle : L’apport fondamental de Charles Darwin à la théorie de l’évolution a été de proposer un mécanisme pour la transformation des espèces au cours des générations: la sélection naturelle. La théorie de la sélection naturelle permet d'expliquer et de comprendre comment l'environnement influe sur l'évolution des espèces et des populations en sélectionnant les individus les plus adaptés au fil des générations. Seuls les individus les mieux adaptés survivront et reproduiront leurs caractéristiques par la transmission de leur pool génique en

28 EXPOSÉ BIBLIOGRAPHIQUE ayant davantage de descendants. Ces caractères augmenteront donc en fréquence au cours des générations et conduiront à l’évolution de la population. La sélection naturelle ne crée pas la variabilité (de nouveaux allèles) mais en modifie la fréquence. Les différents types de sélection sont définis selon la capacité reproductive du porteur du génotype si elle augmente sous l’effet de la sélection (positive), ou elle diminue (négative). Il existe trois types de sélection naturelle (Figure 6): La sélection stabilisante qui favorise le phénotype hétérozygote (intermédiaire) ; La sélection diversifiante qui favorise les phénotypes extrêmes (en faible fréquence) et désavantage les phénotypes intermédiaires ; Et la sélection directionnelle qui se caractérise par l’accentuation d’un caractère (favorisant) donné : ex. éclaircissement de la pigmentation cutanée (de l’Afrique vers les zones septentrionales de moins en moins ensoleillées)… (Bauduer 2013)

Figure 6 : Les trois types de sélection naturelle

III.1.2.3 Dérive génétique : L’identification de facteurs sélectifs dans le milieu n’est pas toujours évidente : de nombreuses mutations ne sont ni favorables ni défavorables pour la survie de l’espèce ; elles sont dites neutres. L’analyse des populations expérimentales ou naturelles montre que les fréquences des allèles neutres évoluent dans la population au cours du temps. Contrairement à la sélection naturelle, le résultat de cette évolution n’est pas prévisible: c’est la dérive génétique.

29 EXPOSÉ BIBLIOGRAPHIQUE

La dérive génétique est donc un mécanisme aléatoire (stochastique) qui va modifier la fréquence des allèles d’un gène dans la population en l’augmentant ou en la diminuant, au fil des générations. Au bout d’un grand nombre de générations, l’allèle neutre tend soit à envahir complètement la population (on parle de fixation), soit à disparaître de la collection d’allèles. En fonction de la taille de la population et de la fréquence des allèles à l’origine, le temps de fixation va varier (c.-à-d. le temps que vont mettre les allèles pour atteindre un point d’équilibre avec un nombre d’allèles fixé et des fréquences alléliques stables) (Figure 7). Plus la taille de la population est faible, plus la dérive est rapide. A plus ou moins long terme, la dérive génétique va entrainer une diminution de la variabilité génétique (Garnier 2011). Ainsi, les populations qui subissent des événements démographiques comme des épisodes de fondateur et des goulots d'étranglement sont soumises à une forte dérive génétique traduite par une faible diversité génétique.

Figure 7: Influence de la taille de population sur la dérive génétique (Hartl et Clark 1997)

III.1.2.3.1 Goulot d'étranglement génétique (genetic bottleneck) : Il se réfère à la baisse brutale de l’effectif d’une population (à cause de guerre ou d’épidémies…). Ceci va faire apparaître un nouveau sous-groupe de population avec ses particularités génétiques propres qui ne sont pas la résultante d’un phénomène de sélection naturelle mais seulement le fruit du hasard. Ainsi, la probabilité que les fréquences alléliques de la population survivante diffèrent de la population initiale est d'autant plus grande que l'effectif rescapé est réduit.

30 EXPOSÉ BIBLIOGRAPHIQUE

III.1.2.3.2 Effet fondateur: Lorsqu’un sous-groupe se sépare de la population initiale, de taille beaucoup plus importante, lors d’une migration pour coloniser un nouveau milieu par exemple, la population pionnière, ou fondatrice, n’est pas le reflet exact de la population de départ. Cette sous-population ne va "prendre" qu'un échantillon du pool d'allèles disponible dans la population mère « dans ces bagages » et ce de manière aléatoire. Elle peut donc avoir des fréquences alléliques fort différentes de la population initiale. Ainsi, on assiste à une surreprésentation des allèles portés par les fondateurs dans la descendance. C’est ce que l’on appelle « l’effet fondateur » qui peut être, également, une conséquence d’un goulot d’étranglement génétique (Garnier 2011).

III.1.2.4 Migrations et le flux génique (gene flow): C’est le transfert d’allèles d’une population à une autre à l’occasion de processus migratoires. Cet échange d’allèles est qualifié de flux génique, un phénomène dépendant des facteurs environnementaux et/ou culturels. Il est, en général, proportionnel à la distance géographique entre les populations. Si des populations possèdent des fréquences alléliques différentes, ces flux géniques conduiront à une plus grande homogénéité de ces fréquences au sein d’un ensemble de population et la différentiation génétique sera diminuée. Cependant, à une échelle locale si l’on considère l’une des populations, la migration pourra être un apport de variabilité. En effet, l’effet global de la migration est double : (1) elle empêche les populations de devenir génétiquement différentes les unes des autres, et (2) elle augmente la variation génétique au sein des populations. Le métissage entre deux populations est un processus à deux variables. La première est le taux d'incorporation d'allèles dans la population réceptrice, lui-même fonction de la structure socioculturelle et de la perméabilité de celle-ci. La seconde est la vitesse de dispersion des allèles introduits, qui dépend du taux de reproduction de la population réceptrice (Jobling et al. 2004 ; Mazières 2006).

III.1.3 Relation entre les différents paramètres influençant l’évolution : Il est difficile de déterminer la part de chaque force évolutive dans l’évolution des fréquences alléliques dans une population. Tous ces mécanismes vont agir conjointement et contribuer à cette évolution. Ces différentes forces évolutives affectent à la fois la variation génétique au sein des populations et la divergence génétique entre populations (Pierce 2012). Ceci s’applique dans l’évolution humaine, en particulier, aux périodes paléolithique et prénéolithique. Durant celles-ci, les migrations par scissions accompagnées de l’effet

31 EXPOSÉ BIBLIOGRAPHIQUE fondateur et de la dérive ont activement mais aléatoirement modifié les fréquences alléliques des gènes. De ce fait, deux groupes éloignés, par le temps et la distance géographique, se retrouveront génétiquement éloignés aujourd’hui, quand on estime leur distance génétique moyenne sur un grand nombre de gènes. Toutefois, l’effet de la dérive cessa dès l’émergence de l’agriculture et de la domestication, avec l’augmentation brutale de l’effectif des populations. La sélection a agi de son côté sur quelques gènes en opposition ou en synergie avec la dérive (Serre 2006).

III.2 Déduction de l’histoire démographique en se basant sur les variations génétiques :

Nous avons vu dans la partie précédente (III.1) comment les paramètres évolutifs de la génétique des populations influent sur le processus de variation génétique. Nous verrons dans la section suivante l’application de nouvelles méthodes tel que la théorie de coalescence et les méthodes statistiques qui ont pu avec succès s’appliquer aux données génomiques pour déduire l’histoire et les relations entre les populations.

III.2.1 Arbre phylogénétique :

Un arbre phylogénétique est un arbre binaire qui montre les relations de parentés entre des groupes d'êtres vivants. Il représente une phylogénie et montre le degré de parenté entre différents organismes censés avoir un ancêtre commun. Chacun des nœuds de l'arbre indique l'ancêtre commun de ses descendants, représentant ainsi un clade. La longueur d’une branche entre un ancêtre et un descendant représente le temps entre l’apparition de ces deux espèces (Bar-Hen et al. 2008).

Cependant, il ne faut pas confondre la phylogénie (ou phylogénétique) des espèces et la phylogénie (ou généalogie) des gènes, qui se base sur la théorie de coalescence. Même si les deux, se ressemblent et utilisent, surtout pour le dernier, la généalogie des séquences d’ADN, des différences existent entre ces deux approches : la "phylogénie moléculaire des espèces" et la "théorie de la coalescence"

1. En phylogénie moléculaire, on s'intéresse surtout à la généalogie de loci homologues entre les espèces. En coalescence, on s'intéresse, a contrario, à la généalogie de ces loci au sein de chaque espèce.

32 EXPOSÉ BIBLIOGRAPHIQUE

2. En phylogénie moléculaire, on cherche surtout à reconstruire l'arbre "vrai" de loci homologues. En coalescence, on ne cherche pas à reconstruire l'arbre "vrai" ; on cherche les forces évolutives (décrites en génétique des populations) qui sont les plus compatibles avec la généalogie observée des séquences étudiées (Achaz 2009). En d’autres termes, la phylogénétique répond à la question : « qui est proche de qui ? », tandis que la théorie de la coalescence répond à la question : « qui descend de qui ?».

III.2.2 Théorie de coalescence : La théorie de la coalescence a été formalisée en 1982 par Sir John Kingman, mathématicien à Oxford. Il s’agit d’un modèle rétrospectif de génétique des populations qui s’est développé au fil des années avec l’avancée de la bio-informatique (Excoffier 1997). Cette théorie utilise des propriétés statistiques décrites dans des modèles idéalisés de génétique des populations, tel que celui de Wright-Fisher. Dans ce modèle, la taille de la population N (ou 2N pour les diploïdes) est constante au cours du temps et les générations ne sont pas chevauchantes. Chaque individu tire son génotype aléatoirement parmi les individus de la génération précédente (Figure 8). La théorie de la coalescence vise à décrire la généalogie des gènes homologues, depuis le moment présent jusqu’au plus proche ancêtre commun de tous les gènes qui constituent l’échantillon de population. La généalogie de ces gènes se traduit donc par un arbre de coalescence similaire à l’arbre phylogénétique, appelé aussi le coalescent. Le terme de coalescence fait allusion à la fusion qui se produit entre deux lignées ancestrales d’un gène, à un moment donné au fil des générations. Cette coalescence se poursuit dans le passé et on peut observer toutes les lignées de l’échantillon de population qui fusionnent en une seule lignée qui correspond à leur ancêtre commun le plus récent, le MRCA (Most Recent Commun Ancestor) (Figure 8) (Rosenberg et Nordborg 2002). La théorie de la coalescence permet, d’une part, de construire l’arbre phylogénétique (nous retiendrons cette appellation qui désignera, de toute évidence, la généalogie des séquences d’ADN ou des gènes). D’autre part, elle permet de déterminer, par des probabilités, la durée écoulée depuis l'ancêtre commun le plus récent et de calculer le temps des coalescences. Par ailleurs, le coalescent est devenu le modèle de référence pour les déductions démographiques dans la génétique des populations. Les simulations de coalescence sont basées sur des milliers de généalogies de gènes qui sont produites aléatoirement sous un modèle évolutionnaire spécifique. Ce dernier est utilisé pour évaluer des paramètres démographiques ou évaluer le rôle des différentes forces évolutives, ce qui ne peut être fait avec l’approche

33 EXPOSÉ BIBLIOGRAPHIQUE phylogénétique classique (Rosenberg et Nordborg 2002).

Figure 8: Modèle de Wright-Fisher et le coalescent de Kingman (Mallein 2011) (Le premier à gauche et au milieu et le deuxième à droite)

III.2.3 Application à la phylogénétique :

Dans les études de la diversité génétique des populations humaines, l’utilité des marqueurs génétiques à héritage uniparental, l’ADN mitochondrial (ADNmt) hérité par la mère et le chromosome Y hérité par le père, réside dans le fait que les séquences d’ADN portées par ces chromosomes échappent à la recombinaison méiotique (puisque présentes en un seul exemplaire dans les zygotes). Ces séquences sont donc transmises sans modification à la génération suivante, si ce n’est du fait de nouvelles mutations. Cette hérédité uniparentale permet alors une construction facile des généalogies de séquences d’ADN des individus et une possible estimation de la chronologie des événements, lorsque le taux de mutation est calibré (Thomas et al. 2010). En effet, le premier arbre phylogénétique établi fut celui de l’ADNmt. Les premières estimations de cet arbre ont suscité l’attention du monde par l’indication que tous les humains partagent un ancêtre féminin commun récent de 200 000 ans, et que la racine de cet arbre indiquait une origine africaine (Rosenberg et Nordborg 2002).

34 EXPOSÉ BIBLIOGRAPHIQUE

IV. Études anthropogénétiques et marqueurs parentaux

L’anthropologie vient du grec anthropos « Humain » et logia « Étude ». Elle étudie la culture et l’environnement des populations humaines, mais elle peut également intégrer des apports d’autres disciplines comme l’archéologie, la linguistique, l’ethnologie et la biologie moléculaire. Ces disciplines permettent d'écrire l'histoire de l'humanité. Dans son approche génétique, l’anthropologie biologique permet d'explorer les génomes pour étudier la diversité génétique des populations humaines actuelles et anciennes. Ceci permettant la déduction de leur histoire ancestrale pour différentes raisons : généalogique, anthropologique et épidémiologique. Les études anthropogénétiques historiques peuvent être divisées en deux types : celles qui reconstruisent la phylogénie des gènes sur la base des haplotypes11 ; et celles qui utilisent des résumés statistiques d’un grand nombre de données génétiques pour déduire les propriétés des populations ancestrales. Les études phylogénétiques dépendant des haplotypes, se focalisent sur l’analyse des données des marqueurs uniparentaux (l’ADN mitochondrial et le chromosome Y) et du chromosome X (puisqu’il est présent en un seul exemplaire chez les hommes). Par contre, pour les autosomes qui ne fournissent pas d’haplotypes, des simulations se basant sur différents paramètres statistiques permettent de distinguer une ou plusieurs populations ancestrales, c’est ce qu’on appelle l’analyse de la structure génétique (ADMIXTURE analysis). Cette dernière se base actuellement sur des données génétiques immenses se basant sur des milliers de SNPs au niveau du génome entier.

De nombreux marqueurs anthropogénétiques peuvent être utilisés pour définir la structure génétique d’une population. Parmi ces marqueurs ceux transmis, de façon exclusive des parents aux enfants. L’ADN mitochondrial est transmis de la mère à tous ses enfants et permet de suivre une filiation maternelle. Le chromosome Y est transmis de père en fils et permet de tracer une lignée paternelle. Le chromosome X, quant à lui, est présent chez le père et la mère et est transmis par les deux. Son analyse dans une population permet d’évaluer la composante génétique issue de cette double transmission.

11 Un haplotype est un groupe d'allèles de différents loci situés sur un même chromosome et transmis ensemble.

35 EXPOSÉ BIBLIOGRAPHIQUE

Il est connu que le chromosome Y et l’ADNmt ont été les plus étudiés puisqu’ils conviennent parfaitement à retracer l'histoire récente de chaque population. Leur phylogénie est à haute résolution moléculaire, c’est à dire que les informations sur la position géographique recueillie à partir de certaines séquences de l’ADN sont plus informatives que n’importe quel loci du génome (Underhill et Kivisild 2007). De plus, les marqueurs uniparentaux présentent des taux de mutation et de dérive génétique supérieurs à ceux du chromosome X. Ceci signifie que les populations auront tendance à différer plus au niveau du chromosome Y et l’ADNmt qu'avec un locus du chromosome X, permettant une meilleur résolution pour les études locales. Cependant, cette dernière caractéristique ne pourrait pas toujours être un avantage : car une dérive génétique rapide signifie toujours que les interactions entre les populations sont plus facilement dissoutes, ce qui rend difficile parfois de retrouver les populations d’origine (Schaffner 2004). C’est pourquoi le recours à l’analyse du chromosome X et des autosomes permet de considérer toute la composante génétique d’une population.

36 EXPOSÉ BIBLIOGRAPHIQUE

IV.1 Le chromosome X : IV.1.1 Caractéristiques du chromosome X:

Le chromosome X est l’un des deux chromosomes du système XY de détermination du sexe chez l’être humain. Il s'étend sur plus de 153 millions de paires de bases et représente environ 5% de l'ADN total dans les cellules des femmes et 2,5 % chez les hommes (Ross et al. 2005). Le chromosome sexuel X est présent dans toutes les cellules nucléées de tous les individus masculins et féminins. Les femmes possèdent deux chromosomes X alors que les hommes ont un chromosome X et un chromosome Y. Les hommes et les femmes conservent un des chromosomes X de leur mère. Les femmes conservent leur deuxième chromosome X de leur père, qu’il hérite de sa mère. Donc, une femme a un chromosome X de sa grand-mère paternelle et un chromosome X de sa mère. Comme pour les autosomes, le chromosome X est composé d’un bras long (Xq) et d’un bras court (Xp) séparés par un centromère. Le chromosome X a été séquencé en 2005, deux ans après son homologue l’Y (Ross et al. 2005). Il présente une large région euchromatine, d’environ 150Mb qui contient plus de 1400 gènes et code pour environ 800 protéines, comparé au chromosome Y (78 gènes codants). Les chromosomes X et Y diffèrent largement par leur taille mais partagent certaines homologies de séquence. Il s’agit des deux "Régions Pseudo-Autosomiques" situées à chaque extrémité des deux bras chromosomique: PAR1 (2,7Mb) et PAR2 (0,33Mb) (Ross et al. 2005; Graves 2010). Contrairement au chromosome Y, qui code spécialement pour les caractéristiques sexuelles masculins et la fertilité, le chromosome X contient des gènes avec une vaste gamme de fonctions, comme ceux constituants les facteurs de coagulation sanguine, les pigments visuels et des gènes impliqués dans le développement du cerveau (Graves 2010).

IV.1.1.1 Inactivation du chromosome X:

Au début du développement embryonnaire chez les femmes, l'un des deux chromosomes X est inactivé, au hasard et de façon permanente, dans presque toutes les cellules somatiques. Ce phénomène est appelé l’inactivation de l’X. De ce fait, le niveau d’expression des gènes du chromosome X est donc identique quel que soit le sexe dans chaque cellule du corps. Ce phénomène crée le corpuscule de Barr : une signature cytologique sous forme d’hétérochromatine sexuelle localisée en bordure de l’enveloppe nucléaire de la plupart des cellules somatiques.

37 EXPOSÉ BIBLIOGRAPHIQUE

IV.1.1.2 Maladies liées à l’X : Le chromosome X est parfois responsable de maladies chromosomiques ou génétiques qui peuvent être particulièrement graves. Ces maladies peuvent être : exclusivement féminines, comme la trisomie X et le syndrome de Turner ; ou masculines comme le syndrome de Klinefelter ; ou encore, touchant les deux sexes comme le daltonisme, les hémophilies et le syndrome de l’X fragile.

IV.1.2 Marqueurs polymorphes du chromosome X: L’analyse moléculaire du chromosome X porte, particulièrement, sur les marqueurs STRs (Short Tandem Repeats : courtes séquences d’ADN répétées en tandem) décrits et utilisés en génétique médico légale et exploités en anthropogénétique. Les SNPs (Single Nucleotide Polymorphisms) sont également utilisés, mais leurs analyses nécessitent le séquençage de grands fragments d’ADN du chromosome X. La recherche des SNPs a pour but aussi la détection des polymorphismes impliqués dans des maladies liées à l’X (Harris et Hey 1999; Yu et al. 2002). Les insertions Alu sont un autre type de polymorphisme qui se sont révélées utiles dans les études de l'évolution humaine.

IV.1.2.1 Polymorphismes STRs du chromosome X :

Des centaines de microsatellites STRs ont été étudiés sur tout le génome humain, mais, ont été retenus pour les analyses génétiques médico-légales et pour l’étude génétique des populations seulement ceux:

* qui sont aisément amplifiables;

* qui présentent un fort taux d'hétérozygotie (surtout pour les autosomes);

* et qui expriment un nombre d'allèles suffisamment élevé.

La localisation génétique des STRs du chromosome X (X-STRs) est importante dans les tests génétiques puisque les allèles des X-STRs peuvent être arrangés en haplotype. L’analyse de ces haplotypes est facile à déterminer chez les hommes hémizygote.

Ø Nomenclature des X-STRs:

L'utilisation d'une nomenclature de consensus est cruciale dans l’analyse des marqueurs STRs puisqu’elle permet la comparaison et l'échange de données entre les différents laboratoires ainsi que l’établissement des bases de données. Depuis 1994, la commission de

38 EXPOSÉ BIBLIOGRAPHIQUE la société internationale de l’hémogénétique médico-légale (ISFH) (International Society of Forensic Haemogenetics) établie les directives standardisées de la nomenclature des STRs communément utilisées (Bar et al. 1994 ; 1997) . La plupart des polymorphismes STRs du chromosome X sont désignés par DXS (DNA X chromosome Segment) + un numéro. Les motifs répétés des marqueurs STRs du chromosome X sont très variés et plus d’un motif sont, parfois, inclus dans un seul STR (Tableau 1). Les allèles d'un marqueur STR ne diffèrent que par 4, 8, 12.... nucléotides, suivant le nombre de motifs répétés (4 nucléotides pour cet exemple). Ils sont, généralement nommés par le nombre de répétition du motif du STR. Pour certains allèles intermédiaires (ex : allèles 38 et 38.1 de DXS10148), la différence de taille ne porte que sur un nucléotide.

Tableau 1: Quelques exemples de polymorphismes STRs du chromosome X (Doutremepuich 2012)

39 EXPOSÉ BIBLIOGRAPHIQUE

Ø Analyse moléculaire des X-STRs : Les microsatellites sont des polymorphismes de longueur de séquence. Ils sont analysés par amplification PCR multiplex grâce à l’utilisation des amorces marquées par des fluorophores. Les fragments d'ADN, amplifiés (amplicons) et marqués, sont séparés par un système d’électrophorèse à très haute résolution, c'est l'électrophorèse capillaire qui est réalisée sur analyseur génétique. Plusieurs études ont mis au point des réactions PCR multiplex permettant l’analyse des marqueurs X-STRs (Szibor et al. 2005 ; Hering et al. 2006 ; Hundertmark et al. 2008). Il s’agit de kits commercialement disponibles permettant l'analyse entièrement automatisée et simultanée de plus de 10 marqueurs.

IV.1.2.2 Polymorphismes Alu du chromosome X :

Les séquences Alu sont des répétitions largement distribuées dans le génome humain. Elles ont une taille de moins de 500 pb. Ce polymorphisme se traduit par une présence ou une absence de l’élément Alu à une position particulière dans le chromosome. Ils ont été utile dans les études de l'évolution humaine parce qu'ils offrent deux avantages importants comparés aux autres marqueurs polymorphes : (i) tout les individus qui partagent ces polymorphismes d’insertion Alu, les ont hérités d'un ancêtre commun et (ii) l'état ancestral de chaque insertion Alu est connu pour être l'absence de cet élément. Ceci permet donc leur utilisation dans le but de distinguer un processus évolutionnaire (Batzer et Deininger 2002).

En 2003, 264 éléments Alu ont été mis en évidence sur le chromosome X, cependant, 16 seulement se sont avérés polymorphique (Callinan et al. 2003). En 2006, l’équipe de Pereira a décrit un polymorphisme d’insertion Alu (nommé DXS225; GDB:11524531) en position (Xq21.3) sur le chromosome X, en exploitant la base de données publiques du projet sur la diversité du génome humain (HGDP-CEPH : Human Genome Diversity Project - Centre d’Étude du Polymorphisme Humain). Les chercheurs ont constaté la présence de cette insertion Alu dans toutes les régions géographiques du globe, suggérant qu’elle a pris place avant l’expansion de l’homme moderne à partir de l’Afrique (Pereira et al. 2006; Rosenberg 2006). Par ailleurs, sur la base d’une analyse d’un fragment du chromosome X de 47 kb contenant le polymorphisme Alu (DXS225) et quatre marqueurs STRs en complète déséquilibre de liaison, le temps à l’ancêtre commun le plus récent a été estimé à 182 000 ans et celui du polymorphisme DXS225 était de 94 000 ans. Ces dates sont compatibles avec l’estimation du temps de l’émergence de l’homme anatomiquement moderne en Afrique (il y

40 EXPOSÉ BIBLIOGRAPHIQUE a environ 195 000 ans) et de son expansion “Out of Africa” (il y a 55 000 à 65 000 ans) (Santos-Lopes et al. 2007).

IV.1.3 Analyse du chromosome X en génétique médico-légale : Le génotypage du chromosome X (ChrX) peut compléter, de manière très efficace, l'analyse des marqueurs autosomiques et ceux du chromosome Y (ChrY), et peut fournir un outil extrêmement informatif dans les cas complexes de test de parenté, particulièrement lorsque le descendant est une femme. Ces particularités ont augmenté considérablement le nombre d’enquêtes médico-légale utilisant ces marqueurs (Szibor 2007). Les applications sont nombreuses, parmi elles : - Le recherche de parenté dans les cas d’identification de squelettes et corps humains des victimes de guerres et des désastres en masse. - La recherche de paternité père/fille ou mère/fils. - Le test de paternité en cas de déficience en l’un des membres concernés ou dans d’autres cas complexe de parenté. Par exemple: Si deux individus féminins ont le même père, ils partagent toujours le même ChrX paternel. L’analyse des marqueurs X-STRs entre deux sœurs ou demi-sœurs peut ainsi exclure la paternité, même si l'ADN des parents n'est pas disponible. - Dans le cas de scènes de crime ou de viols: pour identifier des traces féminines dans un échantillon masculin (Szibor 2007).

IV.1.4 Analyse du chromosome X appliquée à la génétique des populations : Les études qui utilisent le chromosome X en génétique des populations ont été jusqu'ici pratiquement absentes, non pas parce qu'il n’est pas de valeur, mais parce que la plus grande partie du travail et des efforts ont été fournies pour réaliser des arbres phylogénétiques des marqueurs uniparentaux. Ces derniers ont été très utiles pour préciser géographiquement et historiquement l'origine de nos ancêtres communs et les interactions entre les différentes populations humaines. Le premier arbre phylogénétique a été établie pour l’ADN mitochondrial humain en 1987 (Cann 1987), et le premier pour le chromosome Y a été publié en 1989 (Lucotte et al. 1989). Cependant, les études de génétique n’ont pu inclure le chromosome X jusqu’à la mise au point de nouvelles technologies de séquençage de l’ADN pratique pour son analyse. Les premières études détaillées sur le chromosome X sont apparues entre 1997 et 1998 et le premier arbre phylogénétique a été établi en 1999 (Schaffner 2004).

41 EXPOSÉ BIBLIOGRAPHIQUE

IV.1.5 Propriétés des marqueurs du chromosome X en anthropogénétique

IV.1.5.1 Haplotypes et recombinaison génétique : Le chromosome X, étant présent en une seule copie chez les hommes, permet de déterminer aisément des haplotypes. Un avantage qu’il partage avec le chromosome Y et l’ADNmt, contrairement aux autosomes. Ces haplotypes sont nécessaires dans les analyses phylogénétiques puisqu’ils ont démontré le rôle dominant de ces trois marqueurs de choix dans les études historiques. La deuxième propriété du chromosome X est la présence de recombinaison. Si la détermination des haplotypes distingue le chromosome X des autosomes, c’est la recombinaison qui le différencie des marqueurs uniparentaux. Dans ces derniers, le chromosome en entier agit comme un seul locus et permet de déterminer une seule histoire généalogique. Par contre, le chromosome X et les autosomes, présentent des locus indépendants puisqu’ils sont affectés par la recombinaison à chaque génération, et donc chaque région chromosomique présente une histoire ancestrale différente. Par ailleurs, la recombinaison rend difficile la construction d’arbre phylogénétique. De ce fait, l’analyse phylogénique du chromosome X doit se baser uniquement sur les régions présentant un haut déséquilibre de liaison où chaque locus aura son propre arbre phylogénétique (Schaffner 2004).

Dans le but de mieux comprendre la difficulté rencontrée lors de l’établissement des arbres phylogénétiques du chromosome X, une simulation de la phylogénie de deux loci (locus 1 et locus 2) a été réalisée au sein d’une population à effectif constant (Figure 9a). Ce modèle est typique dans l’estimation de la variation génétique observée ; Même si les deux loci partage la même histoire de la population, l’âge et la diversité génétique du locus 1 sont plus élevées que pour le locus 2 ; ce qui indique que la déduction des caractéristiques génétiques de la population à partir d’un seul arbre donnera un résultat dévié (Schaffner 2004).

D’un autre coté, les trois marqueurs anthropogénétiques (le chromosome X, l’ADN autosomique et les marqueurs uniparentaux) sont comparés, dans le but d’estimer le temps à l’ancêtre commun le plus récent. Cette analyse montre que les autosomes enregistrent un âge légèrement plus vieux que le chromosome X, mais tout les deux rapportent une histoire considérablement plus vielle que celles de l’ADNmt et du chromosome Y (Figure 9b) (Schaffner 2004).

42 EXPOSÉ BIBLIOGRAPHIQUE

Toutes ces comparaisons indiquent que le chromosome X enregistre des centaines ou des milliers de différents moment instantanés de l'histoire lointaine de la population, tandis que le chromosome Y et l’ADNmt rapporte seulement une histoire récente et unique. Les informations d'un système recombinant sont, donc, cruciales pour fournir une vue aussi complète que possible de l'histoire des populations humaines. C'est bien la combinaison des haplotypes accessible et des histoires génétiques multiples qui fait que le chromosome X représente un outil puissant pour les études historiques (Schaffner 2004).

Figure 9: Analyse du chromosome X en génétique des populations (Schaffner 2004)

a) Simulation de la phylogénie de deux loci du chromosome X b) Comparaison des estimations de l’âge entre les marqueurs anthropogénétiques

IV.1.5.2 Diversité et dérive génétique:

Les chromosomes X passent deux tiers de leur vie chez les femmes. De plus, en raison des événements mutationnels moins fréquents chez les femmes comparés aux hommes, on s'attend donc à une diversité génétique du chromosome X inférieure à celles des autosomes (Li et al. 2002). Ceci implique un effet du flux génétique et un déséquilibre de liaison plus important que pour les chromosomes autosomiques. La diversité du chromosome X est cependant deux fois plus importante que celle du chromosome Y, pour certaines régions chromosomiques informatives.

Puisque seulement trois copies du chromosome X sont présentes dans la population pour chaque quatre autosomes, les effets de la dérive génétique peuvent être plus important (Harris et Hey 1999). En conséquence, les populations devraient différer plus par leurs

43 EXPOSÉ BIBLIOGRAPHIQUE chromosomes X que par leurs autosomes, indiquant ainsi, des distances génétiques significativement plus grandes (Schaffner 2004).

IV.1.5.3 Sélection naturelle et flux migratoires:

Le chromosome X est idéal pour étudier les différences génétiques entre les hommes et les femmes au sein de la population, particulièrement les différences du taux de mutation et des modèles de recombinaison. La présence d'une seule copie du chromosome X chez les hommes signifie que les allèles liés de l’X sont plus exposés à la sélection naturelle, rendant le chromosome X un marqueur important pour examiner le rôle de la sélection dans l'histoire humaine (Schaffner 2004).

Une étude récente (Keinan et al. 2008) a comparé la variation génétique multi-locus sur le chromosome X et les autosomes afin d’observer les différences des histoires démographiques mondiales entre les hommes et les femmes. L’analyse a révélée que pendant la dispersion des humains modernes à partir de l'Afrique, le chromosome X a été sous un effet important de dérive génétique comparé aux autosomes. Dans les populations africaines, la diversité génétique du chromosome X était, comme attendu, plus faible de 25% par rapport aux autosomes. Par contre, les populations européennes et asiatiques présentaient une diversité du chromosome X inférieure de 40% à celle les autosomes. Cela signifie donc, qu’au cours de leur évolution, les populations européennes et asiatiques ont connu des périodes où elles comptaient moins de 3 chromosomes X pour 4 autosomes. En d’autres termes, il y avait bien moins de 50% de femmes dans ces populations. Des hypothèses ont été établies afin d’expliquer ces résultats : Soit un goulot d’étranglement a eu lieu durant la migration de ces populations depuis l’Afrique vers l’Europe et l’Asie (mais avant que ces populations se séparent) ; Ou encore, une forte pression de sélection a dû s’exercer sur un ou plusieurs gènes du chromosome X, conditionnée par les changements environnementaux lors des migrations. Toutefois, aucune simulation n’a validé de telles hypothèses. Ces résultats ne peuvent donc pas être expliqués par des épisodes connus de l'histoire humaine ou par la sélection naturelle. Une explication parcimonieuse suppose qu'une première population fondatrice a été formée par la migration d’hommes et de femmes dont une grande partie de patrimoine génétique a été remplacé par des migrants masculins ultérieurs, les femmes ayant moins pris part à ces vagues migratoires (où ayant moins survécu) (Keinan et al. 2008).

44 EXPOSÉ BIBLIOGRAPHIQUE

IV.1.5.4 Importance des marqueurs en déséquilibre de liaison : Le déséquilibre de liaison (DL), ou l'association non-aléatoire des allèles, n'est pas complètement compris dans le génome humain. Cependant, les études de DL entre des microsatellites et, plus récemment, entre les SNPs du chromosome X ont fourni de nouveaux aperçus sur l'origine et l'histoire des populations humaines et dans la révélation des différences ethniques (Szibor 2007). Les marqueurs STRs très étroitement liés présentent régulièrement un déséquilibre de liaison (DL). Par ailleurs, seulement deux tiers des chromosomes X peuvent recombiner chez les femmes à chaque génération. On s'attend donc à des intervalles de déséquilibre de liaison (DL) plus large pour le chromosome X comparé aux autosomes (Kong et al. 2002). Quatre groupes de liaison des marqueurs STRs sont décrits pour le chromosome X (Szibor et al. 2003) (Figure 10). Au sein de ces groupes de liaison, ce sont les fréquences des haplotypes qui sont considérées au lieu des fréquences alléliques, lors des études génétique des populations. Par ailleurs, les marqueurs X-STRs étroitement liés forment des clusters qui sont généralement analysés dans l’échantillon masculin, et complétés par des analyses de pedigree permettant l'évaluation des haplotypes d'individus féminins. En génétique médico-légale, des calculs de probabilité du ratio sont effectués dans les analyses d’affiliation utilisant les X-STRs. Ces calculs exigent une connaissance précise des fréquences alléliques et haplotypiques, et du statut de la liaison génétique et du déséquilibre de liaison (DL), dans la population appropriée (Tillmar et al. 2008). Par ailleurs, les fréquences haplotypiques ne peuvent pas être calculées par multiplication des fréquences des allèles uniques. Elles doivent être évaluées par l'analyse d'échantillons de population. Ainsi, comme pour le chromosome Y et l’ADNmt, il existe également pour le chromosome X une base de donnée en ligne de différentes populations (ChrX-STR.org 2.0), crée par les trois chercheurs Allemands : Szibor R., Edelmann J. et Hering S et disponible sur le site http://www.chrx-str.org (Szibor et al. 2006).

45 EXPOSÉ BIBLIOGRAPHIQUE

Figure 10: Idiogramme du chromosome X (ChrX-STR.org 2.0) (Les marqueurs STRs en gras forment les 4 groupes de liaison)

46 EXPOSÉ BIBLIOGRAPHIQUE

IV.2 Mitochondrie et génome mitochondrial

IV.2.1 Généralités sur la mitochondrie : La découverte des mitochondries a été révélée par l’expérience d’Altmann, en 1890. Il décrit leur coloration qui lui permit de les observer (Altmann et al. 1890). Les mitochondries sont des organelles cytoplasmiques présentes dans toutes les cellules humaines, en centaines de copies, voire en milliers, à l’exception des hématies. La fonction principale de la mitochondrie est de fournir l'énergie nécessaire pour de nombreuses activités cellulaires, tel que le mouvement, la différenciation et la mort cellulaire, ainsi que le contrôle et la croissance du cycle cellulaire (Wilson III et Brooks 2010). En effet, la mitochondrie occupe une place essentielle dans le métabolisme intermédiaire. Elle est le siège des réactions de catabolisme des acides aminés et du cycle de Krebs, de la β oxydation des acides gras et de la phosphorylation oxydative (Wallace et al. 1999 ; Wallace 2005).

IV.2.2 Découverte et séquençage du génome mitochondrial : Le génome mitochondrial diffère de l’ADN contenu dans le noyau de la cellule. Il possède ses propres systèmes autonomes de réplication d’ADN et de synthèse protéique. Toutefois, la plupart des protéines présentes dans la mitochondrie sont codées par l’ADN nucléaire. De plus, le code génétique mitochondrial diffère légèrement du code génétique nucléaire. Par exemple, UGA est un tryptophane dans la mitochondrie et un codon stop dans le code universel (Nass et Nass 1963; Anderson et al. 1981). Le génome mitochondrial humain a été intégralement séquencé en 1981 (Anderson et al. 1981). Cette séquence, appelée « séquence d’Anderson ou Cambridge Reference Sequence (CRS)», a été révisée en 1999 (Andrews et al. 1999). The revised Cambridge reference sequence (rCRS) (Genbank accession NC_012920) sert désormais de séquence de référence à laquelle est comparée toute nouvelle séquence d'ADNmt (Andrews et al. 1999). Elle est entièrement disponible sur le site web de MITOMAP, qui est une base de données du génome mitochondrial humain : (www.mitomap.org,http://www.ncbi.nlm.nih.gov/nuccore/251831106).

IV.2.3 Structure de l’ADN mitochondrial : L’ADN mitochondrial (ADNmt) humain forme un petit génome haploïde très condensé, appelé chondrome. Il s’agit d’un ADN circulaire double brin ayant une longueur de 16569pb, qui comprend un brin L (Light, léger) riche en Cytosines (C) et un brin H (Heavy, lourd)

47 EXPOSÉ BIBLIOGRAPHIQUE riche en Guanines (G). Par convention, les positions des nucléotides de l’ADNmt humain sont numérotées de 1 à 16569 selon la séquence de référence (rCRS). Près de 94% de l’ADN mitochondrial est formé de régions codantes. Il comprend 37 gènes, qui ne possèdent pas d'introns, codant pour 13 sous-unités du système de phosphorylation oxydative (respiration cellulaire), 22 ARN de transfert (ARNt) et 2 ARN ribosomaux (ARNr) (Figure 11) (Anderson et al. 1981; Andrews et al. 1999). La région non codante de l’ADN mitochondrial a une fonction de régulation et porte l’origine de réplication d’un des deux brins de l’ADN. Elle est appelée région contrôle ou D- loop (Displacement Loop ou Boucle de Déplacement). Il s’agit d’une séquence de 1122 pb, située entre la position 16024 et la position 576 (Anderson et al. 1981). La région contrôle présente un degré de variation relativement important, où la plupart des polymorphismes sont inclus dans deux régions hypervariables: • la région hypervariable I (HV1, HVI ou HVS-I) de la position 16024 à 16365 est d’une taille de (342 pb) ; • la région hypervariable II (HV2, HVII ou HVS-II) de la position 73 à 340 est d’une taille de (268 pb) (HVS pour hypervariable segment). Il existe également une troisième région hypervariable HV3 (de 438 à 576) et deux régions variables qui peuvent être informatives (Butler 2005).

Figure 11 : Carte schématique de l’ADN mitochondrial humain (Butler 2005) (Cyt b : cytochrome b ; ND: NADH déshydrogénase ; CO: cytochrome c oxydase ; ATP: ATP synthétase)

48 EXPOSÉ BIBLIOGRAPHIQUE

IV.2.4 Propriétés de l’ADN mitochondrial : La première étude approfondie sur les variations de l’ADNmt humain, date d’il y a 25 ans (Brown 1980). Depuis, l’ADNmt est devenu un outil de choix dans les études de l’évolution humaine, dans l’analyse génétique des individus, dans les études de phylogénies et dans les études des migrations et des histoires des populations. Cette utilisation répandue est due aux caractéristiques uniques de l’ADNmt qui le rendent particulièrement utile. Ces caractéristiques incluent un grand nombre de copie, sa transmission maternelle, l’absence de recombinaison et son taux de mutation plus élevé que celui de l'ADN nucléaire.

IV.2.4.1 Grand nombre de copies : L’ADNmt est présent en un grand nombre de copies dans les cellules humaines. Contrairement à l'ADN nucléaire, il y a environ 200 à 1700 copies d'ADN mitochondrial (ADNmt) dans chaque cellule somatique et plusieurs dans chaque mitochondrie (Holand et Parsons 1999). Cette propriété ajoutée à l’emplacement cytoplasmique et extranucléaire de l’ADNmt rend ce dernier plus facile à obtenir et à analyser. De ce fait, suite à la mort cellulaire, il est plus probable de mettre en évidence une information issue de l'ADNmt, que celle contenue dans l'ADN nucléaire. Ainsi, l’ADNmt est la molécule de choix dans l’étude de l’ADN ancien et dans certaines applications génétique en médecine légale et en criminalistique (Pakendorf et Stoneking 2005). À de rare exceptions, les molécules de l’ADNmt chez un même individu peuvent différer. Ceci est du aux mutations qui peuvent affecter certaines copies de l’ADNmt et pas d’autres : indiquant une hétéroplasmie. Une étude récente estime que 14 % de la population ont un second type d’ADNmt présent à une fréquence d'au moins 1 % (Tully et al. 2000).

IV.2.4.2 Transmission maternelle : L’ADN mitochondrial suit une hérédité cytoplasmique. Ainsi, le génome mitochondrial paternel ne participe pas au patrimoine génétique de l’embryon pour deux raisons : 1) le flagelle, qui contient la plupart des mitochondries du spermatozoïde, ne pénètre pas dans l’ovocyte lors de la fécondation ; 2) le peu de mitochondries du spermatozoïde qui y parvient est rapidement dégradé. Par conséquent, chaque individu hérite du patrimoine génétique mitochondrial de sa mère, qui elle-même l’a reçu de sa mère, etc. Ce mode de transmission de l'ADNmt, exclusivement maternel, constitue un grand avantage, permettant aux chercheurs de suivre les lignées maternelles au fil des générations, et de mettre en évidence l’ancêtre maternel d'une population (Manfredi et al. 1997 ; Giles et al. 1980).

49 EXPOSÉ BIBLIOGRAPHIQUE

IV.2.4.3 Absence de recombinaison : Une autre caractéristique de l’ADN mitochondrial est l’absence de recombinaison (Olivio et al. 1983). Etant donné que le génome mitochondrial est haploïde, aucune recombinaison par crossing-over n’intervient lors de la méiose, contrairement aux chromosomes autosomaux. Toutefois, quatre publications scientifiques ont exposé la preuve de l’existence de la recombinaison dans l’ADNmt humain (Awadalla et al. 1999; Eyre-Walker et al. 1999; Hagelberg et al. 1999; Awadalla et al. 2000). Ces études ont été fortement critiquées et des arguments contredisants ont été proposées (Arctander 1999; Macaulay et al. 1999a; Merriwether et Kaestle 1999; Jorde et Bamshad 2000; Kumar et al. 2000; Parsons et Irwin 2000). La recombinaison entre l’ADNmt maternel et paternel peut exister, mais ceci dans des cas extrêmement rares (Pakendorf et Stoneking 2005).

IV.2.4.4 Taux de mutation : Le taux de mutation des séquences de l'ADNmt est de 6 à 17 fois supérieur à celui des séquences d'ADN nucléaire (Wallace et al. 1995). Il est du, d’une part, à l’absence de protéines protectrices (les histones), au manque de fidélité de la réplication et à la défaillance du système de réparation des erreurs commises par l’ADN polymérase mitochondriale (Croteau et al. 1999). Et d’autre part, l’ADNmt est constamment exposé aux radicaux oxygénés (ROS : Recative Oxygen Species) libérés dans la matrice de la mitochondrie (Genova et al. 2004). De plus, comme pour l’ADN nucléaire, les parties non-codantes de l’ADN mitochondrial, exemptes de toute pression de sélection, mutent rapidement et par conséquent, sont très polymorphes. Le taux de mutation n’est pas le même sur tout le génome mitochondrial. En dehors de la région contrôle, il est estimé à 0.017 × 10−6 à 1.46 × 10−6 substitutions/site/an (Ingman et al. 2000; Howell et al. 2003). Par ailleurs, dans la région contrôle, le taux de mutation est très hétérogène. Ceci du à la présence de sites appelés « points chauds » pour lesquels les mutations sont quatre à cinq fois plus fréquentes. (Hasegawa et al. 1993; Wakely 1993; Excoffier et Yang 1999; Meyer et al. 1999; Heyer et al. 2001). La très grande variabilité des deux régions (HVS-I et HVS-II) a permis leur usage dans l’identification individuelle puisqu'il est possible d'exclure un lien de parenté par lignées maternelles entre deux individus avec une probabilité de succès de plus de 99% (Piercy et al. 1993). Inversement, si un même profil génétique est observé entre plusieurs individus de populations différentes, il est donc probable que ces deux populations aient été liées par le passé, ou que le profil génétique en question ait été introduit d'une population à l'autre. La

50 EXPOSÉ BIBLIOGRAPHIQUE région de contrôle peut donc, dans un deuxième temps, servir de traceur hautement informatif des mouvements des populations (Mazières 2006).

IV.2.5 Analyse phylogénétique de l’ADN mitochondrial : La méthode d’analyse de l’ADNmt la plus répandue consiste en l'amplification par PCR puis le séquençage d'environ 610 pb correspondant aux régions hypervariables I et II (HVS-I et HVS-II). Toutefois, l'analyse de la région codante augmente le pouvoir discriminant de l'ADNmt (Coble et al. 2004 ; Vallone et al. 2004; Divne et Allen, 2005 ; Niederstatter et al. 2006). La détermination des variations génétiques des séquences de l’ADNmt est effectuée par comparaison avec la séquence rCRS. L’ensemble des polymorphismes détectés est transmis en bloc d’une génération à une autre et représente un haplotype. La comparaison des haplotypes mitochondriaux permet d’identifier ceux qui partagent des mutations en commun, dérivant d’une même séquence ancestrale. Dans ce cas, ils sont associés phylogénétiquement et décrivent un haplogroupe précis qui définit une lignée féminine à l’échelle d’une population. Les différents haplogroupes reflètent la généalogie partagée des ADN mitochondriaux et peuvent être utiles, d’une part, pour évaluer les proportions du mélange dans des populations habitants les routes de migration connues et d’autre part, de considérer les flux géniques entre différentes populations éloignées géographiquement (Pakendorf et Stoneking 2005).

IV.2.5.1 Construction de l’arbre phylogénétique de l’ADNmt: En 1980, l'étude pionnière de Brown sur 21 individus de diverses ethnies et régions géographiques a indiqué que le polymorphisme de longueur des fragments de restriction (RFLP) de l’ADNmt pourrait être utilisé pour tracer l'histoire génétique humaine (Brown 1980). L’arbre phylogénétique de l’ADNmt humain a été établi en 1987 (Cann 1987). Durant le début des années 1990, en parallèle avec les études abordant l'origine d'Homo sapiens, les analyses de l’ADNmt avaient commencé à être appliquées sur un grand nombre d’individus de différents continents. L’objectif était de déterminer des origines humaines dans chaque zone géographique majeure. Par ailleurs, ces études ont permis de déterminer des combinaisons de polymorphismes à haute résolution, aboutissant à une meilleure vision de la phylogénie mondiale de l’ADNmt. Les premiers haplogroupes mitochondriaux, découverts chez les natifs Américains ont été nommés par ordre alphabétique A, B, C et D (Torroni et al. 1993). Plus tard, d’autres

51 EXPOSÉ BIBLIOGRAPHIQUE haplogroupes ont été détectés et désignés par d’autres lettres de l’alphabet, et des règles cladistiques ont été explicitement établies, pour l'ordre hiérarchique des haplogroupes et sous-haplogroupes (ou sous-groupes) (Richards et al. 1998). Les mêmes principes ont été, ultérieurement, appliqués à la nomenclature de l'arbre phylogénétique du chromosome Y (The Y Chromosome Consortium, 2002). Cependant, la nomenclature de l’ADNmt n’est pas aussi cohérente (Figure 12) que celle du chromosome Y. En effet, certaines branches dérivant un même clade monophylétique ont reçues des désignations différentes (ex. les haplogroupes : N9, Y1b et Y2), et le même nom a été donné à des haplogroupes de clade paraphylétique (ex. haplogroupe L) (Pakendorf et Stoneking 2005).

Ces dernières années, de nouvelles techniques sont utilisées dans l’analyse de l’ADNmt permettant une identification rapide d’un grand nombre de SNPs, telles que les techniques multiplex SNaPshot et l’utilisation des puces à ADN. Mais avec le développement des techniques de séquençage de nouvelle génération, il est devenu plus commun de séquencer le génome mitochondrial entier dans les études de populations (Pakendorf et Stoneking 2005). Jusqu'au 19 Février 2014, date de la dernière mise à jour, 20666 séquences entières de l’ADNmt sont disponibles sur le site web : http://www.phylotree.org.

Figure 12 : Phylogénie de l’ADN mitochondrial simplifié, illustrant la nomenclature des haplogroupes par les lettres de l’alphabet (van Oven et Kayser 2009) (L’étoile au sommet de l’arbre désigne l’ancêtre matrilinéal le plus récent)

52 EXPOSÉ BIBLIOGRAPHIQUE

IV.2.5.2 Théorie de l’Ève mitochondriale : Grâce à la comparaison de l’ADNmt d’un grand nombre d’individus, originaires des cinq continents, Cann et ses collaborateurs de l’Université de Berkeley avaient conclus, en 1987, que l’ADNmt témoigne d’une origine africaine commune et récente de l’homme moderne, datant d’il y a environ 150 000 à 200 000 ans (Cann et al. 1987 ; Quintana-Murci et al. 1999). Cette publication a suscité de nombreuses réactions de par ses conclusions et leurs implications qui reposaient sur une mauvaise compréhension. En effet, la presse publique lui a donné le nom de la théorie de «l’Ève Africaine» ou « l’Ève mitochondriale ». Ceci a induit certains à assimiler l’ancêtre commun des lignées maternelles à une mère unique de la population mondiale. Ce qui n’est pas le cas car la généalogie des individus n’est pas celle des gènes. Tout ce que peut montrer une généalogie de gènes est que dans une population donnée les gènes homologues semblables ou avec des différences mineures entre les individus sont tous issus d’une seule et unique copie présente à une certaine époque. La théorie de l’Ève mitochondriale fut reprise dans le livre connu du professeur d’Oxford. Les Sept filles d’Ève (en anglais : The Seven Daughters of Eve) décrit sept lignées d’ADNmt aboutissant à sept femmes originelles, poétiquement baptisées Ursula (Grèce), Xénia (Caucase), Héléna (Pyrénées), Velda (Cantabrie), Tara (Toscane), Katrine (Vénétie) et Jasmine (Syrie). La théorie de « l’Ève mitochondriale » est proche de la théorie « Out of Africa » qui a également soulevé des objections et des polémiques. Néanmoins, la plupart des données génétiques situent la racine de l’arbre phylogénétique humain en Afrique. Ainsi, les hommes modernes se répandirent dans le monde, à partir de l’Afrique, par deux routes de sortie proposées: (1) une route du nord, atteignant l'ouest et le centre de l'Asie par la Péninsule du Sinaï (Egypte) à travers le Moyen- Orient et ; (2) une route du sud à partir de l’Ethiopie et à travers Bab el-Mandeb (le Détroit séparant Djibouti et le Yémen) vers le long de la côte asiatique sud, atteignant l'Australie (Nei et Roychoudhury 1993; Cavalli-Sforza et al. 1994; Foley et Lahr 1997). Cette dernière hypothèse reste la plus probable et la plus soutenue par la communauté scientifique. En effet, les premières datations du peuplement du sud-ouest de l’Asie, il y a environ 50 000 ans, et de l’Australie, il y a environ 48 000 ans, combiné à la distribution des lignées de l’ADNmt suggèrent que la route côtière sud à travers l’Arabie est la sortie majeur de l’Afrique durant le dernier Pléistocène. Néanmoins, les datations des haplogroupes mitochondriaux restent encore très controversées (Soares et al. 2012).

53 EXPOSÉ BIBLIOGRAPHIQUE

IV.2.5.3 Phylogénie et distribution géographique des haplogroupes l’ADNmt:

Les branches de l’arbre phylogénétique de l’ADNmt correspondent aux haplogroupes mitochondriaux qui ont tendance à montrer une spécificité régionale (Figure 13). Il existe plus de 25 macro-haplogroupes mitochondriaux et de nombreux sous-haplogroupes dont la répartition géographique actuelle est le reflet des mouvements de populations féminines au cours du temps. Ainsi, le macro-haplogroupe L avec ses sous-groupes L1, L2 et L3 sont limités à l’Afrique (Salas et al. 2002), tandis que les macro-haplogroupes M et N (lignées ancestrales), originaires de l’est de l’Afrique et formés à partir de l’haplogroupe L3, sont dispersés en Eurasie, en Amérique et en Océanie (Quintana-Murci et al. 1999; Mishmar et al. 2003). Les haplogroupes H, I, J, K, N, T, U, V, W et X, incluent les variants mitochondriaux des populations européennes, nord africaines, et de l’Asie de l’Ouest. Enfin, les haplogroupes A, B, C, D, E, F et G réunissent la majorité des haplotypes de l’Asie, de l’Océanie et des natifs américains (Torroni et al. 1996; Maca-Meyer et al. 2003a; Mishmar et al. 2003; Reidla et al. 2003; Olivieri et al. 2006).

Asia Simplified mtDNA lineages E www.mitomap.org, 2012 D B G = rCRS C (GenBank NC_012920) F Q P Z

Y M T S O J A JT

H HV R N L3

Europe U Africa V I W L* (L0, L1, L2, L4, L5, L6) X K

This is licensed by a Creative Commons Attribution 3.0 license. Figure 13 : Distribution continentale des haplogroupes de l’ADN mitochondrial simplifié (www.mitomap.org, Novembre 2012)

54 EXPOSÉ BIBLIOGRAPHIQUE a) Les premiers embranchements de l’arbre phylogénétique mitochondrial : La racine de l’arbre phylogénétique de l’ADNmt humain date de 192 000 ans et se divise en deux branches majeures L0 et L1’2’3’4’5’6 (L1’6) (Torroni et al. 2006; Soares et al. 2009). Cette datation semble cohérente avec celle des nouveaux fossiles de l’homme anatomiquement moderne trouvés en Afrique de l’Est (Oppenheimer 2012). L’haplogroupe L0 est caractéristique des populations du sud de l'Afrique, particulièrement celles parlant le Khoisan ou le Bantu (tel que les Pygmées12) (Behar et al. 2008a; Batini et al. 2011a). La branche L1’6, la plus répandue, a donné naissance à toutes les lignées de l’ADNmt trouvées aujourd'hui. L’expansion de l’homme anatomiquement moderne de leur terre d’origine, suggérée être l’est de l’Afrique, a permis la distribution génétique précoce de l’haplogroupe L1 à travers la plupart du continent africain. Ce dernier a été submergé plus tard par une vague d'expansion de L2 et L3 daté entre 60 000 et 80 000 ans B.P. (Before Present ) (Forster 2004). b) L’haplogroupe L3 et la théorie « Out of Africa » : L’haplogroupe L3, originaire de l’Afrique de l’Est, est subdivisé en deux branches majeures M et N. Elles forment la plus grande partie de la diversité génétique non-africaine mondiale, marquant l’expansion « Out of Africa ». L’expansion de l’haplogroupe L3 date d’il y a environ 60 000 à 70 000 ans, incluant sa dispersion en Afrique (Figure 14) (Salas et al. 2002; Torroni et al. 2006; Soares et al. 2012). Cependant, cette datation semble en désaccord avec l’hypothèse d’une sortie « Out of Africa » juste avant l’éruption du supervolcan de Toba à Sumatra (Indonésie), il y a environ 74 000 ans. Ce dernier a crée un goulot d’étranglement des populations humaines qui ont frôlé l’extinction (Soares et al. 2012). Par ailleurs, le temps à l’ancêtre commun le plus récent (TMRCA : Time to Most Recent Commun Ancestor) des lignées L3, M et N et leurs dérivés est de (94.3 6 ± 9.9 kya « kilo years ago »). Ce qui correspond, approximativement, à la moitié du TMRCA de tous les humains modernes (194.36 ± 32.55 kya). Ceci supporte le modèle proposant que l’homme moderne a vécu en Afrique pendant longtemps avant son exode vers d’autres régions du monde (Penny et al. 1995).

12 Les Pygmées sont des chasseurs-cueilleurs qui vivent dans la forêt centrafricaine et qui parlent la langue Bantu.

55 EXPOSÉ BIBLIOGRAPHIQUE

Figure 14 : Les grandes migrations des haplogroupes majeurs de l’ADN mitochondrial (www.mitomap.org, Mars 2013)

c) Les macro-haplogroupes M et N : Les haplogroupes M et N ont une codistribution répandue à l’extérieur de l’Afrique et leur origine sud asiatique est fortement soutenue puisque les fréquences les plus élevées y sont observées. Notamment l’haplogroupe N qui présente les branches les plus basales au sud de l’Asie (Oppenheimer 2012).

L’haplogroupe M est plus jeune au sud de l’Asie, précisément en Inde où il date de 49 400 ans, mais avec une distribution prédominante à l’est ou il a été daté à 60 000 ans (Oppenheimer 2002; 2003; Metspalu et al. 2004). Il est subdivisé en 6 sous-haplogroupes trouvés exclusivement en Asie Q, G, E, D, C et Z. Cependant, le grand débat concernant l’origine de l’haplogroupe M, est liée à son sous-haplogroupe M1, qui est son seul variant trouvé en Afrique (Metspalu et al. 2004).

L’haplogroupe N a donc une origine sud asiatique avec une distribution prédominante à l’ouest (l’endroit le plus proche de l’Afrique). Il a été daté entre 50 000 et 65 000 ans à l’Ouest Eurasien et 71 200 ans en Arabie (Soares et al. 2009). Il est le seul macro- haplogroupe représenté au Proche Orient et en Europe, certes moins diversifié mais plus

56 EXPOSÉ BIBLIOGRAPHIQUE dérivé et plus jeune que celui trouvé au sud de l’Asie. La présence de ses variants en Afrique (Ethiopie), datant d’il y a 12 600 à 14 400 ans, suggère une migration retour au continent africain. Après son arrivée en Asie, l’haplogroupe N a presque immédiatement divergé pour donner naissance à l’haplogroupe R (Torroni et al. 2006). Les expansions vers le nord, à partir de l’Arabie, des haplogroupes majeurs M, N et R sont arrivées plus tard, il y a 45 000 ans à 50 000 ans, quand les conditions climatiques ont permis l'exploration de l'intérieur de l'Eurasie (Torroni et al. 2006; Soares et al. 2010). La subdivision de l’haplogroupe N est résumée dans la figure 15. La plupart des lignées mitochondriales européennes dérivent des trois branches de l’haplogroupe R ; la branche R0 (précédemment appelé pre-HV), JT et U, qui semblent être déjà présents à la fin du paléolithique, pour la plupart, par leurs sous-embranchements majeurs (Torroni et al. 2006).

Figure 15: Phylogénie basale des haplogroupes mitochondriaux européens (Torroni et al. 2006)

• L’haplogroupe R0 et son sous-groupe HV semblent être originaires de l’Eurasie. Ils sont prédominant au Proche et Moyen Orient et chez les Caucases (Loogväli et al. 2004). L’haplogroupe HV est ancestrale à deux haplogroupes majoritaires en Europe H et V.

• Les haplogroupes JT : L'haplogroupe J est l'un des plus vieux haplogroupes mitochondriaux (45 000 ans B.P.) en Europe et au Moyen-Orient d’où il tire ses origines. Il est généralement associé à la propagation de l'agriculture durant le néolithique.

57 EXPOSÉ BIBLIOGRAPHIQUE

L'haplogroupe T pourrait avoir son origine du Moyen Orient ou du nord-est de l'Afrique, il y a au moins 12 000 ans. On le trouve en Europe, au nord-est de l'Afrique et à l’ouest de l’Asie.

• L'haplogroupe U est extrêmement ancien. Il est apparu il y a 60 000 ans à la limite du nord-est de l'Afrique et du Moyen Orient, peu après que les premiers Homo sapiens se soient aventurés hors de l'Afrique. C'est pourquoi chacun de ses sous-groupes principaux peuvent être caractéristiques d’une population ancestrale. Le sous-groupe U1 est surtout présent au Moyen-Orient, U5 en Europe, U6 en Afrique du Nord, U7 au Proche-Orient et surtout en Inde, et les rares U9 se retrouvent entre l'Éthiopie, la Péninsule Arabe et le Pakistan. L’haplogroupe K, qui est le principal sous-groupe de U8, est trouvé dans toute l'Europe et l'Asie occidentale.

IV.2.6 ADN mitochondrial et archéogénétique (ou paléogénétique) : L’archéogénétique, c’est-à-dire l’étude de l’ADN ancien préservé dans les restes biologiques (fossiles), est une science archéologique relativement jeune dont l’apport à l’interprétation des sites archéologiques devient incontournable (Amorim 1999 ; Renfrew 2000). L’analyse génétique des restes biologiques contribue de manière importante à l’élucidation des migrations d’humains et d’animaux et de la domestication des plantes et d’animaux. Elle permet, également, la caractérisation de la structure des sociétés préhistoriques. Ceci à travers la détermination du sexe et des relations de parenté entre les sépultures, ou encore de l’identification de certains agents pathogènes et donc de certaines maladies. Cependant, l’analyse de l’ADN ancien se heurte à deux difficultés majeures : • L’ADN se dégrade après la mort de l’individu sous l’effet d’enzymes endonucléases. Ainsi, la partie du génome la plus adaptée à ce type d’exploration est l’ADNmt car il en existe de nombreuses copies par cellule (contre un seul ADN nucléaire) et il démontre une grande résistance aux attaques du temps. • L’ADN « moderne » qui constitue une source de contamination par le biais d’êtres vivants du milieu extérieur ayant entretenu un contact avec le spécimen (y compris et surtout les chercheurs !). Des critères très stricts sont requis pour le prélèvement d’un échantillon (microforage au cœur de l’os, recueil de la pulpe dentaire) et pour l’environnement au laboratoire (conditions de stérilité maximum). De plus, des contrôles sont nécessaires sur les résultats obtenus (Bauduer 2013).

58 EXPOSÉ BIBLIOGRAPHIQUE

IV.2.7 ADN mitochondrial et sciences génétiques médico-légales et criminalistiques : L’étude de l’ADNmt s’est avérée très utile en médecine légale et en criminalistique, notamment quand l’investigation de l’ADN nucléaire échoue à cause de la dégradation et la faible quantité du matériel biologique, ce qui est souvent le cas (Wilson et al. 1995). C’est ainsi qu’il était possible d'identifier de nombreux restes non déterminés, comme des victimes de la guerre du Vietnam, des victimes d'affaires criminelles ou des victimes de catastrophes naturelles comme le Tsunami. De même, grâce à l’analyse de l’ADNmt, des énigmes de l’histoire ont pu être résolues, tels que l’identification des restes de la famille Romanov, derniers Tsars de Russie disparus en 1918 et découverts en 1991 (Holland et al. 1993; Gill et al. 1994 ; Lutz et al. 1996; Bender et al. 2000; Deng et al. 2005).

En génétique médico-légale, c’est le séquençage des fragments HVS-I et HVS-II de la région contrôle de l’ADN mitochondrial qui se fait en routine. Cependant, des travaux récents proposent l’analyse de certaines régions codantes de l’ADNmt afin d’accroître la discrimination entre les spécimens analysés. Des bases de données regroupant des séquences d’ADNmt de différentes populations humaines ont été élaborées dans le but d’augmenter le succès dans la résolution des affaires. Parmi ces bases de données, nous citerons celles du FBI (Federal Bureau of Investigation –USA) et de l’AFDIL (Armed Forces DNA Identification Laboratory-USA) aux États Unis d’Amérique. Ainsi que la EMPOP (the European Mitochondrial DNA POPulation database) élaborée par l’institut de médecine légale d’Innsbruck en Autriche (Nilsson et al. 2008; Parson et al. 2008).

IV.2.8 ADN mitochondrial et pathologies humaines: L'ADN mitochondrial est vulnérable au stress oxydatif et aux dérivés oxygénés: ROS (Reactive Oxygen Species) produit au cours des réactions de la phosphorylation oxydative. Il s’agit d’un cercle vicieux dans lequel les ROS induisent une augmentation des mutations mitochondriales ce qui altère le transfert des électrons au niveau de la mitochondrie et augmente par conséquent la production des ROS, et ainsi de suite. Les mutations affectant l’ADNmt et/ou l’ADN nucléaire entraînent un changement dans l'activité des enzymes mitochondriales et donc un déficit de la phosphorylation oxydative et de la respiration cellulaire ce qui donne naissance à des pathologies: les cytopathies mitochondriales et certaines maladies multifactorielles (Cohen et Gold 2001; Chan 2006; Sperl et al. 2006).

59 EXPOSÉ BIBLIOGRAPHIQUE

- Les cytopathies mitochondriales: Les cytopathies mitochondriales touchent environ 2,5 personnes sur 10 000. Elles sont caractérisées par un dysfonctionnement de la chaîne respiratoire mitochondriale et se traduisent par un déficit énergétique. Ces pathologies peuvent survenir à n'importe quel âge et peuvent concerner n’importe quel tissu ou organe (neuromusculaire, neurosensorielle, hépatique, cardiaque, rénale…). Les mutations ponctuelles de l’ADNmt sont retrouvées chez 10 à 15 % des patients atteints de maladies mitochondriales et sont presque toujours à l'état hétéroplasmique (Chabrol et al. 2011). L’identification des mutations responsables est importante pour le diagnostic mais également pour le conseil génétique et le diagnostic prénatal. - ADN mitochondrial et maladies multifactorielles: Les désordres mitochondriaux peuvent être impliqués dans plusieurs pathologies humaines, telles que les maladies neuro-dégénératives : Alzheimer (Wirz et al. 2014), Parkinson (Lin et al. 2012), les myopathies, les ischémies cardiaques et cérébrales, les maladies métaboliques, les cancers, la surdité et le vieillissement, en voici quelques exemples : - Trois mutations (A3243G, T14709C et A8296G), localisées au niveau de gènes mitochondriaux de l’ARNt, ont été associées au diabète de type MIDD (Maternally Inherited Diabetes and Deafness). De plus, il a été montré qu’un dysfonctionnement mitochondrial, réduisant l’oxydation des acides gras, inhibe chez les patients atteints de diabète de type II, le transport du glucose au niveau des muscles (Vialettes et al. 1997; Kameoka et al. 1998; Lowell et Shulman 2005). - Le rôle de la mitochondrie dans la formation des tumeurs a été évoqué depuis plus d’une cinquantaine d’années. La littérature est riche en travaux décrivant des mutations et des haplogroupes mitochondriaux associées à de nombreux cancers. L’haplogroupe N caractérisé par le polymorphisme G10398A représente un facteur de risque pour le cancer du sein et l’œsophage. L’haplogroupe U chez les Nord-Américains Caucasiens a été décrit comme à haut risque pour le cancer de la prostate. L’haplogroupe D, plus spécifiquement D4a et D5a prédisposent génétiquement au cancer de l’œsophage dans la population chinoise (Booker et al. 2006 ; Darvishi et al. 2007; Li et al. 2007).

Au final, l’ADNmt est une molécule de plus en plus attractive pour les chercheurs. Son rôle dans les maladies monogéniques a été démontré et son implication dans les maladies multifactorielles sera progressivement élucidée.

60 EXPOSÉ BIBLIOGRAPHIQUE

IV.3 Le chromosome Y :

Le deuxième marqueur anthropogénétique uniparental est le chromosome Y. Il présente des particularités et avantages qui le rendent un outil incontournable dans les études d’évolution et de migrations humaines, de l’histoire et la généalogie familiale, ainsi que dans les analyses génétique médico-légale qui se basent sur les études génétiques des populations humaines.

IV.3.1 Propriétés du chromosome Y :

Le chromosome Y, l'un des deux chromosomes sexuels, est un chromosome particulier dans le caryotype humain car il est le seul qui soit constitutionnellement présent en un seul exemplaire et qui ne soit pas indispensable à la vie. Cependant, il est nécessaire à la survie de l’espèce puisqu’il est impliqué dans les deux mécanismes fondamentaux du déterminisme testiculaire et de la production des spermatozoïdes, indispensables à la reproduction humaine. Il s’agit d’un petit chromosome représentant de 1,5 à 2% de l'ADN total des cellules. Il est long de 57 701 691pb et renferme 156 unités de transcription, dont 78 gènes codants (Figure 16). Malgré son état haploïde, les deux "Régions Pseudo-Autosomiques", PAR1 et PAR2 du chromosome Y permettent l'appariement des deux chromosomes X et Y lors de la première phase de la méiose, au cours de laquelle a lieu le processus de recombinaison homologue. La région située entre les deux PARs est appelée MSY (Male Specific Y chromosome), précédemment NRY (Non Recombining Y chromosome). Elle représente 95% de la longueur de l'Y et ne recombine jamais avec le chromosome X (Skaletsky et al. 2003). Tous les gènes de cette région non-recombinante sont par conséquent en déséquilibre de liaison et sont intégralement transmis par le père. Par cette propriété, le génome du chromosome Y est l’équivalent masculin de l’ADN mitochondrial.

Figure 16 : Structure et organisation du chromosome Y

61 EXPOSÉ BIBLIOGRAPHIQUE

IV.3.2 Avantages de l’analyse du chromosome Y: L'étude du chromosome Y présente trois avantages principaux: une large région non recombinante (MSY), la spécificité de l'ADN masculin lors de l'analyse de mélanges d'ADN et la possibilité de suivre les lignées paternelles. En effet, la région spécifique au mâle du chromosome Y (MSY) est caractérisée par les plus faibles taux de la diversité des séquences du génome humain (comparé aux chromosomes autosomiques et au chromosome X), et par son faible taux de mutation (comparé à l’ADNmt). Outre dans les recherches médicales comme celles portant sur l'origine de l'infertilité masculine, le chromosome Y est devenu une ressource puissante dans différentes applications, tel que: • L'analyse criminalistique d'indices dans le cadre d'agressions sexuelles en permettant l'amplification spécifique de l'ADN masculin. Ceci permet d’éviter les extractions différentielles pour séparer les spermatozoïdes des cellules épithéliales ainsi que le masquage du profil génétique masculin par le profil féminin (Sibille et al. 2002; Parson et al. 2003) ; • La recherche de personnes disparues pour lesquelles tout parent en lignée paternelle peut être utilisé comme échantillon de référence (Dettlaff-Kakol et Pawlowski 2002; Koyama et al. 2002) ; • Les tests de paternité déficients pour relier les enfants masculins à une lignée paternelle (Santos et al. 1993; Jobling et al. 1997; Rolf et al. 2001); • Les études d'évolution et de migrations humaines, car l'absence de recombinaison dans la MSY permet la comparaison d'individus masculins séparés par de longues périodes de temps (Ke et al. 2001; Underhill et al. 2001) ; • Les recherches historiques ou généalogiques, puisque dans la majorité des sociétés le nom de famille se transmet de père en fils (Foster et al. 1998; Sykes et Irven 2000; Jobling 2001).

IV.3.3 Marqueurs polymorphes du chromosome Y : La partie non recombinante du chromosome Y porte deux catégories de marqueurs polymorphes permettant d’étudier la diversité du chromosome Y : les marqueurs bialléliques déterminants des haplogroupes et les marqueurs multialléliques déterminants les haplotypes (de Knijff 2000).

62 EXPOSÉ BIBLIOGRAPHIQUE

IV.3.3.1 Polymorphismes bialléliques du chromosome Y : Les polymorphismes bialléliques du chromosome Y ont une évolution lente et sont représentés par les insertions d’éléments Alu (YAP : Y-Alu polymorphism) et les SNPs (Single Nucleotide Polymorphisms).

Ø Polymorphisme YAP : Cette insertion Alu correspond au premier marqueur biallélique du chromosome Y décrit (Hammer 1994). Sa présence ou absence peut être aisément mise en évidence par PCR (Batzer et al. 1994; Hammer 1994; Kass et al. 1994). Ce polymorphisme est très utile dans les études de génétique de population, car la probabilité de rétrotransposition indépendante, dans le même site chromosomique, est virtuellement nulle (Batzer et Deininger 1991). Par conséquent, tous les loci portant une insertion Alu polymorphique particulière dérivent d'un seul événement et sont donc identiques par descendance (Batzer et al. 1994).

Ø Polymorphismes SNPs : Les premières analyses des SNPs du chromosome Y utilisaient la chromatographie liquide à haute pression en condition dénaturante (DHPLC) par le groupe de Underhill (Underhill et al. 1997; Underhill et al. 2000). Ces SNPs correspondent à deux versions possible dans une séquence d’ADN: ancestral et dérivée. Leurs très faible taux de mutation (~10-8 par génération) permet de considérer que la survenue d’un tel évènement est unique dans l'évolution de l'espèce humaine, ils sont alors appelés UEPs (Unique-Event Polymorphisms) (Thomas et al. 2000). Suite au développement des techniques de biologie moléculaire, un grand nombre de SNP a été identifié dans la MSY. Ils ont permit la construction d'un arbre phylogénétique liant toutes les lignées du chromosome Y des populations du monde. Ces lignées paternelles sont définies par une combinaison d’allèles SNPs informatifs forment des haplogroupes et sous-haplogroupes.Il en existe plus de 311 qui se basent sur plus de 600 marqueurs bialléliques (The Y Chromosome Consortium 2002; Jobling et Tyler-Smith 2003; Karafet et al. 2008). Les différents haplogroupes ne changent que par mutation ponctuelle et permettent de remonter l'histoire d'un chromosome Y avec une assez grande précision et d'appréhender l'histoire biologique des lignées paternelles des populations humaines. Leurs fréquences varient selon les origines ethniques et géographiques (Underhill et al. 2000; The Y Chromosome Consortium 2002).

63 EXPOSÉ BIBLIOGRAPHIQUE

IV.3.3.2 Marqueurs multialléliques du chromosome Y : Les marqueurs multialléliques du chromosome Y les plus utilisés sont les microsatellites, appelées Y-STRs pour (Y chromosome Short Tandem Repeats). Le premier microsatellite polymorphique du chromosome Y, aujourd'hui nommé DYS19, a été décrit en 1992 (Roewer et Epplen 1992). En l’an 2000, lorsque le domaine de généalogie génétique est né, il y avait seulement environ 20 marqueurs Y-STRs connus (Butler 2003). Depuis, plus de 400 Y-STRs ont été caractérisés (Redd et al. 2002; Kayser et al. 2004; Hanson et Ballantyne, 2006). Toutefois, seulement 120 Y-STRs sont assez polymorphes pour être utiles dans les applications médico-légales ou en phylogénétique. Les marqueurs Y-STRs sont d’évolution lente et permettent de différencier les haplotypes du chromosome Y avec une grande résolution. Ceci est du à leur taux de mutation élevée (~ 10-3 par génération), supérieur de 4 à 5 à celui des SNPs (Kayser et al. 2000; Dupuy et al. 2004).

Ø Nomenclature des Y-STRs: La société internationale de génétique médico-légale ISFG (International Society for Forensic Genetics) est le leader reconnu qui établi les directives standardisées de la nomenclature des Y-STRs (Butler 2005). La plupart des marqueur Y-STRs sont représentés par DYS (DNA Y chromosome Segment) + un numéro (exemple: DYS 393). De plus, chaque allèle est désigné par le nombre de répétitions du motif (c’est à dire la séquence répétée). Un ensemble d’allèles de différents STRs est appelé haplotype.

Ø Bases de données des Y-STRs : La distribution des haplotypes Y-STRs dans les populations du monde entier est rendue disponible à grande échelle par différentes publications et par l'élaboration d'un grand nombre de bases de données (Gusmao et Carracedo 2003). La plus large base de données des haplotypes Y-STRs utilisée en génétique médico-légale a été crée en 2000 par Lutz Roewer et ses collègues de l’Université Humbolt à Berlin, Allemagne: The Y chromosome Haplotype Reference Database YHRD (www.yhrd.org). Elle héberge approximativement 115 000 haplotypes de 850 populations. Le développement de ces bases de données est important non seulement pour l'évaluation des fréquences haplotypiques et des calculs de probabilité de concordance dans les analyses génétique médico-légales, mais aussi pour l'analyse comparative des populations (Roewer et al. 2001; Gusmao et Carracedo, 2003; Willuweit et Roewer 2007; Roewer et al. 2013).

64 EXPOSÉ BIBLIOGRAPHIQUE

IV.3.3.3 Pourquoi analyser les Y-SNPs et Y-STRs? Dans l’analyse du chromosome Y, les marqueurs STRs offrent plus d’avantages en coût et en temps, comparés aux marqueurs SNPs. En raison de la disparité des taux de mutation entre SNP et STR, un SNP désignant un haplogroupe pourrait en réalité inclure plus d’un haplotype STR (Wang et al. 2010). Il est donc très intéressant de remarquer que la variabilité des STRs est plus importante par haplogroupe que par population (Bosch et al. 1999; Behar et al. 2004). Ainsi, les haplotypes STRs pourrait être utilisés pour déduire l’haplogroupe d'un chromosome Y. En effet, en absence des données SNPs, la prédiction d’un haplogroupe à partir d’un haplotype STR est une stratégie qui a suscité beaucoup d’intérêt et différents logiciels et méthodes de prédiction des haplogroupes ont été élaborés. Bien que cette approche soit correcte en principe, les débats restent toujours en cours quant ‘au choix des Y-STRs informatifs et la fiabilité de la prédiction. En effet, il est possible de trouver le même ou semblable haplotype au sein de différents haplogroupes (Muzzio 2011). Néanmoins, ces méthodes ont un apport non négligeable puisqu’elles permettent une première étape effective dans l’identification des haplogroupes, en ciblant les SNPs à tester. Enfin, l’analyse des SNPs reste la seule méthode fiable qui permet de déterminer avec exactitude les haplogroupes du chromosome Y (Wang et al. 2010). La détermination des haplotypes STRs est plus utilisée dans les analyses de génétique médico-légale et les tests de paternité mais elle permet, également, de déduire les affinités entre les populations étroitement liées en génétique des populations (Schlecht et al. 2008).

IV.3.4 Analyse phylogénétique du chromosome Y: La résolution de l'arbre phylogénétique MSY a été significativement augmentée cette dernière décennie suite aux avancées technologiques en biologie moléculaire. De récentes études se basent même sur le séquençage entier du chromosome Y. La nomenclature originale de l’arbre phylogénétique du chromosome Y établie en 2002, comptait 18 haplogroupes majeurs nommés de A à R (The Y Chromosome Consortium 2002). En 2008, Karafet et ses collaborateurs l’ont actualisée regroupant 20 haplogroupes majeurs nommés de A à T (Karafet et al. 2008). Chaque haplogroupe (ou clade) est subdivisé en plusieurs sous- haplogroupes (sous-clade/ sous-groupe). En 2014, une analyse basée sur les données les plus récentes a redéfinie les relations phylogénétiques basiques entre les haplogroupes du chromosome Y (Figure 17) (van Oven et al. 2014).

65 EXPOSÉ BIBLIOGRAPHIQUE

Ø Nomenclature des haplogroupes, sous-haplogroupes et paragroupes : La nomenclature des haplogroupes du chromosome Y est plus simple que celle de l’ADNmt. Dans l’analyse mitochondriale, chaque haplogroupe est caractérisé par un haplotype « ensemble » de mutations très répandues et partagés entre les haplogroupes. Par contre, chaque haplogroupe du chromosome Y est défini par une ou plusieurs mutations caractéristiques, auxquelles s’ajoutent d’autres mutations définissant un sous-haplogroupe particulier. Le paragroupe est le terme qui désigne une lignée originale ne présentant pas davantage de mutations. Par exemple : si un individu, porteur de l’haplogroupe E-M78 (M78 indique la mutation), présente une nouvelle mutation V65, il appartient alors à un sous- groupe de E-M78 qui est E-V65. Par contre s’il ne présente aucune autre mutation, il appartient alors au paragroupe désigné par E-M78*.

Figure 17 : Structure de l’arbre phylogénétique du chromosome Y (van Oven et al. 2014)

66 EXPOSÉ BIBLIOGRAPHIQUE

IV.3.4.1 La racine de l’arbre phylogénétique du chromosome Y : La transmission patrilinéaire du chromosome Y indique que tous les chromosomes Y des hommes vivants sont les descendants d’un seul chromosome Y « le plus récent ancêtre patrilinéaire commun”. Ainsi, des chercheurs ont évoqué, comme pour l’ADN mitochondrial, l’expression de “l’Adam Y-chromosomique” qui désigne la séquence d’ADN ancestrale du chromosome Y. L’origine africaine de l’homme anatomiquement moderne (AMHs: Anatomically Modern Humans) est soutenue par l’analyse des embranchements basales de la racine de l’arbre phylogénétique du chromosome Y. En effet, les haplogroupes A et B, constituant les branches les plus profondes dans l’arbre phylogénétique, sont essentiellement limitées à l’Afrique où ils atteignent leurs fréquences les plus élevées (Hammer 1995; Semino et al. 2002; Stringer 2002; Goebel 2007; Batini et al. 2011b).

À la recherche de la racine de l’arbre : La racine de l’arbre phylogénétique du chromosome Y a d’abord été située entre l’haplogroupe (A) et les haplogroupes (BT) (Karafet et al. 2008; Underhill et Kivisild 2007). Les origines les plus profondes dans cette phylogénie ont été attribuées à la population Khoisan de l'Afrique du Sud et aux Éthiopiens de l'Afrique orientale (Hammer et al. 2001; Semino et al. 2002). Cependant, en 2011, dans une étude de re-séquencage du chromosome Y, la racine de l'arbre phylogénétique a été déplacée à une nouvelle position entre deux sous-haplogroupes A (A1b et A1a-T). Cette étude démontre que l’origine de l’homme anatomiquement moderne n’est pas de l’est ou du sud de l’Afrique mais du nord-ouest de l’Afrique Centrale. Le temps à l’ancêtre commun le plus récent (TMRCA) a été réévalué à 140 000 ans, contrairement à 100 000 ans estimé précédemment (Cruciani et al. 2011a). En 2013, un laboratoire d’une société privée a analysé l’ADN d’un Africain American afin d’identifier ses ancêtres lointains. Cette analyse a permis la découverte d'un chromosome Y qui porte l'état ancestral de tous les SNPs définissant la partie basale de l'arbre phylogénétique du chromosome Y. Les chercheurs ont alors déterminé une nouvelle lignée qu’ils ont nommé A00 et le temps à l'ancêtre commun le plus récent (TMRCA) a été réévalué à il y a 338 000 ans (Mendez et al. 2013). La lignée A00 n'a pas été identifiée dans des populations de chasseurs-cueilleurs traditionnelles de l'Afrique subsaharienne tels que les Khoisan et les Pygmées. Grâce à l’analyse des Y-STRs, des séquences d’ADN assez similaire de cette lignée ont été trouvée à de très faible fréquence en Afrique centrale, dans la

67 EXPOSÉ BIBLIOGRAPHIQUE population Mbo de l’ouest du Cameroun (Scally et Durbin 2012; Veeramah et al. 2012). La découverte de la lignée A00 démontre le pouvoir et l’intérêt de la participation publique des individus dans les enquêtes scientifiques qui vont probablement continuer dans l'ère actuelle de l’identification génomique personnelle. Par ailleurs, des études plus étendues dans les populations de l’Afrique subsaharienne et dans la diaspora africaine pourraient exposer de nouvelles lignées basales plus diversifiées du chromosome Y (Mendez et al. 2013).

IV.3.4.2 Les haplogroupes qui caractérisent la sortie de l’Afrique « Out of Africa »: Tous les clades du chromosome Y qui ne sont pas exclusivement africains appartiennent au macro-haplogroupe CT, daté à 70 000 ans B.P. Le clade CT est subdivisé en deux clades majeurs, DE (TMRCA= 65 000 ans) et CF (TMRCA= 68 000 ans) (Karafet et al. 2008; Underhill et Kivisild 2007). Les haplogroupes du clade DE sont porteurs de la mutation YAP et décrivent les premiers événements de divergence en dehors de l'Afrique. L’haplogroupe D n’a été trouvé nul part en dehors de l’Asie, ce qui indique son origine probable. Alors que l’haplogroupe E est majoritairement africain et couvre tout le continent. Des fréquences moyennes sont, également, observées au Moyen Orient et au sud de l’Europe et de rares présences au centre et au sud de l’Asie (Hammer et al. 1998; Underhill et al. 2001; Cruciani et al. 2002; Jobling et Tyler-Smith 2003; Semino et al. 2004; Karafet et al. 2008). L’haplogroupe E est le plus diversifié des clades du chromosome Y. Il a été daté à 52 500 ans B.P et est probablement originaire de l’Afrique de l’Est (Karafet et al. 2008; Oppenheimer 2012). Les haplogroupes du clade CT (G, I, J, L, H, D, R, N, O, T, C, Q) témoignent d’une expansion à partir de l'Afrique, il y a environ 60 000 ans. Leur expansion est caractérisée par la dispersion rapide à travers l'Eurasie et l'Océanie, suivie par un isolement ultérieur (Deshpande et al. 2009).

IV.3.4.3 Phylogéographie des haplogroupes du chromosome Y: La distribution géographique des fréquences des 15 plus importants haplogroupes (A, B, E, G, I, J, L, H, D, R, N, O, T, C, Q) a été illustrée à partir d’un grand ensemble de données publiées (Figure 18). Les haplogroupes K, M et S n’ont pas été inclus parce qu’ils ont une distribution très restreinte : ils ont été retrouvés seulement en Océanie. De même, pour les haplogroupes F et P qui sont paraphylétiques (Chiaroni et al. 2009).

68 EXPOSÉ BIBLIOGRAPHIQUE

Figure 18 : Distribution géographique des haplogroupes du chromosome Y (Chiaroni et al. 2009)

Les haplogroupes L et H sont trouvés en majorité dans le subcontinent Indien (Sengupta et al. 2006). L’haplogroupe T est observé en faible fréquence au Moyen Orient, en Afrique et en Europe (Underhill et al. 2001; Karafet et al. 2008). L’haplogroupe G est restreint au moyen orient, à la Méditerranée et dans les montagnes des Caucases (Karafet et al. 2008). L’haplogroupe I est l’un des haplogroupes européens majeurs avec l’haplogroupe R, mais contrairement à ce dernier, l’haplogroupe I est largement répandu en Europe et est virtuellement absent ailleurs. Il semble être un candidat des lignées ancestrales Européennes au début du paléolithique supérieur (Rootsi et al. 2004).

69 EXPOSÉ BIBLIOGRAPHIQUE

Les lignées de l’haplogroupe J sont trouvées à de hautes fréquences au Moyen-Orient, en Afrique du Nord, en Europe, en Asie Centrale, au Pakistan et en Inde (Karafet et al. 2008). Il est caractérisé par deux sous-haplogroupes majeurs (J1 et J2). L’haplogroupe J2-M172 est le plus commun en Europe, tandis que l’haplogroupe J1-M267 prédomine au Moyen-Orient, en Afrique du Nord et en Éthiopie (Semino et al. 2004; Karafet et al. 2008).

De point de vue géographique, les haplogroupes N, O, C, Q et R sont les plus largement répandus. L’haplogroupe N est fréquent dans les pays Nordiques et au nord-ouest de l'Asie. Son absence en Amérique indique que sa diffusion à travers l'Asie est arrivée après la submersion du pont terrestre de la Béringie (Chiaroni et al. 2009). L’haplogroupe O se trouve majoritaire au sud-est de l’Asie et à des fréquences modérées à faible au centre de l’Asie et en Océanie (Karafet et al. 2008). Les Haplogroupes C et Q présentent une généalogie asiatique avec l’unique privilège d'avoir conquis l'Amérique. Leur origine semble être du nord-est de l’Asie (Karafet et al. 2008; Chiaroni et al. 2009).

L’haplogroupe R recouvre l'Afrique du Nord, le centre et l'ouest de l'Asie mais se manifeste à de très hautes fréquences en Europe (Jobling et Tyler-Smith 2003; Underhill et Kivisild 2007; Chiaroni et al. 2009). L’haplogroupe R est divisé en deux sous-haplogroupes: R1- M173 qui est le plus répandu et R2-M479. Bien que la fréquence des lignées R1 soit actuellement la plus élevée en Europe, l'argument phylogéographique de leur origine en dehors de l'Europe, probablement quelque part à l'ouest de l'Asie, résulte de la distribution géographique de ses premières branches dérivées : • En effet, le sous-haplogroupe R1a-M420 est plus fréquent à l'Est. Son sous-groupe, porteur de la mutation M17, est observé à des fréquences qui excèdent les 30 % dans certaines populations asiatiques et les 50 % en Europe de l’Est (Rootsi et al. 2013). • Le sous-haplogroupe R1b-M343 est plus commun à l’ouest. Son sous-groupe, défini par la mutation M269, est majoritaire en Europe de l’Ouest atteignant les 45% au nord- est de l'Italie et aux Balkans (Myres et al. 2011).

70 EXPOSÉ BIBLIOGRAPHIQUE

IV.4 Données bibliographiques sur l’analyse des marqueurs parentaux en Algérie : Très peu d’analyses génétiques des marqueurs parentaux ont été effectuées dans la population algérienne contrairement à celles de la Tunisie et du Maroc. À l’heure actuelle et à notre connaissance, aucune étude des marqueurs du chromosome X n’a été effectuée en Algérie. L’analyse de l’ADN mitochondrial dans la population algérienne n’a été effectuée que dans deux échantillons: le premier (n=85) est de la population M’Zab de Ghardaïa (Côrte-Real et al. 1996), et le deuxième (n=47) est un mélange d’échantillons d’ADN d’Algériens dont les caractéristiques (dialecte parlé, région d’échantillonnage) n’ont pas été définies par les auteurs (Plaza et al. 2003).

Concernant le chromosome Y, la première étude a été effectuée par Arredi et al. en 2004 dans le cadre d’une analyse de 5 échantillons de populations nord africaines, dont deux groupes Algériens (Arabophone d’Alger (n=35) et Berbérophone de Tizi Ouzou (n=19)) (Arredi et al. 2004). En 2006, un échantillon, incluant un effectif important de 102 hommes représentatifs du nord-ouest Algérien, a été analysé pour la première fois dans le cadre d’une collaboration scientifique entre l’équipe de recherche du professeur Benhamamouch S. et l’équipe des professeurs Piazza A., Torre C. et Robino C. de l’Université de Torino en Italie (Robino et al. 2008a). Les résultats préliminaires de cette étude ont été complétés et approfondis par l’analyse des sous-haplogroupes E-M78 et R-M343 dans le même échantillon analysé. L’ensemble des données recueilli de ces travaux sur les marqueurs uniparentaux ont été repris dans les analyses comparatives dans le cadre de ce travail de thèse.

71 EXPOSÉ BIBLIOGRAPHIQUE

V. Objectifs des travaux de thèse:

Les travaux présentés dans ce mémoire sont le fruit de collaborations scientifiques avec différentes équipes de recherche italiennes et espagnoles qui se sont intéressées depuis longtemps aux populations du bassin méditerranéen dont l’Histoire est étroitement liée. La problématique de ce travail de thèse s’inscrit dans le cadre de questionnements sur le peuplement des deux rives de la Méditerranée, et en particulier, l’Afrique du Nord: Comment s’est faite l’installation des populations actuelles en Afrique du Nord ? Quelles sont leurs origines ? Comment ces populations ont évolué dans le temps ? Sont elles différentes les unes des autres ou possèdent elles un patrimoine génétique commun? Dans quelle mesure se sont effectués les échanges avec les populations de l’Europe, de l’Asie et de l’Afrique subsaharienne? L’apport des données de la diversité génétique des populations actuelles, confrontés aux données historiques et archéologiques, permet d’apporter davantage d’informations sur les relations et les évènements historiques et démographiques passés entre elles.

L’objectif de ce travail est d’abord de contribuer à une meilleure connaissance de la structure anthropogénétique de la population nord-ouest algérienne. Par différentes techniques de biologie moléculaire, nous avons analysé, pour la première fois, les marqueurs parentaux : le chromosome X, l’ADN mitochondrial et le chromosome Y. D’une part, nous nous sommes intéressé aux marqueurs STRs du chromosome X qui ont un intérêt particulier en génétique médico-légale. Par ailleurs, leur analyse permet de définir des haplotypes transmis au fil des générations qui peuvent être caractéristiques des populations. Et d’autre part, nous avons réalisé l’analyse des marqueurs uni-parentaux (l’ADNmt et le chromosome Y) afin de déterminer des haplogroupes et de tracer les lignées paternelles et maternelles. L’analyse de ces marqueurs uniparentaux pouvant servir à: • Déterminer l’origine géographique des ancêtres de la population actuelle ; • Identifier les contributions génétiques des autres peuples qui ont côtoyé la population autochtone ; • Tracer les voies de migrations ayant permis ces contributions génétiques ; • Fournir des informations sur les variations génétiques dans la population algérienne, essentielles pour la compréhension de l'impact des processus démographiques ; • Quantifier la contribution génétique de chaque marqueur uniparental ;

72 EXPOSÉ BIBLIOGRAPHIQUE

• Et enfin, évaluer les apports différentiels des lignées féminines et masculines, mettant en évidence les différences culturelles et démographiques entre les hommes et les femmes.

Cette étude, qui décrit pour la première fois le profil génétique de la population nord-ouest algérienne, se base sur des analyses phylogénétiques et statistiques permettant de comparer notre population d’étude avec d’autres échantillons de la population algérienne et de révéler les similitudes et/ ou différences éventuellement présents. De plus, la comparaison de la population algérienne avec les populations du bassin méditerranéen contribue d’une part à mieux comprendre l’histoire des migrations des populations nord africaines et leurs relations passées, et d’autre part de déterminer et quantifier l’apport des populations méditerranéennes dans le patrimoine génétique des populations actuelles.

Des perspectives à ces travaux seront évoqués à différents niveaux pour :

• Une meilleure connaissance de la structure génétique ancestrale des populations actuelles à partir de l’analyse du génome entier qui complèterait les résultats de l’analyse des marqueurs uniparentaux; • La création d’une base de données génétiques des marqueurs STRs destinée à la communauté nationale et internationale de génétique médico-légale ; • Des applications dans le domaine clinique et notamment les pathologies les plus fréquentes dans notre pays, posant un réel problème de santé publique, pourraient être reconsidérées à la lumière de l’étude d’autres marqueurs anthropogénétiques, dont ceux portés par les autosomes.

73

POPULATIONS ET MÉTHODES POPULATIONS ET MÉTHODES

I. Obtention et description de l’échantillon de la population analysée: Notre population comprend 240 sujets, originaires du Nord-Ouest Algérien, recrutés entre 2006 et 2007, dans différents établissements de santé de la wilaya d’Oran, tel que la polyclinique d’Es-Senia et le Centre Hospitalo-Universitaire d’Oran (CHUO). Tous les participants à cette étude ont été choisis selon leurs origines et celles de leurs parents et grands parents qui sont du Nord-Ouest Algérien. Dix Wilayas ont été considérées : Oran, Sidi Bel Abbés, Saïda, Ain Temouchent, Mostaganem, Tiaret, Mascara, Chlef, Tlemcen, Relizane (Figure 19). Tous les individus étaient adultes, consentants et sans lien de parenté. Nous avons précisé leur lieu de naissance et de résidence, l’origine de leurs parents et grands parents ainsi que la consanguinité entre leurs parents et entre leurs grands parents. Un consentement éclairé et un questionnaire relatif aux critères d’inclusion et au recueil d’informations sociodémographiques ont été recueillies pour chaque individu (Annexe I). Notre échantillon est représentatif de la région nord-ouest algérienne, mais compte tenu de l’échantillonnage effectué exclusivement à Oran et dans un souci de simplification, les termes Oranie ou Oran sont utilisés.

I.1 Prélèvements et extraction d’ADN : Les prélèvements de sang de 8 à 15 ml ont été effectués, pour chaque individu, dans des tubes contenants un anticoagulant EDTA (acide éthylène diamine tétra acétique). Ils ont été ensuite stockés à -20°C. L’extraction d’ADN a été effectuée par la technique Salting out (Miller et al. 1988), au niveau du Laboratoire de Biologie Moléculaire et Cellulaire de l’Université des Sciences et de la Technologie (Mohamed Boudiaf) d’Oran (USTO). Le culôt lymphocytaire est obtenu à partir de plusieurs lavages avec une solution TE (Tris/HCl 1M, EDTA 0.5M, pH8), suivie d’une centrifugation à 10000 rpm (rotation par minute) pendant 5 minutes. Une solution de lyse des globules blancs contenant du SDS 10% (Sodium Dodecyl Sulfate) et la protéinase K (10 mg/ml) est ensuite ajoutée pour une incubation de 12 heures à 37°C. La précipitation des protéines et débris cellulaire est effectuée, par centrifugation, après ajout d’une solution de NaCl (Chlorure de sodium) concentrée à 6 M. L’ADN est ensuite précipité avec de l’éthanol absolu et conservé à -20°C dans une solution TE (10/1).

74 POPULATIONS ET MÉTHODES

Figure 19: Origine géographique des sujets prélevés de la population nord-ouest algérienne (en rouge)

I.2 Quantification de l’ADN : La quantification d’ADN a été réalisée au laboratoire des Sciences Criminalistiques, section de génétique médico-légale, Université de Torino, Italie. Afin d’obtenir une quantification précise, nous avons employé la technique de PCR (Polymerase Chain Reaction) en temps réel. Nous avons quantifié 19 échantillons d’ADN sélectionnés selon le volume de sang prélevé pour chaque individu, les valeurs maximales et minimales ont été prises en considération, ainsi que le rendement de l’extraction d’ADN.

75 POPULATIONS ET MÉTHODES

- Le principe de la réaction PCR : La technique PCR (Polymerase Chain Reaction) permet d’amplifier un fragment spécifique d’ADN in vitro afin d'en obtenir une quantité suffisante pour le détecter et l’étudier. Pour se faire, une série de réactions répétées en boucles permettent la réplication de l’ADN double brin. Chaque cycle PCR est constitué de trois étapes: dénaturation de l’ADN ; hybridation des amorces spécifiques, qui encadrent le fragment à amplifier ; et enfin l’extension des amorces par une ADN polymérase thermostable (Taq polymérase), qui incorpore les nucléotides (dNTPs) complémentaires au brin néosynthétisé. Les trois étapes sont effectuées à des températures différentes permettant de contrôler l’activité enzymatique dans un appareil appelé thermocycleur (dans le cas d’une PCR classique).

La PCR en temps réel est une technique d’amplification d’ADN en système clos reposant sur la visualisation, en temps réel, de la phase exponentielle de la réaction PCR. Elle permet la mesure de la quantité d’ADN tout au long de la réaction, grâce à l’utilisation d’un marqueur fluorescent dont la fluorescence est proportionnelle à la quantité d’amplicons produite. Dans cette étude, nous avons utilisé le kit Quantifiler™ Human DNA Quantification Kit (Applied Biosystems), en procédant à une quantification absolue qui se réfère à une gamme de concentrations connues du kit basée sur la technique 5' Nucléase de la technologie TaqMan. Les amplifications et lectures ont été faites au moyen de l'appareil ABI PRISM® 7000 Sequence Detection System (Applied Biosystems), selon les recommandations du fabricant.

- Principe de la technologie TaqMan du kit Quantifiler™: Le kit Quantifiler™ utilise une sonde TaqMan qui s’hybride spécifiquement à une séquence cible d’ADN humain (un fragment de 62 pb du gène codant pour la télomérase réverse transcriptase humaine). Cette sonde est marquée à son extrémité 5’ par un fluorochrome émetteur (reporter) et à son extrémité 3’ par une molécule appelée suppresseur de fluorescence (quencher) (Figure 20). Si la sonde est intacte, aucune fluorescence n’est détectée en raison de la proximité de ces deux molécules. Lors de la phase d’élongation de la réaction PCR, la sonde hybridée à sa séquence cible va être dégradée par l’ADN polymérase grâce à son activité 5’ nucléase. Le fluorochrome émetteur, alors séparé du suppresseur, va pouvoir émettre de la fluorescence qui sera détectée par une caméra de l’appareil.

76 POPULATIONS ET MÉTHODES

Pendant la phase exponentielle de la PCR, l’augmentation du signal de fluorescence détecté est proportionnelle à la quantité d’amplicons générée. Il est possible de déterminer le nombre de molécules d’ADN cibles de départ en fonction du nombre de cycles nécessaire pour atteindre une valeur seuil de fluorescence. Un échantillon d’ADN de concentration connue sert à réaliser une gamme de dilution (de 23 pg à 50 ng/µl) qui permet de réaliser une courbe standard à partir de laquelle sont déduites les concentrations des échantillons. À partir de la quantification des 19 échantillons d’ADN, nous avons effectué des dilutions de l’ensemble de notre DNAthéque afin d’obtenir des concentrations variant de 10 à 50 ng/µl.

Figure 20: Principe de la technologie TaqMan (Applied Biosystems)

77 POPULATIONS ET MÉTHODES

II. Techniques d’identification des polymorphismes étudiés : Deux types de polymorphismes ont été analysés dans nos travaux : les polymorphismes SNPs (Single Nucleotide Polymorphism) et STRs (Short Tandem Repeat). Différentes techniques de biologie moléculaire ont été appliquées. L’analyse est effectuée d’abord par une étape d’amplification (PCR) de la région d’ADN contenant le polymorphisme étudié. Une analyse post-PCR est ensuite réalisée pour déterminer le variant allélique au site polymorphe considéré. Différentes techniques de détection des produits de la discrimination allélique ont été employées dans notre étude et qui seront détaillées ultérieurement. L’analyse des marqueurs SNPs a été réalisée soit par digestion enzymatique spécifique (technique PCR-RFLP), soit par séquençage de la séquence portant le ou les polymorphismes analysés, ou encore par la technique d’extension des amorces (miniséquençage SNaPshot). Les produits de l’amplification (PCR) des marqueurs STRs ont été analysés par électrophorèse capillaire sur un analyseur génétique (séquenceur).

78 POPULATIONS ET MÉTHODES

III. Analyse des 21 marqueurs STRs du chromosome X

L’analyse des marqueurs STRs du chromosome X a été réalisée au Laboratoire des Sciences Criminalistiques, section de génétique médico-légale sous la co-direction des professeurs Carlo Robino et Carlo Torre au Département d’Anatomie, pharmacologie et médecine légale, Université de Torino, Italie.

III.1 Analyse par PCR multiplex: La PCR multiplex est une technique qui permet l’amplification de plusieurs marqueurs STRs en une seule réaction pour un même échantillon. Chaque marqueur STR est amplifié en utilisant un couple d'amorces dont une seule est marquée par un fluorochrome à son extrémité 5'. À l'issue de la PCR, les amplicons des différents STRs se retrouvent marqués. Leur analyse est ensuite réalisée par électrophorèse capillaire qui détecte les différents fluorochromes utilisés. L’analyse de 21 marqueurs X-STRs (Tableau 2) a été réalisée par 4 différentes réactions PCR multiplex :

- Deux PCR (multiplex A et B) ont été développées par (Robino et al. 2006) permettant d’analyser 12 marqueurs STRs ; - Une nouvelle multiplex C, incluant 4 marqueurs STRs, a été mise au point dans le cadre de ce travail ; - Et enfin une multiplex du kit Mentype® Argus X-8 (Biotype GE, Dresden Germany) permettant l’analyse de 8 X-STRs, dont trois sont également révélés par la multiplex A et B.

79 POPULATIONS ET MÉTHODES

Tableau 2 : Caractéristiques des 21 marqueurs X-STRs analysés

III.1.1 PCR multiplex A, B et C: Une mise au point du protocole des techniques PCR multiplex A et B, précédemment décrites par l’équipe de Robino et al. (2006) a été effectuée dans le cadre de ce travail. Ces deux multiplex permettent l’identification de 12 marqueurs STRs : les STRs DXS6789, DXS6809, DXS8378, DXS101, GATA172D05, DXS8377 ont été analysés par la multiplex A et DXS7132, DXS6800, DXS6801, DXS7424, HPRTB, DXS10011 par la multiplex B. Une nouvelle multiplex C permettant l’analyse des 4 marqueurs STRs : DXS10148, DXS10079, DXS10103 et DXS10146 a été mise au point dans le présent travail. Les caractéristiques de ces trois multiplex (A, B et C) sont présentées en Annexe IIa.

80 POPULATIONS ET MÉTHODES

La réaction PCR a été effectuée dans un volume final de 12.5 µl contenant 10 ng/µl d’ADN, le Master Mix 1 X (Qiagen, Hilden, Germany), qui est un mélange de Taq polymérase, de dNTP et de tampon nécessaire à la réaction d’amplification, et le mix des amorces dont la séquence et la concentration de chacune sont décrites en Annexe IIa. Pour les trois PCR, le protocole consiste à 15 min de dénaturation pré-PCR à 95°c, suivie de 32 cycles de dénaturation à 94°C pendant 30 sec, 1 min 30 d’hybridation à 61°C (pour la multiplex A) et à 57°C (pour les multiplex B et C) et une extension à 72°C pendant 1 min, avec en final 30 min d’extension à 72°C.

III.1.2 PCR multiplex du kit Mentype® Argus X-8 : La PCR multiplex du kit Mentype® Argus X-8 (Biotype GE, Dresden Germany) permet d’identifier 8 marqueurs STRs (DXS10135, DXS8378, DXS7132, DXS10074, HPRTB, DXS10101, DXS10134, and DXS7423) dont trois sont également révélés par la multiplex A et B, qui sont : DXS8378, HPRTB, DXS7132 (Annexe IIb). La multiplex Argus permet également l’amplification du gène qui code la protéine Amélogénine qui se trouve sur les deux chromosomes X et Y (Sullivan et al. 1993). Une délétion de 6 pb caractérise le chromosome X, ce qui permet de distinguer les amplicons des deux chromosomes X et Y par séparation électrophorétique. Ainsi, on obtient un seul pic (ou bande sur gel) si l'ADN est fourni par une femme et 2 pics distincts (ou 2 bandes) si l'ADN est fourni par un homme. La réaction PCR a été effectuée dans un volume final de 25 µl, en présence de 2 ng/µl d’ADN, de 1 X du Mix de Réaction A (Biotype GE, Dresden Germany), de 1 Unité (1U) de Taq polymérase JumpStart (Sigma-Aldrich, Irvine Écosse) et du mix des amorces, selon les instructions du fournisseur. Le protocole d’amplification consiste à 4 min de dénaturation pré-PCR à 95°C, suivie de 30 cycles de dénaturation à 94°C pendant 30 sec, 3 min d’hybridation à 58°C et une extension à 72°C pendant 1 min 15, avec en final 60 min d’extension à 68°C.

III.1.3 Analyse des produits PCR par électrophorèse capillaire : Les produits d’amplification des 4 multiplex ont été révélés après électrophorèse capillaire sur un appareil ABI PRISM® 310 Genetic Analyzer (Applied Biosystems, Foster City, CA). Les données sont ensuite interprétées grâce aux logiciels GeneScan et Genotyper software version 3.7 (Applied Biosystems). La taille des amplicons est vérifiée par un marqueur de taille et les allèles sont identifiés par comparaison avec des marqueurs alléliques de référence (allelic ladder) pour chaque STR analysé.

81 POPULATIONS ET MÉTHODES

III.1.3.1 Principe de l’électrophorèse capillaire : L'échantillon contenant les produits amplifiés (après PCR) est injecté dans un long tube capillaire (47 cm) de très faible diamètre interne (50 µm) rempli d'un gel de faible viscosité (polymère). Une très forte tension (15 kV) est appliquée au contenu du capillaire maintenu à température constante. Les fragments d'ADN dénaturés (monobrin) chargés négativement, soumis au champ électrique, migrent dans le gel vers l'anode d'autant plus rapidement qu'ils sont plus courts. Une fenêtre de détection est disposée le long du capillaire (Figure 21). Quand les fragments d'ADN parviennent à son niveau, le fluorochrome qu'ils portent est excité par un laser, envoyant un signal lumineux capté par une caméra CCD (Charge Coupled Device) qui le transforme en un signal électrique. Ce dernier sera converti en information numérique utilisable par les logiciels de l’analyseur génétique relié à un ordinateur. Le traitement des données obtenues conduit à l'affichage de pics, correspondant chacun à un ensemble de fragments d'ADN de même taille (allèle). Chaque pic est caractérisé en abscisse par sa position (qui dépend de la vitesse de migration donc de la taille) et en ordonnée par l'intensité relative de la fluorescence initiale (Figure 22).

III.1.3.2 Marqueur de taille et marqueurs alléliques de référence : Comme pour une électrophorèse classique, sur gel d’agarose par exemple, l’utilisation d’un marqueur de taille est nécessaire en électrophorèse capillaire puisqu’elle permet de vérifier la taille des fragments amplifiés qui seront ensuite comparés à des marqueurs alléliques de référence. D’une part, le marqueur "standard de taille" (marqué avec un fluorochrome particulier, ex : ROX « Figure 22 ») est ajouté à chaque échantillon d’ADN à analyser, et sera traité avec ce dernier. Le marqueur de taille permet de détecter la taille exacte des amplicons après électrophorèse. D’autre part, on utilise un mélange de marqueurs alléliques de référence qui sont traités comme un échantillon à part. Ils sont spécifiques aux STRs analysés et sont marqués de la même manière. Après électrophorèse, un marqueur allélique présente différents pics correspondants aux différents allèles pour un STR. Les pics obtenus par les échantillons analysés sont comparés à ceux du marqueur allélique, ce qui facilite leur identification. Généralement, les marqueurs alléliques sont fournis dans le kit utilisé (allelic ladder fourni dans le kit Argus X-8) (Figure 22). Dans le cas contraire (multiplex A, B et C), des marqueurs alléliques d’ADN contrôles de lignées cellulaires témoin K562 et 9947A (Promega, Madison, WI) sont utilisés.

82 POPULATIONS ET MÉTHODES

Figure 21 : L’analyseur génétique ABI PRISM® 310 Genetic Analyzer (Applied Biosystems)

83 POPULATIONS ET MÉTHODES

Figure 22 : Profil des allèles de références (allelic ladder) des 8 marqueurs STRs analysés par le kit Argus X-8 (Biotype GE, Dresden Germany)

- En rouge : les pics représentent le marqueur de taille marqué par le fluorochrome ROX. - En bleu, à gauche : Le marqueur du sexe Amélogénine produit 2 pics distincts (pour X et Y) ce qui indique l'ADN d’un homme. La présence d’un seul pic (pour X) aurait indiqué l’ADN d’une femme.

84 POPULATIONS ET MÉTHODES

III.2 Analyse du marqueur STR (DXS10148) par séquençage: Nous avons réalisé le séquençage des échantillons d’ADN masculin qui ont présenté des allèles différents de ceux décrits dans la littérature pour le marqueur STR DXS10148 (Hundertmark et al. 2008).

III.2.1 Principe de la réaction de séquençage : Le séquençage d'un ADN, c'est à dire la détermination de la succession des nucléotides le composant, repose sur une adaptation de la méthode enzymatique de Sanger. En plus des désoxynucléotides (dNTPs) nécessaires à la synthèse du nouveau brin d’ADN, on utilise des didésoxynucléotides (ddNTPs), qui sont des dNTPs dont le groupement OH a été remplacé par un groupement H, entraînant l’arrêt de la synthèse de l’ADN, dû à l’impossibilité qu’ont ces nucléotides de former une liaison phosphodiester avec un autre nucléotide. La Taq polymérase du milieu réactionnel ajoute ainsi au hasard des dNTPs ou des ddNTPs complémentaires du brin du fragment d’ADN à séquencer. La synthèse est arrêtée à chaque fois qu’un ddNTP est incorporé. Au bout d’une vingtaine de cycle d’amplification, on obtient de nombreuses copies de toutes les tailles possibles terminées par un didésoxynucléotide. Chaque ddNTP porte simultanément son fluorochrome spécifique de couleur. On les appelle des terminateurs d'élongation ou "BigDye Terminators" ou "Dye-labeled Terminator". Après excitation par le laser, ces molécules hautement fluorescentes émettent de la lumière qui est captée par une caméra présente dans le séquenceur. Le résultat est présenté par la machine sous forme de courbes (pics) présentant la fluorescence détectée de chaque base du ddNTP (A, T, G, C), qui se retrouve symboliquement sur le chromatogramme en couleur rouge pour T, noir pour G, bleu pour C, vert pour A. L’analyse des fragments des séquences est réalisée sur le séquenceur automatique (analyseur génétique) (Figure 23).

85 POPULATIONS ET MÉTHODES

Figure 23 : Principe de la réaction de séquençage d’ADN

86 POPULATIONS ET MÉTHODES

III.2.2 Étapes du protocole de séquençage employé : Le séquençage de l’ADN est réalisé en plusieurs étapes : après amplification de la région d’intérêt, les produits amplifiés ont été purifiés afin d'effectuer la réaction de séquençage. Après une seconde purification, l’analyse des produits de séquençage est effectuée par électrophorèse sur un analyseur génétique.

1. Réaction d’amplification d’ADN : La PCR a été effectuée dans un volume final de 25 µl contenant 20 ng/µl d’ADN, 2 µM de chacune des deux amorces du DXS10148 (Forward et Reverse non marquées) et le Master Mix 1 X (Qiagen, Hilden, Germany). Les conditions d’amplification sont les suivantes : une dénaturation pré-PCR de 15 min à 95°C, suivie de 32 cycles de dénaturation à 95°C pendant 30 sec, une hybridation de 90 sec à 57°C et une extension de 60 sec à 72°C, avec en final 30 min d’extension supplémentaire à 60°C. Une électrophorèse sur gel d’agarose (3%), de 5 µl des produits d’amplification, est ensuite réalisée afin de vérifier les résultats de la PCR.

2. Purification des produits de la PCR : La purification des produits de PCR est un élément important pour une séquence de qualité. Cette étape permet d’éliminer les sels, les amorces et les dNTPs non incorporés lors de la PCR. Nous avons utilisé le kit de purification des produits PCR (QIAquick PCR Purification Kit, Qiagen) (Figure 24). Le pH des produits de PCR est d’abord vérifié à l’aide du buffer indicateur de pH fourni par le kit QIAquick (Qiagen). L’adsorption de l’ADN nécessite un pH ≤ 7.5 qui, en présence de l’indicateur de pH, sera indiqué par une couleur jaune. Si le pH est > 7.5 les produits PCR auront une couleur violette. L’ajustement du pH est effectué alors avec de l’acétate de sodium (3 M/ pH 5.2). Ainsi, les produits de PCR sont chargés dans des colonnes à filtres (QIAquick, Qiagen), puis centrifugé pendant 1 minute à 17000 rpm. Chaque colonne est ensuite placée dans un tube microcentrifuge de 1.5 ml. On ajoute aux colonnes 50 µl de buffer EB (Elution Buffer) (10 mM Tris-Cl, pH 8.5) (fourni dans le kit) qui permet l’élution de l’ADN. Le tout est laissé 1 minute à température ambiante puis centrifugé 1 minute à 17000 rpm. Une partie du produit de purification est déposée sur un gel d’agarose (3%), afin d’estimer la quantité d’ADN obtenue par comparaison de l’intensité des bandes à celles d’un marqueur de taille.

87 POPULATIONS ET MÉTHODES

Figure 24: Protocole de purification des produits de PCR avec le kit (QIAquick PCR Purification Kit, Qiagen)

88 POPULATIONS ET MÉTHODES

3. Réaction de séquençage : Elle est réalisée sur chaque brin d’ADN, car il n’est possible de séquencer qu’un brin à la fois. La réaction est effectuée dans deux tubes différents, chacun contenant l’une des deux amorces (Forward ou Reverse), dans un volume final de 20 µl. Le mélange réactionnel comprend entre 5 et 10 µl de produit d’amplification purifié (selon l’intensité des bandes de chaque échantillon), 0.1 µM de l’amorce choisie (Forward ou Reverse), le buffer de séquence (Applied Biosystems) et le BigDye™ Terminator v3.1 (Applied Biosystems) qui contient une polymérase et les 4 ddNTPs (didesoxynucléotide triphosphaté) marqués par des fluorochromes différents, selon les instructions du fournisseur. Ces mélanges sont ensuite déposés dans un thermocycleur et soumis au programme suivant : 1 minute de dénaturation à 96°C, puis 25 cycles composés de 10 secondes de dénaturation, 5 secondes d’hybridation et 4 minutes d’élongation. Les produits d’amplification sont ensuite conservés à 4°C.

4. Phase de purification : Les produits de séquençage (2 µl) ont été purifiés sur colonnes de résine de Sephadex, en leur rajoutant du SDS à 2%. Après incubation à 95°C pendant 5 min suivie de 10 min à 25°C, une centrifugation de 2 minutes à 8000 rpm est réalisée. L’éluât est récupéré et centrifugé une deuxième fois sur les colonnes de Sephadex.

5. Analyse des produits de séquençage : Avant l’analyse par électrophorèse capillaire des échantillons, 5 µl d’ADN purifiés sont repris dans 20 µl d’eau milliQ. Les échantillons sont analysées dans un séquenceur automatique ABI PRISM® 310 Genetic Analyzer (Applied Biosystems, Foster City, CA) et les données sont interprétées grâce aux logiciels GeneScan et Genotyper software version 3.7 (Applied Biosystems). Les séquences obtenues, sous forme de chromatogrammes, ont été comparées au motif répétitif décrit par (Hundertmark et al. 2008) et les différences ont été a notés. Le motif de référence présente la structure suivante : PF-[GGAA]4-[AAGA]X-A - a [AAAG]Y-N8-[AAGG]2–N104-PR; ( désigne l’insertion d’Adénine donnant naissance aux allèles intermédiaires, PF et PR désignent la position des amorces Forward et Reverse).

89 POPULATIONS ET MÉTHODES

III.3 Analyse statistique des données génétiques du chromosome X: L’analyse des résultats a été effectuée par le logiciel Arlequin version 3.0 (Excoffier et al. 2005) :

- L'ensemble des fréquences alléliques des 21 X-STRs a été déterminé par comptage et vérifié par le logiciel Arlequin. Nous avons effectué une comparaison de la distribution de ces fréquences alléliques, entre les échantillons des hommes et des femmes, par le test exact de la différenciation génique basé sur la méthode de la chaîne de Markov (Guo et Thompson, 1992), dont les paramètres ont été fixés à 100000 chaines. - Dans l’échantillon féminin, nous avons estimé l’équilibre d’Hardy-Weinberg et dans l’échantillon masculin, nous avons déterminé le nombre et les fréquences des haplotypes des 19 marqueurs étroitement liés observés au sein des 6 clusters: (cluster 1 DXS10148- DXS10135-DXS8378, en position Xp22; cluster 2 DXS7132-DXS10074-DXS10079, en position Xq12; cluster 3 DXS6801-DXS6809-DXS6789, en position Xq21; cluster 4 DXS7424-DXS101, en position Xq22; cluster 5 DXS10103-HPRTB-DXS10101, en position Xq26; cluster 6 DXS8377-DXS10146-DXS10134-DXS7423-DXS10011, en position Xq28) (Figure 25). Aussi, nous avons vérifié la présence de déséquilibre de liaison entre les paires de marqueurs X-STRs dans ces mêmes clusters. Les deux marqueurs DXS6800 et GATA172D05 n’ont pas été inclus dans cette analyse, en raison de leur position génétique.

Figure 25: Position des marqueurs X-STRs étroitement liés dans les 6 clusters (DL)

90 POPULATIONS ET MÉTHODES

- Nous avons calculé certains paramètres d’intérêt en génétique médico-légale pour chaque marqueur en utilisant le système de calculs en ligne de la base de données ChrX-STR.org 2.0 (http://www.chrx-str.org). Les paramètres calculés, à partir des fréquences alléliques des 21 X-STRs, sont: • l’hétérozygotie attendue (h) qui représente le niveau de variation nucléotidique des allèles identifiés dans la population ; • le pouvoir de discrimination chez les femmes et les hommes (PDF et PDM) ; • le PIC « Polymorphism Information Content » ou le Contenu Informatif du Polymorphisme qui est une valeur souvent utilisée pour mesurer le taux d’informativité d'un marqueur génétique dans les études d’apparenté familiale ; • et enfin, les index de performance (ou d’exclusion) dans les cas de recherche de paternité (MECI : « Mean Exclusion Chance » la moyenne d’exclusion des marqueurs autosomiques chez les trios, MECII : la moyenne d’exclusion des marqueurs X-STRs chez les trios avec une fille et MECIII : la moyenne d’exclusion des marqueurs X-STRs chez les duos Père/ fille).

- Nous avons calculé la proportion de variance (FST) locus par locus entre l’échantillon algérien analysé et des échantillons de différentes populations (Angola, Mozambique, Uganda, Ghana, Italy, Portugal, Spain, Kurdistan, et Pakistan) dont les données sont publiés dans (Robino et al. 2006; Gomes et al. 2007; Pereira et al. 2007; Aler et al. 2007; Tariq et al. 2008; 2009; Poetsch et al. 2009).

L'indice de différenciation ou de fixation (FST) de Wright est une mesure statistique de la proportion de variance allélique, c’est à dire le niveau de différenciation génétique trouvée entre les populations (ou les groupes étudiés) (Hartl et Clark 2007). Si une sous- population a subit une importante dérive génétique par rapport à la population d’origine,

cette proportion de variance FST est très importante. À l’inverse, s’il y a des flux

génétiques maintenus entre les deux populations, FST sera aux alentours de 0. La valeur

FST varie ainsi entre 0 et 1, où 0 indique un partage entier du matériel génétique et 1

indique qu’il n y a aucun partage. Quand la valeur de FST atteint 1, la population est dite fixée ce qui implique qu’elle ne partage aucun allèle avec une autre population, c'est-à- dire qu’il n y a pas de métissage entre elles et qu’elles sont complètement isolées l'une de

l'autre. Cependant, les valeurs FST n’atteignent jamais 1 parce qu’elles sont seulement utilisées pour mesurer le métissage entre les populations de la même espèce qui montre toujours une preuve de croisement entres elles.

91 POPULATIONS ET MÉTHODES

- Afin de résumer les relations entre la population nord-ouest algérienne et les populations des références bibliographiques mentionnées précédemment, nous avons effectué une analyse en composantes principales (ACP) qui permet d’obtenir une représentation graphique sous forme de plot (figure), en utilisant le logiciel R-package v2.0.1 (http://www.r-project.org). L'application de l’analyse en composantes principales est basée sur les fréquences alléliques des marqueurs X-STRs, localisés dans des groupes de liaison distincts et pour lesquels les données sont disponibles chez toutes les populations analysées. Nous avons également utilisé le programme PHYLIP v3.67 (Felsenstein, 1989) qui permet d’effectuer le même type d’analyse mais avec une représentation sous forme d’arbre de Neighbor-Joining (NJ), en utilisant la matrice des distances génétiques selon Nei (Nei 1972), comme fichier d’entrée.

- Une comparaison entre la population algérienne et italienne a été effectuée par le calcul du test exact de différenciation entre populations et l’analyse de la variance moléculaire AMOVA (Excoffier et al. 1992) afin de mesurer la diversité nucléotidique intra et inter populationnelle pour les 2 groupes de liaison des marqueurs X-STRs : le cluster DXS6801–DXS6809-DXS6789 et le cluster DXS7424–DXS101.

- Enfin, nous avons analysé la distribution des haplotypes X-STRs des deux clusters (DXS6801-DXS6809-DXS6789) et (DXS7424-DXS101) parmi les hommes algériens précédemment analysés pour les haplogroupes du chromosome Y (Robino et al. 2008a).

92 POPULATIONS ET MÉTHODES

IV. Analyse des marqueurs uniparentaux (l’ADN mitochondrial et le chromosome Y)

Suite à notre étude préliminaire des polymorphismes du chromosome Y (Robino et al. 2008a), réalisée sur un échantillon de la population nord-ouest algérienne, nous avons entrepris l’analyse du deuxième marqueur uniparental (l’ADN mitochondrial), en augmentant l’échantillon analysé. Et nous avons entrepris une analyse approfondie des polymorphismes du chromosome Y dans le même échantillon de population. Ø Les analyses ont été réalisées au Département de Génétique, Faculté de Biologie, Université de La Laguna, La Laguna, Tenerife, en Espagne, sous la co-direction des professeurs Vicente M. Cabrera, José M. Larruga et Ana M. González. Ø La partie de l’analyse par la technique SNaPshot a été effectuée au Laboratoire de génétique médico-légale, Institut de Médecine légale de Las Palmas, Las Palmas de Gran Canaria, Gran Canaria, Espagne, sous la co-direction du professeur José Pestano et en collaboration avec Dr. Rosa Fregel.

IV.1 Analyse des séquences de l’ADNmt :

IV.1.1 Séquençage de la région HVS-1 : La région HVS-1 de l’ADNmt a été amplifiée puis séquencée en utilisant le couple d’amorces L15840/H16401. Notons que les amorces indiquent les positions nucléotidiques de la région amplifiée (entre 15840 et 16401), L et H correspondent aux deux brins de l’ADNmt. Les séquences des amorces sont les suivantes : (L15840: 5’ acttcacaacaatcctaatcct ’3, H16401 5’ tgatttcacggaggatggtg ’3). Les différentes étapes du protocole de séquençage de l’ADNmt employé sont présentées sur la Figure 26.

93 POPULATIONS ET MÉTHODES

Figure 26 : Protocole de séquençage de l’ADNmt

1. Réaction PCR : La réaction d’amplification a été effectuée dans un volume final de 15 µl contenant 20 ng/µl d’ADN, 0.15 µM de chacune des deux amorces L15840/H16401, 0.25 mM du mélange des 4 nucléotides triphosphate, 0.5 µg/µl de BSA (Bovine Serum

Albumine), 3 mM du tampon MgCl2 (Chlorure de Magnesium), 1 X du buffer et 0.5 U de Taq polymérase. Les conditions d’amplification sont les suivantes : une dénaturation pré- PCR de 5 min à 95°C, suivie de 35 cycles de dénaturation à 94°C pendant 15 sec, une hybridation de 15 sec à 52°C et une extension de 15 sec à 72°C, avec en final 5 min d’extension supplémentaire à 72°C. Une électrophorèse sur gel d’agarose (2%) est ensuite réalisée afin de vérifier les résultats de la PCR et d’estimer la quantité d’ADN amplifiée.

94 POPULATIONS ET MÉTHODES

2. Purification des produits de la PCR : La purification des produits PCR a été effectuée selon le protocole décrit par (Fregel et al. 2010). Il consiste à rajouter à 10 µl du produit de PCR, 30% de la solution G (qui contient 5 mg/ml de glycogène et 10 M d’acétate d’ammonium NH4Ac) complétée avec 70% d’éthanol. Un refroidissement à -20°C pendant 30 min, permet la précipitation de l’ADN et l’élution des sels, le culot est ensuite récupéré après centrifugation à 12000 rpm pendant 10 min et doit être séché avant de procéder à l’amplification de séquençage.

3. Réaction de séquençage : Le principe de la technique de séquençage est détaillé précédemment, en page 85. La réaction de séquençage a été réalisée en utilisant le kit (DYEnamic™ ET Dye Terminator Cycle Sequencing Kit for MegaBACE™, Amersham Biosciences). Contrairement au principe classique du séquençage, c'est-à-dire, l'excitation directe des fluorochromes par le laser du séquenceur, les ddNTPs du kit MegaBace portent deux fluorochromes (donateur et accepteur) qui utilisent le transfert d’énergie pour augmenter l’efficacité d’excitation. Le principe du transfert de l'énergie, versus l'excitation directe, garantit alors un séquençage plus sensible et plus fiable. Le fluorochrome donateur (5-carboxyl-fluorescein-FAM), qui est directement excitée par un laser argon (488nm), transfert de l’énergie au fluorochrome accepteur qui varie selon le ddNTP considéré. Lors de leur retour à l’équilibre, les fluorochromes accepteurs émettent une lumière à des longueurs d’onde différentes qui leur sont caractéristiques. Cette fluorescence est ainsi détectée, permettant de reconnaitre le type de ddNTP incorporé et donc la séquence d’ADN analysée. La réaction de séquençage est effectuée dans deux tubes (pour chaque amorce) contenant un volume total de 8 µl. Le mélange réactionnel contient le produit d’amplification purifié, 2.5µM d’amorce (sens Forward 5’ ou Reverse 3’, chacune dans un tube) et le Premix DYEnamic reagent (contenant une polymérase appelée Thermo Sequenase II, des dNTPs classiques et des ddNTPs marqués aux fluorochromes), et son tampon (MegaBACE™, Amersham Biosciences), selon les instructions du fournisseur. La réaction de séquençage est réalisée selon le protocole suivant : une dénaturation de 5 min à 94°C, suivie de 35 cycles de dénaturation à 96°C pendant 5 sec, une hybridation de 5 sec à 50°C et une extension de 2 min à 60°C, avec en final 5 min d’extension supplémentaire à 72°C.

95 POPULATIONS ET MÉTHODES

4. Purification après séquençage : Les produits de séquençage sont purifiés avant de les détecter par électrophorèse capillaire. Cette purification est effectuée avec 30% d’une solution A (contenant 1% de polyacrylamide et 10 M d’acétate d’ammonium) complété avec 70% d’éthanol. De la même manière que la précédente purification : après 30 min de refroidissement à -20°C, le culot est récupéré après centrifugation à 12000 rpm et doit être séché avant de rajouter 10 µl de Hi-Di™ Formamide. Les échantillons d’ADN ont été ensuite envoyés à la plateforme de séquençage commune de l’Université de La Laguna. Les séquences d’ADN sont ensuite communiquées après électrophorèse capillaire, effectuée sur l’analyseur génétique MegaBACETM 1000 (Amersham Biosciences), selon les instructions du fournisseur.

5. Analyse des séquences obtenues : Les chromatogrammes obtenus par séquençage ont été convertis en Format FASTA par le logiciel « Chromas ». Une comparaison des séquences des échantillons analysés avec la séquence de référence rCRS (Revised Cambridge Sequence Reference) a été effectuée, après alignement des séquences avec le logiciel BioEdit, afin de noter les différents polymorphismes présents. Dans le but d’apporter plus de précision aux haplotypes obtenus, nous avons effectué d’autres analyses des polymorphismes SNPs (Single Nucleotide Polymorphisms) et RFLPs (Restriction fragment length polymorphism) de la région codante de l’ADNmt.

IV.1.2 Analyse des polymorphismes de l’ADNmt : Dans le but de déterminer, de façon précise, les haplogroupes et sous-groupes de chaque individu: - d’une part, nous avons analysé 16 RFLPs présents dans la région codante de l’ADNmt par la méthode PCR-RFLP sur 93 échantillons, - et d’autre part, nous avons analysé 27 SNPs, dont 26 sont localisés dans la région codante, par des réactions multiplex de miniséquençage SNaPshot. Ces SNPs définissent des haplogroupes assez répandues en Europe, et des sous-groupes de l’haplogroupe H. Le principe de ces deux méthodes est expliqué dans la partie suivante.

96 POPULATIONS ET MÉTHODES

IV.1.2.1 Analyse par PCR-RFLP : a. Principe de la PCR-RFLP : C’est une technique d’amplification d’une séquence génique, contenant le SNP, qui est ensuite digéré par une enzyme de restriction. Le SNP touche une base nucléotidique, modifiant le site de coupure d’une enzyme de restriction en provoquant soit l’apparition ou la disparition du site de restriction. La détection de la présence ou l’absence du polymorphisme sera alors interprétée après électrophorèse sur gel d’agarose et analyse des tailles des fragments obtenus après digestion. b. Protocole de l’analyse effectuée : Le Tableau 3 présente les 16 polymorphismes, caractéristiques de certains haplogroupes et sous-groupes de l’ADNmt, analysés par PCR-RFLP.

Tableau 3 : Les polymorphismes de l’ADNmt analysés par PCR-RFLP Coupure + / Position Enzyme de Haplogroupe Absence de coupure RFLP restriction - H 7025 AluI - H1 3010 Tsp509I - H3 6776 NdeI + H6 239 MaeIII + H9 13020 HaeIII - M 10397 AluI - M 10394 DdeI - HV 14766 Tru9I - L1 et L2 3592 HpaI - V/HV0 15904 Tru9 - V/HV0 4577 Hsp92II + H/V/HV/R0 11718 HaeIII + X, I ou N 1719 DdeI - K/U 9052 HaeII - U 12308 HinfI - U5 9477 Tsp509I + U8b/K 9052 HaeII -

97 POPULATIONS ET MÉTHODES

L’analyse par PCR-RFLP a été réalisée en deux étapes : La première étape : est l’amplification du fragment contenant le polymorphisme RFLP dans un milieu réactionnel de volume final de 10µl qui contient 50 ng/µl d’ADN, 1 X du tampon,

1 mM de dNTPs, 0.1 µm des amorces, 2.5 mM de MgCl2 et 0.5 U de Taq polymérase. Les conditions d’amplification sont les suivantes : une première étape de dénaturation à 95°C pendant 2 min, et 35 cycles comprenant une étape de dénaturation (94°C pendant 15 sec), une étape d’hybridation des amorces (température selon les caractéristiques des amorces, voir Annexe III), et une étape d’élongation à 72°C pendant 15 sec, suivie d’un cycle d’élongation finale à 72°C pendant 2 min.

La deuxième étape : Après vérification de l’amplification par migration électrophorétique sur gel d’agarose, on procède à la digestion enzymatique. Le milieu réactionnel comprend 10µl du produit de PCR, 0.5 U de l’enzyme de restriction appropriée, 1 X du tampon de l’enzyme et 0.1 µg/µl de BSA. L’incubation est effectuée à la température spécifiée par le fournisseur pour chaque enzyme pendant 2 heures (Annexe III). Le test de digestion est réalisé sur un gel d’acrylamide (29 :1) à 60 Volts pendant environ 3 heures. Après coloration au BET, les fragments de digestion sont révélés sous une lampe UV.

IV.1.2.2 Analyse par miniséquençage SNapShot : a. Principe de la réaction multiplex de miniséquençage SNapShot : Le typage des SNPs par miniséquençage utilise le kit SNapShotTM (Applied Biosystems). Il s’agit d’une étape de discrimination allélique qui repose sur une réaction d’extension d’amorce d’une seule base appelée SBE (pour Single Base Extension) ou réaction de miniséquençage. Cette réaction nécessite l’utilisation des didésoxynucléotides ddNTPs marqués par des fluorochromes. Dans le mélange réactionnel du kit SNapShotTM (Applied Biosystems) :

• Le ddATP est marqué par le dR6G (un fluorochrome qui donne une couleur verte) ; • Le ddCTP est lié au dTAMRA qui donne une fluorescence jaune, indiqué par une couleur noir ; • Le ddGTP est lié au dR110, indiqué par une couleur bleue ; • Et le ddTTP est lié au dROX, indiqué par une couleur rouge.

98 POPULATIONS ET MÉTHODES

Les séquences d’ADN cibles sont d’abord amplifiées, puis subissent une dénaturation donnant ainsi de l’ADN simple brin. Les amorces spécifiques SBE (Single Base Extension) vont s’hybrider de façon adjacente au polymorphisme à détecter, puis une ADN polymérase va incorporer le ddNTP (portant le fluorochrome) complémentaire du nucléotide potentiellement muté, ce qui permet aussitôt l’arrêt de l’extension. D’où le nom de miniséquençage car un seul nucléotide est séquencé (Figure 27). La nature du signal émis par ce fluorochrome indique donc la nature du nucléotide (normal ou muté) au site s’intérêt. Il est également possible de multiplexer les réactions PCR et SBE afin d’analyser plusieurs SNPs simultanément. La PCR multiplex utilise ainsi des amorces SBE de différentes tailles afin de pouvoir distinguer les différents produits de l’extension de chaque SNP sur l’électrophorégramme généré après leur migration par électrophorèse capillaire (Figure 28). L’analyse des résultats est effectuée par le software GeneMapper® (Applied Biosystems).

Figure 27: Principe de la réaction de miniséquençage SNapShot (Bouakaze, 2010)

99 POPULATIONS ET MÉTHODES

Figure 28: Réaction multiplex pour l’analyse simultanée de plusieurs SNPs par miniséquençage SNapShot (Vallone, 2002)

b. Protocole de l’analyse SNapShot employé: Nous avons analysé, par une première réaction multiplex de miniséquençage SNapShot, 11 SNPs caractérisant des haplogroupes assez répandus en Europe qui sont : HV, N, H, V, HV0, L1/L2, L3, J/T, M, U, K, R, J, I, selon le protocole décrit par (Quintáns et al. 2004). Par ailleurs, deux autres multiplex de miniséquençage SNapShot ont été réalisées dans le but de déterminer les sous-groupes de l’haplogroupe H. La première définissant les sous-groupes de H1 à H7 et analysant 7 SNPs. La deuxième définissant les sous-groupes de H8 à H15 et analysant 9 SNPs, selon les protocoles décrits par (Quintáns et al. 2004) et (Grignani et al. 2009). La position et la nature des polymorphismes caractéristiques des haplogroupes et sous-groupes génotypés, par ces trois réactions multiplex, sont indiquées dans le Tableau 4.

100 POPULATIONS ET MÉTHODES

Tableau 4: Caractéristiques des polymorphismes de l’ADNmt identifiés par miniséquençage SNapShot

101 POPULATIONS ET MÉTHODES

Chaque réaction de miniséquençage est effectuée de la même manière qu’une réaction de séquençage : L’analyse débute par une première étape d’amplification de la région contenant le ou les polymorphismes analysés, suivie d’une purification des amplicons puis de la réaction PCR-SBE (PCR- Single Base Extension) et enfin une détection des produits d’extension purifiés après électrophorèse capillaire (Figure 29).

Figure 29 : Protocole de l’analyse SNapShot

102 POPULATIONS ET MÉTHODES

1. Amplification d’ADN par PCR : Chaque réaction PCR multiplex est réalisée dans un volume total de 20 µl qui contient 50 ng/µl d’ADN, 1 X du tampon, 1 mM des dNTPs,

2.5 mM de MgCl2, 0.075 µg/µl de BSA (Bovine Serum Albumine), 0.75 U de la Taq polymérase et le mix des amorces dont les caractéristiques et les concentrations sont décrites en Annexe (IV.a et IV.b). Les conditions d’amplification comprennent une première étape de dénaturation pendant 5 min à 95°C, et 32 cycles comprenant une étape de dénaturation (94°C pendant 30 sec), une étape d’hybridation des amorces (60°C pendant 30 sec), une étape d’élongation (72°C pendant 1 min), et un cycle d’élongation finale (72°C pendant 15 min). Le test d’amplification est réalisé sur gel de polyacrylamide (19 :1) afin de vérifier les résultats de la PCR.

2. L’étape de purification est réalisée pour 5 µl du produit d’amplification, auquel est rajouté 1 U d’Exo-SAP (Amersham). Il s’agit d’un mélange de deux enzymes l’Exonucléase I et la phosphatase alcaline de crevette (Pandalus borealis) (SAP : Shrimp Alkaline Phosphatase). La première dégrade les simples brins d’ADN et le reste d’amorces, et la deuxième hydrolyse les dNTPs non incorporés lors de la PCR. L’incubation est effectuée à 37°C pendant 15 min puis à 85°C (15 min) pour inactiver l’enzyme.

3. La PCR-SBE est réalisée dans un volume final de 5 µl comprenant 1,5 µl du produit d’amplification purifié, le réactif SNaPshot multiplex (Applied Biosystems), selon les recommandations du fournisseur, et le mix des amorces SBE dont les caractéristiques et concentrations sont données en Annexe (IV.a et IV.b). Les conditions de la PCR-SBE consistent à 25 cycles composés d’une dénaturation à 96°C pendant 10 sec, une hybridation à 50°C pendant 5 sec, et une élongation à 60°C pendant 30 sec.

4. Une phase de purification des produits d’extension est ensuite réalisée avec l’enzyme SAP (1 U) qui élimine le reste de ddNTPs après incubation à 37°C pendant 1heure, suivie de 10 min à 85°C pour inactiver l’enzyme.

5. Analyse des produits de miniséquençage: Afin de préparer les produits amplifiés pour TM l’électrophorèse capillaire, 1 µl du produit SNaPshot est déposé sur 9.5 µl de Hi-Di Formamide et 0,5 µl de GenScan-Liz120 (un marqueur de taille). Ce mélange subit rapidement une dénaturation à 95°C pendant 5 min. Jusqu’au chargement des échantillons

103 POPULATIONS ET MÉTHODES sur le séquenceur automatique, ils sont stockés à froid à 4°C. Les échantillons ont été analysés avec le séquenceur automatique ABI PRISM® 3130 Genetic Analyzer (Applied Biosystems). Les données sont ensuite interprétées grâce aux logiciels GeneScan et Genotyper software version 3.7 (Applied Biosystems).

IV.1.3 Classification des haplotypes de l’ADNmt en haplogroupes: L’analyse conjointe des combinaisons SNPs et RFLPs de l’ADNmt permet d’établir les haplotypes qui sont regroupés d’après leurs relations phylogénétiques, et assignés en haplogroupes. Cette classification en haplogroupes et sous-haplogroupes a été effectuée, en utilisant la nomenclature de l’arbre phylogénétique de l’ADNmt actualisée (mtDNA tree Build 15; 30-9-2012) proposée par van Oven et Kayser (2009). La classification des sous- haplogroupes H a été effectuée selon Loogväli et Roostalu et al. (Loogväli et al. 2004; Roostalu et al. 2007).

IV.2 Analyse du chromosome Y : L’analyse du chromosome Y, avait pour but d’affiner les résultats d’une étude précédente (Robino et al. 2008a) sur la population nord-ouest algérienne, en analysant de nouveaux SNPs. Nous avons donc sélectionné les 6 échantillons d’ADN appartenant à l’haplogroupe E1b (M78) et les 12 échantillons d’ADN appartenant à l’haplogroupe R1b (M343), afin de déterminer leurs sous-groupes (Figure 30). L’analyse a été effectuée par la technique PCR- RFLP : - Pour la subdivision de l’haplogroupe E, nous avons recherché les mutations suivantes : V12, V13, V22, V32 et V65. - Pour la subdivision de l’haplogroupe R, nous avons recherchés les mutations suivantes : V88, L11, L23, M412, M529, S116, U106 et U152.

104 POPULATIONS ET MÉTHODES

Figure 30 : Représentation phylogénétique simplifiée des polymorphismes et haplogroupes du chromosome Y recherchés

IV.2.1 Analyse de la subdivision de l’haplogroupe E1b (M78) : L’amplification du fragment contenant le polymorphisme RFLP est réalisée dans un volume total de 50 µl qui contient 50 ng/µl d’ADN, 1 X du tampon, 200 µM de chaque dNTP,

2.5 mM de MgCl2, 1 U de Taq polymérase et 10 pm de chaque amorce dont les séquences sont décrites en Annexe V.

IV.2.2 Analyse de la subdivision de l’haplogroupe R1b (M343) : L’amplification du fragment contenant le polymorphisme RFLP est réalisée dans un volume total de 10 µl qui contient 50 ng/µl d’ADN, 0.25 mM du mélange des 4 nucléotides,

0.1 µg/µl de BSA (Bovine Serum Albumine), 2.5 mM de MgCl2, 1 X du tampon, 0.5 U de Taq polymérase et 1 µM de chaque amorce dont les séquences sont décrites en Annexe V.

IV.2.3 Conditions d’amplification et de digestion enzymatique : Pour les deux PCR, précédemment décrites, les conditions d’amplification comprennent une première étape de dénaturation pendant 2 min à 95°C, et 34 cycles comprenant une étape de dénaturation (94°C pendant 15 sec), une étape d’hybridation des amorces (température décroissante de 63 à 56°C, selon un programme PCR Touchdown pour les 14 premiers cycles, suivie de 20 cycles à 56°C), une étape d’élongation (72°C pendant 15 sec), et un cycle d’élongation finale (72°C pendant 2 min). La digestion est réalisée pour 10 µl du produit

105 POPULATIONS ET MÉTHODES

PCR, auquel est ajouté l’enzyme appropriée, selon les instructions du fournisseur (Annexe V). Les résultats sont ensuite visualisés après électrophorèse sur gel d’agarose à 3%.

IV.2.4 Classification et nomenclature des haplogroupes du chromosome Y: Pour la subdivision des marqueurs E-M78 et R-M343, nous avons utilisé la nomenclature actualisée proposée par Cruciani et Myres et leurs collaborateurs (Cruciani et al. 2006; 2007; Myres et al. 2011). Dans l’analyse comparative des haplogroupes du chromosome Y entre différentes populations de la littérature, nous avons utilisé la nomenclature proposée par Karafet et al. (Karafet et al. 2008), et actualisée selon le site web de l’ISOGG (the International Society of Genetic Genealogy) (http://www.isogg.org/tree/). Pour l’abréviation, dans le texte, nous avons utilisé le nom de l’haplogroupe majeur plus le marqueur SNP terminal.

IV.3 Analyse statistique des résultats des marqueurs uniparentaux : L’analyse statistique des résultats de l’étude des marqueurs uniparentaux comprend : • L’analyse de la variation génétique de ces deux marqueurs ; • Les méthodes de réduction dimensionnelles qui résument les relations entre la population nord-ouest algérienne et des populations de différents pays et/ou régions géographiques choisies dans la littérature ; • Et enfin une représentation des relations phylogénétiques, par la méthode median- joining Network, des séquences HVS-I des sous-groupes M1 de l’ADNmt.

En plus des échantillons analysés, nous avons inclus dans l’analyse statistique comparative 18050 séquences HVS-1 de l’ADNmt de 18 populations de différents pays et/ou régions géographiques choisis dans la littérature: du bassin méditerranéen (12675 séquences), du Moyen Orient (4106) et du Caucase (1269) (Tableau 5, Figure 31). Pour l’analyse de la dissection de l’haplogroupe H de l’ADNmt, seules les séquences HVS-I de la position 16024 à 16365 ont été utilisées pour la comparaison génétique. Nous avons, également, effectué une analyse statistique comparative de la distribution des haplogroupes du chromosome Y entre différentes populations, en incluant des données récentes (Tableau 5, Figure 31). Nous avons considéré 19343 individus à partir : du bassin méditerranéen (11314), du Moyen Orient (4448) et du Caucase (3581). Afin d’éviter les effets de micro-différentiation, certains échantillons de populations ont été regroupés dans

106 POPULATIONS ET MÉTHODES des régions larges ou dans un même pays. Les références des études menées sur les populations considérées dans ces analyses, et présentées dans le Tableau 5, sont indiquées en Annexe (VI et VII).

Tableau 5: Populations considérées dans l’analyse des marqueurs uniparentaux

Pour l’analyse du Pour l’analyse de l’ADNmt chromosome Y

Code Populations Effectif Code Populations Effectif

Péninsule Ibérique (Espagne + IP 3873 1971 Portugal) FRC France + Corse 1304 776

ISS Italie + Sardaigne + Sicile 2525 3401

BAL Balkans + Crète 1971 3115

SAM Sahara Occidental + Mauritanie 145 189

MOR Maroc (Arabes + Berbères) 1194 760

ALG Algérie (Nord-Ouest) 240

AlgNC Algérie (Nord-Centre) 47 ALG Algérie 156

MOZ Algérie (M’Zab) 85

TUN Tunisie (Arabes + Berbères) 591 Tunisie TUN (Arabes + 601 TuAn Tunisiens Andalous 155 Berbères)

LIB Libye 269 83

EGY Egypte 516 370

CAU Caucase 1269 3581

TUR Turquie 494 523

Levant (Jordanie, Palestine, Syrie et LEQ 655 2741 Liban) + Irak KRN Kurdes + Iran 924 IRN Iran 566

Péninsule Arabe (Arabie Saoudite, ARP Koweït, les Emirats Arabes Unis 2033 618 (EAU), Yémen, Oman)

107 POPULATIONS ET MÉTHODES

Figure 31 : Carte géographique montrant les pays et populations considérées dans l’analyse des marqueurs uniparentaux

IV.3.1 Analyse de la variation génétique des marqueurs uniparentaux : Les différents indices de structure génétique des populations sont analysées avec le logiciel Arlequin version 3.5 (Excoffier et Lischer 2010). Il s’agit de l’analyse de la diversité génétique (h) de Nei (Nei 1987), le calcul de l’indice statistique de fixation FST de Wright (Wright 1950) et l’analyse de la variance moléculaire (AMOVA).

• La diversité génétique (h) de Nei : représente le niveau de variation nucléotidique des allèles identifiés dans une population. Elle exprime la probabilité pour que 2 gènes tirés au 2 hasard dans une population soient différents. h = 1- Σ Pi : où pi est la fréquence de l’allèle i au locus considéré. h est équivalent à l’hétérozygotie théorique sous l’hypothèse de Hardy- Weinberg;

108 POPULATIONS ET MÉTHODES

• Les statistiques F de Wright (FST) : La mesure de l'indice de différenciation FST entre les populations a été calculée à partir des fréquences des haplogroupes de l’ADNmt et du chromosome Y, et leurs valeurs significatives ont été évaluées par un test de permutation non paramétrique implanté dans le programme Arlequin. Les distances moléculaires entre les populations ont été représentées à travers une matrice du paramètre de variabilité inter- populationnelle FST, obtenue par la méthode pairwise difference (nombre de nucléotides différents entre chaque paire d'haplotypes) ;

• Les analyses de la variance moléculaire AMOVA (Excoffier et al. 1992) mesurent la diversité nucléotidique et peuvent être utilisées pour (1) décrire les sources des variations intra et intergroupes et (2) tester les groupements de populations que l’on définit pour nos analyses. Dans l'évaluation des structures génétiques maternelle et paternelle de la population nord- ouest algérienne, l’analyse de la variation génétique AMOVA pour les deux marqueurs uniparentaux a été répartie dans et parmi différentes régions géographiques.

Nous avons partagé les 2 groupes des populations des deux rives du bassin méditerranéen : - L'Afrique du Nord : incluant les échantillons de l'Égypte, la Libye, la Tunisie, le Maroc, la Mauritanie et le Sahara Occidental. - L’Europe du Sud : incluant l'Espagne, le Portugal, la France, la Corse, l'Italie, la Sicile, la Sardaigne, les Balkans et la Crète.

Pour des comparaisons géographiques plus étendues, les régions de l’ouest de l’Asie suivantes ont été prises en compte : • Le Caucase ; • La Péninsule arabe (incluant l'Arabie Saoudite, le Koweït, les Emirats Arabes Unis (EAU), le Yémen, l'Oman et Dubaï) ; • Le Levant (incluant la Jordanie, la Palestine, la Syrie et le Liban) et l’Irak; • La Turquie et l'Iran qui ont été, chacune, considérées à part.

109 POPULATIONS ET MÉTHODES

IV.3.2 Méthodes de réduction dimensionnelles: L'application de l’analyse en composantes principales (ACP), basée sur les données des fréquences des haplogroupes, a été réalisée par le logiciel statistique IBM SPSS Statistic 19 version (SPSS Inc., Chicago, Illinois). L'objectif est de représenter graphiquement les relations génétiques entre des populations sur un plot (une figure) pour que les coordonnées projetées rapprochent les ressemblances génétiques originales. Malgré quelques limitations (c'est-à-dire des processus démographiques différents qui peuvent donner les mêmes projections), ces projections informent de l'histoire généalogique sous-jacente des échantillons (McVean 2009). Ceci implique que les inférences démographiques comme la migration, l'isolement géographique et le mélange dans la structure génétique peuvent être effectuées à partir de l'étude de ces plots.

IV.3.3 Méthode median-joining Network appliquée aux sous-groupes M1 de l’ADNmt: La méthode du Network est appliquée sans filtre afin de construire un arbre de median- joining à partir des haplotypes complets (Bandelt et al. 1999). Cet arbre met alors en évidence l'ensemble des mutations détectées et leur répartition entre les populations. Le Network présente une forme d’un arbre étoilé avec des relations phylogénétiques linéaires entre les haplotypes représentés par les différentes mutations. La relation phylogénétique, entre les séquences HVS-I de l’ADNmt appartenant aux sous-groupes M1, a été établie par l’analyse du reduced median network algorithm pour l’ensemble des populations analysées, en utilisant le logiciel du site : http://www.fluxus-engineering.com/sharenet.htm.

110

RÉSULTATS ET DISCUSSION RÉSULTATS ET DISCUSSION

I Analyse du chromosome X :

I.1 Résultats des essais PCR : Une concordance de génotype complète a été observée pour les trois marqueurs DXS8378, DXS7132 et HPRTB, amplifiés simultanément par le kit Argus X-8 (Biotype GE, Dresden Germany) et par les réactions PCR multiplex A et B développées au laboratoire d’accueil. Cette comparaison entre les différentes techniques employées est intéressante puisque des incompatibilités de génotypage des loci STRs, entre des échantillons amplifiés avec différentes amorces, sont possibles. Ces incompatibilités peuvent être principalement dues à des mutations ponctuelles qui peuvent survenir au niveau des sites de liaisons des amorces utilisées dans chaque réaction multiplex (Clayton et al. 2004). Plusieurs cas de non liaisons des amorces aux sites mutés ont été précédemment décrites pour les marqueurs X-STRs (Robino et al. 2008b). Dans le cas d’une mutation au niveau du site de liaison des amorces pour un locus donné, l’amplification d’ADN n’aura pas lieu et aboutira à ce qu’on appelle des allèles nuls « null alleles ». Si un individu est hétérozygote pour un STR donné, la présence d’allèle nul sur un des deux chromosomes aboutira à l’obtention d’un génotype homozygote. De tels résultats erronés sont inacceptables lors d’une enquête médico-légale qui utilise des marqueurs X-STRs. De ce fait, une évaluation appropriée de la reproductibilité des résultats de PCR, dans les études qui utilisent différents protocoles d’amplification, est nécessaire pour une standardisation inter-laboratoires des méthodes d’analyses employées.

I.2 Analyse génétique des 21 X-STRs : Nous avons pu obtenir les génotypes, des 21 marqueurs X-STRs analysés, pour 210 échantillons d’ADN de 104 hommes et 106 femmes (316 chromosomes) de la population nord-ouest algérienne. Aucune déviation significative (p = 0.36) dans la distribution allélique des X-STRs entre les sous-échantillons masculins et féminins, n’a été observée par le test exact de différenciation génique (valeur significative : p < 0.0025). Les fréquences alléliques obtenues sont rapportées sur la Figure 32. Nous remarquons que les marqueurs STRs DXS10135 et DXS10011 sont les plus polymorphes et présentent chacun 35 et 34 allèles, respectivement. Par ailleurs, le marqueur le moins polymorphe (DXS7423), qui présente seulement 5 allèles, démontre la fréquence allélique la plus élevée, comptant pour 42%. Le locus DXS10103 présente la deuxième fréquence allélique la plus élevée (41%).

111 RÉSULTATS ET DISCUSSION

112 RÉSULTATS ET DISCUSSION

113 RÉSULTATS ET DISCUSSION

En se basant sur la distribution des génotypes observés et attendus dans le sous-échantillon féminin, tous les marqueurs X-STRs étaient en équilibre d’Hardy-Weinberg (HW) (p < 0.0025), après la correction de Bonferroni pour le test multiple.

I.3 Séquençage du marqueur STR (DXS10148): Au locus DXS10148, environ 5 % des chromosomes analysés (Figure 32) ont montré la présence d'allèles caractérisés par de longues unités de répétitions (> 36), précédemment non décrites dans l’échantillon allemand (398 chromosomes) analysé par Hundertmark et al. (2008). Au début, le séquençage du locus DXS10148 a été réalisé uniquement pour les individus (n=7) présentant des allèles > 36 dans le sous-échantillon hémizygote masculin, où le chromosome X est présent en une seule copie. Certains échantillons ont montré une structure de l’unité de répétition légèrement différente de celle décrite par Hundertmark et al. b (2008). La structure de référence étant : PF - [GGAA]4 - [AAGA]X - A - [AAAG]Y - N8 -

[AAGG]2 – N104 - PR. Par exemple, un des trois allèle séquencé (38.1) a montré un motif additionnel répété en bloc [AGGA]3 à l’intérieur de l’unité de répétition [AAGA]X du locus. De plus, les deux séquences de l’allèle (41.1) ont montré une substitution A>T dans une seule unité de répétition [AAGA]X (Tableau 6). Ces résultats nous ont encouragé à séquencer au moins un échantillon de chaque variant allélique observé pour ce locus, dans le sous-échantillon masculin de la population nord- ouest algérienne. Curieusement, nous avons observé une variabilité, tant dans la position de l’insertion de l’Adénine donnant des allèles intermédiaires, que dans l’unité de structure répétée. Des allèles ayant la même taille mais des structures de l’unité de répétition des X- STRs différentes ont été, également, observées. Aussi, la taille des amplicons, pour certains allèles génotypés, présente des écarts larges (> ± 0.5 bp) comparés aux tailles attendues, basées sur des séquences des lignées cellulaires témoins K562 et 9947A (Promega, Madison, WI). De nouvelles données sur la distribution de fréquence et le séquençage des allèles du locus DXS10148 dans d'autres populations (notamment africaines, subsahariennes et asiatiques) sont nécessaires pour mieux comprendre le degré de variabilité dans sa structure moléculaire. Ceci permettant de clarifier probablement sa signification évolutionnaire et de définir une nomenclature de consensus (Bär et al. 1997),

114 RÉSULTATS ET DISCUSSION

Tableau 6 : Structure de l’unité de répétition du locus DXS10148 analysée dans l’échantillon nord-ouest algérien

Alléle Structure de l’unité de répétition Nba

14 PF - [GGAA]4 - [AAAG]6 - N8 - [AAGG]2 - [AAAG] - [AAGG] - N104 - PR 1

17 PF - [GGAA]4 - [AAGA]7 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1

18 PF - [GGAA]4 - [AAGA]8 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 2

19 PF - [GGAA]4 - [AAGA]9 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 20.1 PF - [GGAA]4 - [AAGA]11 - A - [AAAG]3 - N8 - [AAGG]2 – N104 - PR 1

21 PF - [GGAA]4 - [AAGA]11 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 22.1 PF - [GGAA]4 - [AAGA]13 - A - [AAAG]3 - N8 - [AAGG]2 – N104 - PR 2

23 PF - [GGAA]4 - [AAGA]11 - [AAAG]4 - N8 - [AAGG]2 - [AAAG] - [AAGG] – N104 - PR 1 b 23.1 PF - [GGAA]4 - [AAGA]12 - A - [AAGA] - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 24.1 PF - [GGAA]4 - [AAGA]15 - A - [AAAG]3 - N8 - [AAGG]2 – N104 - PR 1 b 24.1 PF - [GGAA]4 - [AAGA]13 - A - [AAGA] - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 25.1 PF - [GGAA]4 - [AAGA]16 - A - [AAAG]3 - N8 - [AAGG]2 – N104 - PR 2 b 26.1 PF - [GGAA]4 - [AAGA]17 - A - [AAAG]3 - N8 - [AAGG]2 – N104 - PR 3 b 26.1 PF - [GGAA]4 - [AAGA]15 - A - [AAGA] - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 27.1 PF - [GGAA]4 - [AAGA]18 - A - [AAAG]3 - N8 - [AAGG]2 – N104 - PR 1

28 PF - [GGAA]4 - [AAGA]16 - [AAAG]4 - N8 - [AAGG]2 - [AAAG] - [AAGG] - N104 - PR 1 b 28.1 PF - [GGAA]4 - [AAGA]17 - A - [AAGA] - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 2 b 28.1 PF - [GGAA]4 - [AAGA]19 - A - [AAAG]3 - N8 - [AAGG]2 – N104 - PR 1

29 PF - [GGAA]4 - [AAGA]17 - [AAAG]4 - N8 - [AAGG]2 - [AAAG] - [AAGG] - N104 - PR 1 b 29.1 PF - [GGAA]4 - [AAGA]18 - A -[AAGA] - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 2 b 31.1 PF - [GGAA]4 - [AAGA]20 - A -[AAGA] - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 31.1 PF - [GGAA]4 - [GGAG]3 - A - [AGGA]16 - [AGAG]3 – [AAAG] - N8 - [AAGG]4 – N104 - PR 1 b 36.1 PF - [GGAA]4 - [AAGA]14 - A - [AAGA]12 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 37.1 PF - [GGAA]4 - [AAGA]13 - A - [AAGA]14 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 38.1 PF - [GGAA]4 - [AAGA]13 - A - [AAGA]15 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 2 b 38.1 PF - [GGAA]4 - [AAGA]12 - A - [AGGA]3 - [AAGA]13 - [AAAG]4 - N8 - [AAGG]2 – N104 - PR 1 b 41.1 PF - [GGAA]4 - [AAGA]17 - A - [AAGA]9 - [TAGA] - [AAGA]4 - [AAAG]4 - N8 - [AAGG]2 – 2

N104 - PR Structure de référence de l’unité de répétition b PF - [GGAA]4 - [AAGA]X - A - [AAAG]Y - N8 - [AAGG]2 – N104 - PR a Nombre d’allèles séquencés b Les insertions donnants des allèles intermédiaires Les différences dans la position de l’insertion de l’Adénine et dans la structure de l’unité de répétition sont données en Gras et Italique

115 RÉSULTATS ET DISCUSSION

I.4 Analyse statistique : I.4.1 Analyse du déséquilibre de liaison : L’analyse du déséquilibre de liaison (DL) entre les marqueurs étroitement liés nécessite les fréquences des haplotypes au sein des groupes de liaison du chromosome X, au lieu des fréquences alléliques. Le Tableau 7 rassemble les combinaison alléliques et le nombre total des haplotypes observés pour chaque marqueur X-STR au sein de l’un des six clusters définis (cluster 1 DXS10148-DXS10135-DXS8378, en position Xp22; cluster 2 DXS7132- DXS10074-DXS10079, en position Xq12; cluster 3 DXS6801-DXS6809-DXS6789, en position Xq21; cluster 4 DXS7424-DXS101, en position Xq22; cluster 5 DXS10103- HPRTB-DXS10101, en position Xq26; cluster 6 DXS8377-DXS10146-DXS10134- DXS7423-DXS10011, en position Xq28). Seuls les allèles ayant une fréquence (N >1) ont été pris en considération. Les valeurs p du test par paires de déséquilibre de liaison sont également rapportées sur ce tableau. Les marqueurs des clusters 1, 2, 5 et 6 correspondent aux quatre groupes de liaison décrits sur le chromosome X, respectivement (Szibor et al. 2003). Le test exact du déséquilibre de liaison (DL) a été réalisé sur 19 marqueurs X-STR analysés dans le sous-échantillon masculin de la population nord-ouest algérienne. Aucun déséquilibre de liaison significatif (p < 0.05) n'a été observé entre les paires de marqueurs, situés dans les six groupes de loci liés (cluster). Cette absence de DL peut être due à la petite taille de l’échantillon analysé (n=104). La plus faible valeur non significative (p = 0.072) a été observée entre les deux loci du sixième cluster (DXS8377- DXS10011), où la distance génétique entre les loci est relativement élevée (5.04 cM). En effet, sur la base de la distance génétique, si une association allélique pouvait être observée entre les loci analysés, elle devrait être attendue pour des marqueurs moins distants, comme par exemple (DXS6809– DXS6789) (0.35 cM) et (DXS10074-DXS10079) (0.1cM). Ces loci ont été rapportés en DL significatif dans la population allemande (n > 781) (Szibor et al. 2005 ; Hering et al. 2005). Néanmoins, des études sur la population italienne (n=80) et coréenne (n=150) n’ont pas pu observé de tels résultats pour ces marqueurs X- STRs (Lee et al. 2004 ; Robino et al. 2006). Par ailleurs, l’analyse du déséquilibre de liaison effectuée dans 80 familles, composées d’une mère et plus d’un fils, de la population italienne a permis d’observer un DL uniquement entre les loci DXS6801 et DXS6809 (p = 0.017) (Inturri et al. 2011).

116 RÉSULTATS ET DISCUSSION

Pareillement, le déséquilibre de liaison peut être attendu pour les marqueurs étroitement liés décrits dans les quatre groupes de liaison du chromosome X. C’est le cas pour la population suédoise (n=718), où les loci (DXS10135-DXS8378, DXS7131-DXS10074, HPRTB- DXS10101, DXS10134-DXS7423) ont été trouvés en DL (Tillmar et al. 2008). Un DL a été également observé entre les marqueurs du même groupe de liaison dans les populations somalienne (n= 127) et espagnole (n=225) (Tomas et al. 2012 ; Ferragut et al. 2014). Cependant, aucun DL n’a été observé entre ces paires de marqueurs dans la population croate (n=78) (Gršković et al. 2013). Ces observations indiquent que le déséquilibre de liaison ne dépend pas seulement de la distance génétique entre les loci. Il est également influencé par la sélection et l’histoire des populations humaines (Nothnagel et al. 2012). D’où l’intérêt de son analyse dans différentes populations.

L’absence de déséquilibre de liaison est définie par une absence d’association allélique non aléatoire. Ainsi, les allèles des 19 marqueurs X-STRs, analysés dans la population nord-ouest algérienne, peuvent être considérés comme indépendants. Ceci implique un fort pouvoir discriminant dans le cadre de leur utilisation dans les études d’apparenté familiale et les analyses médico-légales. En effet, dans les tests de paternité, pour certaines combinaisons haplotypiques des X-STRs, l’index de paternité va considérablement changer si le DL entre les loci n’est pas pris en considération (Tillmar et al. 2008). De plus, certains marqueurs STRs sont fortement liés, et constituent des marqueurs encore plus complexes lorsqu’ils sont combinés que lors de leur utilisation individuelle (Nothnagel et al. 2012). De ce fait, un DL peut toujours se produire entre des marqueurs étroitement liés et doit donc être mesuré au préalable de leur utilisation en médecine légale (Szibor et al. 2003).

117 RÉSULTATS ET DISCUSSION

118 RÉSULTATS ET DISCUSSION

119 RÉSULTATS ET DISCUSSION

I.4.2 Analyse des paramètres statistiques d’intérêt médico-légal Les paramètres d’intérêt en génétique médico-légale ont été calculés pour les 21 X-STRs, à savoir: l’hétérozygotie attendue (h), le pouvoir de discrimination chez les femmes et les hommes (PDF et PDM), les valeurs PIC « Polymorphism Information Content » et les index de performance dans les cas de recherche de paternité (MECI : « Mean Exclusion Chance » moyenne d’exclusion des marqueurs autosomiques chez les trios, MECII : moyenne d’exclusion des marqueurs X-STRs chez les trios avec une fille et MECIII : moyenne d’exclusion des marqueurs X-STRs chez les duos Père/ fille) (Tableau 8).

L’hétérozygotie des loci X-STRs dans la population nord-ouest algérienne varie entre 0.957 (DXS10011) et 0.648 (DXS6801). Le marqueur le plus polymorphe est le DXS10011 (PIC= 0.952, avec 34 allèles) et le moins polymorphe est le DXS6801 (PIC= 0.597, avec 6 allèles). Les marqueurs (DXS10011, DXS6801) montrent, également, les valeurs les plus élevées (0.996, 0.954) et les plus faibles (0.826, 0.646) du pouvoir de discrimination chez les femmes (PDF) et chez les hommes (PDM), respectivement. Nous pouvons remarquer, également, que l’ensemble des 21 loci STR analysés présente des valeurs du pouvoir de discrimination chez les femmes (PDF) supérieures à 0.826. Ces résultats suggèrent que ces loci sont très polymorphes et possèdent une efficacité satisfaisante en sciences médico-légales, voir excellente pour certains loci. En effet, il est intéressant de noter que les marqueurs DXS10011, DXS10135, DXS10146, DXS8377, DXS10101 et DXS 10148 sont les plus polymorphes (h > 0.90), avec les valeurs les plus élevées du pouvoir discriminant (> 0.90) et des probabilités d’exclusion paternelle (MEC > 0.80). Ils présentent également le plus large panel du nombre d’allèles (Figure 32). Par ailleurs, les marqueurs STRs : DXS8378, DXS7132, DXS6800, DXS6801 et DXS7423 montrent des valeurs PDF inférieures à 0.900, leur pouvoir discriminant paternel ainsi que leur PIC présentent des valeurs moyennes, en comparaison avec les autres loci.

Les tests de paternité effectués pour un trio généralement composé d’une mère, d’un enfant et du présumé père peuvent être aisément résolus par l’utilisation des marqueurs STRs autosomiques et ne nécessitent pas davantage de marqueurs alternatives. Cependant, quand c’est la relation père/fille qui est mise en test, il est intéressant d’utiliser les marqueurs X- STRs également. Ceci, particulièrement, dans les cas d’une analyse difficile du matériel biologique, tel que l’utilisation des cadavres exhumés ou des échantillons historiques ou préhistoriques. Dans ces cas, les STRs de petites tailles doivent être dotés d’un pouvoir

120 RÉSULTATS ET DISCUSSION

statistique satisfaisant. Favorablement, les X-STRs sont caractérisés par les index de probabilité d’exclusion paternel (MEC) les plus élevés, même s’ils sont faiblement ou moyennement polymorphes (Szibor et al. 2003). Ainsi, l’évaluation des paramètres d’intérêt médico-légal permet aux X-STRs de servir comme une extension aux systèmes autosomiques largement utilisés dans les analyses d’identification parentales et dans les analyses médico-légales et les tests d’identification.

Tableau 8: Paramètres statistiques d’intérêt médico-légal

STR h PDF PDM PIC MECI MECII MECIII DXS10148 0.907±0.016 0.984 0.907 0.900 0.809 0.894 0.826 DXS10135 0.950±0.012 0.995 0.947 0.944 0.891 0.943 0.897 DXS8378 0.694±0.026 0.843 0.692 0.630 0.417 0.628 0.484 DXS7132 0.733±0.025 0.885 0.731 0.688 0.502 0.689 0.548 DXS10074 0.868±0.020 0.968 0.865 0.851 0.731 0.850 0.753 DXS10079 0.813±0.022 0.939 0.810 0.786 0.630 0.783 0.665 DXS6800 0.734±0.025 0.885 0.732 0.688 0.501 0.688 0.549 DXS6801 0.648±0.027 0.826 0.646 0.597 0.404 0.597 0.450 DXS6809 0.848±0.020 0.960 0.845 0.827 0.691 0.825 0.720 DXS6789 0.807±0.022 0.938 0.805 0.781 0.626 0.781 0.659 DXS7424 0.793±0.023 0.927 0.791 0.761 0.597 0.761 0.634 DXS101 0.895±0.017 0.979 0.892 0.882 0.780 0.880 0.798 GATA172D05 0.818±0.022 0.940 0.815 0.789 0.631 0.789 0.668 DXS10103 0.752±0.024 0.906 0.749 0.718 0.545 0.718 0.582 HPRTB 0.751±0.024 0.900 0.749 0.711 0.530 0.711 0.574 DXS10101 0.909±0.016 0.984 0.906 0.899 0.807 0.895 0.823 DXS8377 0.919±0.015 0.987 0.916 0.910 0.830 0.910 0.840 DXS10146 0.923±0.015 0.988 0.920 0.915 0.838 0.913 0.849 DXS10134 0.855±0.020 0.962 0.852 0.836 0.707 0.834 0.733 DXS7423 0.676±0.026 0.832 0.674 0.612 0.406 0.612 0.466 DXS10011 0.957±0.011 0.996 0.954 0.952 0.903 0.948 0.910 Les loci STRs en vert indiquent les valeurs les plus élevées. Les loci STRs en orange indiquent les valeurs les plus faibles.

121 RÉSULTATS ET DISCUSSION

I.4.3 Analyse comparative avec d’autres populations : L’analyse comparative entre la population nord-ouest algérienne et d’autres échantillons de différentes populations (de l’Angola, Mozambique, Uganda, Ghana, Italie, Portugal, Espagne, Kurdistan, et Pakistan) n’a pu être effectuée que pour 13 marqueurs X-STRs, dont les données n’ont pas été disponibles pour l’ensemble de ces populations.

Les résultats de la mesure de la proportion de variance (FST) locus par locus, calculés après la correction de Bonferroni pour le test multiple, sont présentés dans le Tableau 9. La plupart des valeurs FST significatives (p < 0.05) ont été observées entre la population algérienne et les populations de l’Afrique subsaharienne, indiquant leur éloignement génétique. En effet, au niveau du locus DXS8377, la valeur FST significative la plus élevée

(FST= 0.602) est observée entre l’Algérie et l’Angola. Pour de nombreux loci, le Pakistan présente, également, des proportions de variation significatives. Alors que, dans la majorité des comparaisons, les populations du contour méditerranéen (Italie, Portugal et Espagne), géographiquement proches de la population algérienne, montrent les plus faibles distances génétiques. Particulièrement, des valeurs significatives sont observées entre l’Algérie et l’Italie pour les locus DXS10011 (FST= 0.003) et DXS6809 (FST= 0.006).

Tableau 9: Proportion de variance (FST) locus par locus entre l’échantillon nord-ouest algérien et différentes populations

Poetsch et Robino et Pereira et Aler et al. Tariq et al. Références Gomes et al. 2007 al. 2009 al. 2006 al. 2007 2007 2008 ; 2009 Angola Mozambique Uganda Ghana Italie Portugal Espagne Pakistan Locus (n=740 (n=112) (n=51) (n=243) (n=160) (n=347) (n=145) (n>302) DXS8378 0.01395 -0.00329 0.00477 0.00498 -0.00082 0.00664 -0.00095 0.00850 DXS7132 0.00146 0.01160 0.03102 0.00000 -0.00236 0.00022 0.00307 -0.00108 DXS6800 - - - 0.16729* 0.00271 - - - DXS6801 - - - - 0.00152 - - 0.01349* DXS6809 -0.00552 0.00955 0.01338 - 0.00626* 0.00367 0.00611 0.00927* DXS6789 0.04475* 0.02629* 0.04505* - 0.02022* 0.01188* 0.00843 0.00743 DXS7424 - - - 0.05784* 0.00112 - - 0.00153 DXS101 0.01159 0.02922* 0.00018 0.02604* -0.00165 0.00105 0.00550* 0.00942* GATA172D05 0.08281* 0.05845* 0.02557 - 0.00274 0.00309 -0.00012 0.01609* HPRTB 0.10926* 0.07245* 0.10886* 0.08281* 0.00212 0.06250* 0.07238* 0.00984* DX8377 0.60274* 0.00881* 0.00839 0.00563* 0.00188 0.00096 0.00307 0.00149 DXS7423 0.03755 0.03704* 0.02070 0.04676* - 0.00000 -0.00058 0.01540* DXS10011 - - - - 0.00338* - - -

* Valeurs p significatives (< 0.004) après la correction de Bonferroni pour le test multiple n : effectif de l’échantillon

122 RÉSULTATS ET DISCUSSION

L’arbre phylogénétique de Neighbor-Joining (NJ), basé sur la matrice des proportions de variance FST, permet de révéler les différences génétiques observées entre les populations examinées (Figure 33). Dans un souci d’utiliser des marqueurs non liés, la comparaison a été limitée à un seul marqueur STR pour chacun des quatre groupes de liaison décrits sur le chromosome X. Ainsi, nous avons sélectionné les loci : DXS8378 (groupe de liaison 1), DXS7132 (groupe de liaison 2), HPRTB (groupe de liaison 3) et DXS8377 (groupe de liaison 4), pour lesquels les fréquences alléliques sont disponibles pour chaque population. Sur l’arbre Neighbor-Joining, les populations de l’Afrique subsaharienne forment un groupe bien distinct des autres populations, notamment de la population algérienne qui semble la plus éloignée. L’arbre montre également que les Algériens sont plus proche génétiquement des Italiens, puis des Pakistanais et moyennement des Espagnols et des Portugais. Ces deux derniers semblent plus proches des Africains.

Figure 33 : Arbre Neighbor-Joining reliant les 8 populations comparées à l’échantillon nord-ouest algérien

(MOZ : Mozambique, GHA : Ghana, ANG : Angola, UGA : Uganda, POR : Portugal, SPA : Espagne, ITA : Italie, PAK : Pakistan, ALG : Algérie)

123 RÉSULTATS ET DISCUSSION

L’analyse en composantes principales (ACP), basée sur des données de fréquence allélique, nous permet, également, d’illustrer la relation entre la population nord-ouest algérienne et les populations des références bibliographiques mentionnées précédemment (Figure 34). En raison du nombre restreint de données X-STRs analysés pour certaines populations, l’analyse comparative est basée sur les mêmes marqueurs utilisés pour l’arbre Neighbor-Joining, à l’exception du DXS101 qui remplace le marqueur HPRTB. Dans le plot (ACP), les relations génétiques ne différent pas de celles observées par la représentation de l’arbre Neighbor- Joining. Ainsi, nous remarquons clairement que les Algériens se regroupent avec les populations eurasiatiques et sont distinctement séparés des populations de l'Afrique subsaharienne.

Figure 34 : Analyse en Composantes Principales de la distribution des fréquences alléliques de 4 X-STRs (DXS8378, DXS7132, DXS101 et DXS8377)

(MOZ : Mozambique, GHA : Ghana, ANG : Angola, UGA : Uganda, POR : Portugal, SPA : Espagne, ITA : Italie, PAK : Pakistan, ALG : Algérie)

124 RÉSULTATS ET DISCUSSION

I.4.3.1 Comparaison entre les populations italienne et nord-ouest algérienne: Compte tenu du rapprochement génétique observé entre les populations algérienne et italienne, nous avons effectué le calcul du test exact de la différenciation génétique entre populations en comparant la distribution des haplotypes des deux clusters : (DXS6801– DXS6809-DXS6789) et (DXS7424–DXS101). Aucune différence significative entre la population algérienne et italienne n’a été observée (p= 0.999 ± 0.001). L’analyse AMOVA a montré que 98.6% de la variation génétique globale au niveau du cluster DXS6801– DXS6809-DXS6789 est due à une diversité intra-populationnelle, alors que 1.4% de la variation est attribuée à la variabilité inter-populationnelle. Une distance génétique non significative a été observée pour ce cluster (FST= 0.014, p = 0.011) entre les deux populations. Au niveau du cluster DXS7424-DXS101, les pourcentages de variation sont de 100.57% à l’intérieur des populations et -0.57% entre les populations. Une faible distance génétique non significative (FST = -0.006, p = 0.562) est également observée entre les deux populations pour ce cluster. Ces résultats indiquent que les variations génétiques se trouvent à l’intérieur des populations algérienne et italienne plutôt qu’entres elles. De telles observations sont en accord avec une étude précédente des polymorphismes SNPs du chromosome X dans les populations méditerranéennes, suggérant une forte homogénéité génétique globale des marqueurs du chromosome X dans les régions au centre et à l’est du bassin méditerranéen. Cette homogénéité serait probablement due à de faibles flux migratoires datant du néolithique, auxquels s’ajoute des migrations plus récentes au nord-ouest de l’Afrique. Toutefois, une distance génétique significative a été rapportée entre la population marocaine et le reste des populations du bassin méditerranéen, incluant les populations géographiquement proches (Tunis, Espagne). Les auteurs expliquent cette particularité de la population marocaine par l’importance du détroit de Gibraltar comme barrière géographique (Tomas et al. 2008).

I. 4.4 Correspondance entre l’analyse des deux chromosomes X et Y : Les haplotypes des marqueurs X-STRs étroitement liés sont transmis d’une génération à une autre, reflétant ainsi l’histoire d’une population. De ce fait, il nous a paru intéressant d'évaluer si la distribution des haplotypes X-STRs corrèle ou non significativement avec celles des autres marqueurs haploïdes. L’échantillon masculin de la population nord-ouest algérienne, analysé dans cette étude, a fait l’objet d’une analyse du chromosome Y en 2006. Cette étude a permis de décrire les

125 RÉSULTATS ET DISCUSSION différents lignées paternelles (haplogroupes de l’Y) dans notre population (Robino et al. 2008a). À partir de ces données, nous avons vérifié la distribution des haplotypes des deux clusters du chromosome X (DXS6801-DXS6809-DXS6789) et (DXS7424-DXS101) au niveau des haplogroupes du chromosome Y. Les résultats obtenus n’indiquent aucune différence significative, c’est-à-dire, qu’il n’existe pas de corrélation entre la distribution des haplotypes X-STRs et les haplogroupes du chromosome Y (Tableau 10). En effet, aucun déséquilibre de liaison significatif (p < 0.05) n'a été observé entre les paires des marqueurs des deux clusters au sein des haplogroupes du chromosome Y, d’une part. Et d’autre part, l'analyse de la variance moléculaire (AMOVA) a montré des valeurs de variation génétique non significatives (p > 0.05) dans la distribution des haplotypes du ChrX parmi les haplogroupes du ChrY. L’analyse d’un plus grand échantillon de population apportera peut être de nouvelles données.

Tableau 10 : Analyse des clusters X-STR parmi les haplogroupes du chromosome Y dans la population nord-ouest algérienne

Haplogroupes du chromosome Y DXS6801-DXS6809-DXS6789 DXS101-DXS7424 DXS6801-DXS6809 p= 0.080±0.001 R-M173 DXS6801-DXS6789 p= 0.872±0.001 p= 0.625±0.001 DXS6809-DXS6789 p= 0.344±0.001 DXS6801-DXS6809 p= 0.742±0.001 E-M2 DXS6801-DXS6789 p= 0.827±0.001 p= 0.935±0.001 DXS6809-DXS6789 p= 0.999±0.001 DXS6801-DXS6809 p= 0.118±0.001 J-267 DXS6801-DXS6789 p= 0.275±0.001 p= 0.811±0.001 DXS6809-DXS6789 p= 0.816±0.001 DXS6801-DXS6809 p= 0.516±0.001 E-M81 DXS6801-DXS6789 p= 0.760±0.001 p= 0.443±0.001 DXS6809-DXS6789 p= 0.041±0.001 M173-M2 p= 0.999±0.001 p= 0.999±0.001 M173-M267 p= 0.999±0.001 p= 0.999±0.001 M173-M81 p= 0.999±0.001 p= 0.999±0.001 M2-M267 p= 0.999±0.001 p= 0.999±0.001 M2-M81 p= 0.999±0.001 p= 0.999±0.001 M267-M81 p= 0.999±0.001 p= 0.999±0.001

Résultats de l’analyse AMOVA FST=-0.017, p= 0.941±0.007 FST=0.015, p= 0.106±0.009

126 RÉSULTATS ET DISCUSSION

I.5 Discussion générale des résultats de l’analyse du chromosome X : Dans un premier temps, nos résultats indiquent l’efficacité des PCR multiplex employées, qui se basent sur un choix particulier des X-STRs dans les analyses génétiques, notamment la multiplex C, développée dans le cadre de ce travail. La validation de ces multiplex offre ainsi un outil convenable et approprié qui s’ajoute aux kits commercialisés (tel que Argus X-8) régulièrement utilisés et approuvés par la communauté médico-légale. De plus, la comparaison des protocoles d’amplification, est nécessaire pour une standardisation inter- laboratoires. Cependant, même l’utilisation des kits commercialisés peut détecter des discordances. En effet, une récente analyse dans la population égyptienne a permis de détecter une différence entre les résultats obtenus par le kit Mentype® Argus X-8 et Argus X- 12 (Biotype AG, Dresden, Germany). De plus des allèles nuls ont été détectés pour plusieurs loci (Elakkary et al. 2014). Ces observations indiquent l’intérêt des analyses des STRs dans différentes populations, avant leur application en génétique médico-légale. L’analyse des marqueurs X-STRs dans la population nord-ouest algérienne nous a permis de détecter de nouveaux allèles pour le marqueur DXS10148 qui n’ont jamais été rapporté auparavant. Une nouvelle description de la structure moléculaire de ce locus a été révélée. Ces observations complètent les données recueillies sur les STRs du chromosome X et sollicitent une attention particulière aux discordances de génotypage qui peuvent être détectées.

Par ailleurs, l’absence de déséquilibre de liaison entre les paires des marqueurs STRs étroitement liés, observés dans la population nord-ouest algérienne, constitue un avantage permettant l’utilisation de ces marqueurs tant en médecine légale que dans les analyses génétiques des populations. De nombreuses études ont démontré que le déséquilibre de liaison entre les loci du chromosome X est spécifique aux populations. Tel que le déséquilibre de liaison observé entre les X-STRs des clusters (DXS6801-DXS6809- DXS6789) et (DXS10074-DXS10079) dans la population allemande, mais qui n’a pas été rapporté dans d’autres populations (Szibor et al. 2005 ; Hering et al. 2006).

La plupart des loci X-STRs analysés dans la population nord-ouest algérienne sont très polymorphes, particulièrement DXS10011 et DXS10135. De plus, l’évaluation des paramètres statistiques d’intérêt en génétique médico-légale, tel que les index d’exclusion paternel (MECs) et les valeurs du pouvoir de discrimination (PDs), confirme le potentiel des loci sélectionnés ainsi que la fiabilité de leur usage dans les analyses médico-légales.

127 RÉSULTATS ET DISCUSSION

Les marqueurs analysés dans ce travail ont permis également de quantifier les affinités génétiques entre les populations. Ainsi, un rapprochement génétique a été observé entre la population algérienne et celles du pourtour méditerranéen, contrairement aux populations de l’Afrique subsaharienne. Ces résultats confirment les données recueillis par l’analyse d’autres marqueurs génétiques, notamment les marqueurs uniparentaux décrits dans la partie suivante.

I.6 Conclusion de l’analyse du chromosome X: Contrairement aux marqueurs uniparentaux, analysés, même sporadiquement, dans certaines régions en Algérie, le chromosome X n’a jamais fait l’objet d’une analyse au sein de la population algérienne. Ce marqueur génétique présente des polymorphismes d’intérêt particulièrement en génétique médico-légale mais également en anthropologie génétique et dans la caractérisation des populations humaines. Les résultats obtenus peuvent fournir à la communauté de génétique médico-légale une base de données détaillée de la diversité allélique et haplotypique des X-STRs dans la population nord-ouest algérienne. Cette base de données est indispensable dans les tests de paternité déficient (c’est à dire quand l’ADN d’un des sujets concernés n’est pas disponible) et les tests de parenté complexes. L’information sur la liaison et le statut du déséquilibre de liaison des marqueurs X-STRs est primordiale dans les calculs de probabilité ; Ainsi de nouvelles études familiales et populationnelles sont toujours exigées, notamment, des analyses étendues à d’autres régions en Algérie qui pourraient fournir de nouvelles données.

128 RÉSULTATS ET DISCUSSION

II Analyse des marqueurs uniparentaux :

II.1 Analyse de l’ADNmt : II.1.1 Les lignées mitochondriales observées dans la population nord-ouest algérienne: L’analyse de l’ADN mitochondrial, par séquençage de la région contrôle HVS-1 et l’identification des polymorphismes SNPs de la région codante, a été concluante pour l’ensemble de l’échantillon de la population nord-ouest algérienne (n=240). Plus de 40 haplogroupes majeurs ont pu être identifiés (Tableau 11, Figure 35). La fréquence la plus élevée (28.75%) a été observée pour l’haplogroupe H, majoritaire en Europe, suivie par des fréquences moyennes (7.08%, 6.67% et 5.42%) des haplogroupes M1, U6a (nord africain) et L2a (subsaharien), respectivement. Les haplogroupes HV0 et V très répandus en Europe ont une fréquence de 3.75%, chacun. Cependant, il est intéressant de remarquer qu’en dehors du sous-groupe L2a, les lignées subsahariennes atteignent une fréquence de 14.59%. Par ailleurs, nous avons remarqué qu’un individu porteur de l’haplogroupe U ne présente aucun polymorphisme qui permettrait sa classification parmi les sous-groupes U décrits jusqu’à présent.

Tableau 11 : Fréquences des haplogroupes observées dans l’échantillon nord-ouest algérien Haplogroupes n Freq. % Haplogroupes n Freq. % Haplogroupes n Freq. % H 69 28,75 L1c3 1 0,42 T* 4 1,67 HV 5 2,08 L1c3b 1 0,42 T1a 8 3,33 HV0 9 3,75 L2* 2 0,83 T2 1 0,42 V 9 3,75 L2a 3 1,25 T2a1b 1 0,42 R0a 4 1,67 L2a1 2 0,83 T2b 6 2,5 J1 3 1,25 L2a1b'f 5 2,08 T2c 2 0,83 J1b2a 1 0,42 L2a1c2 1 0,42 U* (no U1'2'3'4'5'6'7'8'9'K) 1 0,42 J2 2 0,83 L2a1(16189) 1 0,42 U1a 2 0,83 J2a2a1 1 0,42 L2a1i 1 0,42 U3 2 0,83 J2b1 1 0,42 L2b1a 1 0,42 U3a 1 0,42 K 4 1,67 L2c1 3 1,25 U4 4 1,67 M1 17 7,08 L3b2a 1 0,42 U5* 1 0,42 N1 1 0,42 L3b (16124) 2 0,83 U5a 2 0,83 I 2 0,83 L3b1a3 1 0,42 U5a1 1 0,42 W 3 1,25 L3d 3 1,25 U5a1a1 1 0,42 X2 2 0,83 L3e1 1 0,42 U5b2b3 1 0,42 X2b 1 0,42 L3e2 1 0,42 U6a 16 6,67 L0f 1 0,42 L3e2b 1 0,42 U6a5 2 0,83 L1b 7 2,92 L3e5 1 0,42 U6c 2 0,83 L1b1a1'4 1 0,42 L3f 2 0,83 L1b1a3'8 1 0,42 L3f1b 3 1,25 L4b2 1 0,42 En rouge sont indiqués les haplogroupes les plus fréquents

129 RÉSULTATS ET DISCUSSION

Figure 35 : Fréquences des haplogroupes majeurs observées dans l’échantillon nord- ouest algérien

130 RÉSULTATS ET DISCUSSION

II.1.2 Analyse de la distribution des haplogroupes mitochondriaux dans les populations nord africaines et eurasiatiques :

II.1.2.1 Analyse des fréquences de l’haplogroupe et sous-groupes H: L’haplogroupe H est majoritaire dans la population nord-ouest algérienne avec une fréquence de (28.8%). La distribution de ses fréquences, dans les populations nord africaines et eurasiatiques, montre une prédominance dans les populations européennes (Figure 36). En effet, la fréquence de l’haplogroupe H atteint une valeur maximale de (44.3%) dans la Péninsule Ibérique, (42.7%) en France et (41.6%) aux Balkans. Néanmoins, l’Italie, incluant la Sardaigne et la Sicile, présente la plus faible fréquence en Europe (29.7%). Au nord de l’Afrique, la fréquence la plus élevée de l’haplogroupe H est observée en Libye (33.3%), suivie par l’Algérie (28.8%) et l’échantillon des Tunisiens Andalous (28.4%). Sa fréquence la plus faible est observée en Egypte (3.8%). Les populations ouest asiatiques du Caucase et du Moyen Orient affichent des fréquences qui se rapprochent de celles des autres pays nord africain (Maroc, Tunisie, Sahara Occidental et Mauritanie). Curieusement, l’Arabie Saoudite et les pays du Golf présente une faible fréquence (7.8%) qui reste supérieure à celle observée en Egypte.

• IP Péninsule Ibérique • FRA France • ITS Italie + Sardaigne • BAL Balkans + Crète • SAM Sahara Occidental + Mauritanie • MOR Maroc • ALG Algérie (nord-ouest) • TUN Tunisie • TuAn Tunisiens Andalous • LIB Libye ; EGY Egypte • CAU Caucase • MEA Moyen Orient (Jordanie, Syrie, Palestine, Liban, Turkie) • ARP (Arabie Saoudite, Koweït, Dubai, Yémen, Oman, autres pays du Golf) • ISS Italie+ Sardaigne+ Sicile.

Figure 36: Histogramme des fréquences de l’haplogroupe H dans les populations nord africaines et eurasiatiques

131 RÉSULTATS ET DISCUSSION

Ces observations, nous ont encouragé à effectuer une analyse approfondie des polymorphismes caractéristiques des sous-groupes de l’haplogroupe H dans la population nord-ouest algérienne. Cette analyse n’a pas été effectuée auparavant dans d’autres échantillons algériens. Nous avons pu identifier dix sous-groupes: H1, H1a, H2a, H2a1, H3, H4, H5a, H6a, H11 et H13a1. Le sous-groupe H1 est majoritaire avec une fréquence de 47.8%, suivie par l’haplogrouope H3 (10.1%). Cependant, 26.1 % des individus porteurs de l’haplogroupe H n’ont pas pu être classifiés, une analyse approfondie des polymorphismes de la région codante pourrait affiner davantage ces résultats (Figure 37).

Figure 37: Fréquences des sous-groupes H dans la population nord-ouest algérienne

132 RÉSULTATS ET DISCUSSION

L’analyse de la distribution des sous-groupes H dans les populations nord africaines et eurasiatiques montre que sa diversité génétique (h) varie entre (75.6 ± 1.8) et (55.6 ± 8.4), observée en Tunisie et au Sahara Occidental et Mauritanie, respectivement. La population nord-ouest algérienne présente une structure typiquement ouest maghrébine (Tableau 12). En effet, la majorité des lignés H (∼ 60%) observées sont représentées par les haplogroupes H1 et H3, complètement absents en Egypte. La fréquence la plus élevée du sous-groupe H1 est observée dans l’échantillon des populations du Sahara Occidental et Mauritanie (65%). Sa fréquence en Algérie est intermédiaire entre celles observées au Maroc (51.61%) et en Tunisie (29,4%), suivant ainsi un gradient décroissant vers l’est, observé précédemment (Ennafaa et al. 2009). Le sous-groupe H3 présente ses plus fortes fréquences en Italie (23%) et en Tunisie (23.5%), alors qu’il est complètement absent en Egypte et à l’ouest de l’Asie (Caucase, Moyen Orient et pays de la Péninsule Arabe et du Golf). Par ailleurs, 42% des lignées H en Egypte correspondent aux sous-groupes H2a1, H4 et H13a1, qui comptent seulement pour 6% en Algérie. De plus, l’haplogroupe caractéristique de la Péninsule Arabe H6b (13%) est absent dans l’échantillon Algérien. Cette subdivision de l’haplogroupe H, nous a permis de constater que la population algérienne est différente des populations géographiquement éloignées de l’Est et semble plus proche des populations maghrébines et sud européennes. Enfin, il est intéressant de noter que les Tunisiens Andalous, ont plus d’affinité génétique avec les populations marocaines et algériennes qu’avec les Tunisiens.

133 RÉSULTATS ET DISCUSSION

134 RÉSULTATS ET DISCUSSION

II.1.2.2 Comparaison de la distribution des haplogroupes mitochondriaux entre les échantillons analysés dans la population algérienne : Avant de comparer la distribution des haplogroupes mitochondriaux dans les populations nord africaines et eurasiatiques, il nous a paru essentiel d’examiner les résultats obtenus dans différents échantillons analysés auparavant dans la population algérienne (Tableau 13). En dehors de notre étude sur la population nord-ouest algérienne (échantillon oranais), l’analyse de l’ADN mitochondrial dans la population algérienne n’a été effectuée que dans deux autres échantillons: le premier (n=85) est de la population M’Zab de Ghardaïa (Côrte-Real et al. 1996), et le deuxième (n=47) est un mélange d’échantillons d’ADN d’Algériens non défini par les auteurs (Plaza et al. 2003). Le test de comparaison par paires entre les trois échantillons algériens (Oranais, M’Zab et le mélange non défini) a montré une distribution hétérogène des fréquences des haplogroupes dans les trois populations. Dans chaque comparaison, l’échantillon M’Zab a montré une différence significative (p < 0.001) par rapport aux autres échantillons. Par contre, la différence observée entre l’échantillon oranais et le mélange non défini était moins significative (p < 0.05). La comparaison des fréquences des haplogroupes montre que la lignée H/HV (> 22.35 %) est majoritaire dans les trois échantillons de populations. Par ailleurs, l’échantillon mozabite se distingue par des fréquences élevées des haplogroupes U6a1’2’3 (27.06 %) et U3b1a (10.59 %). Ces deux haplogroupes se trouvent en faibles fréquences uniquement dans l’échantillon oranais (5 % et 1.25 %, respectivement). Une absence de l’haplogroupe HV0 est remarquée dans l’échantillon du mélange non défini, qui se distingue par de fortes fréquences des lignées J/J1c/J2 (12.77 %), L3e5 (10.64 %) et L2a1* (6.38 %), presque absentes ailleurs. Par ailleurs, dans une comparaison étendue, incluant d’autres populations du bassin méditerranéen, l’échantillon oranais présente des haplogroupes qui suivent les différents gradients des fréquences observées au nord de l’Afrique. Néanmoins, nous observons une légère déficience en haplogroupe K* (1.67%, p= 0.04) et un excès remarquable de l’haplogroupe M1 (7.08% p= 0.002). Ces deux haplogroupes (K* 4.26% et M1 12.77%) sont présents à des fréquences élevées dans l’échantillon du mélange non défini.

Sur la base de ces observations, nous pouvons considérer que l’échantillon Oranais est le plus représentatif de la population algérienne urbaine globale. Cependant, si l’on considère les trois échantillons séparément, ceux-ci forment un cluster compact qui se manifeste par le

135 RÉSULTATS ET DISCUSSION rapprochement de leurs positions dans l’ACP (Analyse en Composantes Principales). À partir de ce résultat, nous avons décidé de grouper les données des trois échantillons algériens avant de les utiliser dans les analyses comparatives étendues.

Tableau 13: Fréquences en pourcentages des haplogroupes de l’ADNmt dans trois populations algériennes

Populations# Populations Mélange Nord- Mélange Nord- non ouest Mozabites3 non ouest Mozabites Haplogroupes Haplogroupes défini1 algérien2 (Nb=85) défini Algérie (Nb=85) (Nb=47) (Nb=240) (Nb=47) (Nb=240) H/HV 29.79 30.83 22.35 N* / M* / L3* - 0.42 - HV1 2.13 - - L3b 2.13 - - HV0/HV0a/V - 7.50 8.24 L3b(16124) - 0.42 - R0a - 1.25 - L3b1a3 - 0.83 3.53 R* - 0.83 1.18 L3b2a - 0.42 - U1a - 0.83 - L3d* 2.13 1.25 1.18 U3b1a - 1.25 10.59 L3e1* - 0.42 - U4 2.13 1.67 1.18 L3e2 - 0.83 2.35 U5* - 0.83 - L3e5 10.64 0.42 - U5a - 1.67 - L3f* - 0.83 - U5b5 2.13 - - L3f1b* - 1.25 - U6a - 2.50 1.18 L4b2 - 0.42 - U6a1'2'3 - 5.00 27.06 L2* - 0.83 - U6c - 0.83 - L2a - 1.25 - U8b/U2c - - 2.35 L2a1* 6.38 0.83 - K* 4.26 1.67 - L2a1a3 - 0.42 - T - 1.67 - L2a1b - - 1.18 T1a 2.13 3.33 4.71 L2a1b’f - 1.25 2.35 T2 - 0.42 - L2a1c2 - 0.42 - T2b* 2.13 2.50 - L2a1(16189) - 0.42 2.35 T2c - 0.83 - L2b1a - 0.42 - T2h - 0.42 - L2c1'2 - 2.08 - J / J1c / J2 12.77 2.08 3.53 L1b* 4.26 3.75 - J1b2a - 0.42 - L1c* - 0.83 - J2a2a1 - 0.42 - L0f - 0.42 - J2b1 - 0.42 - L0a1 2.13 - - I - 0.83 - W - 1.25 - X 2.13 1.25 - M1 12.77 7.08 4.71

* : Absence de mutations caractérisant davantage le sous-groupe # : Références des populations analysés: 1 : Plaza et al. 2003 ; 2 : La présente étude ; 3 : Côrte-Real et al. 1996 En Vert et en orange (gras) sont indiquées les fréquences les plus élevées

136 RÉSULTATS ET DISCUSSION

II.1.2.3 Analyse des fréquences des haplogroupes majeurs : Les fréquences des haplogroupes de l’ADNmt, observées dans les populations comparées, sont représentées dans le Tableau 14 et 15. Dans cette analyse, nous avons additionné les fréquences des sous-groupes dans leurs haplogroupes ancestraux pour lesquels toutes les populations disposent de données. De manière générale, nous observons que de toutes les populations nord africaines, les lignées eurasiatiques sont les plus fréquentes en Algérie (80%) alors que les lignées subsahariennes comptent pour les 20% restant.

II.1.2.3.1 Les lignées eurasiatiques :

§ Les dérivés de l’haplogroupe HV : Les haplogroupes majoritaires observées dans les populations analysées sont : H, HV, HV1, HV0, HV0a et V (Tableau 14). Leurs fréquences totales dépassent les 26% dans toutes les populations, à l’exception de la Péninsule Arabe (11.41%) et de l’Egypte (20,93%). Les plus fortes fréquences sont observées en Europe, particulièrement à l’Ouest. Par ailleurs, la fréquence des haplogroupes H/HV dans la population algérienne est en accord avec le gradient décroissant ouest-est observé pour ces haplogroupes. Les fréquences du sous-groupe HV1 suivent un gradient est-ouest avec une fréquence particulièrement élevée aux Balkans (17%). L’haplogroupe HV0 et ses sous-groupes HV0a et V semblent caractéristiques des pays de l’ouest. Il présentent des fréquences assez élevées dans la Péninsule Ibérique (7.23%), mais encore plus élevées au Maroc (8.12%) et au Sahara Occidental et Mauritanie (8.28%). Cependant, la fréquence la plus élevée est observée en Libye (8.55%). Ces haplogroupes dérivent des haplogroupes majeurs R0 et HV qui semblent être originaires de l’Eurasie (Moyen Orient). Ils ont probablement atteint l’Europe et l’Afrique à des épisodes parallèles depuis les temps épipaléolithique, durant lesquelles les voyages à travers la Méditerranée ont joué un rôle important dans les migrations des populations humaines (Richards et al. 2000; Plaza et al. 2003; Francalacci et al. 2003; González et al. 2003; Falchi et al. 2006; García et al. 2010).

137 RÉSULTATS ET DISCUSSION

138 RÉSULTATS ET DISCUSSION

§ Les haplogroupes U6 et M1 : Les deux lignées eurasiatiques M1 et U6 datent du paléolithique. Elles se sont étendues au nord de l’Afrique atteignant le Sahel et le Soudan. Dans les populations de l’Afrique du Nord (Maroc, Algérie, Tunisie et Libye), les fréquences de l’haplogroupe M1 suivent un gradient décroissant est-ouest. Néanmoins, sa fréquence en Algérie (7.1%) atteint un seuil étrange qui rappelle celui observé en Egypte (8.53%). Il est important de noter que le sous-groupe M1a1 majoritaire en Egypte (6.4%) est absent en Algérie. L’haplogroupe U6 est prédominant au nord-ouest de l’Afrique. Ses fréquences les plus élevées sont observées en Algérie (11.83%) et au Sahara Occidental et Mauritanie (11.04%). Elles déclinent en allant vers l’Est: Tunisie (5.24%), Libye (4.08%) et l’Egypte (0.77%). Il est important de rappeler que la présence du sous-groupe U6a en Algérie est majoritaire dans l’échantillon de Mozabites (28.24%), ce qui a permis de l’attribuer aux populations berbères (Côrte-Real et al. 1996; Rando et al. 1998; 1999). Toutefois, sa fréquence dans l’échantillon nord-ouest algérien n’est pas négligeable (7.5%). L’haplogroupe U6 est également présent en Europe mais sa fréquence est nettement élevée dans la péninsule Ibérique (1.45%), comparée à la France (0.23%), l’Italie (0.52%) et aux Balkans (0%).

§ Les haplogroupes J, T, N et X : Les haplogroupes J et T sont assez répandus dans toutes les populations examinées. Les fréquences de l'haplogroupe J varient entre 17.9% (en Péninsule Arabe) et 2.76% (au Sahara Occidental et Mauritanie). Sa fréquence dans l’échantillon algérien (4.57%) est en accord avec le gradient décroissant est-ouest observé au nord de l’Afrique. L'haplogroupe T présente les fréquences les plus élevées chez les Tunisiens Andalous et en Italie (11.6%). Il est presque absent au Sahara Occidental et Mauritanie. Les haplogroupes N1 (incluant son sous- groupe I), N2 et X ont une distribution rare et dispersée.

§ Les sous-groupes U : L'haplogroupe U est extrêmement ancien. C'est pourquoi chacun de ses sous-groupes principaux peuvent être caractéristiques d’une population ancestrale. Le sous-groupe U3 présente des fréquences élevées au Moyen Orient (6.11%) et dans le Caucase et la Turquie (4.8%). Elles déclinent en allant vers l’ouest (sud de l’Europe et l’Afrique du Nord). Néanmoins, sa fréquence en Algérie (3.32%) semble légèrement supérieure à celles des pays voisins (Maroc : 1.09%, Tunisie : 1.35%). Le sous-groupe U7 est caractéristique de l’Iran (7.47%) et assez rare ailleurs (< 1.7%).

139 RÉSULTATS ET DISCUSSION

L’haplogroupe U8 est assez rare mais son sous-groupe K* présente des fréquences qui varient entre (3%) et (7.5%) dans toutes les populations analysées. Néanmoins, une déficience remarquable est observée en Algérie (1.67%) et chez les Tunisiens Andalous (0.65%). L’haplogroupe U5 est ancestrale en Europe. Ses plus fortes fréquences sont observées dans la Péninsule Ibérique (8.99%), en France (8.04%) et aux Balkans (7.25%), tandis qu’elle chute remarquablement en Italie (4.87%). Un des dérivées de U5, le sous-groupe U5b1b, n’a pas encore été observé en Algérie. Son haplotype, pourtant rare au nord de l’Afrique, a atteint une fréquence remarquable (6.2%) au Sahara Occidental et Mauritanie. Le sous-groupe U5b3 est également absent dans l’échantillon nord-ouest algérien. Malgré ses fréquences assez faibles sur les côtes méditerranéennes, il est caractéristique en Sardaigne. Sa diffusion à travers l’Italie pourrait daté du paléolithique (Pala et al. 2009). Enfin, il est intéressant de préciser qu’un haplotype particulier (192 224 261 270), appartenant à l’haplogroupe U5b2b3, a été trouvé dans notre échantillon. Jusqu’à présent, cet haplogroupe a été observé principalement en Hongrie et chez les Roms de Bulgarie (Gresham et al. 2001; Tambets et al. 2004; Malyarchuk et al. 2010). La présence de cet haplogroupe de l’Europe de l’Est en Algérie pourrait être attribuée à l’influence Ottomane.

II.1.2.3.2 Les lignées subsahariennes: Les lignées subsahariennes, représentées par les sous-haplogroupes L, sont fortement répandues au nord de l’Afrique, particulièrement au Sahara Occidental et Mauritanie (40.7%) (Tableau 15). Leurs fréquences globales ne dépassent pas (3%) dans toutes les autres populations analysées, à l’exception de la Péninsule Arabe (17.98%) et du Moyen Orient (9.91%). Le pourcentage de la composante subsaharienne en Algérie (19.37%) est similaire à celui observé au Maroc (20.4%) et en Egypte (22.9%). Cependant, une différence significative est observée en Tunisie (30.1%) (p = 0.003) et presque significative en Libye (27.1%) (p = 0.059). Hormis le sous-groupe L2a largement répandu, la majorité des lignées subsahariennes observées en Algérie (14.59%) ont une origine ouest africaine (L1b, L2a1, L2b, L2c, L3b, L3d). Les fréquences du sous-groupe L1b, par exemple, suivent un gradient décroissant ouest-est au nord de l’Afrique. Les haplogroupes typiques du centre de l’Afrique (L1c, L3e, L3f) comptent pour 5% et le reste des lignées (L0, L3*, L4) (1%) sont de l’est de l’Afrique.

140 RÉSULTATS ET DISCUSSION

141 RÉSULTATS ET DISCUSSION

II.1.3 Analyse de la variation génétique mitochondriale: Sur la base de la distribution des haplogroupes mitochondriaux, une mesure de la proportion de variance totale (FST) a été effectuée entre les populations analysées (Tableau 16). Au nord de l’Afrique, la population algérienne présente la plus faible distance génétique avec les

Tunisiens (FST= 0.016) et la plus grande distance avec les Egyptiens (FST= 0.026). Par ailleurs, l’Italie (FST= 0.032) et les Balkans (FST= 0.032) sont les plus proches pays européens de l’Algérie, tandis que la France semble être la plus éloignée (FST= 0.042). Finalement, au Proche Orient, les populations du Levant présentent la plus faible distance génétique (FST= 0.014) par rapport aux Algériens, et la Péninsule Arabe, la plus grande distance (FST= 0.033). Il est intéressant d’observer qu’une faible distance génétique non significative est remarquée entre les Tunisiens Andalous et les Marocains (FST= 0.0018, p = 0.099). Toutefois, un rapprochement génétique, basé sur la distribution des haplogroupes, a été observé entre ces deux populations. Par ailleurs, la valeur moyenne de la variation génétique est significative (p < 0.05) entre les Tunisiens Andalous et les Tunisiens, ce qui indique leurs différence.

L’analyse de variation génétique AMOVA permet de comparer l’échantillon algérien avec des populations groupées dans des régions plus étendues (de l’Afrique du Nord, du sud de l’Europe et du Moyen Orient). Les résultats montrent des valeurs significatives (p < 0.05) entre l’échantillon algérien et les nord africains (0.023 ± 0.002), les européens (0.036 ± 0.003) et les populations du Moyen Orient (0.021 ± 0.003). Cependant, lorsque nous avons soustrait la Péninsule Arabe du Moyen Orient, la valeur FST moyenne décroît considérablement pour le Moyen Orient (FST = 0.018 ± 0.001), tandis que la variance observée entre l’Algérie et l’Europe augmente de manière significative (p < 0.01).

142 RÉSULTATS ET DISCUSSION

143 RÉSULTATS ET DISCUSSION

II.1.4 Analyse en composantes principales de l’ADNmt: Les gradients des haplogroupes observées et les origines géographiques des populations analysées sont reflétés sur le plot de l’analyse en composantes principales (ACP) (Figure 38). Les populations européennes, de la péninsule Ibérique jusqu’au Caucase, incluant la Turquie sont regroupées et clairement séparées des populations nord africaines par le premier composant. Les haplogroupes N2, U2, T2 et I sont ceux qui distinguent les populations européennes. En contrepartie, ce sont les haplogroupes subsahariens (L3d, L1b, L2a1b’f, L2a1c1’2, L3b) et nord africain berbère (U6a) qui éloignent les populations nord africaines dans le sens opposé, en particulier le Sahara Occidental et Mauritanie. De plus, Nous remarquons que les populations de l’Iran et des pays du Levant semblent assez proches des populations européennes. Le deuxième composant aligne les populations méditerranéennes, jusqu’à l’ouest de l’Asie, selon leurs positions géographiques longitudinales transversales. Ainsi, la Péninsule Arabe et l’Egypte se trouvent assez éloignées, alors que les pays du Levant sont dans une position intermédiaire. Les haplogroupes du deuxième composant, H, HV0, T2b et dans un moindre degré J2b1 et plusieurs sous-groupes U5, séparent les populations sud-ouest européennes et nord-ouest africaines des populations de la Péninsule Arabe et de l’Egypte. Ces dernières se distinguent par les haplogroupes subsahariens L3i, L3x, L2a2 et par les lignées est eurasiatique N1, R0a et U9.

144 RÉSULTATS ET DISCUSSION

Figure 38 : Analyse en composantes principales (ACP) de l’ADNmt

IP Péninsule Ibérique ; FRC France + Corse ; ISS Italie + Sardaigne + Sicile ; BAL Balkans + Crète ; SAM Sahara Occidental + Mauritanie ; MOR Maroc ; ALG Algérie ; TUN Tunisie ; TuAn Tunisiens Andalous ; LIB Libye ; EGY Egypte ; CAU Caucase ; TUR Turquie ; LEQ Levant + Irak ; KRN Kurdes + Iran ; ARP Péninsule Arabe

145 RÉSULTATS ET DISCUSSION

II.1.5 Analyse des sous-groupes M1 de l’ADNmt : En Afrique du Nord, l’haplogroupe M1 a été observé à de forte fréquences en Algérie (7.3%) et en Egypte (8.5%). Cependant, la subdivision de ce cluster montre une nette différence phylogéographique. D’une part, 6.4% des lignées observées en Egypte appartiennent au sous-groupe M1a1, typique à l’est de l’Afrique. Et d’autre part, aucun haplotype M1a1 n’a été observé en Algérie. Pour cela, nous avons effectué une analyse des séquences HVS-I de l’ADNmt appartenant aux sous-groupes M1 par la méthode du reduced median-joining network (Tableau 17, Figure 39). L’arbre du network (appelé aussi le réseau des haplotypes) met en évidence l'ensemble des mutations détectées et leurs répartitions dans les différentes populations analysées. Les nœuds de l’arbre représentent les haplotypes et les branches indiquent les différentes mutations.

Dans cette analyse, l’haplotype HT1, qui représente le motif central (triangle noir), diffère de la séquence rCRS par la présence de polymorphismes en positions G16129A, T16189C, T16223C, T16249C et T16311C (Anderson et al. 1981; Andrews et al. 1999). Ces différentes mutations, dans la région HVS-I, caractérisent l’haplogroupe M1. Les haplotypes HT2, HT3 et HT4 sont représentés par des ronds noirs. Ils ne présentent pas la mutation T16359C caractéristique du sous-groupe M1a1. L’haplotype HT2 est séparé de HT1 par la mutation 185, en position 16000, ainsi il est défini par 129 185 189 223 249 311. L’haplotype HT3 est séparé de HT1 par deux branches, l’une avec la mutation 185 et l’autre avec la mutation 129. Ce qui indique que l’haplotype HT3, comparé à HT1, gagne la mutation 185 et perd la 129. Il est donc défini par 185 189 223 249 311. L’haplotype HT4 est défini par 129 189 249 311, puisqu’il perd la mutation 223, comparé à HT1.

Les haplotypes HT5 et HT6, représentés par des triangles gris, sont les seuls à porter la mutation 359, les séparant de HT1. Ainsi, HT5 est défini par 129 189 223 249 311 359 et HT6, qui perd la mutation 249, est défini par 129 189 223 311 359. L’arbre se retrouve ainsi divisé en deux parties, séparées par la mutation T16359C. Chacune des deux parties montre une distribution des haplotypes distincte dans les différentes populations analysées. L’Algérie, le Maroc et la Tunisie ne présentent pas les haplotypes incluant la mutation 16359. Cette mutation est, cependant, retrouvée systématiquement dans les populations du Levant, de la France, du Caucase et des Balkans. Par ailleurs, les individus Egyptiens porteurs de l’haplogroupe M1a1 sont clairement majoritaires à droite de l’arbre et sont porteurs de certains haplotypes bien distinctifs. Par exemple, à l’extrémité supérieure droite

146 RÉSULTATS ET DISCUSSION de l’arbre, un haplotype particulier caractérise les 2 individus Egyptiens : 189 223 249 260 311 320 359, les séparant ainsi des autres haplotypes plus communs. Un autre haplotype Egyptien caractéristique (189 223 292 293C 311 359) apparaît à l’extrême droite inférieure de l’arbre. Les différents modèles de phylogénie représentés sur ce réseau des haplotypes sont en accord avec l’existence de deux origines différentes de diffusion géographique de l’haplogroupe M dans le Maghreb et l’est de l’Afrique. Il a été démontré que l’origine de diffusion de la majorité des sous-groupes M1a est de l’est de l’Afrique. Cependant, la diffusion de l’haplogroupe M1 au Maghreb a été effectuée par la route méditerranéenne (Quintana-Murci et al. 1999; González et al. 2007). L’analyse des mutations, situés en dehors de la région HVS-I, caractéristiques des autres sous-groupes de M1 dans la population algérienne, pourrait apporter davantage de précisions.

Tableau 17 : Nombre d’individus porteurs de l’un des 6 haplotypes du sous-groupe M1 observés dans les populations étudiées Populations1

IP ISS LIB IRN FRC ARP BAL TUN TUR LEQ CAU ALG EGY SAM MOR TuAn Haplotypes

HT1 5 - 5 2 - 18 13 13 1 2 8 - - - - 17 HT2 - - - 1 1 3 6 2 - 2 - - 1 1 1 HT3 - - - - - 2 2 ------1 - 1 HT4 3 - - - - 2 3 - - - 2 - - - - - HT5 4 1 7 3 - 6 - - - 2 10 3 - 4 1 14 HT6 ------16 - - - - 1

1 IP Péninsule Ibérique ; FRC France + Corse ; ISS Italie + Sardaigne + Sicile ; BAL Balkans + Crète ; SAM Sahara Occidental + Mauritanie ; MOR Maroc ; ALG Algérie ; TUN Tunisie ; TuAn Tunisiens Andalous ; LIB Libye ; EGY Egypte ; CAU Caucase ; TUR Turquie ; LEQ Levant + Irak ; IRN Iran ; ARP Péninsule Arabe.

147 RÉSULTATS ET DISCUSSION

Figure 39 : Reduced median-joining network reliant les séquences du sous-groupe mitochondrial M1 (Les positions des polymorphismes mitochondriaux sont indiquées sur les branches par valeurs en position 16000; les mutations sont des transitions, sauf quand un suffixe est rajouté pour indiquer une transversion (N) ou délétion (D); Les ronds noirs représentent les haplotypes retrouvés en Algérie ; les triangles gris représentent les haplotypes retrouvés en Egypte ; les triangles noirs représentent les haplotypes retrouvés en Algérie et en Egypte ; les ronds gris représentent les haplotypes observés dans d’autres régions géographiques ; la taille des ronds et des triangles correspond au nombre d’individus porteurs de l’haplotype, voir Tableau 17).

148 RÉSULTATS ET DISCUSSION

II.1.6 Discussion des résultats: les contributions génétiques maternelles eurasiatiques et subsahariennes En plus de la contribution génétique subsaharienne non négligeable, la plupart des haplogroupes mitochondriaux observés au nord de l’Afrique sont d’origine eurasiatique. Certains peuvent dater de l’époque paléolithique (tel que les haplogroupes M1 et U6), et d’autres sont plus récents, acquis de l’Europe ou du Moyen Orient (tel que les haplogroupes: H, J, T, U5, V, R0a, J1b, U3) (Rando et al. 1998; Krings et al. 1999; Plaza et al. 2003; Maca- Meyer et al. 2003a ; Fadhlaoui-Zid et al. 2004; Harich et al. 2010).

Dans le but de comprendre l’impact génétique, dû aux différents échanges entre l’Afrique du Nord et l’Europe, il est indispensable de comprendre l’origine et la diversité génétique de leur peuplement ancestral.

• Le peuplement de l’Europe : En dehors du continent africain, qui a suscité beaucoup d’intérêt en rapport avec l’origine de l’homme moderne et ses migrations vers d’autres continents, l’étude du peuplement de l’Europe a fait l’objet de nombreuses analyses génétiques. En effet, les plus anciennes lignées mitochondriales observées en Europe appartiennent aux haplogroupes U5 et U8. L’haplogroupe U8 semble avoir un âge de 50 000 ans en Europe, bien que son sous- haplogroupe K apparaît au Proche-Orient autour de 30 000 ans. L’âge de l’haplogroupe U5 est évalué à environ 37 000 ans, mais il semble être sous-estimé en raison des importantes expansions post-DMG (Dernier Maximum Glaciaire) de ses sous-embranchements majeurs, il y a environ 13 000 ans. L’analyse de ces lignées mitochondriales ancestrales a permis une datation du peuplement de l’Europe entre 30 000 à 55 000 ans B.P., avec les premières évidences dans la partie sud du Bassin du Danube (Churchill et Smith 2000; Conard et Bolus 2003 ; Soares et al. 2010). Ceci suggère que les premiers chasseurs-cueilleurs sont arrivés en Europe à partir du Proche Orient, en passant par l’Anatolie (Roostalu et al. 2007). Ces observations sont en accord avec les données archéologiques qui démontrent que l’homme anatomiquement moderne de type Cro-Magnon s’est répandu en Europe à partir du sud-est, il y a environ 45 000 ans (Mellars 2006). Par ailleurs, il est évident, aujourd’hui, que le signal majeur du pool génétique mitochondrial Européen remonte à la ré-expansion et le repeuplement du nord de l’Europe, durant la période de réchauffement climatique post glaciaire, il y a environ 15 mille ans (Soares et al. 2010).

149 RÉSULTATS ET DISCUSSION

II.1.6.1 Contribution européenne dans le pool génétique nord africain: L’échange entre les populations nord africaines et sud européennes peut être mesuré à travers les sous-haplogroupes mitochondriaux HV0, H1, H3, V et U5b. Leurs variations génétiques communes aux populations nord africaines et sud européennes ont pu être introduites ou maintenues par des flux géniques divers. Soit à travers le détroit de Gibraltar, suite à l’expansion post glaciaire en Europe, ou alors, plus récente au cours de l’histoire, lors de l’occupation pendant près de sept siècles (du VIIIème au XVème siècle) de la péninsule Ibérique par les troupes berbères musulmanes, almoravides puis almohades (Coudray 2009). L’haplogroupe H, observé à une fréquence très élevée dans l’échantillon nord-ouest algérien (28.8%), semble arrivé en Europe, à partir du Proche Orient, avant le Dernier Maximum Glaciaire (DMG) (20 000 ans B.P.). Il a survécu dans les refuges Franco-cantabriques au sud-ouest de l’Europe et a subit une ré-expansion post glaciaire (Pereira et al. 2005a; Soares et al. 2010). Ses fréquences élevées et sa distribution méditerranéenne, le rendent particulièrement intéressant dans les études de migration des populations.

Il est intéressant de constater que les sous-groupes (H1, H3, HV0), observées à des fréquences élevées à l’ouest de l’Europe, suivent un gradient décroissant radiale qui s’étend de la Péninsule Ibérique aux populations avoisinantes, incluant les populations nord africaines (surtout Berbères) (Soares et al. 2010). Au nord de l’Afrique, les fréquences de ces sous-groupes suivent un gradient décroissant nord-ouest, en accord avec les résultats obtenus dans l’échantillon nord-ouest algérien (H1 (47.8%), H3 (10.1%) et HV0 (7.5%)). Plusieurs études suggèrent que la diffusion de ces sous-groupes remonte à l’expansion post-glaciale à partir de la Péninsule Ibérique, il y a environ 13 000 ans. Toutefois, une analyse récente indique que l’expansion des populations durant le néolithique aurait favoriser la diffusion de l’haplogroupe H et de ses sous-groupes à travers l’Europe (Torroni et al. 1998, 2001; Achilli et al. 2004 ; 2005; Loogväli et al. 2004; Pereira et al. 2005a; Cherni et al. 2009; Ennafaa et al. 2009; Rhouda et al. 2009; Ottoni et al. 2010; Brotherton et al. 2013).

150 RÉSULTATS ET DISCUSSION

II.1.6.2 Contribution eurasiatique typiquement nord africaine: Il a été démontré qu’après la sortie des populations humaines de l’Afrique «Out of Africa », un des plus important mouvement migratoire observé a été le flux qui retourne vers l’Afrique, durant le paléolithique (il y a 40.000 à 45.000 ans). Ceci a été prouvé par les analyses phylogénétiques et phylogéographiques des haplogroupes U6 et M1. Ces derniers présentent une prédominance nord-ouest (U6) et nord-est (M1) africaine qui aurait une origine du sud-ouest de l’Asie (Macaulay et al. 1999b; Maca-Meyer et al. 2003a; Olivieri et al. 2006; Soares et al. 2009; Pereira et al. 2010a). L’arrivée des haplogroupes M1 et U6 en Afrique du Nord coïncide avec le peuplement de l’Europe par l’homme moderne. Ceci est dû aux mêmes changements des conditions climatiques qui ont permis aux humains d'arriver au Levant, ouvrant la voie à la colonisation tant de l'Europe que de l'Afrique du Nord. Par ailleurs, la présence typiquement nord africaine des haplogroupes M1 et U6 indique que la première population du paléolithique supérieur, portant ces haplogroupes, n'est pas arrivée en Afrique par la route côtière sud du "Out of Africa", mais serait plutôt arrivée par la route méditerranéenne.

La révision archéologique récente de la datation de l’industrie Atérienne en Afrique du Nord (40 000 à 140 000 ans) indique que la population de cette époque n’a laissé aucune empreinte sur les lignées mitochondriales actuelles en Afrique du Nord. En effet, les haplogroupes les plus ancestraux au nord de l’Afrique semblent être M1 et U6 qui datent de 36.6 (24.9; 48.8) mille ans et 35.3 (24.6; 46.4) mille ans, respectivement (Soares et al. 2009; Pereira et al. 2010a; Pennarun et al. 2012; Secher et al. 2014). Ces dates peuvent être encore plus anciennes, cependant, elles semblent correspondre à l’industrie Dabban, il y a 40 à 50 mille ans, à Cyrénaïque (Libye) au paléolithique supérieur. Ainsi, les industries Dabban nord africaine et Aurignacienne européenne semblent dériver d'une source commune du Levant (Macaulay et al. 1999b; Olivieri et al. 2006). En effet, l’haplogroupe U6 et son proche dérivé, l’haplogroupe U5, se sont subdivisés d’un ancêtre commun du proche orient, il y a 50 mille ans. Tandis que l'haplogroupe U5 se répandait tout le long de la côte nord méditerranéenne en se diversifiant en Europe, l’haplogroupe U6 diffusait le long de la côte sud méditerranéenne (Macaulay et al. 1999b; Soares et al. 2010). Ce dernier a été trouvé, principalement, en Afrique du Nord et aux Îles Canaries. Sa fréquence la plus élevée est observée chez les Berbères Algériens (les M’Zab). Pour cela, il a été attribué aux populations ancestrales de l’Afrique du Nord, parlant le Berbère (Côrte-Real et al. 1996; Rando et al. 1998; 1999). Quant à la présence de certains sous-groupes de U6

151 RÉSULTATS ET DISCUSSION

(U6b, U6c) dans la population des Iles Canaries, elle confirme les données anthropologiques, archéologiques et linguistiques qui identifient leurs relations ancestrales avec la population nord africaine (Navarro et al. 1997; Maca-Meyer et al. 2003a). D’un autre coté, la présence de l’haplogroupe U6 en Europe a été attribuée à l’expansion des Maures musulmans ayant eu une longue histoire médiévale avec les populations ouest méditerranéennes (Péninsule Ibérique, U6 (1.45%)). Cependant, d’autres études indiquent une introduction préhistorique de l’haplogroupe U6 en Europe (González et al. 2003; Pereira et al. 2005b).

Par ailleurs, l’analyse des sous-groupes U6 et M1 a montré que certains de leurs variants ont été impliqués dans l’origine et la diffusion de la culture Ibéromaurusienne (Pennarun et al. 2012). Cette observation est confortée par l’analyse de l’ADN ancien de sépultures d’Ibéromaurusiens, datées de 12 000 ans, exhumées du site archéologique de Taforalt au Maroc. Dans cette étude, la présence de l’haplogroupe U6 indique une probable évolution in situ d'une population ancêtre de Taforalt, avec une continuité génétique au nord de l’Afrique (Kefi et al. 2005).

En ce qui concerne l’haplogroupe M1, il a été observé à de fortes fréquences dans les échantillons algérien et égyptien. Sa présence à l’est de l’Afrique a suscité un grand débat sur l’origine du macro-haplogroupe M. En effet, son sous-haplogroupe M1 est le seul variant trouvé en Afrique (Metspalu et al. 2004). Deux explications potentielles ont été considérées: 1) l’haplogroupe M était déjà présent dans les populations anciennes de l’Afrique de l’Est (Ethiopie) qui ont quitté l’Afrique pour coloniser l’Asie. Ainsi, son sous-haplogroupe M1 semble être le seul qui soit resté, avec des taux élevés observés en Afrique de l’Est (Quintana-Murci et al. 1999; Kivisild et al. 2004); 2) ou au contraire, son sous-haplogroupe M1 est le résultat d’une migration retour à partir du sud-ouest de l’Asie vers l’Afrique de l’Est, pendant le Dernier Pléistocène, diffusant ainsi jusqu’à la région méditerranéenne (Olivieri et al. 2006; González et al. 2007).

152 RÉSULTATS ET DISCUSSION

II.1.6.3 Composante génétique subsaharienne en Afrique du Nord: Outre l’impact génétique eurasiatique important en Afrique du Nord, d’autres flux migratoires en provenance de l’Afrique subsaharienne ont contribué de manière considérable au pool génétique des populations nord africaines actuelles. En effet, Il est connu que le pool génétique femelle des populations nord africaines est composé, á un quart jusqu’à la moitié, de lignées typiques subsahariennes (sous-haplogroupes L), et leurs fréquences augmentent dans les régions proches de l’Afrique subsaharienne (Plaza et al. 2003; Pereira et al. 2005b). En Algérie, les lignées subsahariennes observées sont originaires de l’ouest, du centre et de l’est de l’Afrique. L’origine ouest africaine étant la plus représentée (14%) Il a été suggéré que ces lignées subsahariennes ont atteint le nord de l’Afrique, depuis l’Holocène (il y a 10 à 5 mille ans), quand les conditions climatiques permettaient la traversée du Sahara. Cependant, leurs distributions en Afrique du Nord reflètent parfaitement les routes connues des esclaves transsahariens introduits par les Arabes, au 7éme siècle (Figure 40). Ceux-ci pourrait avoir faciliter énormément l’introduction de ces lignées mitochondriales en Afrique du Nord (Harich et al. 2010; Pereira et al. 2010b).

Figure 40 : Carte géographique des routes du commerce des esclaves transsahariens (Harich et al. 2010)

153 RÉSULTATS ET DISCUSSION

II.2 Analyse du chromosome Y:

II.2.1 Subdivision de l’haplogroupe E1b (M78) et R1b (M343) : Une étude des polymorphismes du chromosome Y a déjà été effectuée dans la population nord-ouest algérienne (Robino et al. 2008a). Dans ce travail, nous avons entrepris une analyse approfondie de nouveaux marqueurs SNPs du chromosome Y, dans le même échantillon de population. Ces marqueurs permettent la subdivision des haplogroupes E-M78 et R-M343, répandus au nord de l’Afrique et en Europe, respectivement. Leurs analyses dans le nord de l’Afrique pourraient apporter de nouveaux éléments d’informations sur la distribution de leurs sous-groupes. Le typage moléculaire des SNPs sélectionnées a permis la détermination des sous-groupes des haplogroupes E1b-M78 et R1b-M343 dans 6 et 12 échantillons algériens, respectivement. Cette analyse a inclus, également, des échantillons de la Péninsule Ibérique (n= 380) et du nord-ouest de l’Afrique : Tunisie (n= 6), Maroc (n= 9) et Sahara Occidental + Mauritanie (n= 13) (Figure 41).

Figure 41 : Arbre phylogénétique simplifié des sous-haplogroupes du chromosome Y analysés (A : pour l’haplogroupe E-M78, B : pour l’haplogroupe R-M343)

154 RÉSULTATS ET DISCUSSION

Il est important de rappeler que la nomenclature des haplogroupes du chromosome Y est beaucoup plus simple que celle de l’ADNmt. Dans l’analyse mitochondriale, chaque haplogroupe est caractérisé par un ensemble de mutations très répandues et partagées entre les haplogroupes. Par contre, pour le chromosome Y, chaque haplogroupe est défini par une ou plusieurs mutations caractéristiques et uniques, auxquelles s’ajoutent d’autres mutations typiques qui définissent au fur et à mesure des sous-groupes.

II.2.1.1 Subdivision de l’haplogroupe E1b (M78) : Parmi les 6 individus algériens porteurs de l’haplogroupe E-M78, 2 échantillons présentent la mutation V65, un individu V22, un individu V12 et 2 individus appartenant au paragroupe E- M78* (Figure 41A). Les résultats de la dissection de E-M78, dans l’ensemble des populations analysées, montrent que le sous-groupe E-V13 est majoritaire dans la péninsule Ibérique (12 des 24 échantillons analysés), alors qu’il est absent chez les populations nord- ouest africaines. Par ailleurs, le seul sous-groupe nord africain E-V65 a été observé dans toutes les populations analysées, à l’exception du Sahara Occidental et Mauritanie (n= 189) qui ne présente aucun individu porteur de la mutation M78. Le sous-groupe E-V32 est absent dans toutes les populations analysées. Dans les populations du Maghreb, E-V22 est présent uniquement en Algérie et en Tunisie, alors que E-V12 est présent uniquement en Algérie. Des individus appartenant au paragroupe E-M78* sont observés dans toutes les autres populations. Nos résultats sont en accord avec une étude précédente, de 517 individus porteurs de l’haplogroupe E-M78 de différentes populations du monde, qui a permis l’identification de nouvelles mutations permettant la classification des sous-groupes E-M78. Les données recueillis par cette étude indiquent que l’haplogroupe E-V65, E-V12 et E-M78* sont caractéristiques des populations nord africaines, alors que E-V13 est typiquement européen. Par ailleurs, le sous-groupe E-V32 présente des fréquences élevées à l’est de l’Afrique (la corne de l’Afrique), et le sous-groupe E-V22 serait largement répandu en Méditerranée (Cruciani et al. 2007).

II.2.1.2 Subdivision de l’haplogroupe R1b (M343) : L’analyse de la subdivision de l’haplogroupe R1b-M343, chez les 12 échantillons algériens, a montré que 4 individus portent la mutation S116 et 4 autres sont porteurs de la mutation U152, qui définie le sous-groupe R-S116. Un individu est porteur de la mutation M412 et un autre la V88. Enfin, 2 individus portent la mutation ancestrale M269 (Figure 41B).

155 RÉSULTATS ET DISCUSSION

Sur l’ensemble des populations analysées, la Péninsule Ibérique reflète un profil européen authentique, à l’exception de la présence d’un seul sous-groupe typiquement du Sahel R- V88. En effet, la majorité des individus de la Péninsule Ibérique (n= 356) sont porteurs des sous-groupes typiquement européens R-M412, R-U152 et R-M529, en particulier R-S116 dont la fréquence est la plus élevée (81.74%). Par contre, tous les individus R-M343 observés au Sahara Occidental et Mauritanie appartiennent au sous-groupe R-V88, atteignant une fréquence de 7% dans l’ensemble de la population (n= 189). Ce résultat est semblable à celui observé dans d’autres populations du Sahel (Cruciani et al. 2010). Par ailleurs, la fréquence de R-V88 ne dépasse pas 1% dans les pays du Maghreb, ce qui est en accord avec les résultats obtenus dans notre étude: un individus R-V88 en Algérie, un au Maroc et un autre en Tunisie. D’un autre coté, la présence des sous-groupes typiquement européens R- M412, R-S116, RU152 et R-M529 dans les populations nord africaines (Maroc : 3 individus R-U152 et 1 R-529, Algérie : 4 individus R-S116 et 4 R-U152) témoignent de flux génétiques à travers la mer Méditerranée (Myres et al. 2011).

II.2.2 Analyse de la distribution des haplogroupes du chromosome Y :

II.2.2.1 Les haplogroupes du chromosome Y observés en Algérie : Seulement deux grandes études sur l’analyse du chromosome Y ont été effectuées dans la population algérienne. Une étude en 2004, de deux échantillons : Algérois Arabophone (n=35) et Berbérophone de Tizi Ouzou (n=19), et une étude en 2006, sur 102 hommes représentatifs du nord-ouest Algérien (Arredi et al. 2004; Robino et al. 2008a). Le test de comparaison par paires entre les trois échantillons algériens (Oranais, Algérois Arabophone et Berbérophone de Tizi Ouzou) a montré une différence significative entre l’échantillon Oranais et l’échantillon algérois (p < 0.0001) et de Tizi Ouzou (p < 0.05). Par contre, aucune différence significative n’est observée entre l’échantillon algérois et celui de Tizi Ouzou (p > 0.05). Une comparaison des fréquences des haplogroupes observées dans les trois échantillons algériens a été effectuée (Figure 42). Nous pouvons constater que l’haplogroupe du chromosome Y E-M81, typiquement nord africain, est présent dans presque la moitié de la population algérienne (> 40%). Le deuxième haplogroupe majoritaire est le J1-M267, caractéristique du Moyen Orient. Sa fréquence est légèrement plus faible dans l’échantillon de Tizi Ouzou (15.79%), comparée aux deux autres échantillons (~ 22 %).

156 RÉSULTATS ET DISCUSSION

Curieusement, l’haplogroupe européen R1-M173, présent à des fréquences supérieures à 12% est absent dans l’échantillon algérois. De même, l’haplogroupe E-M78 (> 5%) est absent à Tizi Ouzou, où c’est l’haplogroupe E-M34 (10.53%) qui est observé. D’un autre coté, l’haplogroupe subsaharien E-M2 est présent uniquement dans l’échantillon nord-ouest algérien (7.84%). Mais il est important de préciser que dans l’étude de Arredi et al. (2004), certaines mutations spécifiques (tel que la mutation M2), qui permettraient une distinction plus précise des haplogroupes, n’ont pas été analysées.

Figure 42 : Fréquences des haplogroupes majeurs du chromosome Y dans la population algérienne (Orn : désigne l’échantillon nord-ouest algérien (Oranais) ; Alg : Algérois Arabophones ; TZO : Berbérophones de Tizi Ouzou)

157 RÉSULTATS ET DISCUSSION

II.2.2.2 Distribution des haplogroupes du chromosome Y dans les populations nord africaines et eurasiatiques :

Les données recueillies dans la population algérienne, et complétées dans le cadre de ce travail pour la subdivision de E-M78 et R-M343, ont été utilisées dans l’analyse de la distribution des haplogroupes paternels dans les populations nord africaines et eurasiatiques (Tableau 18). Les trois échantillons algériens (Oranais, Algérois et Berbère de Tizi Ouzou) ont été regroupés, en raison de leur distribution semblable des haplogroupes. De plus, dans le but de garder une meilleure résolution phylogénétique des SNPs du chromosome Y, nous avons parfois extrapolé la subdivision des haplogroupes génotypés dans une partie d’un échantillon à des échantillons de la même région (Flores et al. 2005). Cependant, quand cela n’était pas possible à effectuer, nous avons additionné les fréquences des sous-groupes dans leur haplogroupe ancestral pour lequel toutes les populations disposent de données. v Les sous-groupes E : L’haplogroupe E est typiquement africain. Il s’est, probablement, diversifié quelque temps après l’expansion à partir de l'Afrique “Out of Africa”. Dans les populations analysées, l’haplogroupe E1a-M33 est assez rare. Cependant, des pics de fréquences sont observées au Sahara Occidental et Mauritanie (5.29%) et au Maroc (2,76%). Cet haplogroupe est majoritaire en Afrique de l’Est (Semino et al. 2004).

L’haplogroupe E1b1, caractérisé par la mutation M2, est subsaharien. Il est assez rare dans l’ensemble des populations, à l’exception de l’Afrique du Nord, où sa fréquence la plus élevée est observée en Libye (38.55%). Sa fréquence en Algérie (5.13) est similaire à celle observée dans la Péninsule Arabe (5.66%) et au Sahara Occidental et Mauritanie (6.88%), contrairement aux autres pays du Maghreb (< 3.29%).

L’haplogroupe E-M35 se diversifie en trois sous-groupes majeurs E-M78, E-M81 et E-M34. Leur distribution n’est pas homogène dans le continent Africain. En effet, nous remarquons qu’au nord de l’Afrique, le sous-groupe E-M34 est majoritaire au Sahara Occidental + Mauritanie (11.11%) et en Egypte (6.76%), alors que sa fréquence ne dépasse pas (1.28%) dans les autres pays. Il est également présent à des fréquences moyennes (≈5.5%) en Turquie, au Levant et dans la Péninsule Arabe.

158 RÉSULTATS ET DISCUSSION

159 RÉSULTATS ET DISCUSSION

160 RÉSULTATS ET DISCUSSION

L’haplogroupe E-M81 est le seul haplogroupe typiquement nord africain, attribué aux populations berbères autochtones. Son origine pourrait dater du néolithique (Arredi et al. 2004). La fréquence la plus élevée de E-M81 est observée au Maroc (67.37%) (Figure 43). Elle est moyenne en Algérie (44.23%) et plus faible en Egypte (11.89%). L’haplogroupe E- M81 est assez rare en Europe, sauf dans la Péninsule Ibérique (4.41%). Il a été trouvé également en Sicile. Sa présence dans ces deux régions européennes serait due à de récents flux génétique à partir du nord de l’Afrique (Semino et al. 2004).

L’haplogroupe E-M78 est probablement originaire du nord-est de l’Afrique (Cruciani et al. 2007). Il présente une fréquence totale majoritaire en Egypte (21.89%). Elle est également élevée aux Balkans (16.69%), au Levant (9.96%) et en Italie (9.12%) (Figure 43). Un petit gradient décroissant est-ouest est observé au sud de l’Europe.

Figure 43: Fréquences des haplogroupes E-M81 et E-M78 dans les populations analysées • (Les abréviations des populations sont les mêmes que sur le tableau 18 pour toutes les figures de l’analyse du chromosome Y). • (Pour E-M78 : les sous- groupes sont inclus dans le calcul des fréquences)

161 RÉSULTATS ET DISCUSSION

L’analyse de la subdivision de l’haplogroupe E-M78 dans la population algérienne, nous a permis de comparer la distribution de ses sous-groupes dans les différentes populations analysées (Figure 44). Il est intéressant de remarquer que la fréquence la plus élevée de l’un de ses sous-groupes, le E-V13, est observée aux Balkans (15.83%). Ce dernier est caractéristique des pays européens, où sa fréquence décline en allant vers l’ouest. Le sous- groupe E-V22 est majoritaire en Egypte (9.19%) et au Moyen Orient (8.72%). Au nord de l’Afrique, sa fréquence ne dépasse pas (3%), observée en Tunisie. Le sous-groupe E-V12 est assez rare, sauf en Egypte (7.03%) où les seuls représentants du E-V32 (1.62%) sont observés, également. Enfin, le sous-groupe E-V65 est caractéristique des populations nord africaines. Sa fréquence la plus élevée est observée en Libye (4.82%) et au Maroc (3.65%). En Algérie (1.92%), sa fréquence est plus faible que celle observée dans les pays voisins. E- V65 est absent au Sahara Occidental et Mauritanie.

Figure 44: Fréquences des sous-groupes E-M78 dans les populations analysées

162 RÉSULTATS ET DISCUSSION v Les sous-groupes R : L’haplogroupe R est subdivisé en R1 et R2. Dans les populations analysées, la fréquence de R2-M124 est assez faible en Europe (< 0.5%) et dans les pays ouest asiatiques (< 1.4%). Il est absent en Afrique du Nord, sauf en Egypte (0.54%). Cependant, l’haplogroupe R1 est majoritaire en Europe. Il est subdivisé en deux sous-groupes R1a-M17 et R1b-M343. Dans les populations analysées, R1a1 est majoritaire en Iran (17.49%), puis aux Balkans (13.58%), mais il est presque absent au nord de l’Afrique. Par ailleurs, le sous-groupe R1b-M343 est plus subdivisé et majoritaire à l’ouest de l’Europe. Ses fréquences totales suivent un gradient décroissant ouest-est. Cependant, l’analyse de sa subdivision montre des spécificités régionales dans sa distribution (Figure 45). Nous remarquons que la majorité des sous-groupes de R1b1 sont représentés par R-S116 et R-U106 présents à des fréquences élevées dans la Péninsule Ibérique (44.5%) et en France (19.46%), respectivement. Par contre, tous les sous-groupes, qui dérivent de la mutation L23, sont quasi absents en Afrique du Nord, à l’exception de l’Algérie et du Maroc. En effet, le sous-groupe R-S116, spécifique de la Péninsule Ibérique, est observé à des fréquences de (2.56%) et (0.92%) en Algérie et au Maroc, respectivement. Ce dernier se subdivise pour donner le sous-groupe R-U152, présent à des fréquences remarquables en Algérie (2.56%) et au Maroc (2.63%), de nouveau. Le sous-groupe R-U152 est majoritaire en Italie (16.32%) et en France (10.05%). Enfin, le sous-groupe R-V88, caractéristique des populations du Sahel, présente des fréquences élevées au Sahara Occidental et Mauritanie (6.88%), en Libye (6.02%) et au Moyen Orient (5.47%). Sa fréquence en Algérie (2.56%) est supérieure à celle observée dans les pays voisins (Maroc et Tunisie).

Figure 45: Fréquences des sous-groupes R1b1 dans les populations analysées

163 RÉSULTATS ET DISCUSSION v Les haplogroupes I/ J1 et J2 : Les fréquences des haplogroupes I, J1 et J2 sont présentées sur la Figure 46. L’haplogroupe I est caractéristique des populations européennes. Sa fréquence la plus élevée est observée aux Balkans (29.03%), où le sous-groupe I1b est majoritaire (23.6%). Elle décline en allant vers l’ouest. Cet haplogroupe est presque absent au nord de l’Afrique et sa fréquence au Proche Orient ne dépasse pas 5.35%, observée en Turquie.

Les fréquences de l’haplogroupe J1, caractérisé par la mutation M267, suivent un gradient décroissant est-ouest. En effet, sa plus forte fréquence est observée dans la Péninsule Arabe (44.01%), suivie par les pays du Levant (30.83%). Sa fréquence en Algérie (21.79%) est remarquablement élevée, comparée aux pays voisins (Maroc 6.32%, Tunisie 16.64%). En Europe, sa fréquence ne dépasse pas (2.97%).

L’haplogroupe J2, caractérisé par la mutation M172, dispose de plus de données de sa subdivision dans les populations analysées. Sa distribution est majoritaire dans les pays de l’ouest de l’Asie, particulièrement chez les Caucases (25.15%) et en Turquie (24.29%). Il est moins fréquent au nord de l’Afrique, comparé à l’Europe. Son sous-groupe J2a2-M67 est particulièrement répandu chez les Caucases (17.7%), mais il est distinctif en Algérie (3.85%) et en Italie (3.97%), comparé á leurs pays voisins respectifs. Le sous-groupe J2a1-M47 est caractéristique des pays du Levant (8.14%).

Figure 46: Fréquences des haplogroupes I, J1 et J2 dans les populations analysées

164 RÉSULTATS ET DISCUSSION v Les haplogroupes minoritaires : • Nous observons d’abord que les haplogroupes A, B, C, D, sont minoritaires. A et B constituent les premières branches de l’arbre phylogénétique du chromosome Y et sont spécifiques aux populations ancestrales de l’Afrique. • L’haplogroupe G est caractéristique de la population Caucase, où il présente la plus forte fréquence (29.71%). Cependant, sa distribution en Afrique du Nord est nettement moins importante qu’au Moyen Orient ou en Europe. • Les haplogroupes K et L sont caractéristiques de la Péninsule Arabe (4.37%) et de l’Iran (8.48%), respectivement. • Les haplogroupes H, L, N, O sont absent en Afrique du Nord et extrêmement rare partout ailleurs, ce qui est en accord avec leur distribution mondiale. • L’haplogroupe Q est assez rare dans toutes les populations analysés (< 1.9%), à l’exception de l’Iran (6.01%). Pourtant cet haplogroupe est nord eurasiatique et se trouve à de fortes fréquences chez certains groupes Sibériens. Il est aussi majoritaire chez les natifs Américains (Karafet et al. 2008). • L’haplogroupe T est également assez rare, à l’exception de l’Egypte (6.22%). Sa présence au Maghreb est limitée à la Tunisie (1.16%).

II.2.3 Analyse de la variation génétique du chromosome Y :

L’analyse de la variation génétique AMOVA effectuée entre l’échantillon algérien et d’autres populations regroupées dans les régions nord africaines (0.061 ± 0.015), européennes (0.197 ± 0.019), et de l’ouest de l’Asie (0.159 ± 0.011), reflète significativement (p < 0.01) la position géographique de l’Algérie.

Les résultats de la mesure de la proportion de variance totale (FST) calculée entre les populations comparées sont présentés sur le Tableau 19. Au nord de l’Afrique, l’échantillon algérien présente la plus faible distance génétique avec le Sahara Occidental et Mauritanie

(FST = 0.023), et la plus grande distance avec la Libye (FST= 0.108). Parmi les pays

Européens, les Italiens sont les plus proches des Algériens (FST= 0.155) alors que la population de la Péninsule Ibérique semble la plus distante (FST = 0.247). Enfin, à l’ouest de l’Asie, le peuple du Levant (FST= 0.128) est le plus proche de la population algérienne, tandis que les populations de la Péninsule Arabe (FST = 0.163) et du Caucase (FST = 0.194) sembles assez éloignés.

165 RÉSULTATS ET DISCUSSION

166 RÉSULTATS ET DISCUSSION

II.2.4 Analyse en composantes principales du chromosome Y:

Les influences géographiques entre les populations analysées sont reflétées sur le plot de l’analyse en composantes principales (ACP) (Figure 47). Toutes les populations européennes, de la Péninsule Ibérique jusqu’à la Turquie et les pays Caucasiens, sont alignées dans une coupe transversale diagonale, en accord avec leurs positions géographiques respectives, et en étant bien séparées des populations nord africaines. Au nord de l’Afrique, les populations du Maghreb se regroupent et sont bien distinguées de l’Egypte qui, en reflétant sa position géographique, est plus proche du Levant et de la Péninsule Arabe. Les haplogroupes du premier composant de l’ACP, les plus influents, E-M81, E-V65 et R- V88 regroupent les populations nord africaines, tandis que les haplogroupes J2-M172, R1b- M173, R1a-M17 et R-L23 tirent les populations ouest asiatiques dans le sens opposé, particulièrement celles de l’Iran et de la Turquie. Dans le deuxième composant, les haplogroupes R-L11, R-M529, R-S116, I-M223 et I-M26 sont responsables de la séparation des populations européennes méditerranéennes des populations de l’Egypte et de la Péninsule Arabe. Ces dernières semblent plus proches entre elles et pas très éloignées des populations nord africaines, par la présence des haplogroupes J1-M267, E-V22 et E-M34 et B-M60.

Figure 47 : Analyse en composantes principales (ACP) du chromosome Y

167 RÉSULTATS ET DISCUSSION

II.2.5 Discussion des résultats: les contributions génétiques paternelles :

Notre travail a permis d’observer, pour la première fois dans la population algérienne, la subdivision des haplogroupes E-M78 et R-M343. Les résultats obtenus complètent la vision de la distribution de leurs sous-groupes respectifs dans les populations méditerranéennes et eurasiatiques. L’haplogroupe E-M78, largement répandu en Egypte et aux Balkans, aurait une origine nord- est africaine, datant du Paléolithique Supérieur (il y a 23.9 à 17.3 mille ans). La distribution de ses sous-groupes E-V65, E-V12 et E-V22 est spécifique au nord de l’Afrique, essentiellement en Egypte. De plus, le E-V65 distingue les populations maghrébines. La présence des sous-groupes E-V65, E-V12 et E-V22 au sud de l’Europe témoigne d’une contribution nord africaine directe au pool génétique des populations sud-ouest européennes, assurée par des flux migratoires transméditerranéens (principalement durant ces derniers 13.0 mille ans). Cette contribution génétique a déjà été détectée par l’analyse du génome entier, surtout que les Balkans, considérés comme la porte d’entrée vers l’Europe, présente de faibles fréquences pour ces sous-groupes. Par ailleurs, le gradient décroissant est-ouest des fréquences du sous-groupe E-V13 au sud de l’Europe, indique une origine ouest asiatique. Sa diffusion vers l’Europe, daté d’il y a 5.3 mille ans, est ultérieure à sa présence aux Balkans, où il a été daté à 17 mille ans B.P. (Cruciani et al. 2002; Cruciani et al. 2007; Botigué et al. 2013).

L’haplogroupe R1-M343 aurait une origine ouest asiatique en accord avec sa zone de diffusion. Son sous-groupe R1b-M269 est jeune en Europe et serait probablement associé à l’expansion néolithique du Proche-Orient, en passant par l'Anatolie. R1b se diversifie et donne le sous-groupe R1b-L11 qui se divise à son tour en deux autres sous-groupes R-U106 et R-S116. Tandis que le premier diffuse à l’est du bassin du Rhin, R-S116 se répand à l’ouest, où il est majoritaire dans la péninsule Ibérique. L’haplogroupe R-S116 se différencie davantage (R-U152) et atteint des pics de fréquences en allant vers le nord : Suisse, France et l’ouest de la Pologne, jusqu’à l’Allemagne et l’Angleterre (Myres et al. 2011). Sa présence en Algérie et au Maroc est probablement due à une diffusion à partir du nord de l’Europe, en passant par l’Italie et la France, où ses fréquences sont plus élevées. Cependant, une contribution de la Péninsule Ibérique n’est pas négligeable même si la fréquence du sous- groupe R-U152 y est plus faible. Ces hypothèses pourraient se voir controversées par de nouvelles données sur la subdivision de l’haplogroupe R1b-M343. Toutefois, Il est

168 RÉSULTATS ET DISCUSSION intéressant de préciser que les âges de coalescence des sous-groupes R-S116 et R-U152 sont assez similaires et datent d’il y a 8.6±1.5 et 8.7±1.5 mille ans, respectivement (Myres et al. 2011). En ce qui concerne la distribution générale des haplogroupes du chromosome Y dans les populations analysées, les observations indiquent que la présence des marqueurs E-V65, E-M81 et J1-M267 reflète la position géographique et ethnique de l’Algérie. Par ailleurs, nous remarquons que les représentants autochtones nord africains E-M81 déclinent considérablement en Egypte. Alors que, paradoxalement, le gradient décroissant est-ouest des fréquences de l’haplogroupe J1-M267 indique une influence du Levant. D’autre part, les haplogroupes G-M201, L-M20, R2-M124, T-M70, J2-M172 et la majorité des dérivés de J2 reflètent une influence ouest asiatique sur l’Europe avec un faible impact sur le nord de l’Afrique. D’un autre coté, différents sous-haplogroupes I, typiquement européens ont diffusé jusqu’à l’ouest de l’Asie avec un faible flux génétique dans les pays africains. Par ailleurs, les haplogroupes E-V65, E-V12 et E-V22 nord africains contribuent au pool génétique des populations sud-ouest européennes. En particulier, l’haplogroup E-M81 assez répandu dans la Péninsule Ibérique, où la présence des berbères maures a duré plus de 500 ans. Les exceptions observées de ces modèles généraux sont les haplogroupes J2-M67 et R-M412 dont les fréquences sont similaires en Algérie comme en Europe. De la même manière, la fréquence de l’haplogroupe R2-M124 en Egypte n’est pas significativement différente des valeurs moyennes observées en Europe et à l’ouest de l’Asie.

En dehors des haplogroupes E-M81 et E-V65, typiquement nord africains, les contributions européennes, subsahariennes et du Proche Orient sont évidentes dans la population algérienne. D’une part, une influence européenne importante est représentée par l’haplogroupe R1b en Algérie, où sa fréquence (9.6%) est la plus élevée en Afrique du Nord. D’autre part, l’influence du Proche Orient est assurée par la présence de l’haplogroupe J1-M267 qui dérive de l’haplogroupe J. La présence de cet haplogroupe en Algérie et au nord de l’Afrique a été attribuée à la conquête musulmane (Zalloua et al. 2008a). Enfin, l’influence subsaharienne en Afrique du Nord est représentée par l’haplogroupe E-M2 qui semble plus répandu en Algérie par rapport au Maroc et la Tunisie. Toutefois, la Libye observe la plus forte fréquence pour cet haplogroupe. Un autre haplogroupe du sud rejoint la composante subsaharienne au nord de l’Afrique. Il s’agit de l’haplogroupe R-V88, qui est majoritaire dans le centre du Sahel (nord du Cameroun, nord du Nigeria, Tchad et Niger). La distribution de R-V88 révèle une contiguïté génétique entre les populations du centre du

169 RÉSULTATS ET DISCUSSION

Sahel, parlant le langage tchadique et d’autres populations du nord de l’Afrique parlant l’afro-asiatique, attribué aux Berbères. En effet, l’étude de Cruciani et al. (2010) a permis d’observer des fréquences voisines de 3% chez les M’Zab et chez les Berbères de Ouarzazate et une fréquence remarquablement élevée (26.9%) chez des Berbères de l’Oasis de Siwa (Egypte). La diffusion de l’haplogroupe R-V88 à partir du Sahel date d’il y a 9.2 à 5.6 mille ans, au début de l’Holocène moyen. Durant cette période, la faune et la flore avaient repeuplé le désert aride qu’a connu le Sahara il y a 23 à 14.5 mille ans. Ce scénario verdoyant a été interrompu par des épisodes arides (il y a 5 à 6 mille ans) qui ont changé le Sahara en cette région sèche et désertique tel que définie aujourd’hui (Talbot 1983 ; Burroughs et al. 2005 ; Cruciani et al. 2010).

170 RÉSULTATS ET DISCUSSION

II.3 Discussion générale : Contribution et concordance entre les marqueurs uniparentaux

Une forte micro-différentiation a été observée par l’analyse de l’ADN mitochondrial dans la population algérienne. Nous avons pu remarquer que les trois échantillons (Oranais, M’Zab et mélange non défini) ont montré une différence significative entre eux. Particulièrement, la population M’Zab qui est connu pour être isolée et endogame. De plus, même si une distribution homogène des haplogroupes du chromosome Y a été observée dans les trois échantillons (Oranais, Algérois et Berbères de Tizi Ouzou), une différence significative a été observée par le test de comparaison par paires de populations. Néanmoins, en dépit de ces différences observées, les échantillons d’un seul pays se regroupent généralement dans les analyses comparatives. À l’exception des Tunisiens Andalous, assez particulier, qui montrent un profil génétique maternel proche de celui des populations marocaines. Ces Tunisiens Andalous seraient les descendants des Maures ayant vécu en Andalousie (sud de l’Espagne) pendant 10 siècles (entre le 8ème et le 17ème siècle) avant de venir s’installer en Tunisie après leur expulsion (Cherni et al. 2009).

L’analyse de l’ADNmt et du chromosome Y dans la population nord-ouest algérienne a permis de détecter les différentes contributions génétiques : nord africaine, européenne, subsaharienne et du Moyen Orient. Cependant, des différences dans la distribution phylogéographique des haplogroupes et sous-groupes sont observées entre les populations nord africaines. Les haplogroupes nord africain U6 et M1 ont une origine du sud-ouest de l’Asie. Ils ont été associés aux migrations retours vers l’Afrique. Nous avons remarqué dans cette étude, que les fréquences les plus élevées de l’haplogroupe U6 sont observées en Algérie et au Sahara Occidental et Mauritanie. Cependant, l’analyse de la subdivision de cet haplogroupe a montré que la majorité des sous-groupes observés au Sahara Occidental et Mauritanie (7.6%) sont inclus dans l’haplogroupe ancestral U6a. Tandis qu’en Algérie, les sous-groupes dérivés U6a1’2’3 sont majoritaires (9.41%). De façon similaire, les plus fortes fréquences de l’haplogroupe M1 en Afrique du Nord sont observées en Algérie (7.3%) et en Egypte (8.5%). Toutefois, la subdivision de ce cluster montre une nette différence phylogéographique : 6.4% des lignées observées en Egypte appartiennent au cluster est africain M1a1, qui n’a pas été observé en Algérie. Ces modèles

171 RÉSULTATS ET DISCUSSION sont en accord avec l’existence de différentes origines de diffusion géographique pour ces haplogroupes et sous-groupes au Maghreb et à l’est de l’Afrique (Maca-Meyer et al. 2003a; González et al. 2007). Par contraste, de tous les pays du Maghreb, les plus faibles fréquences des lignées autochtones nord africaines du chromosome Y (E-V65 et E-M81), sont observées en Algérie. Cependant, comparée à l’Egypte (11.9%), la fréquence de l’haplogroupe E-M81 en Algérie (44.2 %) est nettement plus significative (p < 0.0001). Ces résultats confirment que pour les deux marqueurs uniparentaux, l'Egypte et dans une moindre mesure la Libye se détachent brusquement du Maghreb. Une discontinuité génétique entre la Libye et l’Egypte a déjà été évoquée, suggérant différents flux génétiques dans la vallée du Nil (Coudray et al. 2009; Fadhlaoui-Zid et al. 2011a). De plus, l’analyse du génome entier confirme un rapprochement particulier entre les Egyptiens et les populations eurasiatiques, comparé aux populations nord africaines. Cette particularité des Egyptiens est attribuée aux flux génétique continu à partir du Moyen Orient très proche géographiquement (Fadhlaoui-Zid et al. 2013).

Le cluster IJ du chromosome Y, défini par la mutation M429, pourrait constitué une autre signature du retour vers l’Afrique. En effet, ce cluster se divise en deux pour donner l’haplogroupe I, largement répandu en Europe et l’haplogroupe J qui s’est répandu au Moyen Orient, en Ethiopie et en Afrique du Nord. Nous avons observé qu’au nord de l’Afrique, la fréquence du sous-groupe J1-M267 est la plus élevée en Algérie. Cet haplogroupe, typiquement originaire du Moyen Orient, a été associé aux arabes et aux juifs. Sa diffusion en Afrique du Nord a été attribuée à l’expansion islamique, qui débuta il y a 650 ans (Nebel et al. 2002 ; Semino et al. 2004 ; Chiaroni et al. 2008). Cependant, l’Etude de Tofanelli et al. (2009) indique une expansion préhistorique datant de l’Holocène Moyen (5.5 à 7.3 milles ans). Par ailleurs, la distribution spécifique de deux haplotypes STRs appartenant à J1-M267 en Algérie témoigne d’une implantation antique de cet haplogroupe dans le pays (Robino et al. 2008a). D’un autre coté, nous avons observé une présence notable de l’haplogroupe J2- M67 en Algérie. Cet haplogroupe est caractéristique des populations Caucases. Il est associé à l’expansion prénéolithique à partir du Moyen Orient vers l’Europe. Sa présence au nord de l’Afrique a été attribuée au commerce maritime des phéniciens (il y a 1550 à 300 ans) (Gusmão et al. 2008 ; Zalloua et al. 2008b).

172 RÉSULTATS ET DISCUSSION

Différents gradients des fréquences des haplogroupes des marqueurs uniparentaux ont été observées au nord de l’Afrique. Principalement, le gradient croissant est-ouest des haplogroupes E-M81, E-V65 du chromosome Y et U6a de l’ADNmt, et le gradient décroissant est-ouest de l’haplogroupe J1-M267 du chromosome Y. Ces observations sont en accord avec l’analyse du génome entier (> 730 000 SNPs) qui a permis de détecter ces deux gradients opposants de la contribution génétique ancestrale (Henn et al. 2012).

La présence inattendue des lignées masculines européennes R-M412, R-S116, R-U152 et R- M529 dans le Maghreb pourraient être la contrepartie masculine du flux génique maternel représenté par les haplogroupes mitochondriaux H1, H3 et HV0. En fait, il y a plusieurs haplogroupes d’origines géographiques établies du coté européen ou nord africain de la Méditerranée, mais ayant un impact génétique sur l'autre rive. Ceci pourrait être utilisé pour évaluer les niveaux respectifs de flux génique entre ces régions, en supposant que leurs fréquences dans les populations actuelles sont les mêmes que dans leurs pays d’origine au moment ou ils diffusent sur l'autre rivage méditerranéen. Ainsi, dans le Maghreb (le Maroc, l'Algérie, la Tunisie, la Libye), les valeurs des fréquences moyennes des lignées masculines, typiquement nord africaines, E-M81 et E-V65 sont (40.03 ± 11.66) et (3.40 ± 0.60), respectivement. Alors que ces valeurs sont nettement plus faibles dans les pays formant le bloc méditerranéen de l'Europe de l’ouest (la Péninsule Ibérique, la France, la Corse, l'Italie, la Sardaigne et la Sicile) (E-M81 : 1.86 ± 1.28 et E-V65 : 0.26 ± 0.8). Pris dans leur ensemble, ces valeurs suggéreraient un apport masculin Maghrébin de 5 % dans l'Europe méditerranéenne. En appliquant le même raisonnement, les lignées européennes E-V13, R-M412, R-S116 et R-U152 pourraient être utilisées pour déduire l'apport Européen masculin dans le Maghreb, qui atteint les 8%. Par ailleurs, les haplogroupes mitochondriaux U6 et M1 du côté européen indiqueraient un flux génique maternel à partir du Maghreb évalué à 10 %. Cependant, l’évaluation de l'apport maternel européen dans le Maghreb, en utilisant les haplogroupes H1, H3 et HV0, n’a pas été aussi précise. En effet, les fréquences moyennes respectives de ces trois haplogroupes en Europe méditerranéenne (38.33±4.31, 17.27±3.57 et 5.23±1.06) et au Maghreb (42.05±4.92, 13.1±3.51 et 6.99±0.90) sont semblables. Ceci impliquerait une contribution européenne de 100% dans le pool génétique maternel maghrébin. La présence de ces trois marqueurs (H1, H3 et HV0) à des fréquences semblables sur les deux rives méditerranéennes, impliquerait probablement des processus stochastiques.

173 RÉSULTATS ET DISCUSSION

Davantage d’analyses, basées sur des séquences entières de l’ADNmt, sont nécessaires pour examiner des scénarios alternatifs.

Les distances génétiques et géographiques, entre les différentes populations analysées, corrèlent fidèlement pour les deux marqueurs uniparentaux. Elles indiquent que les populations des deux rives de la Méditerranée sont séparées mais se rapprochent davantage en se dirigeant vers le Levant. Ceci nous a permis d'opposer les principaux composants maternels et paternels dans la distribution spatiale de l’analyse en composantes principales (ACP). Des équivalences sont observées, tel que l’haplogroupe mitochondrial U6a et les lignées E-M81 et E-V65 du chromosome Y qui regroupent les pays du Maghreb. Aussi, nous avons observé une ressemblance entre le composant mitochondrial subsaharien de l’Est (haplogroupe L) et le sous-groupe R-V88 du chromosome Y, caractéristique du Sahel. Ces deux marqueurs différencient le Sahara Occidental et Mauritanie des populations nord africaines. Par ailleurs, la distribution des deux lignées uniparentales dans l'Europe méditerranéenne est en grande partie déterminée par des lignées d’origine et ou de dispersion européenne.

Cependant, ces correspondances entre les deux marqueurs uniparentaux reflètent seulement les fréquences des haplogroupes observées dans les populations actuelles. Parce qu’en dépit des similitudes, des différences significatives sont observées entre les échantillons masculins et les échantillons représentatifs de l’apport féminin. Par exemple, la distance FST moyenne entre l'Algérie et les pays du Maghreb pour le chromosome Y (0.061) est presque trois fois supérieure à celle observée pour l’ADNmt (0.023). Elle est 5 fois supérieure entre l'Algérie et l'Europe et presque 8 fois supérieure en considérant les populations du Moyen-Orient. Les distances génétiques entres les populations humaines sont donc significativement plus élevée pour le chromosome Y, comparé à l’ADNmt. Ceci est expliqué par un taux de migration plus élevé chez les femmes dans les populations à structure patrilocales (dans lesquelles la femme part s’installer dans le village/ la ville ou le pays de son mari après le mariage) (Bentley et al. 2009). Cependant, d’autres processus démographiques peuvent constituer un facteur de dérive génétique entre les sexes. Par exemple : une plus forte mortalité chez les hommes, ou bien la polygynie qui se traduit par le fait que les hommes peuvent avoir plusieurs partenaires (Seielstad et al. 1998; Wood et al. 2005). La polygynie et la patrilocalité ont été mises en cause dans les différences sexe-spécifiques des marqueurs uniparentaux observées dans la structure génétique de la population tunisienne (Ennafaa et al. 2011).

174 RÉSULTATS ET DISCUSSION

Les différences sexe-spécifiques sont également observées dans les affinités entre les populations. Ainsi, nous avons remarqué que les Tunisiens sont plus proche des Algériens, sur la base de leur profil génétique mitochondrial. Alors que pour le chromosome Y, ce sont les populations du Sahara Occidental et Mauritanie qui sont les plus proches. Sur la base des données mitochondriales et du chromosome Y, la France et la Péninsule Ibérique semblent les plus éloignés de l’Algérie, respectivement. Enfin, la comparaison des profils maternels montre que la population de l’Arabie Saoudite est la plus distante de la population algérienne. Cependant, c’est la population Caucase qui est la plus éloignée par son profil génétique paternel. Curieusement, pour les deux marqueurs uniparentaux, c’est la population italienne qui semble la plus proche de la population algérienne. Cette observation a été également effectuée par notre analyse des marqueurs STRs du chromosome X dans la population nord-ouest algérienne. De façon générale, la contribution génétique nord africaine au pool génétique des populations sud-européennes est attribuée à l’expansion musulmane qui a duré plus de 500 ans (Sarno et al. 2014). Toutefois, il ne faut pas négliger le contact régulier entre les populations des deux rives méditerranéennes durant les périodes historiques reculées ou plus récentes, notamment, la conquête romaine des terres nord africaines qui a duré plus que 5 siècles.

Une analyse récente du génome entier, basée sur plus de 730 000 SNPs a décrit 5 composants génétiques ancestraux ayant un impact sur le pool génétique des populations nord africaines, à savoir : le composant Maghrébin, Européen, celui du Moyen Orient et ceux de l’est et l’ouest de l’Afrique subsaharienne (Henn et al. 2012). Dans une tentative d’illustration de la distribution de ces 5 composants dans les différentes populations analysées (Figures 48 et 49), nous avons utilisé les données phylogéographiques recueillies et les taux de diversité génétique du chromosome Y et de l’ADNmt (Annexe VIII et IX).

175 RÉSULTATS ET DISCUSSION

176 RÉSULTATS ET DISCUSSION

177 RÉSULTATS ET DISCUSSION

De nouveau, en considérant les 5 différents composants génétiques : du nord de l’Afrique, du Proche-Orient, de l'Europe et de l’ouest et de l’est de l’Afrique subsaharienne, les ressemblances et les différences sont apparentes entre les deux marqueurs uniparentaux (Figure 48 et 49). Par exemple, les fréquences les plus élevées du composant subsaharien de l'Afrique de l’Est sont observées en Egypte et dans la Péninsule Arabe, tant pour le chromosome Y que pour l’ADNmt. Cependant, en Afrique du Nord, les contributions subsahariennes orientales féminine et masculine sont cumulées en Tunisie et au Sahara Occidental et Mauritanie, respectivement. Par ailleurs, les apports masculins et féminins du composant subsaharien de l'Afrique de l’Ouest concordent. Nous observons, ainsi, qu’en Europe, le flux subsaharien de l’ouest est prédominant en Italie et dans la Péninsule Ibérique. En Afrique du Nord, il est majoritaire en Libye et au Sahara Occidental et Mauritanie, et au Moyen Orient, il est supérieur dans la Péninsule Arabe et au Levant. Quant’ au composant européen, il est prédominant, pour les deux marqueurs, dans la Péninsule Ibérique, en Italie, et en France. Néanmoins, en Afrique du Nord, il est prédominant pour l’ADNmt, particulièrement au Maroc. En Algérie, le composant européen masculin est le plus important. Le composant du Moyen Orient montre des valeurs similaires pour les deux marqueurs : la région des Balkans présente la plus grande contribution du Moyen Orient en Europe, l'Égypte en Afrique du Nord et l'Iran au Moyen Orient. Finalement, le composant nord africain est prédominant en Algérie pour l’ADNmt et au Maroc pour le chromosome Y.

Dans le cadre d’une collaboration scientifique entre l’équipe du Pr. Benhamamouch et l’équipe du Pr. Comas-Martinez David de l’Université Pompeu Fabra de Barcelone, une analyse des données des marqueurs SNPs du génome entier dans la population algérienne est en cours de réalisation. Dans une partie de cette étude, nous avons comparé les marqueurs autosomiques à ceux du chromosome X (environ 3000 SNPs). Cette approche permet de déterminer s’il existe une différence sexe-spécifique dans la distribution des composantes génétiques ancestrales, dans la population algérienne. Les résultats préliminaires indiquent que, d’une part, la composante nord africaine est plus spécifique aux marqueurs autosomiques qu’aux marqueurs du chromosome X. Ceci suggère une contribution essentiellement masculine. D’autre part, les composantes ancestrales européennes et du Moyen Orient sont introduites en majorité par les femmes. Ceci est démontré par des fréquences élevées des composantes ancestrales pour le chromosome X, comparé aux

178 RÉSULTATS ET DISCUSSION autosomes. Enfin, la composante ancestrale subsaharienne ne montre aucune différence sexuelle dans la structure de la population algérienne. Les résultats obtenus dans cette analyse sont en accord avec une distribution ancestrale nord africaine masculine et européenne féminine en Algérie, basée sur l’analyse des marqueurs uniparentaux.

Récemment, il a été rapporté que le flux génétique subsaharien en Tunisie montre un forte différence sexe-spécifique, impliquant une contribution féminine significativement élevée (p< 0.0001) (Ennafaa et al. 2011). Cette observation se tient pour toutes les populations nord africaines sauf la Libye, où probablement l’échantillonnage insuffisant (n=47) aurait eu un impact (Ottoni et al. 2011). Cette différence sexe-spécifique est également observée au Moyen-Orient, où des valeurs significatives sont atteintes dans la Péninsule Arabe (p = 0.0005) et dans le Caucase (p = 0.045). En Europe, seule l'Italie montre des différences significatives (p = 0.0001) pour la contribution sexe-spécifique du composant subsaharien. Cependant, l’impact masculin (3.91 %) est supérieur au féminin (1.35 %). Différentes études, basées sur les marqueurs uniparentaux ou sur l’analyse du génome entier attribuent une grande partie du flux génétique subsaharien aux événements historiques tel que la romanisation, l’expansion Islamique et les commerces des esclaves par les arabes (Richards et al. 2003; Malyarchuk et al. 2008; Moorjani et al. 2011; Cerezo et al. 2012; Henn et al. 2012). De plus, l’intégration des femmes, de groupes ethniques minoritaires, dans les sociétés patriarcales a été avancée pour expliquer ces observations (Richards et al. 2003; Ennafaa et al. 2011).

179 RÉSULTATS ET DISCUSSION

II.4 Conclusion de l’Analyse des marqueurs uniparentaux : La distribution des lignées paternelles et maternelles en Afrique du Nord, en général, et en Algérie, en particulier, nous ont permis d’observer différents flux migratoires ayant contribué au pool génétique des populations actuelles. Particulièrement, la région méditerranéenne semble parfaitement refléter son histoire commune par les spécificités uniparentales observées, résumées ainsi : D’une part, plusieurs foyers de dispersion à partir de l’ouest de l’Asie ont dû influencer indépendamment l'Afrique et l'Europe méditerranéenne, à différentes périodes. D’autre part, la diffusion des lignées autochtones des deux cotés de la Méditerranée semble indépendante. Enfin, des contacts maritimes bidirectionnels ont certainement contribué à de faibles flux génétiques entre les deux rives méditerranéennes. La distribution de certains haplogroupes uniparenteaux, en Afrique du nord, a montré des migrations retour à partir du sud ouest de l’Asie mais à des datations différentes. En effet, cette migration retour se situe au néolithique pour le chromosome Y, alors que pour l’ADNmt, les signaux d’une influence paléolithique sont évidentes (Maca-Meyer et al. 2003a ; Arredi et al. 2004 ; Olivieri et al. 2006; Gonzales et al. 2007 ; Cruciani et al. 2010). Par ailleurs, une récente étude a estimé que l’émergence des lignées paternelles au nord de l’Afrique date d’il y a 15 000 ans, ce qui correspond à la période post-DMG (Dernier Maximum Glacier). Dans cette étude, seules les Berbères Tunisiens semblent montré une composante paternelle plus ancestrale, datant du paléolithique (Fadhlaoui-Zid et al. 2013). La différence de datation sexe-spécifique a été attribuée, précédemment à l’âge de coalescence plus important pour l’ADNmt que pour le chromosome Y (Cruciani et al. 2011a). Cependant, de récentes analyses indiquent que ces différences devraient être attribuées à des mouvements de populations sexe-spécifiques détectés par chaque marqueur uniparental (Mendez et al. 2013). Une vue conciliant les deux perspectives serait que les lignées masculines sont mieux adaptées pour détecter des expansions humaines plus récentes tandis que les ramifications de généalogies de l'ADNmt s'étendent aux temps paléolithiques et au-delà.

180

CONCLUSION GÉNÉRALE ET PERSPECTIVES CONCLUSION GÉNÉRALE ET PERSPECTIVES

Conclusion générale et perspectives

L’analyse du chromosome X, effectuée pour la première fois dans la population algérienne, permet d’apporter une forte contribution à la communauté scientifique médico-légale nationale et internationale. D’une part, l’efficacité des PCRs multiplex développées ou testées pour l’analyse des X-STRs dans la population algérienne, offre un outil convenable et approprié qui s’ajoute aux kits commercialisés (tel que Argus X-8) régulièrement utilisés. De plus, l’observation d’une variabilité dans la structure moléculaire du locus DXS10148 permet de prévenir les études ultérieures quant’ à la diversité moléculaire des X-STRs, potentiellement rencontré dans certaines populations. D’autre part, l’analyse a permis de fournir une base de données de 21 marqueurs X-STRs dans la population nord-ouest algérienne, et de décrire leur potentiel dans les analyses médico-légales. L’utilisation de ces marqueurs X-STRs permet de compléter efficacement l'analyse des STRs autosomiques et du chromosome Y dans la résolution des cas de recherche parentale complexes. Par ailleurs, une disponibilité croissante des données des marqueurs (SNPs) du chromosome X est fournie par l’analyse du génome entier dans différentes populations. Ceci permet d'offrir de nouveaux aperçus dans l’utilisation conjointe des marqueurs à évolution rapide (X-STRs) et lente (X-SNPs) dans les analyses de la diversité génétique des populations. Néanmoins, nos résultats de l’analyse des X-STRs seulement ont permis d’observer un rapprochement génétique entre la population nord-ouest algérienne et les populations eurasiatiques, en particulier, la population italienne. Ce résultat surprenant a été attribué, au départ, au manque de données sur des populations plus proches géographiquement. Cependant, cette observation a été confirmée, plus tard, par l’analyse des marqueurs uniparentaux. Ainsi l’anthropologie biologique semble réinterpréter la diversité biologique humaine.

L’analyse de l’ADN mitochondrial et du chromosome Y, effectuée pour la première fois dans la population nord-ouest algérienne, nous a permis de compléter efficacement les informations recueillies sur la structure génétique des populations nord africaines. Dans un premier temps, la comparaison entre les échantillons de la population algérienne a permis d’observer quelques différences pour les deux marqueurs uniparentaux. Néanmoins, la

181 CONCLUSION GÉNÉRALE ET PERSPECTIVES structure génétique ancestrale nord africaine est clairement observée dans tous les échantillons. De plus, la diversité génétique des marqueurs uniparentaux au sein de chaque échantillon reflète presque les mêmes flux migratoires, concluant qu’un isolat géographique n’est pas forcement un isolat génétique. Nous pouvons même avancer que les différences observées, entre les échantillons algériens analysés, sont probablement dues à un confinement plus récent, reflétant des processus démographiques (ex. endogamie chez les Mozabites), sociaux et culturels. Toutefois, de telles conclusions seraient trop hâtives. Il nous parait intéressant, aujourd’hui, d’effectuer une comparaison génétique entre différents groupes ethniques algériens (tribus, arabophone et berbérophone) du nord au sud et de l’est à l’ouest. De telles études ont été largement effectuées en Tunisie et au Maroc révélant des observations intéressantes portant sur l’affinité génétique entre les groupes ethniques (Arabes et berbères) (Cherni et al. 2009 ; Fadhlaoui-Zid et al. 2013).

L’analyse des marqueurs uniparentaux a montré que le pool génétique de la population algérienne reflète parfaitement sa position géographique. Les fréquences des haplogroupes uniparentaux obtenues sont en accord avec les différents gradients de fréquences observées au nord de l’Afrique. D’une part, des gradients de fréquences décroissants ouest-est sont observés pour les haplogroupes mitochondriaux H/HV (européen) et U6a (nord africain) et pour l’haplogroupe du chromosome Y : E-M81 (nord africain). D’autre part, des gradients de fréquences décroissants est-ouest sont observés pour l’haplogroupe mitochondrial M1 (est africain) et les haplogroupes du chromosome Y : J1-M267 (du Moyen Orient) et E-M78 (nord-est africain). Ces différents gradients des haplogroupes reflètent une histoire démographique de l’Afrique du Nord dynamisée par des flux migratoires suivant un axe est- ouest. Néanmoins, d’autres flux migratoires sont également considérés : À partir du Sud, l’impact subsaharien est représenté par les lignées L de l’ADN mitochondrial et les sous- groupes E-M2 et R-V88 du chromosome Y. À partir du Nord, différents haplogroupes et sous-groupes indiquent des flux génétiques bidirectionnels entre la population algérienne et les populations sud européenne. Ces observations renforcent la complexité génétique de la population algérienne.

L’évaluation de l’apport génétique maternel et paternel montre non seulement des gradients spatiaux pour certaines lignées, mais aussi une asymétrie sexuelle dans les affinités relatives entre les populations nord africaines. Toutefois, l’analyse des marqueurs uniparentaux montre que les femmes et les hommes nord africains ont tous les deux accumulé les flux

182 CONCLUSION GÉNÉRALE ET PERSPECTIVES génétiques africain et eurasiatique qui constituent la structure génétique de la population actuelle. En effet, l’analyse de l’ADNmt et du chromosome Y dans la population algérienne indique une contribution génétique eurasiatique d’environ 80% et 90% et une composante subsaharienne de 20% et 10%, respectivement. Nous pouvons conclure que nos résultats concordent avec ceux des autres populations nord africaines. La structure génétique des populations nord africaines actuelles reflète quatre principales composantes génétiques : nord africaine, européenne, du Moyen Orient et subsaharienne. Cette structure mosaïque résulte de différents épisodes de migration de populations, survenus à différentes périodes historiques et préhistoriques. Ces populations se seraient ensuite sédentarisées au cours du temps :

1) Le plus ancien flux génétique au nord de l’Afrique, attesté par les lignées maternelles (U6a et M1), semble dater du paléolithique. Il est dû à une migration retour vers l’Afrique, à partir du Moyen Orient, après le fameux épisode du « Out Of Africa », il y a 55 000 à 60 000 ans. 2) Un flux génétique qui correspond à l’expansion néolithique à partir du proche orient : Il est évident pour plusieurs lignées paternelles et maternelles ayant eu un impact direct au nord de l’Afrique ou indirect à travers l’Europe. 3) Un flux génétique subsaharien qui date de l’Holocène, une période verdoyante ou la traversée du Sahara était possible. 4) Enfin, de récents impacts génétiques historiques à partir du Proche Orient. Ils correspondent à l’expansion musulmane il y a 1 400 ans, au commerce méditerranéen des Phéniciens ou à l’influence Ottomane au Maghreb... Il est intéressant de noter que l’impact historique de l’expansion arabe est évident tant sur le plan culturel, linguistique et religieux que sur le plan génétique. En outre, les routes des esclaves introduits par les arabes au 7éme siècle ont largement contribué à la diffusion du flux subsaharien.

Par ailleurs, les études paléontologiques ont montré que la présence de l’homme anatomiquement moderne au nord de l’Afrique est antérieure à 60 000 ans. De ce fait, des questions restent en suspens: Est-ce que la population nord africaine ancestrale a fait partie du « Out Of Africa » et est ensuite revenu en Afrique avec tout le pool génétique observé de cette migration retour ; Ou bien y a-t-il eu une population ancestrale qui a persisté in situ durant les 50 000 ans passés mais qui a largement été affectée par des flux migratoires à

183 CONCLUSION GÉNÉRALE ET PERSPECTIVES partir du proche orient ? Il est difficile de répondre à toutes ces questions par l’analyse de l’ADN des populations actuelles uniquement. D’un autre coté, les paléontologues estiment, aujourd’hui, que le rôle de l’Afrique du Nord a été négligé et qu’elle pourrait être une source potentielle de la migration « Out Of Africa ». De plus, l’analyse des fossiles hominides suggère une forte ressemblance et probablement un lien évolutif entre les spécimens nord africains et les fossiles représentant la migration « Out Of Africa » entre 130 000 et 40 000 ans (Balter 2011). De ce fait, il nous semble important que soient envisagées des analyses génétiques sur des sépultures anciennes, du Maghreb et de l’Algérie en particulier, afin de déterminer une éventuelle continuité génétique.

L'enjeu principal de la caractérisation génétique d’une population est de déduire son histoire ancestrale pour différentes raisons : généalogique, anthropologique et épidémiologique. De ce fait, la caractérisation génétique de la population algérienne s’inscrit dans une perspective qui devrait répondre à des analyses de marqueurs liés ou associées aux pathologies, aux tests d'identification génétique médico-légale et aux études sur la diversité génétique des populations. Par ailleurs, le travail accompli dans cette thèse ne constitue qu’une première ébauche de la détermination de la diversité génétique dans la population algérienne. Il convient d’effectuer d’autres analyses génétiques de différents marqueurs dans d’autres échantillons de notre population. Ceci permettra de compléter les données obtenues et d’effectuer des comparaisons entre différents groupes ethniques en Algérie. Dans ce cas, l’analyse des marqueurs uniparentaux offre un outil efficace et applicable à la détection temporelle et spatiale des mouvements humains passés, apportant un enrichissement certain aux données archéologiques et anthropologiques.

Les modestes travaux de cette thèse ouvrent de larges perspectives déjà envisagées par notre équipe, en collaboration avec l’équipe du Pr. Comas-Martinez David de l’Université de Barcelone. Des études en cours de réalisation apportent des résultats préliminaires qui restent à approfondir : La comparaison des données génétiques de différents échantillons algériens permet d’observer que les variations entre les populations sont moins importantes que les relations intra-populationnelles déjà révélées par l’utilisation des marqueurs moléculaires. Ces travaux mettent en évidence, une fois de plus, une affinité génétique entre les tribus arabophones et berbérophones qui renvoient aux relations complexes et subtiles entre le biologique, le social, le culturel et le géographique.

184 CONCLUSION GÉNÉRALE ET PERSPECTIVES

Par ailleurs, il est important de constater que le développement prodigieux des techniques de biologie moléculaire et des analyses bio-statistiques ouvrent de nouveaux horizons. En effet, le séquençage du génome entier et l’analyse de milliers de polymorphismes SNPs, accompagnés par des analyses statistiques complexes (tel que les analyses ADMIXTURE) sont entrain de modeler la génétique des populations. En effet, l’analyse des marqueurs autosomiques offre une nouvelle vision puisque chaque segment du génome renseigne sur sa propre histoire ancestrale et différents segments génomiques de différents individus peuvent déduire une histoire ancestrale impliquant différentes populations. De plus, ce type d’analyse ne nécessite qu’un très petit effectif de la population, plutôt que d’étudier plusieurs marqueurs à travers un grand échantillon de population.

Pour écrire enfin l’histoire de notre population depuis les temps anciens, il nous parait indispensable que les contributions scientifiques soient pluridisciplinaires, incluant des généticiens en biologie moléculaire, des paléontologues, des experts en génétique médico- légale, des anthropologues, des historiens, des sociologues et des linguistes. Ces travaux de collaborations permettront d’exploiter et d’approfondir les données génétiques des populations nord africaines en général et algériennes en particulier. Enfin, à court ou à moyen terme, la maitrise des techniques de biologie moléculaire utilisées dans ce travail et les résultats obtenus peuvent dynamiser dans notre université la formation pratique de nouveaux masters professionnels. Nous citons, par exemple, le master de criminalistique et criminologique dont s’est doté, depuis 2011, l'Université des Sciences et de la Technologie Houari-Boumediene (USTHB-Alger) en coordination avec la gendarmerie nationale et l’Institut National de Criminologie et de Criminalistique (INCC). Cette nouvelle stratégie scientifique, définie directement avec le secteur utilisateur, permet de créer une passerelle entre le monde scientifique et le marché de l’emploi, mais aussi entre la recherche scientifique universitaire et la recherche criminalistique. Il est donc possible d’envisager ce même type de collaboration pédagogique et de recherche dans l’ouest algérien, avec une formation orientée vers les attentes des annexes régionales et nationales des secteurs d’application.

185

RÉFÉRENCES BIBLIOGRAPHIQUES RÉFÉRENCES BIBLIOGRAPHIQUES

Références Bibliographiques

Aboukhalid, R., Bouabdellah, M., Abbassi, M., Bentayebi, K., Elmzibri, M., Squalli, D., Amzazi, S. (2010). Haplotype frequencies for 17 Y-STR loci (AmpFlSTRY-filer) in a Moroccan population sample. Forensic Science International: Genetics, 4(3), e73-4. Abu-Amero, K. K., González, A. M., Larruga, J. M., Bosley, T. M., Cabrera, V. M. (2007). Eurasian and African mitochondrial DNA influences in the Saudi Arabian population. BMC Evolutionary Biology, 7, 32. Abu-Amero KK, Larruga JM, Cabrera VM, González AM. (2008). Mitochondrial DNA structure in the . BMC Evolutionary Biology, 8, 45. Abu-Amero, K. K., Hellani, A., González, A. M., Larruga, J. M., Cabrera, V. M., Underhill, P. A. (2009). Saudi Arabian Y-Chromosome diversity and its relationship with nearby regions. BMC Genetics, 10, 59. Abu-Amero, K. K., Al-Boudari, O. M., Mousa, A., Gonzalez, A.M., Larruga, J. M, Cabrera, V. M., Dzimiri, N. (2010). The mitochondrial DNA variant 16189T>C is associated with coronary artery disease and myocardial infarction in Saudi . Genetic Testing and Molecular Biomarkers, 14(1), 43-47. Abu-Amero, K. K., Cabrera, V. M., Larruga, J. M., Osman, E. A., González, A. M., Al-Obeidan, S. A. (2011a). Eurasian and Sub-Saharan African mitochondrial DNA haplogroup influences pseudoexfoliation glaucoma development in Saudi patients. Molecular Vision, 17, 543-547. Abu-Amero, K. K., González, A. M., Osman, E. A., Larruga, J. M., Cabrera, V. M., Al-Obeidan, S. A. (2011b). Susceptibility to primary angle closure glaucoma in Saudi Arabia: the possible role of mitochondrial DNA ancestry informative haplogroups. Molecular Vision, 17, 2171-2176. Achaz G. (2009). Introduction à la coalescence. Cours introductifs en Français à la théorie de coalescence. Achilli, A., Rengo, C., Magri, C., Battaglia, V., Olivieri, A., Scozzari, R., … Torroni, A. (2004). The molecular dissection of mtDNA haplogroup H confirms that the Franco-Cantabrian glacial refuge was a major source for the European gene pool. American Journal of Human Genetics, 75(5), 910–8. Achilli, A., Rengo, C., Battaglia, V., Pala, M., Olivieri, A., Fornarino, S., … Torroni, A. (2005). Saami and --an unexpected mitochondrial DNA link. American Journal of Human Genetics, 76(5), 883–6.

186 RÉFÉRENCES BIBLIOGRAPHIQUES

Achilli, A., Olivieri, A., Pala, M., Metspalu, E., Fornarino, S., Battaglia, V., ... Torroni A. (2007). Mitochondrial DNA Variation of Modern Tuscans Supports the Near Eastern Origin of Etruscans. American Journal of Human Genetics, 80(4), 759-768. Adams, S. M., Bosch, E., Balaresque, P. L., Ballereau, S. J., Lee, A. C., Arroyo, E., López-Parra, A. M., ... Jobling, M. A. (2008). The genetic legacy of religious diversity and intolerance: paternal lineages of Christians, Jews, and Muslims in the Iberian Peninsula. American Journal of Human Genetics, 83(6), 725-36. Al-Zahery, N., Semino, O., Benuzzi, G., Magri, C., Passarino, G., Torroni, A., Santachiara- Benerecetti, A. S. (2003). Y-chromosome and mtDNA polymorphisms in Iraq, a crossroad of the early human dispersal and of post-Neolithic migrations. Molecular Phylogenetics and Evolution, 28(3), 458-472. Al-Zahery, N., Pala, M., Battaglia, V., Grugni, V., Hamod, M. A., Hooshiar-Kashani, B., Olivieri, A., Torroni, A., Santachiara-Benerecetti, A. S., Semino, O. (2011). In search of the genetic footprints of Sumerians: a survey of Y-chromosome and mtDNA variation in the Marsh Arabs of Iraq. BMC Evolutionary Biology, 11, 288. Aler, M., Sánchez-Diz, P., Gomes, I., Gisbert, M., Carracedo, A., Amorim, A., Gusmão, L. (2007). Genetic data of 10 X-STRs in a Spanish population sample. Forensic Science International, 173(2-3), 193–6. Alfonso-Sánchez, M. A., Cardoso, S., Martínez-Bouzas, C., Peña, J. A., Herrera, R. J., Castro, A., Fernández-Fernández, I., De Pancorbo, M. M. (2008). Mitochondrial DNA haplogroup diversity in : a reassessment based on HVI and HVII polymorphisms. American Journal of Human Biology, 20(2), 154-164. Alonso, S., Flores, C., Cabrera, V., Alonso, A., Martín, P., Albarrán, C., Izagirre, N., de la Rua, C., García, O. (2005). The place of the Basques in the European Y-chromosome diversity landscape. European Journal of Human Genetics, 13(12), 1293–1302. Alshamali, F., Brandstätter, A., Zimmermann, B., Parson, W. (2008). Mitochondrial DNA control region variation in Dubai, United Arab Emirates. Forensic Science International: Genetics, 2(1), e9-10 Altmann, R. (1890). Die Elementarorganismen und ihre Beziehungen zu den Zellen. Leipzig: Verlag yon Veit &Comp. Alvarez-Iglesias, V., Mosquera-Miguel, A., Cerezo, M., Quintans, B., Zarrabeitia, M. T., Cusco, I., Lareu, M. V., Garcıa, O., Perez-Jurado, L., Carracedo, A., Salas, A. (2009). New Population and Phylogenetic Features of the Internal Variation within Mitochondrial DNA Macro-Haplogroup R0. PloS One, 4(4), e112.

187 RÉFÉRENCES BIBLIOGRAPHIQUES

Alvarez, J. C., Johson, D. E. L., Lorente, J. A., Martinez-espin, E., Martinez-Gonzalez, L. J., Allard, M., Wilson, M. R., Budowle, B. (2007). Characterization of human control region sequences for Spanish individuals in a forensic mtDNA data set. Legal Medicine, 9(6), 293-304. Alvarez, L., Santos, C., Montiel, R., Caeiro, B., Baali, A., Dugoujona, J. M., Aluja, M. P. (2009). Y- chromosome variation in South Iberia: insights into the North African contribution. American Journal of Human Biology, 21(3), 407-409. Alvarez, L., Santos, C., Ramos, A., Pratdesaba, R., Francalacci, P., Aluja, M. P. (2010). Mitochondrial DNA Patterns in the Iberian Northern Plateau: Population Dynamics and Substructure of the Zamora Province. American Journal of Physical Anthropology, 142(4), 531-539. Amorim, A. (1999). Archaeogenetics. J. Iberian Archaeol. 1, 15–25 M.R. Wilson, J.A. DiZinno, D. Polanskey, J. Replogle, B. Budowle, Validation of mitochondrial DNA sequencing for forensic casework analysis. International Journal of Legal Medicine, 108(1995), 68-74. Anderson, S., Benkier, A. T., Barrell, B. G., de Bruijn, M. H. L., Coulson, A. R., Drouin, J., … Young, I. G. (1981). Sequence and organization of the human mitochondrial genome. Nature, 290(9), 457–465. Andrews, R. M., Kubacka, I., Chinnery, P. F., Lightowlers, R. N., Turnbull, D. M., Howell, N. (1999). Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA. Nature Genetics, 23(2), 147. Arambourg, C. (1963). Le gisement de Ternifine II – l'Atlanthrope mauretanicus. Archives de l'IPH, 32, 37–190. Arctander, P. (1999). Mitochondrial recombination? Science, 284, 2090–91 Arredi, B., Poloni, E. S., Paracchini, S., Zerjal, T., Fathallah, D. M., Makrelouf, M., … Tyler-Smith, C. (2004). A Predominantly Neolithic Origin for Y-chromosomal DNA Variation in North Africa. American Journal of Human Genetics, 75(2), 338–45. Aumassip, G. (2001). L’Algérie des premiers hommes. Les editions de la Maison des Sciences de l’Homme, 7-13, 23-38, 225 Awadalla, P., Eyre-Walker, A., Smith, J. M. (1999). Linkage disequilibrium and recombination in hominid mitochondrial DNA. Science, 286, 2524–25 Awadalla, P., Eyre-Walker, A., Smith, J. M. (2000). Questioning evidence for recombination in human mitochondria. Science, 288, 1931 Babalini, C., Martinez-Labarga, C., Tolk, H. V., Kivisild, T., Giampaolo, R., Tarsi, T., Contini, I., Barac, L., Janicijevic, B., Martinovic Klaric, I., Pericic, M., Sujoldzic, A., Villems, R., Biondi, G., Rudan, P., Rickards, O. (2005). The population history of the Croatian linguistic minority of Molise (southern Italy): a maternal view. European Journal of Human Genetics, 13(8), 902-912.

188 RÉFÉRENCES BIBLIOGRAPHIQUES

Balanovsky, O., Dibirova, K., Dybo, A., Mudrak, O., Frolova, S., ... Balanovska E., Genographic Consortium. (2011). Parallel evolution of genes and languages in the Caucasus region. Molecular Biology and Evolution, 28(10), 2905-20. Balter, M. (2011). Was North Africa The Launch Pad For Modern Human Migrations? Science, 331, 20–23. Bandelt, H. J., Forster, P., Röhl, A. (1999). Median-joining networks for inferring intraspecific phylogenies. Molecular biology and evolution, 16, 37–48. Bar, W., Brinkmann, B., Lincoln, P., Mayr, W. R., Rossi, U. (1994). DNA recommendations--1994 report concerning further recommendations of the DNA Commission of the ISFH regarding PCR-based polymorphisms in STR (short tandem repeat) systems. International Journal of Legal Medicine, 107, 159–160. Bar, W., Brinkmann, B., Budowle, B., Carracedo, A., Gill, P., Lincoln, P., Mayr, W. R., Olaisen, B. (1997). DNA recommendations - further report of the DNA commission of the ISFH regarding the use of short tandem repeat systems. International Journal of Legal Medicine, 110, 175–176. Bar-Hen, A., Mariadassou, M., Poursat, M. A., Vandenkoornhuyse Ph. (2008). Influence Function for Robust Phylogenetic Reconstructions. Molecular Biology and Evolution, 25(5), 869– 873. Bär, W., Brinkmann, B., Budowle, B., Carracedo, A., Gill, P., Lincoln, P., Mayr, W., Olaisen, B. (1997). DNA recommendations. Further report of the DNA Commission of the ISFH regarding the use of short tandem repeat systems. International Society for Forensic Haemogenetics. International Journal of Legal Medicine, 110, 175–176 Barac, L., Pericic, M., Klaric, I. M., Rootsi, S., Janicijevic, B., Kivisild, T., Parik, J., Rudan, I., Villems, R., Rudan, P. (2003). Y chromosomal heritage of Croatian population and its island isolates. European Journal of Human Genetics, 11(7), 535-42. Barton, R. N. E., Bouzouggar, A., Collcutt, S. N., Schwenninger, J-L., Clark-Balzan, L. (2009). OSL dating of the Aterian levels at Grotte de Dar es-Soltan I (Rabat, Morocco) and possible implications for the dispersal of modern Homo sapiens. Quaternary Science Reviews, 28. Batini, C., Lopes, J., Behar, D. M., Calafell, F., Jorde, L. B., van der Veen, L., … Comas, D. (2011a). Insights into the demographic history of African Pygmies from complete mitochondrial genomes. Molecular Biology and Evolution, 28(2), 1099–110. Batini, C., Ferri, G., Destro-Bisol, G., Brisighelli, F., Luiselli, D., Sánchez-Diz, P., … Capelli, C. (2011b). Signatures of the preagricultural peopling processes in sub-Saharan Africa as revealed by the phylogeography of early Y chromosome lineages. Molecular Biology and Evolution, 28(9), 2603–13.

189 RÉFÉRENCES BIBLIOGRAPHIQUES

Battaglia, V., Fornarino, S., Al-Zahery, N., Olivieri, A., Pala, M., Myres, N. M., King, R. J., Rootsi, S., Marjanovic, D., Primorac, D., ... Semino O. (2009). Y-chromosomal evidence of the cultural diffusion of agriculture in Southeast Europe. European Journal of Human Genetics, 17(6), 820-30. Batzer, M. A., Deininger, P. L. (1991). A human-specific subfamily of Alu sequences. Genomics, 9, 481–487. Batzer, M. A. et Deininger, P. L. (2002). Alu repeats and human genomic diversity. Nature Reviews. Genetics, 3(5), 370–9. Batzer, M. A., Stoneking, M., Alegria-Hartman, M., Bazan, H., Kass, D. H., Shaikh, T. H., … Herrera, R. J. (1994). African origin of human-specific polymorphic Alu insertions. Proceedings of the National Academy of Sciences of the United States of America, 91(25), 12288–92. Bauduer, F. (2013). Éléments d’anthropologie biologique. Ellipses Édition, 45-9; 71. Behar, D. M., Garrigan, D., Kaplan, M. E., Mobasher, Z., Rosengarten, D., Karafet, T. M., … Hammer, M. F. (2004). Contrasting patterns of Y chromosome variation in Ashkenazi Jewish and host non-Jewish European populations. Human Genetics, 114(4), 354–65. Behar, D. M., Villems, R., Soodyall, H., Blue-smith, J., Pereira, L., Metspalu, E., … Rosset, S. (2008a). The Dawn of Human Matrilineal Diversity. American Journal of Human Genetics, 82(5), 1130–1140. Behar, D. M., Metspalu, E., Kivisild, T., Rosset, S., Tzur, S., ... Skorecki, K. (2008b). Counting the founders: the matrilineal genetic ancestry of the Jewish Diaspora. PLoS One, 3(4), e2062. Belledi, M., Poloni, E. S., Casalotti, R., Conterio, F., Mikerezi, I., Tagliavini, J., Excoffier, L. (2000). Maternal and paternal lineages in Albania and the genetic structure of Indo-European populations. European Journal of Human Genetics, 8(7), 480-486. Bellil, R. (1999). Les oasis du Gourara (Sahara algérien). Peeters Publishers, 62-66. Bender, K., Schneider, P. M., Rittner, C. (2000). Application of mtDNA sequence analysis in forensic casework for the identification of human remains. Forensic Science International, 113, 103-7. Bentley, R. A., Layton, R. H., Tehrani, J. (2009). Kinship, Marriage , and the Genetics of Past Human Dispersals. Human Biology, 81(2), 159–179. Bertranpetit, J., Sala, J., Calafell, F., Underhill, P. A., Moral, P., Comas, D. (1995). Human mitochondrial DNA variation and the origin of the Basques. Annals of Human Genetics, 59, 63-81. Bini, C., Ceccardi, S., Luiselli, D., Ferri, G., Pelotti, S., Colalongo, C., Falconi, M., Pappalardo, G. (2003). Different informativeness of the three hypervariable mitochondrial DNA regions in the population of Bologna (Italy). Forensic Science International, 135(1), 48-52.

190 RÉFÉRENCES BIBLIOGRAPHIQUES

Booker, L. M., Habermacher, G. M., Jessie, B. C., Sun, Q.C., Baumann, A. K., ... Petros J.A. (2006). North American white mitochondrial haplogroups in prostate and renal cancer. Journal of Urology, 175, 468-72. Bosch, E., Calafell, F., Santos, F. R., Pérez-Lezaun, A., Comas, D., Benchemsi, N., … Bertranpetit, J. (1999). Variation in short tandem repeats is deeply structured by genetic background on the human Y chromosome. American Journal of Human Genetics, 65(6), 1623–38. Bosch, E., Calafell, F., Comas, D., Oefner, P.J., Underhill, P. A., Bertranpetit, J. (2001). High- resolution analysis of human Y-chromosome variation shows a sharp discontinuity and limited gene flow between northwestern Africa and the Iberian Peninsula. American Journal of Human Genetics, 68(4), 1019-29. Bosch, E., Calafell, F., González-Neira, G., Flaiz, C., Mateu, E., Scheil, H.-G., Huckenbeck, W., Efremovska, L., Mikerezi, I., Xirotiris, N., Grasa, C., Schmidt, H., Comas, D. (2006). Paternal and maternal lineages in the Balkans show a homogeneous landscape over linguistic barriers, except for the isolated Aromuns. Annals of Human Genetics, 70(4), 459-487. Botigué, L. R., Henn, B. M., Gravel, S., Maples, B. K., Gignoux, C. R., Corona, E., … Bustamante, C. D. (2013). Gene flow from North Africa contributes to differential human genetic diversity in southern Europe. Proceedings of the National Academy of Sciences of the United States of America, 110(29), 11791–6. Bouakaze, C. (2010). Analyse de polymorphismes ponctuels d’ADN extraits de tissus humains anciens: application à l’étude de populations sibériennes anciennes. Thèse de Doctorat, Université de Strasbourg, 57 Brakez, Z., Bosch, E., Izaabel, H., Akhayat, O., Comas, D., Bertranpetit, J., Calafell, F. (2001). Human mitochondrial DNA sequence variation in the Moroccan population of the Souss area. Annals of Human Biology, 28(3), 295-307. Brotherton, P., Haak, W., Templeton, J., Brandt, G., Soubrier, J., Jane Adler, C., … Ziegle, J. S. (2013). Neolithic mitochondrial haplogroup H genomes and the genetic origins of Europeans. Nature Communications, 4, 1764. Brown, W. M. (1980). Polymorphism in mitochondrial DNA of humans as revealed by restriction endonuclease analysis. Proceedings of the National Academy of Sciences USA, 77, 3605–9 Brunet, M., Guy, F., Pilbeam, D., Mackaye, H. T., Likius, A., Ahounta, D., … Zollikofer, C. (2002). A new hominid from the Upper Miocene of Chad, Central Africa. Nature, 418(6894), 145–51. Burroughs, W.J. (2005). Climate Change in Prehistory. The End of the Reign of Chaos. Cambridge University Press, 169-289.

191 RÉFÉRENCES BIBLIOGRAPHIQUES

Butler, J. M. (2003). Recent Developments in Y-Short Tandem Repeat and Y-Single Nucleotide Polymorphism Analysis. Forensic Science Review, 15, 91–111. Butler, J. M. (2005). Forensic DNA Typing. Biology, technology, and genetics of STR markers. Elsevier Academic Press (Second edition), 201–298. Cadenas, A. M., Zhivotovsky, L. A., Cavalli-Sforza, L. L., Underhill, P. A, Herrera, R. J. (2008). Y- chromosome diversity characterizes the Gulf of Oman. European Journal of Human Genetics, 16(3), 374-386. Cahïla, H. (2002). Oran, Histoire d’une ville. Edition Ibn-Khaldoun, 14. Calafell, F., Underhill, P., Tolun, A., Angelicheva, D., Kalaydjeva, L. (1996). From Asia to Europe: mitochondrial DNA sequence variability in Bulgarians and Turks. Annals of Human Genetics, 60, 35-49. Cali, F., Le Roux, M. G., D'Anna, R., Flugy, A., De Leo, G., Chiavetta, V., Ayala, G. F., Romano, V. J. (2001). MtDNA control region and RFLP data for Sicily and France. Legal Medecine, 114(4-5), 229-231. Callinan, P. A., Hedges, D. J., Salem, A.-H., Xing, J., Walker, J. A., Garber, R. K., … Batzer, M. A. (2003). Comprehensive analysis of alu associated diversity on the human sex chromosomes. Gene, 317(1-2), 103–10. Camps, G. (1969). Amekni, Néolithique ancien du Hoggar. Paris, Arts et Métiers graphiques. Mémoire du Centre de Recherches anthropologiques, préhistoriques et ethnologiques : CRAPE, 10, 232. Camps, G. (1974). Les civilisations préhistoriques de l’Afrique du Nord et du Sahara. Paris: Doin, 374. Cann, R. L., Stoneking, M., Wilson, A. C. (1987). Mitochondrial DNA and human evolution. Nature, 325, 31-6. Capelli, C., Redhead, N., Romano, V., Calì, F., Lefranc, G., Delague, V., ... Goldstein, D. B. (2006). Population structure in the Mediterranean basin: a Y chromosome perspective. Annals of Human Genetics, 70, 207-25. Capelli, C., Brisighelli, F., Scarnicci, F., Arredi, B., Cagliá, A., Vetrugno, G., Tofanelli, S., Onofri, V., Tagliabracci, A., Paoli, G., Pascali, V. L. (2007). Y chromosome genetic variation in the Italian peninsula is clinal and supports an admixture model for the Mesolithic- Neolithic encounter. Molecular Phylogenetics and Evolution, 44(1), 228-39. Caratti, S., Gino, S., Torre, C., Robino, C. (2009). Subtyping of Y-chromosomal haplogroup E-M78 (E1b1b1a) by SNP assay and its forensic application. International Journal of Legal Medicine, 123(4), 357-360.

192 RÉFÉRENCES BIBLIOGRAPHIQUES

Casas, M. J., Hagelberg, E., Fregel, R., Larruga, J. M., González, A. M. (2006). Human mitochondrial DNA diversity in an archaeological site in al-Andalus. Genetic impact of migrations from North Africa in medieval Spain. American Journal of Physical Anthropology, 131, 539–551. Cavalli-Sforza, L. L., Bodmer, W. F. (1971). The genetics of human populations. WH Freeman, San Francisco. Cavalli-Sforza, L. L., Menozzi, P., Piazza, A. (1994). The History and Geography of Human Genes. Princeton, NJ: Princeton University Press. Cavalli-Sforza, L. L. et Feldman, M. W. (2003). The application of molecular genetic approaches to the study of human evolution. Nature Genetics, 33, 266–75. Cejas, E. J. M. et Casanas, G-T. F. (2013). Jeux, abaques et calculatrices astronomiques des îles Canaries depuis l'Antiquité. Éditions L’Harmattan, 59-66 Cerezo, M., Achilli, A., Olivieri, A., Perego, U. A., Brisighelli, F., Lancioni, H., … Cellulare, B. (2012). Reconstructing ancient mitochondrial DNA links between Africa and Europe. Genome Research, 22(5), 821-826. Cerny, V., Mulligan, C. J., Rídl, J., Zaloudková, M., Edens, C. M., Hájek, M., Pereira, L. (2008). Regional differences in the distribution of the sub-Saharan, West Eurasian, and South Asian mtDNA lineages in . American Journal of Physical Anthropology, 136(2), 128-137. Chabrol, B., de Lonlay, P., Cochat, P. (2011). Maladies métaboliques héréditaires. Éditions Doin, 69- 68. Chan, D. C. (2006). Mitochondria: dynamic organelles in disease, aging, and development. Cell, 125, 1241-52. Chastagnol, A et Balout, L. (1960). Algérie préhistorique. Annales: Économies, Sociétés, Civilisations. 15e Année, 4, 789–791. Cherni, L., Fernandes, V., Pereira, J. B, Costa, M. D., Goios, A., Frigi, S., Yacoubi-Loueslati, B., Ben Amor, M., Slama, A., Amorim, A., El Gaaied, A. A., Pereira, L. (2009). Post-Last Glacial Maximum Expansion From Iberia to North Africa Revealed by Fine Characterization of mtDNA H Haplogroup in Tunisia. American Journal of Physical Anthropology, 139(2), 253-260. Chiaroni, J., King, R. J., Underhill, P. (2008). Correlation of annual precipitation with human Y chromosome diversity and the emergence of Neolithic agriculture and pastoral economies in the fertile crescent. Antiquity, 82, 281– 289. Chiaroni, J., Underhill, P. A., Cavalli-Sforza, L. L. (2009). Y chromosome diversity, human expansion, drift, and cultural evolution. Proceedings of the National Academy of Sciences of the United States of America, 106(48), 20174–9. Childe, V. G. (1925). L’aube de la civilisation européenne, Paris, Payot.

193 RÉFÉRENCES BIBLIOGRAPHIQUES

Churchill, S. E. et Smith, F. H. (2000). Makers of the early Aurignacian of Europe. Yearbook of Physical Anthropology, 49, 61–115. Cinnioglu, C., King, R., Kivisild, T., Kalfoglu, E., Atasoy, S., Cavalleri, G. L., Lillie, A. S., Roseman, C. C., Lin, A. A, Prince, K., … Underhill, P. A. (2004). Excavating Y- chromosome haplotype strata in Anatolia. Human Genetics. 114(2), 127-148. Clayton, T. M., Hill, S. M., Denton, L. A., Watson, S. K., Urquhart, A. J. (2004). Primer binding site mutations affecting the typing of STR loci contained within the AMPFlSTR SGM Plus kit. Forensic Science International, 139, 255-259. Coble, M. D., Just, R. S., O'Callaghan, J. E., Letmanyi, I. H., Peterson, C. T., Irwin, J. A., Parsons, T. J. (2004). Single nucleotide polymorphisms over the entire mtDNA genome that increase the power of forensic testing in Caucasians. International Journal of Legal Medicine, 118(3), 137-46. Coca, A. F. et Deibert, O. (1923). A study of the occurrence of the blood groups among the American Indians. Journal of Immunology, 8, 487-91. Cohen, B. H. et Gold, D. R. (2001). Mitochondrial cytopathy in adults: what we know so far. Cleveland Clinic Journal of Medicine, 68, 625-6. Comas, D., Calafell, F., Mateu, E., Perez-Lezaun, A., Bertranpetit, J. (1996). Geographic variation in human mitochondrial DNA control region sequence: the population history of Turkey and its relationship to the European populations. Molecular Biology and Evolution, 13, 1067-1077. Comas, D., Calafell, F., Bendukidze, N., Fananas, L., Bertranpetit, J. (2000). Georgian and kurd mtDNA sequence analysis shows a lack of correlation between languages and female genetic lineages. American Journal of Physical Anthropology, 112(1), 5-16. Comas, D., Plaza, S., Wells, R., Yuldaseva, N., Lao, O., Calafell, F., Bertranpetit, J. (2004). Admixture, migrations, and dispersals in Central Asia: evidence from maternal DNA lineages. European Journal of Human Genetics, 12, 495-504. Conard, N. J. et Bolus, M. (2003). Radiocarbon dating the appearance of modern humans and timing of cultural innovations in Europe: new results and new challenges. Journal of Human Evolution, 44:331–371. Contu, D., Morelli, L., Santoni, F., Foster, J. W., Francalacci, P., Cucca, F. (2008). Y-chromosome based evidence for pre-neolithic origin of the genetically homogeneous but diverse Sardinian population: inference for association scans. PLoS One, 3(1), e1430. Côrte-Real, H. B. S. M., Macaulay, V. A., Richards, M. B., Hariti, G., Issad, M. S., Cambon- Thomsen, A., … Sykes, B. C. (1996). Genetic diversity in the Iberian Peninsula determined from mitochondrial sequence analysis. Annals of Human Genetics, 60, 331– 350.

194 RÉFÉRENCES BIBLIOGRAPHIQUES

Costa, M. D., Cherni, L., Fernandes, V., Freitas, F., Ammar El Gaaied, A. B., Pereira, L. (2009). Data from complete mtDNA sequencing of Tunisian centenarians: testing haplogroup association and the "golden mean" to longevity. Mechanisms of Ageing and Development, 130(4), 222-226. Coudray, C., Olivieri, A., Achilli, A., Pala, M., Melhaoui, M., Cherkaoui, M., … Dugoujon, J. M. (2009). The complex and diversified mitochondrial gene pool of Berber populations. Annals of Human Genetics, 73(2), 196–214. Crespillo, M., Luque, J. A., Paredes, M., Fernández, R., Ramírez, E., Valverde, J. L. (2000). Mitochondrial DNA sequences for 118 individuals from northeastern Spain. International Journal of Legal Medicine, 114, 130-132. Croteau, D. L., Stierum, R. H., Bohr, V. A. (1999). Mitochondrial DNA repair pathways. Mutation Research, 434, 137-48. Crubézy, E., Braga, J., Larrouy, G. (2002). Abrégé Anthropologie. Éditions Masson, 305. Cruciani, F., Santolamazza, P., Shen, P., Macaulay, V., Moral, P., Olckers, A., … Underhill, P. a. (2002). A back migration from Asia to sub-Saharan Africa is supported by high- resolution analysis of human Y-chromosome haplotypes. American Journal of Human Genetics, 70(5), 1197–214. Cruciani, F., La Fratta, R., Santolamazza, P., Sellitto, D., Pascone, R., Moral, P., … Scozzari, R. (2004). Phylogeographic analysis of haplogroup E3b (E-M215) y chromosomes reveals multiple migratory events within and out of Africa. American Journal of Human Genetics, 74(5), 1014–22. Cruciani, F., La Fratta, R., Torroni, A., Underhill, P. A., Scozzari, R. (2006). Molecular dissection of the Y chromosome haplogroup E-M78 (E3b1a): a posteriori evaluation of a microsatellite-network-based approach through six new biallelic markers. Human Mutation, 27(8), 831–2. Cruciani, F., La Fratta, R., Trombetta, B., Santolamazza, P., Sellitto, D., Colomb, E. B., … Scozzari, R. (2007). Tracing past human male movements in northern/eastern Africa and western Eurasia: new clues from Y-chromosomal haplogroups E-M78 and J-M12. Molecular Biology and Evolution, 24(6), 1300–11. Cruciani, F., Trombetta, B., Sellitto, D., Massaia, A., Destro-Bisol, G., Watson, E., … Scozzari, R. (2010). Human Y chromosome haplogroup R-V88: a paternal genetic record of early mid Holocene trans-Saharan connections and the spread of Chadic languages. European Journal of Human Genetics : EJHG, 18(7), 800–7. Cruciani, F., Trombetta, B., Massaia, A., Destro-Bisol, G., Sellitto, D., Scozzari, R. (2011a). A revised root for the human Y chromosomal phylogenetic tree: the origin of patrilineal diversity in Africa. American Journal of Human Genetics, 88(6), 814–8.

195 RÉFÉRENCES BIBLIOGRAPHIQUES

Cruciani, F., Trombetta, B., Antonelli, C., Pascone, R., Valesini, G., Scalzi, V., Vona, G., Melegh, B., Zagradisnik, B., Assum, G., Efremov, G. D., Sellitto, D., Scozzari, R. (2011b). Strong intra- and inter-continental differentiation revealed by Y chromosome SNPs M269, U106 and U152. Forensic Science International: Genetics, 5(3), e49-52. Danan, C., Sternberg, D., van Steirteghem, A., Cazeneuve, C., Duquesnoy, P., Besmond, C., Goossens, M., Lissens, W., Amselem, S. (1999). Evaluation of Parental Mitochondrial Inheritance in Neonates Born after Intracytoplasmic Sperm Injection. American Journal of Human Genetics, 65, 463–473. Darvishi, K., Sharma, S., Bhat, A. K., Rai, E., Bamezai, R. N. (2007). Mitochondrial DNA G10398A polymorphism imparts maternal Haplogroup N a risk for breast and esophageal cancer. Cancer Letters, 249, 249-55. De Knijff, P. (2000). Messages through bottlenecks: on the combined use of slow and fast evolving polymorphic markers on the human Y chromosome. American Journal of Human Genetics, 67(5), 1055–61. Deng, Y.J., Li, Y. Z., Yu, X. G., Li, L., Wu, D. Y., Zhou, J., Man, T. Y., Yang, G., Yan, J. W., Cai, D. Q., Wang, J., Yang, H. M., Li, S. B., Yu, J. (2005). Preliminary DNA identification for the tsunami victims in Thailand. Genomics Proteomics Bioinformatics, 3, 143-57. Derradji A. (2005). Le site acheuléen d'Errayah (Mostaganem, Algérie) dans son contexte géologique. Comptes Rendus Palevol, 5 (1-2), 229-235. Deshpande, O., Batzoglou, S., Feldman, M. W., Cavalli-Sforza, L. L. (2009). A serial founder effect model for human settlement out of Africa. Proceedings Biological Sciences, 276(1655), 291–300. Dettlaff-Kakol, A. et Pawlowski, R. (2002). First Polish DNA "manhunt"-an application of Ychromosome STRs. International Journal of Legal Medicine, 116(5), 289-91. Di Benedetto, G., Erguven, A., Stenico, M., Castri, L., Bertorelle, G., Togan, I., Barbujani, G. (2001). DNA diversity and population admixture in Anatolia. American Journal of Physical Anthropology, 115(2), 144-156. Di Gaetano, C., Cerutti, N., Crobu, F., Robino, C., Inturri, S., Gino, S., Guarrera, S., Underhill, P. A., King, R. J., Romano, V., Cali, F., Gasparini, M., Matullo, G., Salerno, A., Torre, C., Piazza, A. (2009). Differential Greek and northern African migrations to Sicily are supported by genetic evidence from the Y chromosome. European Journal of Human Genetics, 17(1), 91-9. Di Giacomo, F., Luca, F., Anagnou, N., Ciavarella, G., Corbo, R. M., Cresta, M., Cucci, F., ... Novelletto, A. (2003). Clinal patterns of human Y chromosomal diversity in continental Italy and Greece are dominated by drift and founder effects. Molecular Phylogenetics and Evolution, 28(3):387-95.

196 RÉFÉRENCES BIBLIOGRAPHIQUES

Divne, A. M. et Allen, M. (2005). A DNA microarray system for forensic SNP analysis. Forensic Science International, 154(2-3), 111-21. Doutremepuich, C. (2012). Les empreintes génétique en pratique judiciaire. Bulletin de l'Académie Nationale de Médecine., 196(6), 1117–1130. Dubut, V., Chollet, L., Murail, P., Cartault, F., Beraud-Colomb, E., Serre, M., Mogentale-Profizi, N. (2004). MtDNA polymorphisms in five French groups: importance of regional sampling. European Journal of Human Genetics, 12(4), 293-300. Dupuy, B. M., Stenersen, M., Flones, A., Egeland, T., Olaisen, B. (2004). Y-chromosomal microsatellite mutation rates: differences in mutation rate between and within loci. International Congress Series, Elsevier B.V., 1261, 76–78. El-Sibai, M., Platt, D. E., Haber, M., Xue, Y., Youhanna, S. C., Wells, R. S., … Zalloua, P. A., Genographic Consortium. (2009). Geographical structure of the Y-chromosomal genetic landscape of the Levant: a coastal-inland contrast. Annals of Human Genetics, 73(Pt 6), 568–81. Elakkary, S., Hoffmeister-Ullerich, S., Schulze, C., Seif, E., Sheta, A., Hering, S., … Augustin, C. (2014). Genetic polymorphisms of twelve X-STRs of the investigator Argus X-12 kit and additional six X-STR centromere region loci in an Egyptian population sample. Forensic Science International: Genetics, 11, 26–30. Ennafaa, H., Cabrera, V. M., Abu-Amero, K. K., González, A. M., Amor, M. B., Bouhaha, R., … Larruga, J. M. (2009). Mitochondrial DNA haplogroup H structure in North Africa. BMC Genetics, 10, 8. Ennafaa, H., Fregel, R., Khodjet-El-Khil, H., González, A. M., Mahmoudi, H. A. El, Cabrera, V. M., … Benammar-Elgaaïed, A. (2011). Mitochondrial DNA and Y-chromosome microstructure in Tunisia. Journal of Human Genetics, 56(10), 734–41. Excoffier, L., Smouse, P. E., Quattro, J. M. (1992). Analysis of molecular variance inferred from metric distances among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics, 131, 479-91 Excoffier, L. (1997). Ce que nous dit la généalogie des gènes. La recherche, 302, 82. Excoffier, L. et Yang, Z. (1999). Substitution rate variation among sites in mitochondrial hypervariable region I of humans and chimpanzees. Molecular Biology and Evolution, 16(10), 1357–68. Excoffier, L., Laval, G., Schneider, S. (2005). Arlequin (version 3.0): An integrated software package for data analysis. Bioinformatics, 47–50. Excoffier, L. et Lischer, H. E. L. (2010). Arlequin suite ver 3.5: a new series of programs to perform population genetics analyses under Linux and Windows. Molecular Ecology Resources, 10(3), 564–7.

197 RÉFÉRENCES BIBLIOGRAPHIQUES

Eyre-Walker, A., Smith, N. H., Smith, J. M. (1999). How clonal are human mitochondria? Proceedings Biological Sciences, 266(1418), 477–83. Fadhlaoui-Zid, K., Plaza, S., Calafell, F., Ben Amor, M., Comas, D., Bennamar Elgaaied, A. (2004). Mitochondrial DNA heterogeneity in Tunisian Berbers. Annals of Human Genetics, 68(3), 222-233. Fadhlaoui-Zid, K., Rodríguez-Botigué, L., Naoui, N., Benammar-Elgaaied, A., Calafell, F., Comas, D. (2011a). Mitochondrial DNA structure in North Africa reveals a genetic discontinuity in the Nile Valley. American Journal of Physical Anthropology, 145(1), 107-117. Fadhlaoui-Zid, K., Martinez-Cruz, B., Khodjet-el-khil, H., Mendizabal, I., Benammar-Elgaaied, A., Comas, D. (2011b). Genetic structure of Tunisian ethnic groups revealed by paternal lineages. American Journal of Physical Anthropology, 146(2), 271–80. Fadhlaoui-Zid, K., Haber, M., Martínez-Cruz, B., Zalloua, P., Benammar Elgaaied, A., Comas, D. (2013). Genome-wide and paternal diversity reveal a recent origin of human populations in North Africa. PloS One, 8(11), e80293. Falchi, A., Giovannoni, L., Calo, C. M., Piras, I. S., Moral, P., Paoli, G., … Varesi, L. (2006). Genetic history of some western Mediterranean human isolates through mtDNA HVR1 polymorphisms. Journal of Human Genetics, 51(1), 9–14. Felsenstein, J. (1989). Phylip: phylogeny inference package (version 3.2). Cladistics, 5, 164–166. Ferkous, S. (2007). Aperçu de L’histoire de l’Algérie: Des Phéniciens à l’indépendance 814 Av.J.- C./1962. Editions Dar El-Ouloum, 12-94. Ferragut, J. F., Bentayebi, K., Castro, J. A., Ramon, C., Picornell, A. (2014). Genetic analysis of 12 X-chromosome STRs in Western Mediterranean populations. International Journal of Legal Medicine, [Epub ahead of print] Ferri, G., Ceccardi, S., Lugaresi, F., Bini, C., Ingravallo, F., Cicognani, A., Falconi, M., Pelotti, S. (2008). Male haplotypes and haplogroups differences between urban (Rimini) and rural area (Valmarecchia) in Romagna region (North Italy). Forensic Science International, 175(2-3), 250-5. Ferri, G., Alù, M., Corradini, B., Radheshi, E., Beduschi, G. (2009). Slow and fast evolving markers typing in Modena males (North Italy). Forensic Science International: Genetics, 3(2), e31-3. Firasat, S., Khaliq, S., Mohyuddin, A., Papaioannou, M., Tyler-Smith, C., Underhill, P. A, Ayub, Q. (2007). Y-chromosomal evidence for a limited Greek contribution to the Pathan population of Pakistan. European Journal of Human Genetics, 15(1), 121-6. Flores, C., Maca-Meyer, N., Larruga, J. M., Cabrera, V. M., Karadsheh, N., Gonzalez, A. M. (2005). Isolates in a corridor of migrations: a high-resolution analysis of Y-chromosome variation in Jordan. Journal of Human Genetics, 50(9), 435–41.

198 RÉFÉRENCES BIBLIOGRAPHIQUES

Foley, R. A. et Lahr, M. M. (1997). Mode 3 technologies and the evolution of modern humans. Cambridge Archaeological Journal, 7, 3–36. Foster, E. A., Jobling, M. A., Taylor, P. G., Donnelly, P., de Knijff, P., Mieremet, R., … Tyler-Smith, C. (1998). Jefferson fathered slave’s last child. Nature, 396(5), 27–28. Forster, P., Cali, F., Rohl, A., Metspalu, E., D'Anna, R., Mirisola, M., De Leo, G., Flugy, A., Salerno, A., Ayala, G., Kouvatsi, A., Villems, R., Romano, V. (2002). Continental and subcontinental distributions of mtDNA control region types. International Journal of Legal Medicine, 116(2), 99-108. Forster, P. (2004). Ice Ages and the mitochondrial DNA chronology of human dispersals: a review. Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences, 359(1442), 255–64; discussion 264. Francalacci, P., Morelli, L., Underhill, P. A., Lillie, A. S., Passarino, G., Useli, A., … Cavalli-Sforza, L. L. (2003). Peopling of three Mediterranean islands (Corsica, Sardinia, and Sicily) inferred by Y-chromosome biallelic variability. American Journal of Physical Anthropology, 121(3), 270–9. Fregel, R., Gomes, V., Gusmão, L., González, A. M., Cabrera, V. M., Amorim, A., Larruga, J. M. (2009). Demographic history of Canary Islands male gene-pool: replacement of native lineages by European. BMC Evolutionary Biology, 9, 181. Fregel, R., González, A., Cabrera, V. M. (2010). Improved ethanol precipitation of DNA. Electrophoresis, 31(8), 1350–2. Garcea, E. A. A. (2010). The spread of Aterian peoples in North Africa. In: Garcea EAA, editor. South-Eastern Mediterranean Peoples Between 130,000 and 10,000 years ago. Oxford: Oxbow Books. García, O., Fregel, R., Larruga, J. M., Alvarez, V., Yurrebaso, I., Cabrera, V. M., González, A. M. (2010). Using mitochondrial DNA to test the hypothesis of a European post-glacial human recolonization from the Franco-Cantabrian refuge. Heredity, 37–45. Garnier, S. (2011). La dérive génétique. Cours mis en ligne. Direction de l'Enseignement Scolaire du Ministère de l'Education Nationale de la République Française - Ecole Normale Supérieure, 45 rue d'Ulm 75005 Paris, et Université Pierre et Marie Curie - Paris VI, Consulté le 16/10/2014. Genova, M. L., Pich, M. M., Bernacchia, A., Bianchi, C., Biondi, A., Bovina, C., Falasca, A. I., Formiggini, G., Castelli, G. P., Lenaz, G. (2004). The mitochondrial production of reactive oxygen species in relation to aging and pathology. Annals of the New York Academy of Sciences, 1011, 86-100. Giles, R. E., Blanc, H., Cann, H. M., Wallace, D. C. (1980). Maternal inheritance of human mitochondrial DNA. Proceedings of the National Academy of Sciences USA, 77, 6715- 6719.

199 RÉFÉRENCES BIBLIOGRAPHIQUES

Gill, P., Ivanov, P. L., Kimpton, C., Piercy, R., Benson, N., Tully, G., Evett, I., Hagelberg, E., Sullivan, K. (1994). Identification of the remains of the Romanov family by DNA analysis. Nature Genetics, 6, 130-5. Goebel, T. (2007). Anthropology. The missing years for modern humans. Science, 315(5809), 194–6. Gomes, I., Alves, C., Maxzud, K., Pereira, R., Prata, M. J., Sánchez-Diz, P., Carracedo, A., Amorim, A., Gusmão, L. (2007). Analysis of 10 XSTRs in three African populations. Forensic Science International: Genetics, 1, 208–211. González, A. M., Brehm, A., Perez, J. A., Maca-Meyer, N., Flores, C., Cabrera, V. M. (2003). Mitochondrial DNA affinities at the Atlantic fringe of Europe. American Journal of Physical Anthropology, 120(4), 391–404. González, A. M., Cabrera, V. M., Larruga, J. M., Tounkara, A., Noumsi, G., Thomas, B., Moulds, J. M. (2006). Mitochondrial DNA variation in Mauritania and Mali and their genetic relationship to other western Africa populations. Annals of Human Genetics, 70, 631- 657. González, A. M., Larruga, J. M., Abu-Amero, K. K., Shi, Y., Pestano, J., Cabrera, V. M. (2007). Mitochondrial lineage M1 traces an early human backflow to Africa. BMC Genomics, 8, 223. González, A. M., Karadssheh, N., Maca-Meyer, N., Flores, C., Cabrera, V. M., Larruga, J. M. (2008). Mitochondrial DNA variation in Jordania and their genetic relationship to other populations. Annals of Human Biology, 35(2), 212-231. Graves, J. A. M. (2010). Review: Sex chromosome evolution and the expression of sex-specific genes in the placenta. Placenta, 31 Suppl, S27–32. Gresham, D., Morar, B., Underhill, P. A., Passarino, G., Lin, A. A., Wise, C., … Kalaydjieva, L. (2001). Origins and divergence of the Roma (gypsies). American Journal of Human Genetics, 69(6), 1314–31. Grignani, P., Turchi, C., Achilli, A., Peloso, G., Alù, M., Ricci, U., … Previderè, C. (2009). Multiplex mtDNA coding region SNP assays for molecular dissection of haplogroups U/K and J/T. Forensic Science International: Genetics, 4(1), 21–5. Gršković, B., Zidkova, A., Stenzl, V., Popović, M., Primorac, D., Mršić, G. (2013). Analysis of 8 X- chromosomal markers in the population of central Croatia. Croatian Medical Journal, 54(3), 238–247. Gsell, S. (1927). Histoire ancienne de l’Afrique du Nord (Tome V): Les royaumes indigènes organization sociale, politique et économique. Paris, Librairie Hachette, 7. Guo, S. W., Thompson, E. A. (1992). Performing the exact test of Hardy-Weinberg proportion for multiple alleles. Biometrics, 48(2), 361-72. Gusmão, L. et Carracedo, A. (2003). Y-STRS Profiles in DNA. www.promega.com.

200 RÉFÉRENCES BIBLIOGRAPHIQUES

Gusmão, A., Gusmão, L., Gomes, V., Alves, C., Calafell, F., Amorim A., Prata M. J. (2008). A perspective on the history of the Iberian gypsies provided by phylogeographic analysis of Y-chromosome lineages. Annals of Human Genetics, 72, 215–227. Haber, M., Platt, D. E., Badro, D. A., Xue, Y., El-Sibai, M., Bonab, M. A., Youhanna, S. C., Saade, S., Soria-Hernanz, D. F., Royyuru, A., Wells, R. S., Tyler-Smith, C., Zalloua, P. A., Genographic Consortium. (2011). Influences of history, geography, and religion on genetic structure: the Maronites in Lebanon. European Journal of Human Genetics, 19(3), 334-40. Hachi S. (2005). Du comportement symbolique des derniers chasseurs Mechta-Afalou d'Afrique du Nord. Comptes Rendus Palevol, 5 (1-2), 429-440. Hagelberg, E., Goldman, N., Lió, P., Whelan, S., Schiefenhövel, W., Clegg, J. B., Bowden, D. K. (1999). Evidence for mitochondrial DNA recombination in a human population of island Melanesia. Proceedings Biological Sciences USA, 266(1418), 485–92. Hammer, M. F. (1994). A recent insertion of an alu element on the Y chromosome is a useful marker for human population studies. Molecular Biology and Evolution, 11(5), 749–61. Hammer, M. F. (1995). A recent common ancestry for human Y chromosomes. Nature, 378(6555), 376–8. Hammer, M. F., Karafet, T., Rasanayagam, A., Wood, E. T., Altheide, T. K., Jenkins, T., … Zegura, S. L. (1998). Out of Africa and back again: nested cladistic analysis of human Y chromosome variation. Molecular Biology and Evolution, 15(4), 427–41. Hammer, M. F., Karafet, T. M., Redd, A. J., Jarjanazi, H., Santachiara-Benerecetti, S., Soodyall, H., Zegura, S. L. (2001). Hierarchical patterns of global human Y-chromosome diversity. Molecular Biology and Evolution, 18(7), 1189–203. Hanson, E. K. et Ballantyne, J. (2006). Comprehensive annotated STR physical map of the human Y chromosome: forensic implications. Legal Medicine, 8, 110-120. Harich, N., Costa, M. D., Fernandes, V., Kandil, M., Pereira, J. B., Silva, N. M., Pereira, L. (2010). The trans-Saharan slave trade-clues from interpolation analyses and high-resolution characterization of mitochondrial DNA lineages. BMC Evolutionary Biology, 10, 138. Harris, E. E et Hey, J. (1999). X chromosome evidence for ancient human histories. Proceedings of the National Academy of Sciences USA, 96(6), 3320–4. Harry, M. (2008). Génétique moléculaire et évolutive (2e édition). Collection sciences fondamentales. Édition Maloine, 322-326; 424-429 Hartl, D. L. et Clark, A. G. (2007). Principles of population genetics. Sunderland, Sinauer Associates. 98, 652. Hasegawa, M., Di Rienzo, A., Kocher, T.D., Wilson, A. C. (1993). Toward a more accurate time scale for the human mitochondrial DNA tree. Journal of Molecular Evolution, 37, 347– 54

201 RÉFÉRENCES BIBLIOGRAPHIQUES

Henn, B. M., Botigué, L. R., Gravel, S., Wang, W., Brisbin, A., Byrnes, J. K., … Comas, D. (2012). Genomic ancestry of North Africans supports back-to-Africa migrations. PLoS Genetics, 8(1), e1002397. Hering, S., Augustin, C., Edelmann, J., Heidel, M., Dressler, J., Rodig, H., Kuhlisch, E., Szibor, R. (2006). DXS10079, DXS10074 and DXS10075 are STRs located within a 280-kb region of Xq12 and provide stable haplotypes useful for complex kinship cases. International Journal of Legal Medicine, 120, 337–345. Heyer, E., Zietkiewicz, E., Rochowski, A., Yotova, V., Puymirat, J., Labuda, D. (2001). Phylogenetic and familial estimates of mitochondrial substitution rates: study of control region mutations in deep-rooting pedigrees. American Journal of Human Genetics, 69(5), 1113–26. Hirszfeld, L. et Hirszfeld, H. (1919). Serological differences between the blood of different races. Lancet 2. Holland, M. M., Fisher, D. L., Mitchell, L. G., Rodriquez, W. C., Canik, J. J., Merril, C. R., Weedn, V. W. (1993). Mitochondrial DNA sequence analysis of human skeletal remains: identification of remains from the Vietnam War. Journal of Forensic Science, 38, 542- 53. Holland, M. M. et Parsons, T. J. (1999). Mitochondrial DNA Sequence Analysis-Validation and Use for Forensic Casework. Forensic Science Review, 11, 21. Houot, A. (2014). Histoire. http://pagesperso orange.fr/houot.alain/Hist/hist.html. Consulté le 22 Mars 2014. Site personnel. Howell, N., Smejkal, C. B., Mackey, D. A., Chinnery, P. F., Turnbull, D. M., Herrnstadt, C. (2003). The pedigree rate of sequence divergence in the human mitochondrial genome: there is a difference between phylogenetic and pedigree rates. American Journal of Human Genetics, 72(3), 659–70. Hundertmark, T., Hering, S., Edelmann, J., Augustin, C., Plate, I., Szibor, R. (2008). The STR cluster DXS10148-DXS8378-DXS10135 provides a powerful tool for X-chromosomal haplotyping at Xp22. International Journal of Legal Medicine, 122(6), 489–92. Ingman, M., Kaessmann, H., Pääbo, S., Gyllensten, U. (2000). Mitochondrial genome variation and the origin of modern humans. Nature, 408(6813), 708–13. International Human Genome Sequencing Consortium. (2004). Finishing the euchromatic sequence of the human genome. Nature, 431(21), 931–945. Inturri, S., Menegon, S., Amoroso, A., Torre, C., Robino, C. (2011). Linkage and linkage disequilibrium analysis of X-STRs in Italian families. Forensic Science International: Genetics, 5(2), 152–4.

202 RÉFÉRENCES BIBLIOGRAPHIQUES

Irwin, J., Saunier, J., Strouss, K., Paintner, C., Diegoli, T., Sturk, K., Kovatsi, L., Brandstätter, A., Cariolou, M. A., Parson, W., Parsons, T. J. (2008). Mitochondrial control region sequences from northern Greece and Greek Cypriots. International Journal of Legal Medicine, 122, 87–89. Jobling, M. A., Pandya, A., Tyler-Smith, C. (1997). The Y chromosome in forensic analysis and paternity testing. International Journal of Legal Medicine, 110(3), 118-24. Jobling, M. A. (2001). In the name of the father: surnames and genetics. Trends in Genetics : TIG, 17(6), 353–7. Jobling, M. A et Tyler-Smith, C. (2003). The human Y chromosome: an evolutionary marker comes of age. Nature Reviews. Genetics, 4(8), 598–612. Jobling, M. A., Hurles, M. E., Tyler-Smith, C. (2004). Human Evolutionary Genetics: origins, peoples and disease. London / New York: Garland Science Publishing, 523. Jorde, L. B. et Bamshad, M. (2000). Questioning evidence for recombination in human mitochondrial DNA. Science, 288, 1931. Julien, Ch.-A. (1975). Histoire de l'Afrique du Nord: Tunisie- Algérie- Maroc, Des origines à la conquête arabe (647 ap. J.-C.). Réimprimé intégralement à partir de la 2re édition 1951, S.NE.D Alger, 9-10. Kaddache, M. (2003). L’Algérie des Algériens: de la préhistoire à 1954. Editions Paris- Méditerranée, 29-180. Kameoka, K., Isotani, H., Tanaka, K., Azukari, K., Fujimura, Y., Shiota, Y., Sasaki, E., Majima, M., Furukawa, K., Haginomori, S., Kitaoka, H., Ohsawa, N. (1998). Novel mitochondrial DNA mutation in tRNA(Lys) (8296A-->G) associated with diabetes. Biochemical and Biophysical Research Communications, 245, 523-7. Karafet, T. M., Mendez, F. L., Meilerman, M. B., Underhill, P. A., Zegura, S. L., Hammer, M. F. (2008). New binary polymorphisms reshape and increase resolution of the human Y chromosomal haplogroup tree. Genome Research, 18(5), 830–8. Kass, D. H., Aleman, C., Batzer, M. A., Deininger, P. L. (1994). Identification of a human specific Alu insertion in the factor XIIIB gene. Genetica, 94(1), 1–8. Kayser, M., Roewer, L., Hedman, M., Henke, L., Henke, J., Brauer, S., … Sajantila, A. (2000). Characteristics and frequency of germline mutations at microsatellite loci from the human Y chromosome, as revealed by direct observation in father/son pairs. American Journal of Human Genetics, 66(5), 1580–8. Kayser, M., Kittler, R., Erler, A., Hedman, M., Lee, A. C., Mohyuddin, A., … Tyler-smith, C. (2004). A Comprehensive Survey of Human Y-Chromosomal Microsatellites. American Journal of Human Genetics, 74(6), 1183–1197. Ke, Y., Su, B., Song, X., Lu, D., Chen, L., Li, H., ... Jin, L. (2001). African origin of modern humans in East Asia: a tale of 12,000 Y chromosomes. Science, 292(5519), 1151-3.

203 RÉFÉRENCES BIBLIOGRAPHIQUES

Kefi, R., Stevanovitch, A., Bouzaid, E., Beraud-Colomb, E. (2005). Diversité mitochondriale de la population de Taforalt (12.000 ans BP – Maroc): Une approche génétique à l’étude du peuplement de l'Afrique du Nord. Anthropologie, XLIII/1, 1–11. Keinan, A., Mullikin, J. C., Patterson, N., Reich, D. (2008). Accelerated genetic drift on chromosome X during the human dispersal out of Africa. Nature Genetics 41, 66 - 70. King, R. J., Ozcan, S. S., Carter, T., Kalfolu, E., Atasoy, S., Triantaphyllidis, C., ... Underhill P. A. (2008). Differential Y-chromosome Anatolian influences on the Greek and Cretan Neolithic. Annals of Human Genetics, 72(Pt 2), 205-14. King, R. J., Di Cristofaro, J., Kouvatsi, A., Triantaphyllidis, C., Scheidel, W., Myres, N. M., ... Chiaroni, J. (2011). The coming of the Greeks to Provence and Corsica: Y-chromosome models of archaic Greek colonization of the western Mediterranean. BMC Evolutionary Biology, 11, 69. Kivisild, T., Reidla, M., Metspalu, E., Rosa, A., Brehm, A., Pennarun, E., … Villems, R. (2004). Ethiopian mitochondrial DNA heritage: tracking gene flow across and around the gate of tears. American Journal of Human Genetics, 75(5), 752–70. Klug W., Cummings M., Spencer C. (2006). Génétique (8e édition). Pearson Education France, 682. Kong, A., Gudbjartsson, D. F., Sainz, J., Jonsdottir, G. M., Gudjonsson, S. A., … Stefansson, K. (2002). A high-resolution recombination map of the human genome. Nature Genetics, 31, 241–247. Kouvatsi, A., Karaiskou, N., Apostolidis, A., Kirmizidis, G. (2001). Mitochondrial DNA sequence variation in Greeks. Human Biology, 73(6), 855-869. Koyama, H., Iwasa, M., Tsuchimochi, T., Maeno, Y., Isobe, I., Matsumoto, T., Nagao, M. (2002). Utility of Y-STR haplotype and mtDNA sequence in personal identification of human remains. American Journal of Forensic Medicine and Pathology, 23(2), 181-5. Krings, M., Halim Salem, A., Bauer, K., Geisert, H., Malek, A. K., Chaix, L., Simon, C., Welsby, D., Di Rienzo, A., Utermann, G., Sajantila, A., Pääbo, S., Stoneking, M. (1999). mtDNA analysis of Nile valley populations: A genetic corridor or a barrier to migration? American Journal of Human Genetics, 64(4), 1166-1176. Kujanova, M., Pereira, L., Fernandes, V., Pereira, J. B., Cerny, V. (2009). Near Eastern Neolithic Genetic Input in a Small Oasis of the Egyptian Western Desert. American Journal of Physical Anthropology, 140, 336–346. Kumar, S., Hedrick, P., Dowling, T., Stoneking, M. (2000). Questioning evidence for recombination in human mitochondrial DNA. Science, 288, 1931. Lancel, S. (2003). L’Algérie antique: De Massinissa à saint Augustin. Éditions Mengés, 246-247. Larmuseau, M. H., Vanderheyden, N., Jacobs, M., Coomans, M., Larno, L., Decorte, R. (2011). Micro-geographic distribution of Y-chromosomal variation in the central-western European region Brabant. Forensic Science International: Genetics, 5(2), 95-9.

204 RÉFÉRENCES BIBLIOGRAPHIQUES

Larruga, J. M., Diez, F., Pinto, F. M., Flores, C., Gonzalez, A. M. (2001). Mitochondrial DNA characterisation of European isolates: the Maragatos from Spain. European Journal of Human Genetics, 9(9), 708-716. Lee, H. Y., Park, M. J., Jeong, C. K., Lee, S. Y., Yoo, J. E., Chung, U., Choi, J. H., Kim, C. Y., Shin, K. J. (2004). Genetic characteristics and population study of 4 X-chromosomal STRs in Koreans: evidence for a null allele at DXS9898. International Journal of Legal Medicine, 118, 355–360. Li, W. H., Yi, S., Makova, K. (2002). Male-driven evolution. Current Opinion in Genetics and Development, 12, 650–656. Li, X. Y., Su, M., Huang, H. H., Li, H., Tian, D. P., Gao, Y. X. (2007). mtDNA evidence: genetic background associated with related populations at high risk for oesophageal cancer between Chaoshan and Taihang Mountain areas in China. Genomics, 90, 474-81. Lin, M. T., Cantuti-castelvetri, I., Zheng, K., Jackson, K. E., Tan, Y. B., Arzberger, T., … Simon, D. K. (2012). Somatic mitochondrial DNA mutations in early Parkinson’s and incidental Lewy body disease. Annals of Neurology, 71(6), 850–854. Loogväli, E.-L., Roostalu, U., Malyarchuk, B. A, Derenko, M. V, Kivisild, T., Metspalu, E., … Villems, R. (2004). Disuniting uniformity: a pied cladistic canvas of mtDNA haplogroup H in Eurasia. Molecular Biology and Evolution, 21(11), 2012–21. Lopez-Parra, A. M., Gusmao, L., Tavares, L., Baeza, C., Amorim, A., Mesa, M. S., Prata, M. J., Arroyo-Pardo, E. (2009). In search of the pre- and post-neolithic genetic substrates in Iberia: evidence from Y-chromosome in Pyrenean populations. Annals of Human Genetics, 73(1), 42-53. Loueslati, B. Y., Cherni, L., Khodjet-Elkhil, H., Ennafaa, H., Pereira, L., Amorim, A., Ben Ayed, F., Ben Ammar Elgaaied, A. (2006). Islands inside an island: reproductive isolates on Jerba island. American Journal of Human Biology, 18(1), 149-153. Lowell, B. B. et Shulman, G. I. (2005). Mitochondrial dysfunction and type 2 diabetes. Science, 307, 384-7. Lucotte, G., Guérin, P., Hallé, L., Loirat, F., Hazout, S. (1989). Y chromosome DNA polymorphisms in two African populations. American Journal of Human Genetics, 45, 16–20. Luis, J. R., Rowold, D. J., Regueiro, M., Caeiro, B., Cinnioglu, C., Roseman, C., Underhill, P. A., Cavalli-Sforza, L. L., Herrera, R. J. (2004). The Levant versus the Horn of Africa: evidence for bidirectional corridors of human migrations. American Journal of Human Genetics, 74(3), 532-544. Lutz, S., Weisser, H.J., Heizmann, J., Pollak, S. (1996). mtDNA as a tool for identification of human remains. Identification using mtDNA. International Journal of Legal Medicine, 109, 205-9.

205 RÉFÉRENCES BIBLIOGRAPHIQUES

Maca-Meyer, N., Gonzalez, A. M., Larruga, J. M., Flores, C., Cabrera, V. M. (2001). Major genomic mitochondrial lineages delineate early human expansions. BMC Genetics, 2, 13. Maca-Meyer, N., González, A. M., Pestano, J., Flores, C., Larruga, J. M., Cabrera, V. M. (2003a). Mitochondrial DNA transit between West Asia and North Africa inferred from U6 phylogeography. BMC Genetics, 4, 15. Maca-Meyer, N., Sanchez-Velasco, P., Flores, C., Larruga, J. M., Gonzalez, A. M., Oterino, A., Leyva-Cobian, F. (2003b). Y chromosome and mitochondrial DNA characterization of Pasiegos, a human isolate from Cantabria (Spain). Annals of Human Genetics, 67, 329- 339. Macaulay, V., Richards, M., Sykes, B. (1999a). Mitochondrial DNA recombination-no need to panic. Proceedings Biological Sciences, 266(1433), 2037–9; discussion 2041–2. Macaulay, V., Richards, M., Hickey, E., Vega, E., Cruciani, F., Guida, V., … Torroni, A. (1999b). The emerging tree of West Eurasian mtDNAs: a synthesis of control-region sequences and RFLPs. American Journal of Human Genetics, 64, 232–249. Mallein, B. (2011). Généalogie de populations: le coalescent de Kingman. (Cours en ligne) Éditions Rue d’Ulm/ Presses de l’École Normale Supérieure. Paris. http://culturemath.ens.fr. Consulté en Janvier 2014. Malyarchuk, B. A., Grzybowski, T., Derenko, M. V, Czarny, J., Drobnic, K., Miscicka-Sliwka, D. (2003). Mitochondrial DNA variability in Bosnians and Slovenians. Annals of Human Genetics, 67, 412-425. Malyarchuk, B. A., Grzybowski, T., Derenko, M., Perkova, M., Vanecek, T., Lazur, J., … Tsybovsky, I. (2008). Mitochondrial DNA phylogeny in Eastern and Western Slavs. Molecular Biology and Evolution, 25(8), 1651–8. Malyarchuk, B. A., Derenko, M., Grzybowski, T., Perkova, M., Rogalla, U., Vanecek, T., & Tsybovsky, I. (2010). The peopling of Europe from the mitochondrial haplogroup U5 perspective. PloS One, 5(4), e10285. Manfredi, G., Thyagarajan, D., Papadopoulou, L. C., Pallotti, F., Schon, E. A. (1997). The fate of human sperm-derived mtDNA in somatic cells. American Journal of Human Genetics, 61(4), 953–60. Marjanovic, D., Fornarino, S., Montagna, S., Primorac, D., Hadziselimovic, R., Vidovic, S., Pojskic, N., Battaglia, V., Achilli, A., Drobnic, K., Andjelinovic, S., Torroni, A., Santachiara- Benerecetti, A. S., Semino, O. (2005). The peopling of modern Bosnia-Herzegovina: Y- chromosome haplogroups in the three main ethnic groups. Annals of Human Genetics, 69(Pt 6), 757-63. Martinez-Jarreta, B., Prades, A., Calafell, F., Budowle, B. (2000). Mitochondrial DNA HVI and HVII variation in a north-east Spanish population. Forensic Science, 45(5), 1162-1163.

206 RÉFÉRENCES BIBLIOGRAPHIQUES

Martinez, L., Underhill, P. A., Zhivotovsky, L. A., Gayden, T., Moschonas, N. K., Chow, C. E., Conti, S., Mamolini, E., Cavalli-Sforza, L. L., Herrera, R. J. (2007). Paleolithic Y- haplogroup heritage predominates in a Cretan highland plateau. European Journal of Human Genetics, 15(4), 485-93. Martinez, L., Mirabal, M., Luis, J. R., Rene, J. Herrera, R. J. (2008). Middle Eastern and European mtDNA Lineages Characterize Populations from Eastern Crete. American Journal of Physical Anthropology, 137, 213-223. Mazières, S. (2006). Le peuplement amerindien de la Guyane française: Apport des marqueurs moléculaires. Thèse de Doctorat, Université Toulouse III, 37, 59. McVean, G. (2009). A Genealogical Interpretation of Principal Components Analysis. PLoS Genetics, 5(10), e1000686. Mellars, P. (2004). Neanderthals and the modern human colonization of Europe. Nature, 432, 462– 465. Mellars, P. (2006). A new radiocarbon revolution and the dispersal of modern humans in Eurasia. Nature, 439, 931–935. Mendez, F. L., Krahn, T., Schrack, B., Krahn, A.-M., Veeramah, K. R., Woerner, A. E., … Hammer, M. F. (2013). An African American paternal lineage adds an extremely ancient root to the human Y chromosome phylogenetic tree. American Journal of Human Genetics, 92(3), 454–9. Mergen, H., Öner, R., Öner, C. (2004). Mitochondrial DNA sequence variation in the Anatolian Peninsula (Turkey). Journal of Genetics, 83(1), 101-109. Merriwether, D. A. et Kaestle, F. A. (1999). Mitochondrial recombination? (continued). Science, 285, 837. Messina, F., Scorrano, G., Labarga, C. M., Rolfo, M. F., Rickards, O. (2010). Mitochondrial DNA variation in an isolated area of Central Italy. Annals of Human Biology, 37(3), 385-402. Metspalu, M., Kivisild, T., Metspalu, E., Parik, J., Hudjashov, G., Kaldma, K., … Villems, R. (2004). Most of the extant mtDNA boundaries in south and southwest Asia were likely shaped during the initial settlement of Eurasia by anatomically modern humans. BMC Genetics, 5, 26. Meyer, S., Weiss, G., von Haeseler, A. (1999). Pattern of nucleotide substitution and rate heterogeneity in the hypervariable regions I and II of human mtDNA. Genetics, 152(3), 1103–10. Miller, S. A., Dykes, D. D., Polesky, H. F. (1988). A simple salting out procedure for extracting DNA from human nucleated cells. Nucleic Acids Research, 16, 1215. Mishmar, D., Ruiz-Pesini, E., Golik, P., Macaulay, V., Clark, A. G., Hosseini, S., … Wallace, D. C. (2003). Natural selection shaped regional mtDNA variation in humans. Proceedings of the National Academy of Sciences of the United States of America, 100(1), 171–6.

207 RÉFÉRENCES BIBLIOGRAPHIQUES

Moorjani, P., Patterson, N., Hirschhorn, J. N., Keinan, A., Hao, L., Atzmon, G., … Reich, D. (2011). The history of African gene flow into Southern Europeans, Levantines, and Jews. PLoS Genetics, 7(4), e1001373. Muzzio, M., Ramallo, V., Motti, J. M., Santos, M. R., López Camelo, J. S., Bailliet, G. (2011). Software for Y-haplogroup predictions: a word of caution. International Journal of Legal Medicine, 125(1), 143-147. Myres, N. M., Rootsi, S., Lin, A. A., Järve, M., King, R. J., Kutuev, I., … Underhill, P. A. (2011). A major Y-chromosome haplogroup R1b Holocene era founder effect in Central and Western Europe. European Journal of Human Genetics : EJHG, 19(1), 95–101. Nasidze, I. et Stoneking, M. (2001). Mitochondrial DNA variation and language replacements in the Caucasus. Proceedings of the Royal Society London, 268, 1197-1206. Nasidze, I., Ling, E. S., Quinque, D., Dupanloup, I., Cordaux, R., Rychkov, S., Naumova, O., Zhukova, O., ... Stoneking, M. (2004a). Mitochondrial DNA and Y-chromosome variation in the Caucasus. Annals of Human Genetics, 68, 205-221. Nasidze, I., Quinque, D., Dupanloup, I., Rychkov, S., Naumova, O., Zhukova, O., Stoneking, M. (2004b). Genetic evidence concerning the origins of South and North Ossetians. Annals of Human Genetics, 68, 588-599. Nasidze, I., Quinque, D., Ozturk, M., Benndukidze, N., Stoneking, M. (2005). MtDNA and Y- chromosome variation in the Kurdish groups. Annals of Human Genetics, 69, 1-12. Nass, S. et Nass, M. M. K. (1963). Ultramitochondrial fibers with DNA characteristics. Journal of Cell Biology, 19, 593- 629. Navarro, J. F. (1997). Arqueología de las Islas Canarias. Espacio, tiempo y forma Serie I. Prehistoria y Arqueología, 10, 447–478. Nebel, A., Landau-Tasseron, E., Filon, D., Oppenheim, A., Faerman, M. (2002). Genetic evidence for the expansion of Arabian tribes into the Southern Levant and North Africa. American Journal of Human Genetics, 70, 1594–1596. Nei, M. (1972). Genetic distance between populations. American Naturalist, 106, 283-292. Nei, M. (1987). Molecular Evolutionary Genetics. Columbia University Press, New York. Nei, M. et Roychoudhury, A. K. (1993). Evolutionary relationships of human populations on a Global Scale. Molecular Biology and Evolution, 10(5), 927–943. Niederstatter, H., Coble, M. D., Grubwieser, P., Parsons, T. J., Parson, W. (2006). Characterization of mtDNA SNP typing and mixture ratio assessment with simultaneous real-time PCR quantification of both allelic states. International Journal of Legal Medicine, 120, 18–23 Nilsson, M., Andréasson-Jansson, H., Ingman, M., Allen, M. (2008). Evaluation of mitochondrial DNA coding region assays for increased discrimination in forensic analysis. Forensic Science International: Genetics, 2, 1-8.

208 RÉFÉRENCES BIBLIOGRAPHIQUES

Non, A. L., Al-Meeri, A., Raaum, R. L., Sanchez, L. F., Mulligan, C. J. (2011). Mitochondrial DNA reveals distinct evolutionary histories for Jewish populations in Yemen and Ethiopia. American Journal of Physical Anthropology, 144(1), 1-10. Nothnagel, M., Szibor, R., Vollrath, O., Augustin, C., Edelmann, J., Geppert, M., … Hering, S. (2012). Collaborative genetic mapping of 12 forensic short tandem repeat (STR) loci on the human X chromosome. Forensic Science International: Genetics, 6(6), 778–84. Olivieri, A., Achilli, A., Pala, M., Battaglia, V., Fornarino, S., Al-Zahery, N., … Torroni, A. (2006). The mtDNA legacy of the Levantine early Upper Palaeolithic in Africa. Science (New York, N.Y.), 314(5806), 1767–70. Olivio, P. D., van de Walle, M. J., Laipis, P. J., Hauswirth, W. W. (1983). Nucleotide sequence evidence for rapid genotypic shifts in the bovine mitochondrial DNA D-loop. Nature 306, 400- 402. Onofri, V., Alessandrini, F., Turchi, C., Fraternale, B., Buscemi, L., Pesaresi, M., Tagliabracci, A. (2007). Y-chromosome genetic structure in sub-Apennine populations of Central Italy by SNP and STR analysis. International Journal of Legal Medicine, 121(3), 234-7. Onofri, V., Alessandrini, F., Turchi, C., Pesaresi, M., Tagliabracci, A. (2008). Y-chromosome markers distribution in Northern Africa: High-resolution SNP and STR analysis in Tunisia and Morocco populations. Forensic Science International: Genetics, Supplement Series, 1 (1), 235-236. Oppenheimer, S. (2002). The first exodus: Journey out of Africa. Geographic Magazine, 74, 32–35. Oppenheimer, S. (2003). Out of Eden: The peopling of the world. London: Robinson. Oppenheimer, S. (2012). Out-of-Africa, the peopling of continents and islands: tracing uniparental gene trees across the map. Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences, 367(1590), 770–84. Ottoni, C., Martinez-Labarga, C., Vitelli, L., Scano, G., Fabrini, E., Contini, I., Biondi, G., Rickards O. (2009). Human mitochondrial DNA variation in Southern Italy. Annals of Human Biology, 36(6), 785-811. Ottoni, C., Primativo, G., Hooshiar Kashani, B., Achilli, A., Martínez-Labarga, C., Biondi, G., … Rickards, O. (2010). Mitochondrial haplogroup H1 in north Africa: an early holocene arrival from Iberia. PloS One, 5(10), e13378. Ottoni, C., Larmuseau, M. H. D., Vanderheyden, N., Martínez-Labarga, C., Primativo, G., Biondi, G., … Rickards, O. (2011). Deep into the roots of the Libyan Tuareg: a genetic survey of their paternal heritage. American Journal of Physical Anthropology, 145(1), 118–24. Pakendorf, B. et Stoneking, M. (2005). Mitochondrial DNA and human evolution. Annual Review of Genomics and Human Genetics, 6, 165–83.

209 RÉFÉRENCES BIBLIOGRAPHIQUES

Pala, M., Achilli, A., Olivieri, A., Kashani, B. H., Perego, U. A., Sanna, D., … Torroni, A. (2009). Mitochondrial haplogroup U5b3: a distant echo of the epipaleolithic in Italy and the legacy of the early Sardinians. American Journal of Human Genetics, 84(6), 814–21. Parson, W., Niederstätter, H., Brandstätter, A., Berger, B. (2003). Improved specificity of Y-STR typing in DNA mixture samples. International Journal of Legal Medicine, 117, 109– 114. Parson, W., Fendt, L., Ballard, D., Borsting, C., Brinkmann, B., Carracedo, Á., ... Brandstätter A. (2008). Identification of West Eurasian mitochondrial haplogroups by mtDNA SNP screening: Results of the 2006–2007 EDNAP collaborative exercise. Forensic Science International: Genetics, 2, 61-68. Parsons, T. J. et Irwin, J. A. (2000). Questioning evidence for recombination in human mitochondrial DNA. Science, 288, 1931 Pennarun, E., Kivisild, T., Metspalu, E., Metspalu, M., Reisberg, T., Moisan, J.-P., … Villems, R. (2012). Divorcing the Late Upper Palaeolithic demographic histories of mtDNA haplogroups M1 and U6 in Africa. BMC Evolutionary Biology, 12(1), 234. Penny, D., Steel, M., Waddell, P. J., Hendy, M. D. (1995). Improved analyses of human mtDNA sequences support a recent African origin for Homo sapiens. Molecular Biology and Evolution, 12(5), 863–82. Pereira, L., Cunha, C., Amorim, A. (2004). Predicting sampling saturation of mtDNA haplotypes: an application to an enlarged Portuguese database. International Journal of Legal Medicine, 118(3), 132-136. Pereira, L., Richards, M., Goios, A., Alonso, A., Albarrán, C., Garcia, O., … Amorim, A. (2005a). High-resolution mtDNA evidence for the late-glacial resettlement of Europe from an Iberian refugium. Genome Research, 15(1), 19-24. Pereira, L., Cunha, C., Alves, C., Amorim, A. (2005b). African female heritage in Iberia: a reassessment of mtDNA lineage distribution in present times. Human Biology, 77(2), 213–229. Pereira, R. W., Santos, S. S. Dos,, Pena, S. D. J. (2006). A novel polymorphic Alu insertion embedded in a LINE 1 retrotransposon in the human X chromosome (DXS225): identification and worldwide population study. Genetics and Molecular Research : GMR, 5(1), 63–71. Pereira, R., Gomes, I., Amorim, A., Gusmão, L. (2007). Genetic diversity of 10 X chromosome STRs in northern Portugal. International Journal of Legal Medicine, 121(3), 192–7. Pereira, L., Silva, N. M., Franco-Duarte, R., Fernandes, V., Pereira, J. B., Costa, M. D., … Macaulay, V. (2010a). Population expansion in the North African late Pleistocene signalled by mitochondrial DNA haplogroup U6. BMC Evolutionary Biology, 10(1), 390.

210 RÉFÉRENCES BIBLIOGRAPHIQUES

Pereira, L., Cerný, V., Cerezo, M., Silva, N. M., Hájek, M., Vasíková, A., … Salas, A. (2010b). Linking the sub-Saharan and West Eurasian gene pools: maternal and paternal heritage of the Tuareg nomads from the African Sahel. European Journal of Human Genetics : EJHG, 18(8), 915–23. Pericic, M., Lauc, L. B., Klaric, I. M., Rootsi, S., Janicijevic, B., Rudan, I., Terzic, R., Colak, I., Kvesic, A., Popovic, D., Sijacki, A., Behluli, I., Dordevic, D., Efremovska, L., Bajec, D. D., Stefanovic, B. D, Villems, R., Rudan, P. (2005). High-resolution phylogenetic analysis of southeastern Europe traces major episodes of paternal gene flow among Slavic populations. Molecular Biology and Evolution, 22(10), 1964-75. Picornell, A., Gomez-Barbeito, L., Tomas, C., Castro, J. A., Ramon, M. M. (2005). Mitochondrial DNA HVRI variation in Balearic populations. American Journal of Physical Anthropology, 128(1), 119-130. Pierce B. A. Traduit de l’anglais par Cunin R. (2012). L’essentiel de la génétique. Édition de Boeck, 442. Piercy, R., Sullivan, K.M., Benson, N., Gill, P. (1993). The application of mitochondrial DNA typing to the study of white Caucasian genetic identification. International Journal of Legal Medicine, 106, 85-90. Plaza, S., Calafell, F., Helal, A., Bouzerna, N., Lefranc, G., Bertranpetit, J., Comas, D. (2003). Joining the pillars of Hercules: mtDNA sequences show multidirectional gene flow in the western Mediterranean. Annals of Human Genetics, 67(Pt 4), 312–28. Poetsch, M., El-Mostaqim, D., Tschentscher, F., Browne, E. N. L., Timmann, C., Horstmann, R. D., von Wurmb-Schwark, N. (2009). Allele frequencies of 11 X-chromosomal loci in a population sample from Ghana. International Journal of Legal Medicine, 123(1), 81–3. Quintana-Murci, L., Semino, O., Bandelt, H.J., Passarino, G., McElreavey, K., Santachiara- Benerecetti, A. S. (1999). Genetic evidence of an early exit of Homo sapiens sapiens from Africa through eastern Africa. Nature Genetics, 23, 437–41. Quintana-Murci, L., Chaix, R., Wells, R. S., Behar, D. M, Sayar, H., Scozzari, R., Rengo, C., ... McElreavey, K. (2004). Where west meets east: the complex mtDNA landscape of the southwest and Central Asian corridor. American Journal of Human Genetics, 74(5), 827- 845 Quintáns, B., Alvarez-Iglesias, V., Salas, A., Phillips, C., Lareu, M. V, Carracedo, A. (2004). Typing of mitochondrial DNA coding region SNPs of forensic and anthropological interest using SNaPshot minisequencing. Forensic Science International, 140(2-3), 251–7. Rando, J. C., Pinto, F., González, A. M., Hernández, M., Larruga, J. M., Cabrera, V. M., Bandelt, H. J. (1998). Mitochondrial DNA analysis of northwest African populations reveals genetic exchanges with European, near-eastern, and sub-Saharan populations. Annals of Human Genetics, 62(Pt 6), 531–50.

211 RÉFÉRENCES BIBLIOGRAPHIQUES

Rando, J. C., Cabrera, V. M., Larruga, J. M., Hernández, M., González, A. M., Pinto, F., Bandelt, H. J. (1999). Phylogeographic patterns of mtDNA reflecting the colonization of the Canary Islands. Annals of Human Genetics, 63(Pt 5), 413–28. Redd, A. J., Agellon, A. B., Kearney, V. A., Contreras, V. A., Karafet, T., Park, H., … Hammer, M. F. (2002). Forensic value of 14 novel STRs on the human Y chromosome. Forensic Science International, 130(2-3), 97–111. Regueiro, M., Cadenas, A. M., Gayden, T., Underhill, P. A., Herrera, R. J. (2006). Iran: tricontinental nexus for Y-chromosome driven migration. Human Heredity, 61(3), 132-143. Reidla, M., Kivisild, T., Metspalu, E., Kaldma, K., Tambets, K., Tolk, H., … Villems, R. (2003). Report Origin and Diffusion of mtDNA Haplogroup X. American Journal of Human Genetics, 73(5), 1178-1190. Renfrew, C. (2000). Archaeogenetics: towards a population prehistory of Europe. In: Renfrew C and Boyle K (eds) Archaeogenetics, 3–11. Cambridge: McDonald Institute. Rhouda, T., Martinez-Redondo, D., Gomez-Duran, A., Elmtili, N., Idaomar, M., Diaz-Sanchez, C., Montoya, J., López-Pérez, M. J., Ruiz-Pesini, E. (2009). Moroccan mitochondrial genetic background suggests prehistoric human migrations across the Gibraltar Strait. Mitochondrion, 9, 402–407. Richard, C., Pennarun, E., Kivisild, T., Tambets, K., Tolk, H.-V., Metspalu, E., Reidla, M., ... Moisan, J.-P. (2007). An mtDNA perspective of French genetic variation. Annals of Human Biology, 34(1), 68–79. Richards, M. B., Macaulay, V. A., Bandelt, H. J., Sykes, B. C. (1998). Phylogeography of mitochondrial DNA in western Europe. Annals of Human Genetics, 62(Pt 3), 241–60. Richards, M., Macaulay, V., Hickey, E., Vega, E., Sykes, B., Guida, V., … Bandelt, H. J. (2000). Tracing European founder lineages in the Near Eastern mtDNA pool. American Journal of Human Genetics, 67(5), 1251–76. Richards, M., Rengo, C., Cruciani, F., Gratrix, F., Wilson, J. F., Scozzari, R., … Torroni, A. (2003). Extensive female-mediated gene flow from sub-Saharan Africa into near eastern Arab populations. American Journal of Human Genetics, 72(4), 1058–64. Robino, C., Giolitti, A., Gino, S., Torre, C. (2006). Development of two multiplex PCR systems for the analysis of 12 X-chromosomal STR loci in a northwestern Italian population sample. International Journal of Legal Medicine, 120(5), 315-318. Robino, C., Crobu, F., Di Gaetano, C., Bekada, A, Benhamamouch, S., Cerutti, N., … Torre, C. (2008a). Analysis of Y-chromosomal SNP haplogroups and STR haplotypes in an Algerian population sample. International Journal of Legal Medicine, 122(3), 251–5. Robino, C., Inturri, S., Varacalli, S., Piccinini, A., Gino, S., Torre, C. (2008b). Molecular characterization of a null allele at locus DXS8378. Forensic Science, 1, 160–161.

212 RÉFÉRENCES BIBLIOGRAPHIQUES

Roewer, L. et Epplen, J. T. (1992). Rapid and sensitive typing of forensic stains by PCR amplification of polymorphic simple repeatsequences in case work. Forensic Science International, 53, 163. Roewer, L., Krawczak, M., Willuweit, S., Nagy, M., Alves, C., Amorim, A., ... Kayser, M. (2001). Online reference database of European Y-chromosomal short tandem repeat (STR) haplotypes. Forensic Science International, 118, 106–113. Roewer, L. (2013). DNA fingerprinting in forensics: past, present, future. Investigative Genetics, 4(1), 22. Rolf, B., Keil, W., Brinkmann, B., Roewer, L., Fimmers, R. (2001). Paternity testing using Y-STR haplotypes: assigning a probability for paternity in cases of mutations. International Journal of Legal Medicine, 115(1), 12-5. Roostalu, U., Kutuev, I., Loogväli, E.-L., Metspalu, E., Tambets, K., Reidla, M., … Villems, R. (2007). Origin and expansion of haplogroup H, the dominant human mitochondrial DNA lineage in West Eurasia: the Near Eastern and Caucasian perspective. Molecular Biology and Evolution, 24(2), 436–48. Rootsi, S., Magri, C., Kivisild, T., Benuzzi, G., Help, H., Bermisheva, M., … Semino, O. (2004). Phylogeography of Y-chromosome haplogroup I reveals distinct domains of prehistoric gene flow in europe. American Journal of Human Genetics, 75(1), 128–37. Rootsi, S., Behar, D. M., Järve, M., Lin, A. A., Myres, N. M., Passarelli, B., … Underhill, P. a. (2013). Phylogenetic applications of whole Y-chromosome sequences and the Near Eastern origin of Ashkenazi Levites. Nature Communications, 4. Rosenberg, N. A et Nordborg, M. (2002). Genealogical trees, coalescent theory and the analysis of genetic polymorphisms. Nature, 3, 380–390. Rosenberg, N. A. (2006). Standardized subsets of the HGDP-CEPH Human Genome Diversity Cell Line Panel, accounting for atypical and duplicated samples and pairs of close relatives. Annals of Human Genetics, 70(Pt 6), 841–7. Ross, M. T., Grafham, D. V., Coffey, A. J., Scherer, S., McLay, K., … Bentley, D. R. (2005). The DNA sequence of the human X chromosome. Nature, 434, 325–337. Rousselet, F. et Mangin, P. (1998). Mitochondrial DNA polymorphisms: a study of 50 French Caucasian individuals and application to forensic casework. International Journal of Legal Medicine, 111(6), 292-298. Sahnouni M. (1998). The Site of Ain Hanech Revisited: New Investigations at this Lower Pleistocene Site in Northern Algeria. Journal of Archaeological Science, 25, 1083–1101. Salas, A., Comas, D., Lareu, M. V., Bertranpetit, J., Carracedo, A. (1998). mtDNA analysis of the Galician population: a genetic edge of European variation. European Journal of Human Genetics, 6(4), 365-375.

213 RÉFÉRENCES BIBLIOGRAPHIQUES

Salas, A., Lareu, V., Calafell, F., Bertranpetit, J., Carracedo, A. (2000). mtDNA hypervariable region (HVII) sequences in human evolution studies. European Journal of Human Genetics, 8, 964-974. Salas, A., Richards, M., De la Fe, T., Lareu, M.-V., Sobrino, B., Sánchez-Diz, P., … Carracedo, A. (2002). The making of the African mtDNA landscape. American Journal of Human Genetics, 71(5), 1082–111. Sanchez, J. J., Hallenberg, C., Borsting, C., Hernandez, A., Morling, N. (2005). High frequencies of Y chromosome lineages characterized by E3b1, DYS19-11, DYS392-12 in Somali males. European Journal of Human Genetics, 13(7), 856-866. Santos, F. R., Epplen, J.T., Pena, S. D. (1993). Testing deficiency paternity cases with a Y-linked tetranucleotide repeat polymorphism. Experientia Supplementum: EXS, 67, 261-5. Santos-Lopes, S. S., Pereira, R. W., Wilson, I. J., Pena, S. D. J. (2007). A worldwide phylogeography for the human X chromosome. PloS One, 2(6), e557. Sarno, S., Boattini, A., Carta, M., Ferri, G., Alù, M., Yao, D. Y., … Luiselli, D. (2014). An ancient Mediterranean melting pot: investigating the uniparental genetic structure and population history of sicily and southern Italy. PloS One, 9(4), e96074. Saunier, J. L., Irwin, J. A., Strouss, K. M., Ragab, H., Sturk, K. A., Parsons, T. J. (2009). Mitochondrial control region sequences from an Egyptian population sample. Forensic Science International: Genetics, (3), 97-103. Scally, A. et Durbin, R. (2012). Revising the human mutation rate: implications for understanding human evolution. Nature Reviews. Genetics, 13(10), 745–53. Schaffner, S. F. (2004). The X chromosome in population genetics. Nature Reviews Genetics, 5(1), 43-51. Scheible, M., Alenizi, M., Sturk-Andreaggi, K., Coble, M. D., Ismael, S., Irwin, J. A. (2011). Mitochondrial DNA control region variation in a Kuwaiti population sample. Forensic Science International: Genetics, 5(4), e112-3. Schlecht, J., Kaplan, M. E., Barnard, K., Karafet, T., Hammer, M. F., Merchant, N. C. (2008). Machine-learning approaches for classifying haplogroup from Y chromosome STR data. PLoS Computational Biology, 4(6), e1000093. Scozzari, R., Cruciani, F., Pangrazio, A., Santolamazza, P., Vona, G., Moral, P., Latini, V., Varesi, L., Memmi, M. M., Romano, V., De Leo, G., Gennarelli, M., Jaruzelska, J., Villems, R., Parik, J., Macaulay, V., Torroni, A. (2001). Human Y-chromosome variation in the western Mediterranean area: implications for the peopling of the region. Human Immunology, 62(9), 871-84.

214 RÉFÉRENCES BIBLIOGRAPHIQUES

Secher, B., Fregel, R., Larruga, J. M., Cabrera, V. M., Endicott, P., Pestano, J. J., González, A. M. (2014). The history of the North African mitochondrial DNA haplogroup U6 gene flow into the African, Eurasian and American continents. BMC Evolutionary Biology, 14, 109. Seielstad, M.T., Minch, E., Cavalli-Sforza, L.L. (1998). Genetic evidence for a higher female migration rate in humans. Nature Genetics, 20, 278-80. Semino, O., Santachiara-Benerecetti, A. S., Falaschi, F., Cavalli-Sforza, L. L., Underhill, P. A. (2002). Ethiopians and Khoisan share the deepest clades of the human Y-chromosome phylogeny. American Journal of Human Genetics, 70(1), 265–8. Semino, O., Magri, C., Benuzzi, G., Lin, A. A., Al-zahery, N., Battaglia, V., … Santachiara- Benerecetti, A. S. (2004). Origin, Diffusion, and Differentiation of Y-Chromosome Haplogroups E and J: Inferences on the Neolithization of Europe and Later Migratory Events in the Mediterranean Area. American Journal of Human Genetics, 74, 1023– 1034. Sengupta, S., Zhivotovsky, L. A., King, R., Mehdi, S. Q., Edmonds, C. A., Chow, C.-E. T., … Underhill, P. A. (2006). Polarity and temporality of high-resolution y-chromosome distributions in India identify both indigenous and exogenous expansions and reveal minor genetic influence of Central Asian pastoralists. American Journal of Human Genetics, 78(2), 202–21. Sennequier, G., Colonna, C. (2003). L'Algérie au temps des royaumes numides: Vè siècle avant J.-C. - 1er siècle après J.-C. Somogy Éditions d’Art. Senut, B., Pickford, M., Gommery, D., Mein, P., Cheboi, K., Coppens, Y. (2001). First hominid from the Miocene (Lukeino Formation, Kenya). Comptes Rendus de l’Académie Des Sciences - Series IIA - Earth and Planetary Science, 332(2), 137–144. Serre, J. L. (2006). Génétique des populations. Cours et exercices corrigés. Édition Dunod, 30. Sibille, I., Duverneuil, C., Lorin de la Grandmaison, G., Guerrouache, K., Teissiere, F., Durigon, M., de Mazancourt, P. (2002). Y-STR DNA amplification as biological evidence in sexually assaulted female victims with no cytological detection of spermatozoa. Forensic Science International, 125(2-3), 212-6. Skaletsky, H., Kuroda-Kawaguchi, T., Minx, P. J., Cordum, H. S., Hillier, L., Brown, L. G., … Page, D. C. (2003). The male-specific region of the human Y chromosome is a mosaic of discrete sequence classes. Nature, 423(6942), 825–37. Smith, T. M., Tafforeau, P., Reid, D. J., Grün, R., Eggins, S., Boutakiout, M., Hublin, J.-J. (2007). Earliest evidence of modern human life history in North African early Homo sapiens. Proceedings of the National Academy of Sciences of the United States of America, 104(15), 6128–33.

215 RÉFÉRENCES BIBLIOGRAPHIQUES

Soares, P., Ermini, L., Thomson, N., Mormina, M., Rito, T., Röhl, A., … Richards, M. B. (2009). Correcting for purifying selection: an improved human mitochondrial molecular clock. American Journal of Human Genetics, 84(6), 740–59. Soares, P., Achilli, A., Semino, O., Davies, W., Macaulay, V., Bandelt, H.-J., … Richards, M. B. (2010). The archaeogenetics of Europe. Current Biology : CB, 20(4), R174–83. Soares, P., Alshamali, F., Pereira, J. B., Fernandes, V., Silva, N. M., Afonso, C., … Pereira, L. (2012). The Expansion of mtDNA Haplogroup L3 within and out of Africa. Molecular Biology and Evolution, 29(3), 915–27. Sperl, W., Jesina, P., Zeman, J., Mayer, J. A., Demeirleir, L., VanCoster, R., … Houstek J. (2006). Deficiency of mitochondrial ATP synthase of nuclear genetic origin. Neuromuscular Disorders, 16, 821-9. Stevanovitch, A., Gilles, A., Bouzaid, E., Kefi, R., Paris, F., Gayraud, R. P., Spadoni, J. L., El- Chenawi, F., Béraud-Colomb, E. (2003). Mitochondrial DNA Sequence diversity in a sedentary population from Egypt. Annals of Human Genetics, 68, 23-39. Stringer, C. (2002). Modern human origins: progress and prospects. Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences, 357(1420), 563–79. Sullivan, K. M., Mannucci, A., Kimpton, C. P., Gill, P. (1993). A rapid and quantitative DNA sex test: fluorescence-based PCR analysis of X-Y homologous gene amelogenin. BioTechniques, 15(4), 637-641. Sykes, B. et Irven, C. (2000). Surnames and the Y chromosome. American Journal of Human Genetics, 66(4), 1417–9. Szibor, R., Krawczak, M., Hering, S., Edelmann, J., Kuhlisch, E., Krause, D. (2003). Use of X-linked markers for forensic purposes. International Journal of Legal Medicine, 117(2), 67–74. Szibor, R., Hering, S., Kuhlisch, E., Plate, I., Demberger, S., Krawczak, M., Edelmann, J. (2005). Haplotyping of STR cluster DXS6801-DXS6809-DXS6789 on Xq21 provides a powerful tool for kinship testing. International Journal of Legal Medicine, 119, 363–369 Szibor, R., Hering, S., Edelmann, J. (2006). A new web site compiling forensic chromosome X research is now online. International Journal of Legal Medicine, 120, 252–254 Szibor, R. (2007). X-chromosomal markers: Past, present and future. Forensic Science, 1, 93–99. Tagliabracci, A., Turchi, C., Buscemi, L., Sassaroli, C. (2001). Polymorphism of the mitochondrial DNA control region in Italians. International Journal of Legal Medicine, 114(4-5), 224- 228. Talbot, M. R. (1983). Late Pleistocene rainfall and dune building in the Sahel. Palaeoecology of Africa, 16, 203–213.

216 RÉFÉRENCES BIBLIOGRAPHIQUES

Tambets, K., Rootsi, S., Kivisild, T., Help, H., Serk, P., Loogväli, E.-L., … Villems, R. (2004). The western and eastern roots of the Saami--the story of genetic “outliers” told by mitochondrial DNA and Y chromosomes. American Journal of Human Genetics, 74(4), 661–82. Tariq, M. A., Ullah, O., Riazuddin, S. A., Riazuddin, S. (2008). Allele frequency distribution of 13 X-chromosomal STR loci in Pakistani population. International Journal of Legal Medicine, 122(6), 525–8. Tariq, M. A., Sabir, M. F., Riazuddin, S. A., Riazuddin, S. (2009). Haplotype analysis of two X- chromosome STR clusters in the Pakistani population. International Journal of Legal Medicine, 123(1), 85–7. The Y Chromosome Consortium. (2002). A Nomenclature System for the Tree of Human Y- Chromosomal Binary Haplogroups. Genome research, 12, 339–348. The International HapMap Consortium. (2005). A haplotype map of the human genome. Nature, 437, 1299-1320. Thomas, M. G., Parfitt, T., Weiss, D. A., Skorecki, K., Wilson, J. F., le Roux, M., … Goldstein, D. B. (2000). Y chromosomes traveling south: the cohen modal haplotype and the origins of the Lemba--the “Black Jews of Southern Africa”. American Journal of Human Genetics, 66(2), 674–86. Thomas, M. G., Weale, M. E., Jones, A. L., Richards, M., Smith, A., Redhead, N., Torroni, A., Scozzari, R., Gratrix, F., Tarekegn, A., Wilson, J. F., Capelli, C., Bradman, N., Goldstein, D. B. (2002). Founding mothers of Jewish communities: geographically separated Jewish groups were independently founded by very few female ancestors. American Journal of Human Genetics, 70, 1411-1420. Thomas, F., Lefévre, T., Raymond, M. (2010). Biologie évolutive. Édition De Boeck Université, 170. Tillmar, A. O., Mostad, P., Egeland, T., Lindblom, B., Holmlund, G., Montelius, K. (2008). Analysis of linkage and linkage disequilibrium for eight X-STR markers. Forensic Science International: Genetics, 3(1), 37–41. Tofanelli, S., Ferri, G., Bulayeva, K., Caciagli, L., Onofri, V., Taglioli, L., Bulayev, O., Boschi, I., … Capelli, C. (2009). J1-M267 Y lineage marks climate-driven pre-historical human displacements. European Journal of HumanGenetics, 17(11), 1520–1524. Tolk, H. V., Barac, L., Pericic, M., Klaric, I. M., Janicijevic, B., Campbell, H., Rudan, I., Kivisild, T., Villems, R., Rudan, P. (2001). The evidence of mtDNA haplogroup F in a European population and its ethnohistoric implications. European Journal of Human Genetics, 9(9), 717-723.

217 RÉFÉRENCES BIBLIOGRAPHIQUES

Tomas, C., Sanchez, J. J., Barbaro, A., Brandt-Casadevall, C., Hernandez, A., Ben Dhiab, M., … Morling, N. (2008). X-chromosome SNP analyses in 11 human Mediterranean populations show a high overall genetic homogeneity except in North-west Africans (Moroccans). BMC Evolutionary Biology, 8(2), 75. Tomas, C., Pereira, V., Morling, N. (2012). Analysis of 12 X-STRs in Greenlanders, Danes and using Argus X-12. International Journal of Legal Medicine, 126(1), 121-8. Torroni, A., Schurr, T. G., Cabell, M. F., Brown, M. D., Neel, J. V, Larsen, M., … Wallace, D. C. (1993). Asian affinities and continental radiation of the four founding Native American mtDNAs. American Journal of Human Genetics, 53(3), 563–90. Torroni, A., Huoponen, K., Francalacci, P., Petrozzi, M., Morelli, L., Scozzari, R., … Wallace, D. C. (1996). European mtDNAs From an Analysis of Three European Populations. Genetics, 144, 1835–1850. Torroni, A., Bandelt, H. J., D’Urbano, L., Lahermo, P., Moral, P., Sellitto, D., … Scozzari, R. (1998). mtDNA analysis reveals a major late Paleolithic population expansion from southwestern to northeastern Europe. American Journal of Human Genetics, 62(5), 1137–52. Torroni, A., Bandelt, H. J., Macaulay, V., Richards, M., Cruciani, F., Rengo, C., … Scozzari, R. (2001). A signal, from human mtDNA, of postglacial recolonization in Europe. American Journal of Human Genetics, 69(4), 844–52. Torroni, A., Achilli, A., Macaulay, V., Richards, M., Bandelt, H.-J. (2006). Harvesting the fruit of the human mtDNA tree. Trends in Genetics : TIG, 22(6), 339–45. Trombetta, B., Cruciani, F., Sellitto, D., Scozzari, R. (2011). A new topology of the human Y chromosome haplogroup E1b1 (E-P2) revealed through the use of newly characterized binary polymorphisms. PloS One, 6(1), e16073. Trousset, P. (1998). Garama: Encyclopédie berbère, 19 | Filage – Gastel, Aix-en-Provence, Edisud, 2964-2969 Tully, L. A., Parsons, T. J., Steighner, R. J., Holland, M. M., Marino, M. A., Prenger, V. L. (2000). A sensitive denaturing gradient-Gel electrophoresis assay reveals a high frequency of heteroplasmy in hypervariable region 1 of the human mtDNA control region. American Journal of Human Genetics, 67(2), 432–43. Turchi, C., Buscemi, L., Previderè, C., Grignani, P., Brandstätter, A., Achilli, A., Parson, W., Tagliabracci, T., Ge.F.I. Group. (2008). Italian mitochondrial DNA database: results of a collaborative exercise and proficiency testing. International Journal of Legal Medicine, 122, 199–204.

218 RÉFÉRENCES BIBLIOGRAPHIQUES

Turchi, C., Buscemi, L., Giacchino, E., Onofri, V., Fendt, L., Parson, W., Tagliabracci, A. (2009). Polymorphisms of mtDNA control region in Tunisian and Moroccan populations: an enrichment of forensic mtDNA databases with Northern Africa data. Forensic Science International: Genetics, 3(3), 166-172. Underhill, P. A., Jin, L., Lin, A. A., Mehdi, S. Q., Jenkins, T., Vollrath, D., … Oefner, P. J. (1997). Detection of numerous Y chromosome biallelic polymorphisms by denaturing high- performance liquid chromatography. Genome Research, 7(10), 996–1005. Underhill, P., Shen, P., Lin, A. A., Jin, L., Passarino, G., Yang, W. H., Kauffman, E., Bonné-Tamir, B., ... Oefner, P. J. (2000). Y Chromosome Sequence Variation and the History of Human Population. Nature Genetics, 26, 358-361. Underhill, P. A., Passarino, G., Lin, A. A., Shen, P., Mirazón Lahr, M., Foley, R. A., … Cavalli- Sforza, L. L. (2001). The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations. Annals of Human Genetics, 65(Pt 1), 43–62. Underhill, P. A et Kivisild, T. (2007). Use of y chromosome and mitochondrial DNA population structure in tracing human migrations. Annual Review of Genetics, 41, 539–64. Vallone, P. (2002). Analyzing Single Nucleotide Polymorphisms. Communication orale au AAFS (American Academy of Forensic Sciences) Annual Meeting Atlanta, GA. Vallone, P. M., Just, R. S., Coble, M. D., Butler, J. M., Parsons, T. J. (2004). A multiplex allele- specific primer extension assay for forensically informative SNPs distributed throughout the mitochondrial genome. International Journal of Legal Medicine, 118(3), 147-57. van Oven, M. et Kayser, M. (2009). Updated comprehensive phylogenetic tree of global human mitochondrial DNA variation. Human Mutation, 30, E386–94. van Oven, M., van Geystelen, A., Kayser, M., Decorte, R., Larmuseau, M. H. (2014). Seeing the Wood for the Trees: A Minimal Reference Phylogeny for the Human Y Chromosome. Human Mutation, 35, 187–191. Varesi, L., Memmí, M., Cristofari, M.-C., Mameli, G. E., Caló, C. M., Vona, G. (2000). Mitochondrial control-region sequence variation in the Corsican population, France. American Journal of Human Biology, 12, 339-351. Veeramah, K. R., Wegmann, D., Woerner, A., Mendez, F. L., Watkins, J. C., Destro-Bisol, G., … Hammer, M. F. (2012). An early divergence of KhoeSan ancestors from those of other modern humans is supported by an ABC-based analysis of autosomal resequencing data. Molecular Biology and Evolution, 29(2), 617–30. Verginelli, F., Donati, F., Coia, V., Boschi, I., Palmirotta, R., Battista, P., Costantini, R. M., Destro- Bisol, G. (2003). Variation of the hypervariable region-1 of mitochondrial DNA in central-eastern Italy. Journal of Forensic Science, 48(2), 443-444.

219 RÉFÉRENCES BIBLIOGRAPHIQUES

Vernesi, C., Di Benedetto, G., Caramelli, D., Secchieri, E., Simoni, L., Katti, E., Malaspina, P., Novelletto, A., Marin, V. T. M., Barbujani, G. (2001). Genetic characterization of the body attributed to the evangelist Luke. Proceedings of the National Academy of Sciences USA, 98(23), 13460-13463. Vialettes, B. H., Paquis-Flucklinger, V., Pelissier, J. F., Bendahan, D., Narbonne, H., Silvestre- Aillaud, P., Montfort, M., Righini-Chossegros, M., Pouget, J., Cozzone, P. J., Desnuelle, C. (1997). Phenotypic expression of diabetes secondary to a T14709C mutation of mitochondrial DNA. Comparison with MIDD syndrome (A3243G mutation): a case report. Diabetes Care, 20, 1731-1737. Vona, G., Ghiani, M. E., Caló, C. M., Vacca, L., Memmí, M., Varesi, L. (2001). Mitochondrial DNA variation sequence análisis in Sicily. American Journal of Human Biology, 13, 576-589. Wakely, J. (1993). Substitution rate variation among sites in hypervariable region 1 of human mitochondrial DNA. Journal of Molecular Evolution, 37(6), 613–623. Wallace, D. C., Lott, M. T., Brown, M. D., Huoponen, K., Torroni, A. (1995). Report of the committee on human mitochondrial DNA. In Cuticchia AJ (ed) Human gene mapping 1995: a compendium. Johns Hopkins University Press, Baltimore, 910-954. Wallace, D. C., Brown, M. D., Lott, M. T. (1999). Mitochondrial DNA variation in human evolution and disease. Gene, 238, 211-230. Wallace, D. C. (2005). A mitochondrial paradigm of metabolic and degenerative diseases, aging, and cancer: a dawn for evolutionary medicine. Annual Review of Genetics, 39, 359–407. Wang, W., Kaushal, S., Bristow, J. M., Thomas, S., Hoffman, R. M., Bouvet, M., … Cavalli-sforza, L. L. (2010). Correction for Chiaroni et al., Y chromosome diversity, human expansion, drift, and cultural evolution. Proceedings of the National Academy of Sciences USA, 107(30), 13556–13556. Wendorf, F. (1968). A Nubian final paleolithic graveyard in Jebel Sahaba, Sudan. In: F. Wendorf (Ed.): The Prehistory of Nubia. Southern Methodist University Press, Dallas, 954–995. Willuweit, S., Roewer, L. (2007). International Forensic Y Chromosome User Group: Y chromosome haplotype reference database (YHRD): update. Forensic Science International: Genetics, 1, 83–87. Wilson III, D. M. et Brooks, P. J. (2010). The Mitochondrial Genome: Dynamics, Mechanisms of Repair, and a Target in Disease and Therapy. Environmental and Molecular Mutagenesis, 51(5), 349–351. Wilson, M. R., DiZinno, J. A., Polanskey, D., Replogle, J., Budowle, B. (1995). Validation of mitochondrial DNA sequencing for forensic casework analysis. International Journal of Legal Medicine, 108(2), 68-74.

220 RÉFÉRENCES BIBLIOGRAPHIQUES

Wirz, K. T. S., Keitel, S., Swaab, D. F., Verhaagen, J., Bossers, K. (2014). Early molecular changes in Alzheimer disease: can we catch the disease in its presymptomatic phase? Journal of Alzheimer’s Disease : JAD, 38, 719–40. Wood, E. T., Stover, D. A., Ehret, C., Destro-Bisol, G., Spedini, G., McLeod, H., … Hammer, M. F. (2005). Contrasting patterns of Y chromosome and mtDNA variation in Africa: evidence for sex-biased demographic processes. European Journal of Human Genetics : EJHG, 13(7), 867–76. Wright, S. (1950). Genetical structure of populations. Nature, 166, 247-9. Yu, N., Fu, Y.-X., Li, W.-H. (2002). DNA polymorphism in a worldwide sample of human X chromosomes. Molecular Biology and Evolution, 19(12), 2131–41. Yunusbayev, B., Metspalu, M., Järve, M., Kutuev, I., Rootsi, S., Metspalu, E., Behar, D. M., Varendi, K., Sahakyan, H., Khusainova, R., Yepiskoposyan, L., Khusnutdinova, E. K., Underhill, P. A., Kivisild, T., Villems, R. (2012). The Caucasus as an asymmetric semipermeable barrier to ancient human migrations. Molecular Biology and Evolution, 29(1), 359-65. Zalloua, P. A., Xue, Y., Khalife, J., Makhoul, N., Debiane, L., Platt, D. E., … Consortium, T. G. (2008a). Y-Chromosomal Diversity in Lebanon Is Structured by Recent Historical Events. American Journal of Human Genetics, 82, 873–82. Zalloua, P. A., Platt, D. E., El Sibai, M., Khalife, J., Makhoul, N., Haber, M., … Tyler-Smith, C. (2008b). Identifying genetic traces of historical expansions: Phoenician footprints in the Mediterranean. American Journal of Human Genetics, 83(5), 633–42. Zimmer, C. Traduit de l’anglais par Swynghedauw B. (2011). Introduction à l’évolution: ce merveilleux bricolage. Éditions De Boeck et Larcier, 209-212. Zimmermann, B., Brandstätter, A., Duftner, N., Niederwieser, D., Spiroski, M., Arsov, T., Parson, W. (2007). Mitochondrial DNA control region population data from Macedonia. Forensic Science International: Genetics, 1(3-4), e4-9. Zupanic Pajnic, I., Balazic, J., Komel, R. (2004). Sequence polymorphism of the mtDNA control region in the Slovenian population. International Journal of Legal Medicine, 118, 1-4.

221

ANNEXES ANNEXES

Liste des Annexes :

• Annexe I : Fiche du questionnaire et consentement établi • Annexe II : Caractéristiques des PCR multiplex amplifiant les 21 marqueurs STRs du chromosome X Annexe II.a : Caractéristiques des PCR multiplex A, B et C Annexe II.b : Caractéristiques de la PCR multiplex du kit Mentype® Argus X-8

• Annexe III: Liste des amorces et enzymes utilisées dans l’analyse de l’ADNmt par PCR- RFLP • Annexe IV : Caractéristiques des amorces PCR et SBE dans les réactions SNaPshot Annexe IV.a : Caractéristiques des amorces PCR et SBE utilisées dans la réaction SNaPshot détectant les haplogroupes majeurs européens de l’ADNmt Annexe IV.b : Caractéristiques des amorces PCR et SBE utilisées dans la réaction SNaPshot détectant les sous-haplogroupes H de l’ADNmt

• Annexe V : Liste des amorces et enzymes utilisées dans l’analyse du chromosome Y par PCR-RFLP • Annexe VI : Références des populations utilisées dans l’analyse comparative de l’ADNmt • Annexe VII : Références des populations utilisées dans l’analyse comparative du chromosome Y • Annexe VIII: Composants géographiques (en %) du chromosome Y et de l’ADNmt • Annexe IX : Phylogéographie des haplogroupes de l’ADNmt et du chromosome Y observés dans la population algérienne. Annexe IX.a : Phylogéographie des haplogroupes de l’ADNmt Annexe IX.b : Phylogéographie des haplogroupes du chromosome Y

ANNEXES

Annexe I : Fiche du questionnaire et consentement établi

Université des Sciences et de la Technologie (Mohamed Boudiaf) d’Oran Centre Hospitalo-Universitaire d’Oran Université d’Oran

Fiche d’enquête du projet : Caractérisation par Biologie Moléculaire des marqueurs Anthropo-génétique de la population du nord-ouest algérienne.

N°……

I Données sociodémographiques : Nom :………………………………./ Prénom :…………………………………../ Sexe : M……./ F………./ Age :…………../ Lieu de naissance :………………………………………../ Profession :………………………………………./ Adresse :….. ……………………………………………………………………./ Situation matrimoniale : M……./ C……/ D………../ V………/ Origine géographique du père :……………………………………………../ Origine géographique de la mère………………………………………/ Origine géographique du grand père paternel.……………………………………../ Origine géographique de la grande mère paternelle.……………………………../ Origine géographique du grand père maternel………………………………/ Origine géographique de la grande mère maternelle ………………………………/ Type de mariage : 1- Mariage des parents (cousins ?) : ……../ 2- Mariage non apparenté (n’appartenant pas à la même famille) ……../ Quel dialecte parlez vous? ………………………../ Antécédents personnels : ……………..……./ ………………………………./ Antécédents familiaux : …………………………/………………………………/ II Données biologiques : Groupe sanguin :………………. /

Consentement éclairé : J’accepte librement sans aucune contrainte d’être prélevé pour des fins d’études. En foi de quoi, j’appose librement ma signature sur le présent document d’enquête.

A le …. .…/……………/20.. Signature

ANNEXES

Annexe II : Caractéristiques des PCR multiplex amplifiant les 21 marqueurs STRs du chromosome X

Annexe II.a : Caractéristiques des PCR multiplex A, B et C

Tailles Concentrations

attendues des STRs Séquences des amorces des amorces Label fragments (µM) amplifiés (pb) F: 5' gttggtacttaataaaccctcttt DXS6789 0.2 FAM 154-198 R: 5' aagaagttatttgatgtcctattgt F: 5' tgaaccttcctagctcagga DXS6809 0.2 FAM 235-279

R: 5' tctggagaatccaattttgc F: 5' tagtggtgatggttgcacag GATA172D05 0.2 VIC 108-136 R: 5' ataattgaaagcccggattc F: 5' actctaaatcagtccaaatatct DXS101 0.2 VIC 179-233 R: 5' aaatcactccatggcacatgtat Multiplex A Multiplex F: 5' cacaggaggtttgacctgtt DXS8378 0.2 NED 163-187 R: 5' acaagagcgaaactccaactc F: 5' cacttcatggcttaccacag DXS8377 0.2 NED 204-261 R: 5' gacctttggaaagctagtgt F: 5' gagcccattttaataaatcc DXS7132 0.3 FAM 131-155 R: 5' gccaaactctattagtcaac F: 5' gtgggaccttgtgattgtgt DXS6800 0.1 FAM 194-218

R: 5' ctggctgacacttagggaaa F: 5' catttcctctaacaagtctcc DXS6801 0.1 VIC 113-137 R: 5' cagagagtcagaatcagtag F: 5' ctgcttgagtccaggaattcaa DXS7424 0.1 PET 147-180 R: 5' gaacacgcacatttgagaacata Multiplex B Multiplex F: 5' atgccacagataatacacatcccc HPRTB 0.1 VIC 259-303 R: 5' ctctccagaatagttagatgtagg F: 5' ggagtgaactctgaaaaaaaa DXS10011 0.3 NED 137-257 R: 5' tgaaatcatctatctttctttc F: 5' aaaaaagggggaaggaagga DXS10148 0.1 HEX 215-262

R: 5' ggctatttctcctgcataag F: 5' gagaatggcttgaacctgg DXS10079 0.1 FAM 313-357 R: 5' gtttgcctgtgttgtaacatcct F: 5' tcataatcacatatcacatgagc DXS10103 0.1 HEX 160-200 R: 5' aaacagaaccaggggaatgaa Multiplex C Multiplex F: 5' ctgccttgcccttcctacc DXS10146 0.3 FAM 178-268 R: 5' gaaaaagaaagaaagacagaga

ANNEXES

Annexe II.b : Caractéristiques de la PCR multiplex du kit Mentype® Argus X-8

Tailles

attendues des STRs Séquences des amorces Label fragments amplifiés (pb) F: 5' aatagaaaaattagcctgacgtgg DXS8378* FAM 154-179 R: 5' atatttttagagatcgggtctcac F: 5' aactttttctctgtatgtagtcgatt

HPRTB* FAM 190-222

8 R: 5' ctacatcaaagtgaaaagccat - F: 5' tgatggggggatacgtttc DXS7423 FAM 233-254 R: 5' tgctgaggggtagatggg F: 5' tgattaggaatatcaaaggcaaa DXS7132* FAM 281-306 R: 5' cttctctggttctctagctcacat F: 5' caacatagtgagatcccacctttac DXS10134 FAM 330-384 R: 5' taatattctattgtatgggcatgctg F: 5' ttattattttgcctacctctctgagc DXS10074 HEX 98-168 R: 5' attttctctctgtcttagctcccata

Multiplex Mentype Argus X Argus Mentype Multiplex F: 5' tgtttcaaaataatatgggagttgg DXS10101 HEX 186-223 R: 5' tctttaatctctcacagcccctac' F: 5' tatttttaatagagacggggtttctc DXS10135 HEX 242-316 R: 5' gagaccgaaaatggtactgagg

* Les marqueurs STRs analysés en double (également dans les multiplex A et B)

ANNEXES

ANNEXES

Annexe IV : Caractéristiques des amorces PCR et SBE dans les réactions SNaPshot • Annexe IV.a : Caractéristiques des amorces PCR et SBE utilisées dans la réaction SNaPshot détectant les haplogroupes majeurs européens de l’ADNmt (2 pages) • Annexe IV.b : Caractéristiques des amorces PCR et SBE utilisées dans la réaction SNaPshot détectant les sous-haplogroupes H de l’ADNmt (2 pages)

ANNEXES

ANNEXES

ANNEXES

Annexe V : Liste des amorces et enzymes utilisées dans l’analyse du chromosome Y par PCR-RFLP

s s dess

du SNP Type de de Type Amorce Taille Taille fragment restriction Références Enzyme de de Enzyme substitution amplifié (pb) amplifié Haplogroupe Séquence

F: CAAAGTTTATTTTCAAAGGGGAGA E1b1b1a1a V12 A > G 439 BsgI R: CCATAAAGTTGGGTTGAAGGAG

F: GGATGCTGCTAAACATCCTACA E1b1b1a1b V13 G > A 235 AciI R: ATCCCATCTCAATCCCTTAACA F: AATGCCTCAACTTACAGAAATGG E1b1b1a1c V22 T > C 289 MmeI R: CACTGACCAGAAACAGCATGAG F: GCAAAATCCCAGAACATCATT E1b1b1a1a1 V32 G > C 355 MnlI Cruciani et al. 2007 al. et Cruciani R: TCATTGACCCAAAGCAGACA 2006; al. et Cruciani F: CCTCAACCTACTAAATGTGACCATG E1b1b1a1d V65 G > T 349 R: ATGGCCACACAATTCTCCAT F: AGACACTAGCAGTCTTGTCCTCAG R1b1a2a1a M412 G > A 386 NlaIII R: CAGGTATGGAAGTGCTCAAATCG F: TCTTATCATTGTCACAGGGCTG

R1b1a2a1a1b4 M529 C > G 305 Tse1 1 R: TGCCTTAGCTGTCTGTGTCC F: GGTTTTTTTATGCTGCTGCA R1b1a2a1a1 L11 T > C 310 R: ACTCTTTTGCCTAAATTGCTTGT F: CCTGTAGTCCCAGCTACTCAGG

R1b1a2a L23 G > A 305 PflFI 201 al. et Myres R: CACTGATGGCAGATTGGATA F: TTTCTCAACCCACTGTCTGC R1b1a2a1a1b S116 C > A 339 BtsI R: TCATGCCATTGTACTCCAGC

ANNEXES

Annexe VI : Références des populations utilisées dans l’analyse comparative de l’ADNmt Code Populations Effectif Références

Alvarez et al. 2007, Alfonso-Sánchez et al. 2008, Alvarez et al. 2010, Alvarez-Iglesias et al. 2009, Bertranpetit et al. 1995, Casas et al. 2006, Corte-Real et al. 1996, Crespillo et al. 2000, Falchi et al. 2006, Péninsule Ibérique IP 3873 Fernández et al. 2008, Garcia et al. 2011, González et al. 2003, Larruga (Espagne + Portugal) et al. 2001, Maca-Meyer et al. 2003b, Martinez-Jarreta et al. 2000, Pereira et al. 2004, Picornell et al. 2005, Plaza et al. 2003, Richards et al. 2000, Salas et al. 1998, Salas et al. 2000

Alvarez et al. 2007, Danan et al. 1999, Dubut et al. 2004, Falchi et al. FRC France + Corse 1304 2006, Garcia et al. 2011, Richard et al. 2007, Rousselet et Mangin 1998, Varesi et al. 2000

Achilli et al. 2007, Babalini et al. 2005, Bini et al. 2003, Cali et al. Italie + Sardaigne + 2001, Falchi et al. 2006, Forster et al. 2002, Messina et al. 2010, Ottoni ISS 2525 Sicile et al. 2009, Richards et al. 2000, Tagliabracci et al. 2001, Turchi et al. 2008, Verginelli et al. 2003, Vona et al. 2001

Babalini et al. 2005, Belledi et al. 2000, Bosch et al. 2006, Forster et al. 2002, Irwin et al. 2008, Kouvatsi et al. 2001, Malyarchuk et al. 2003, BAL Balkans + Crète 1971 Martinez et al. 2008, Richards et al. 2000, Tolk et al. 2001, Vernesi et al. 2001, Zimmermann et al. 2007, Zupanic et al. 2004

Sahara Occidental + SAM 145 González et al. 2006, Plaza et al. 2003, Rando et al. 1998 Mauritanie

Alvarez et al. 2007, Brakez et al. 2001, Costa et al. 2009, Coudray et Maroc (Arabes + MOR 1194 al. 2009, Falchi et al. 2006, Harich et al. 2010, Plaza et al. 2003, Rando Berbères) et al. 1998, Rhouda et al. 2009, Thomas et al. 2002, Turchi et al. 2009

ALG Algérie (nord-ouest) 240 Cette étude AlgNC Algérie (nord-centre) 47 Plaza et al. 2003 MOZ Algérie (M’Zab) 85 Corte-Real et al. 1996 Cherni et al. 2009, Costa et al. 2009, Ennafaa et al. 2011, Fadhlaoui- Tunisie (Arabes + TUN 591 Zid et al. 2004, Loueslati et al. 2006, Plaza et al. 2003, Turchi et al. Berbères) 2009 TuAn Tunisiens Andalous 155 Cherni et al. 2009 LIB Libye 269 Fadhlaoui-Zid et al. 2011a Coudray et al. 2009, Krings et al. 1999, Kujanova et al. 2009, Saunier EGY Egypte 516 et al. 2009, Stevanovitch et al. 2003

Comas et al. 2000, Nasidze and Stoneking 2001, Nasidze et al. 2004a, CAU Caucase 1269 Nasidze et al. 2004b, Quintana-Murci et al. 2004, Richards et al. 2000, Thomas et al. 2002, , unpublished data

Calafell et al. 1996, Comas et al. 1996, Di Benedetto et al. 2001, TUR Turquie 494 Mergen et al. 2004, Nasidze et al. 2004a, Quintana-Murci et al. 2004, Richards et al. 2000

Levant (Jordanie, Al-Zahery et al. 2003, Behar et al. 2008b, González et al. 2008, LEQ Palestine, Syrie et 655 Macaulay et al. 1999b, Richards et al. 2000, Thomas et al. 2002, Liban) + Irak Vernesi et al. 2001, unpublished data

Comas et al. 2000, Comas et al. 2004, González et al. 2008, Metspalu KRN Kurdes + Iran 924 et al. 2004, Nasidze et al. 2004a, Nasidze et al. 2005, Quintana-Murci et al. 2004, Richards et al. 2000

ANNEXES

Annexe VI : Suite

Populations Effectif Références Code Péninsule Arabe (Arabie Abu-Amero et al. 2007, Abu-Amero et al. 2008, Abu-Amero et al. Saoudite, Koweït, les 2010, Abu-Amero et al. 2011a, Abu-Amero et al. 2011b, Alshamali et ARP 2033 Emirats Arabes Unis al. 2008, Cerny et al. 2008, Kivisild et al. 2004, Non et al. 2011, (EAU), Yémen, Scheible et al. 2011, Thomas et al. 2002 Oman)

ANNEXES

Annexe VII: Références des populations utilisées dans l’analyse comparative du chromosome Y

Effec- Références de la subdivision Code Populations Références tif des haplogroupes E: Cruciani et al. 2007; this Péninsule Ibérique Alonso et al. 2005; Adams et al. 2008; study; I: Rootsi et al. 2004; J: IP (Espagne + 1971 Lopez-Parra et al. 2009 Semino et al. 2004; R: Myres Portugal) et al. 2011 E: Cruciani et al. 2004;2007; I: Scozzari et al. 2001; Francalacci et al. Rootsi et al. 2004; R: Cruciani FRC France + Corse 776 2003; King et al. 2011; Larmuseau et et al. 2010 ; 2011b; Myres et al. 2011 al. 2011 Di Giacomo et al. 2003; Francalacci et E: Cruciani et al. 2007; Caratti al. 2003; Capelli et al. 2006; 2007; et al. 2009; I: Rootsi et al. Italie + Sardaigne + Onofri et al. 2007; Contu et al. 2008; ISS 3401 2004; J: Semino et al. 2004; Sicile Ferri et al. 2008; 2009; Battaglia et al. Onofri et al. 2008; R: Cruciani 2009; Di Gaetano et al. 2009; King et et al. 2010a; Myres et al. 2011 al. 2011; Larmuseau et al. 2011 Barac et al. 2003; Di Giacomo et al. E: Cruciani et al. 2007; King et 2003; Bosch et al. 2006 ; Marjanovic et al. 2008; I: Rootsi et al. 2004; BAL Balkans + Crète 3115 al. 2005; Pericic et al. 2005; Firasat et Martinez et al. 2007; J: Semino al. 2007; Martinez et al. 2007; King et et al. 2004; Martinez et al. al. 2008; 2011; Battaglia et al. 2009 2007; R: Myres et al. 2011 Bosch et al. 2001; Fregel et al. 2009; E: Cruciani et al. 2007; this Sahara Occidental + SAM 189 Aboukhalid et al. 2010; unpublished study; J: Semino et al. 2004; R: Mauritanie results Cruciani et al. 2010 ; 2011b. Bosch et al. 2001; Onofri et al. 2008; E: Cruciani et al. 2007; this Maroc (Arabes + Zalloua et al. 2008a; Alvarez et al, MOR 760 study; J: Semino et al. 2004; R: Berbères) 2009; Fregel et al. 2009; Aboukhalid et Cruciani et al. 2010 ; 2011b. al. 2010; unpublished results E: Cruciani et al. 2007; this ALG Algérie 156 Arredi et al. 2004; Robino et al. 2008a study; J: Semino et al. 2004; R: Cruciani et al. 2010 ; 2011b. Arredi et al. 2004; Capelli et al. 2006; E: Cruciani et al. 2007; this Tunisie (Arabes + Onofri et al. 2008; Zalloua et al. 2008a; TUN 601 study; J: Semino et al. 2004; R: Berbères) Ennafaa et al. 2011; Fadhlaoui-zid et Cruciani et al. 2010 ; 2011b. al. 2011b E: Cruciani et al. 2007; this Cruciani et al. 2007; Ottoni et al. 2011; LIB Libye 83 study; J: Semino et al. 2004; R: unpublished results Cruciani et al. 2010 ; 2011b. E: Cruciani et al. 2007; this Arredi et al. 2004; Luis et al. 2004; El- EGY Egypte 370 study; J: Semino et al. 2004; R: Sibai et al. 2009; Kujanova et al. 2009 Cruciani et al. 2010 ; 2011b. Battaglia et al. 2009; Balanovsky et al. CAU Caucase 3581 2011; Yunusbayev et al. 2012 E: Cruciani et al. 2007; R: TUR Turquie 523 Cinnioglu et al. 2004 Myres et al. 2011 Al-Zahery et al. 2003; Flores et al. Levant (Jordanie, 2005; Sanchez et al. 2005; El-Sibai et LEQ Palestine, Syrie et 2741 al. 2009; Zalloua et al. 2008a; 2008b; Liban) + Irak Al-Zahery et al. 2011 Regueiro et al. 2006; El-Sibai et al. IRN Iran 566 2009; Haber et al. 2011 Péninsule Arabe (Arabie Luis et al. 2004; Cadenas et al. 2008; Saoudite, Koweït, ARP 618 Abu-Amero et al. 2009; El-Sibai et al. les Emirats Arabes 2009 Unis (EAU), Yémen, Oman)

ANNEXES

ANNEXES

Annexe IX : Phylogéographie des haplogroupes de l’ADNmt et du chromosome Y observés dans la population algérienne

Annexe IX.a : Phylogéographie des haplogroupes de l’ADNmt

Origine Haplogroupe H1 H7 U4c1 X2c'e H11a HV0/HV0a/V U5* H1a I4 U5a

H1b J1c7 U5a1b1 H2a J2b1 U5b* Europe H3 T2b* U5b1b* H5a T2b4 U5b1c H6a T2e U5b3 I H2a1 J1d / J2b N2 U1* X1a A H4 J1d1 N9 U2* X2b1 B H6b J2a R* U2e

C/Z H8 J2a2a1 R0a U3* D/G/M9/E HV1 K* T U4 F I1 K1a* T1* U4a* H* J / J1c / J2 K1b1* T1a U7 Moyen Orient Moyen H13a1 J1a'b'e N1a* T2 U8* H14a J1b1a1 N1b T2c U9a H20 J1b2a N1c T2i X L3e5 M1 M1a1 U6a U6a1'2'3

Nord de l'Afrique de Nord U6b'c'd

L1b* L2a1* L2a2 L3b1a3 L1b3 L2a1a2'3'4 L2b* L3b (16124!) L1c* L2a1b L2c1'2 L3b2a L1c2 L2a1b'f L2d L3d* L2* L2a1c1'2 L2e L3e2'3'4

Ouest de l'Afrique de Ouest L2a L2a1 (16189) L3b L3f1b*

L0* L3d1d L4a'b* L0a1 L3e1* L5* L0a1b L3f* L6 L0a2* L3h1b* N* / M* / L3* L3c/L4/M L3i* Est de l'Afrique de Est L3d1a1 L3x*

ANNEXES

Annexe IX.b : Phylogéographie des haplogroupes du chromosome Y Origine Haplogroupe Polymorphisme caractéristique E1b1b1a2 V13 I M170, M253, P259, M227, M507 I1b P215, M438, P37.2, M359, P41.2 I1b2 M26 I1c M223, M284, P78, P95 J2a1 M47 J2a2 M67, M166 Europe J2a2a M92 J2b M12, M102, M280, M241 R1b1b1a M412, P310 R1b1b1a1 L11 R1b1b1a1a U106 R1b1b1a1b U198, P312, S116 R1b1b1a1b1, 2, 3, 4, 5 U152, M529, M65, M153, SRY2627 C RPS4Y, M130, M217, M48, M356, M168 F M89, M282 G M201, M285, P15, P16, M406 H M69, M52, M82, M197, M370 J1 M304, M267, P58, M365, M368, M369 J2 M172, M410, M158, M319, DYS445=6, M339, M340 K M9, M184 L M11, M20, M27, M76, M317, M274, M349, M357 N M231, M214, LLY22g, Tat, M178 Moyen Orient O M175, M119 P, R 92R7, M207, M173, M45 Q MEH2, M242, P36.2, M25, M346 R1a1 M420, M17, M198, M204, M458 R1b M173, M343, P25, M73 R1b1b M269 R1b1b1 L23 R2 M479, M124 T M70 E1b1b1a M78 E1b1b1a1 V12 E1b1b1a1b V32 Nord de l'Afrique E1b1b1a3 V22 E1b1b1a4 V65 E1b1b1b M81 E1a M33 Ouest de l'Afrique E1b1 P2, M2, U175, M191 R1b1a V88, M18 A M91, M13 B M60, M181, SRY10831.1, M150, M109, M112 Est de l'Afrique DE M1, YAP, M174, M40, M96, M75, M98 E1b1b1 M35 E1b1b1c M123, M34

PUBLICATIONS

Partie I : Analyse de 21 marqueurs STR du chromosome X dans un échantillon de la population algérienne

Cette partie a fait l’objet d’un article publié dans la revue scientifique en ligne:

International Journal of Legal Medicine, Impact Factor (2010) = 2,93

Bekada A., Benhamamouch S., Boudjema A., Fodil M., Menegon S., Torre C., Robino C (2010). Analysis of 21 X-chromosomal STRs in an Algerian population sample. International Journal of Legal Medecine, 124(4), 287-94. doi: 10.1007/s00414-009-0397-9

Int J Legal Med (2010) 124:287–294 DOI 10.1007/s00414-009-0397-9

SHORT COMMUNICATION

Analysis of 21 X-chromosomal STRs in an Algerian population sample

Asmahan Bekada & Soraya Benhamamouch & Abdallah Boudjema & Mustapha Fodil & Silvia Menegon & Carlo Torre & Carlo Robino

Received: 10 September 2009 /Accepted: 18 November 2009 /Published online: 11 December 2009 # Springer-Verlag 2009

Abstract Twenty-one X-chromosomal short tandem repeat Keywords X chromosome . Short tandem repeat . Algeria . loci, including the six clusters of linked markers DXS10148- Haplotype . Linkage disequilibrium . DXS10148 DXS10135-DXS8378 (Xp22), DXS7132-DXS10074- DXS10079 (Xq12), DXS6801-DXS6809-DXS6789 (Xq21), DXS7424-DXS101 (Xq22), DXS10103-HPRTB-DXS10101 Introduction (Xq26), DXS8377-DXS10146-DXS10134-DXS7423- DXS10011 (Xq28), and the loci DXS6800 and GATA172D05 X-chromosomal short tandem repeat (STR) loci provide an were typed in a northwestern Algerian population sample extremely useful tool in paternity testing, especially in (n=210; 104 men and 106 women). Allele and haplotype deficiency cases with female offspring. As a consequence, frequencies were calculated. No evidence of linkage disequi- the number of established X-STR markers suitable for librium was observed between pairs of loci within clusters of forensic usage has risen continually during recent years [1]. linked markers. At locus DXS10148, sequence analysis of a Since haplotype analysis of X-STRs is straightforward in subset of alleles displaying unusual amplicon length (≥ 36 hemizygous males and it can be used to detect kinship repeat units) and anomalous electrophoretic mobility showed between alleged relatives in large and incomplete pedigrees, that this marker has a complex molecular structure with many authors have focused on the development of different repeat variants within alleles of identical amplicon multiplex polymerase chain reaction (PCR) systems allow- size. ing the typing of clusters of closely linked markers [2–4]. The use of X-STR markers in forensic practice requires that the peculiar properties of the X chromo- Electronic supplementary material The online version of this article some are taken into account [5]. X chromosomes spend (doi:10.1007/s00414-009-0397-9) contains supplementary material, two thirds of their life in females, therefore a lower genetic which is available to authorized users. diversity is expected, due to less frequent mutational : : A. Bekada S. Benhamamouch M. Fodil events in females than in males [6]. However, since only Département de Biotechnologie, three X chromosome copies are present in the population ’ Faculté des Sciences, Université d Oran, for every four autosomes, stronger effects of genetic drift Oran, Algeria are possible [7]. Because only two thirds of the X A. Boudjema chromosomes can recombine in females at each gener- Département de Génétique Moléculaire Appliquée, ation, longer linkage disequilibrium (LD) intervals are Faculté des Sciences, Université Mohamed Boudiaf USTO, expected for the X chromosome compared with auto- Oran, Algeria somes [8]. Therefore, for likelihood ratio calculations in : : S. Menegon C. Torre C. Robino (*) relationship testing with X-STRs, especially when clusters Department of Anatomy, of closely linked markers are employed, a precise Pharmacology and Legal Medicine, University of Turin, knowledge of allele and haplotype frequencies, genetic Corso Galileo Galilei 22, 10126 Turin, Italy linkage, and LD in the appropriate population is required e-mail: [email protected] [9]. 288 Int J Legal Med (2010) 124:287–294

With this in mind, we have collected data on the genetic following primers were used (Szibor, personal communica- diversity of a large set of X-STR markers in the Algerian tion): F: 5′ tcataatcacatatcacatgagc; R: 5′ aaacagaaccagg population. As a matter of fact, no previous population ggaatgaa. For this last multiplex reaction, primer sequences, studies regarding the distribution of X-STRs in North concentrations, and dye-labeling are listed in Table S2.PCR Africa are available at present. The typed markers included was performed in a 12.5-μl volume containing 1–10 ng of those comprised in two multiplex PCR sets which were template DNA and 1× QIAGEN Multiplex PCR Master Mix formerly developed in-house [10], those contained in a (Qiagen, Hilden, Germany). The PCR protocol consisted of a commercial typing kit (Argus X-8) [11] and four additional 15-min pre-PCR heat step at 95°C, followed by 32 cycles of X-STRs (DXS10148, DXS10079, DXS10103, and denaturation at 94°C for 30 s, annealing at 57°C for 90 s, and DXS10146) chosen in order to implement haplotipic data extension at 72°C for 1 min, with a final 30-min extension provided with the Argus X-8 kit. In all, 21 X-STRs were step at 60°C. analyzed including six clusters of linked markers: Typing was done by capillary electrophoresis on the ABI DXS10148-DXS10135-DXS8378 (Xp22); DXS7132- PRISM 310 Genetic Analyzer (Applied Biosystems, Foster DXS10074-DXS10079 (Xq12); DXS6801–DXS6809– City, CA) in comparison to allelic ladders and control DNA DXS6789 (Xq21); DXS7424–DXS101 (Xq22); from K562 and 9947A cell lines (Promega, Madison, WI) DXS10103-HPRTB-DXS10101 (Xq26); DXS8377- [15] using the GeneScan and Genotyper software version DXS10146-DXS10134-DXS7423-DXS10011 (Xq28), and 3.7 (Applied Biosystems). loci GATA172D05 and DXS6800. The physical and genetic Sequencing of DXS10148 alleles was performed with localizations on the X chromosome of the 21 typed markers the Big Dye Terminator Sequencing kit (Applied Bio- are shown in Table S1. systems), using the unlabelled multiplex PCR primers. Arlequin software [16] was used to perform exact test of differentiation (100,000 Markov steps) between male and Materials and methods female allele frequencies, test of Hardy–Weinberg equilib- rium (HWE) in the female subsample, test of LD between Blood samples were obtained from unrelated healthy pairs of markers within clusters of linked loci in the male adults residing in northwest Algeria (104 men and 106 subsample, and to calculate locus by locus population women) after informed consent. The sampling was pairwise genetic distances (FST) between northwestern anonymous in order to prevent linkage to the original Algerians and other population samples drawn from the donor. DNA was extracted using the standard salting- literature. In order to summarize the relationship between out method [12]. X-STR markers were amplified in Algerians and reference populations, principal component four separate multiplex PCR reactions. Loci DXS8378, analysis (PCA) was performed by using the R-package DXS6809, DXS6789, DXS101, GATA172D05, software v2.0.1 (http://www.r-project.org). DXS8377, and DXS7132, DXS6800, DXS6801, The following statistical parameters of forensic interest DXS7424, HPRTB, DXS10011 were amplified as were calculated using the online functions provide by the described by Robino et al. [10], with minor modifica- ChrX-STR.org 2.0 database (http://www.chrx-str.org)[15]: tions. In particular, a 5-dye (FAM, VIC, PET, NED, LIZ) expected heterozygosity (h) [17], polymorphism informa- chemistry was used in order to prevent ambiguous typing tion content (PIC) [18], power of discrimination in females of loci DXS6801 and DXS7424, which, in the original 4- (PDF) and males (PDM)[19], mean exclusion chance for dye protocol, were both labeled with JOE and generated autosomal markers in trios (MECI) [20], X-STRs in trios amplicons of almost overlapping size (113–137 bp and with daughters (MECII) [21], and X-STRs in father/ 147–180 bp). In the new set of primers, DXS6801 is now daughter duos (MECIII) [19]. labeled with VIC and DXS7424 with PET. A slightly modified reverse primer (R: 5′ acaagagcgaaactccaactc) for amplification of locus DXS8378 was used [13]. Loci Results and discussion DXS10135, DXS8378, DXS7132, DXS10074, HPRTB, DXS10101, DXS10134, and DXS7423 were amplified by Since the three markers DXS8378, DXS7132, and HPRTB means of the Mentype Argus X-8 kit (Biotype GE, were amplified both in the multiplex PCR reactions Dresden Germany) according to the manufacturer's developed in-house and the Argus X-8 system, a partial instructions. concordance study between the two assays was performed. The remaining loci were amplified in a single multiplex Genotype incompatibilities at STR loci between samples reaction using primers previously described by Hundertmark typed with different PCR primers are indeed possible, due et al. (DXS10148) [4], Hering et al. (DXS10079) [3], and to primer binding site mutations [22], and were previously Edelmann et al. (DXS10146) [14]; for locus DXS10103, the described also for X-STRs [13]. In this case, full genotype n ea e 21)124:287 (2010) Med Legal J Int Table 1 Allele frequencies of X-STR loci in northwestern Algerian population (316 chromosomes) and P values for HWE (standard error ± 0.001)

Allele DXS10148 DXS10135 DXS8378 DXS7132 DXS10074 DXS10079 DXS6800 DXS6801 DXS6809 DXS6789 DXS7424 DXS101 GATA172D05 DXS10103 HPRTB DXS10101 DXS8377 DXS1046 DXS10134 DXS7423 DXS10011

5 .006 6 .184 7 .041 .006 8 .193 .193 9 .009 .032 .013 .101 .013 10 .335 .016 .054 .006 .253 .013 11 .345 .032 .006 .519 .016 .184 .117 a 12 .003 – 294 12 .275 .111 .009 .250 .032 .073 .373 12.1 .006 13 .028 .301 .022 .136 .101 .269 .038 14 .022 .006 .380 .038 .003 .028 .009 .146 .003 .003 .146 .332 15 .006 .139 .079 .038 .003 .111 .285 .009 .009 .066 .421 16 .003 .038 .149 .016 .313 .032 .291 .111 .193 16.1 .003 16.2 .003 17 .038 .016 .209 .063 .044 .025 .101 .006 .089 .016 17.1 .022 17.3 .003 18 .149 .063 .130 .180 .165 .019 .098 .190 .003 18.1 .006 18.2 .006 18.3 .006 .367 19 .025 .092 .057 .294 .041 .067 .415 19.1 .025 19.3 .019 20 .019 .047 .009 .231 .032 .329 .003 .022 .146 20.1 .028 21 .003 .089 .098 .073 .168 .054 .025 .003 21.1 .006 .019 22 .006 .054 .044 .184 .057 .006 22.1 .019 .022 23 .041 .054 .006 .003 .095 .060 .003 23.1 .028 .038 24 .003 .089 .003 .006 .161 .009 24.1 .108 .006 24.2 .016 25 .003 .054 .168 .003 .044 25.1 .123 .009 25.2 .003 26 .038 .139 .006 .111 .003 26.1 .165 27 .006 .038 .006 .079 .006 .146 .013 27.1 .085 27.2 .028

28 .003 .070 .006 .063 .057 .101 .028 289 28.1 .051 290 Table 1 (continued)

Allele DXS10148 DXS10135 DXS8378 DXS7132 DXS10074 DXS10079 DXS6800 DXS6801 DXS6809 DXS6789 DXS7424 DXS101 GATA172D05 DXS10103 HPRTB DXS10101 DXS8377 DXS1046 DXS10134 DXS7423 DXS10011

28.2 .051 .006 .006 29 .006 .019 .044 .006 .054 .130 .025 29.1 .019 29.2 .133 .028 .025 30 .025 .104 .003 .076 .073 .006 .025 30.1 .006 .003 30.2 .139 .044 31 .009 .139 .079 .051 .019 .038 31.1 .009 31.2 .158 .047 31.3 .003 32 .006 .130 .003 .085 .022 .016 .025 32.1 .003 32.2 .025 .041 33 .019 .253 .044 .016 .025 .047 33.2 .009 .025 34 .009 .180 .019 .013 .111 .060 34.1 .003 34.2 .003 .009 .006 35 .006 .092 .237 .044 35.2 .019 .013 36 .029 .206 .073 36.1 .006 36.2 .003 .003 36.3 .003 37 .003 .009 .003 .161 .079 37.1 .009 37.2 .009 .003 37.3 .006 38 .006 .082 .070 38.1 .013 38.2 .006 38.3 .006 39 .013 .032 .054 39.1 .006 .003 124:287 (2010) Med Legal J Int 39.2 .013 39.3 .009 40 .009 .003 .063 40.1 .003 40.2 .003 .044 40.3 .032 41 .016 .003 .035 41.1 .009 41.2 .016 41.3 .003 .019

42 .019 .028 – 294 42.1 .003 .003 n ea e 21)124:287 (2010) Med Legal J Int Table 1 (continued)

Allele DXS10148 DXS10135 DXS8378 DXS7132 DXS10074 DXS10079 DXS6800 DXS6801 DXS6809 DXS6789 DXS7424 DXS101 GATA172D05 DXS10103 HPRTB DXS10101 DXS8377 DXS1046 DXS10134 DXS7423 DXS10011

42.2 .016 42.3 .019 43 .054 .032 43.2 .057 44 .013 .013 44.2 .022 45 .057 .013 45.2 .016 –

46 .070 .003 294 46.2 .009 47 .117 .006 47.2 .003 48 .130 49 .117 50 .079 51 .117 52 .060 53 .054 54 .028 55 .019 56 .016 57 .003 P .307 .187 .257 .163 .223 .141 .562 .963 .016 .757 .354 .111 .041 .036 .916 .823 .706 .035 .830 .921 .034 a Apparent intermediate allele with an equivalent size to 11.2 repeats due to an AG deletion at bases 48 and 49 downstream from the repeat unit (D48AGdel) 291 292 Int J Legal Med (2010) 124:287–294 concordance was observed for overlapping loci amplified structure that was slightly different from the one reported with different PCR systems. by Hundertmark et al. [4]; as it can be seen in Table 2, one No significant deviation in the allelic distribution of X- out of three of the sequenced alleles 38.1 shows an

STRs between the male and female subsamples was seen additional [AGGA]3 repeat block in between of the by exact test, after Bonferroni correction for multiple [AAGA]x repeat units; moreover, both of the sequenced testing. Allele frequencies for the 21 X-STRs, combined 41.1 alleles showed an A > T substitution in a single repeat over both sexes, are therefore reported in Table 1. Based on unit of the [AAGA]x block. This observation prompted us the observed and expected distribution of genotypes in the to completely resequence at least one sample for each female subsample, all the markers were found to be in allelic variant observed in the hemizygous male subsample. HWE, after Bonferroni correction for multiple testing. As it As shown in Table 2, variability both in the position of the can be seen in Table 1, at locus DXS10148, about 5% of adenine insertion giving rise to intermediate alleles and in the analyzed chromosomes showed the presence of alleles the repeat unit structure could be seen. Moreover, alleles characterized by long repeat motifs (> 36), previously having the same size but different repeat arrays were also undetected in the large German sample described by found. The complex structure found at locus DXS10148 Hundertmark et al. [4]. All the > 36 alleles found in males accounts for the rather large deviations in size (> ± 0.5 bp) were sequenced. Among them, some showed a repeat observed for some of the typed alleles versus the expected

Table 2 Repeat structure of DXS10148 in a subset of alleles sequenced in the Algerian population sample compared with reference structure as described by Hundertmark et al. [4]

Allele Repeat structure Number of sequenced alleles

14 PF-[GGAA]4-[AAAG]6-N8-[AAGG]2-[AAAG]-[AAGG]-N104-PR 1

17 PF-[GGAA]4-[AAGA]7-[AAAG]4-N8-[AAGG]2–N104-PR 1

18 PF-[GGAA]4-[AAGA]8-[AAAG]4-N8-[AAGG]2–N104-PR 2

19 PF-[GGAA]4-[AAGA]9-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 20.1 PF-[GGAA]4-[AAGA]11-A -[AAAG]3-N8-[AAGG]2–N104-PR 1

21 PF-[GGAA]4-[AAGA]11-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 22.1 PF-[GGAA]4-[AAGA]13-A -[AAAG]3-N8-[AAGG]2–N104-PR 2

23 PF-[GGAA]4-[AAGA]11-[AAAG]4-N8-[AAGG]2-[AAAG]-[AAGG]–N104-PR 1 a 23.1 PF-[GGAA]4-[AAGA]12-A -[AAGA]-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 24.1 PF-[GGAA]4-[AAGA]15-A -[AAAG]3-N8-[AAGG]2–N104-PR 1 a 24.1 PF-[GGAA]4-[AAGA]13-A -[AAGA]-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 25.1 PF-[GGAA]4-[AAGA]16-A -[AAAG]3-N8-[AAGG]2–N104-PR 2 a 26.1 PF-[GGAA]4-[AAGA]17-A -[AAAG]3-N8-[AAGG]2–N104-PR 3 a 26.1 PF-[GGAA]4-[AAGA]15-A -[AAGA]-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 27.1 PF-[GGAA]4-[AAGA]18-A -[AAAG]3-N8-[AAGG]2–N104-PR 1

28 PF-[GGAA]4-[AAGA]16-[AAAG]4-N8-[AAGG]2-[AAAG]-[AAGG]-N104-PR 1 a 28.1 PF-[GGAA]4-[AAGA]17-A –[AAGA]-[AAAG]4-N8-[AAGG]2–N104-PR 2 a 28.1 PF-[GGAA]4-[AAGA]19-A -[AAAG]3-N8-[AAGG]2–N104-PR 1

29 PF-[GGAA]4-[AAGA]17-[AAAG]4-N8-[AAGG]2-[AAAG]-[AAGG]-N104-PR 1 a 29.1 PF-[GGAA]4-[AAGA]18-A -[AAGA]-[AAAG]4-N8-[AAGG]2–N104-PR 2 a 31.1 PF-[GGAA]4-[AAGA]20-A -[AAGA]-[AAAG]4-N8–[AAGG]2–N104-PR 1 a 31.1 PF-[GGAA]4-[GGAG]3-A -[AGGA]16-[AGAG]3–[AAAG]-N8-[AAGG]4–N104-PR 1 a 36.1 PF-[GGAA]4-[AAGA]14-A -[AAGA]12-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 37.1 PF-[GGAA]4-[AAGA]13-A -[AAGA]14-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 38.1 PF-[GGAA]4-[AAGA]13-A -[AAGA]15-[AAAG]4-N8-[AAGG]2–N104-PR 2 a 38.1 PF-[GGAA]4-[AAGA]12-A -[AGGA]3-[AAGA]13-[AAAG]4-N8-[AAGG]2–N104-PR 1 a 41.1 PF-[GGAA]4-[AAGA]17-A -[AAGA]9-[TAGA]-[AAGA]4-[AAAG]4-N8-[AAGG]2–N104-PR 2 Reference structure a PF-[GGAA]4-[AAGA]X-A -[AAAG]Y-N8-[AAGG]2–N104-PR

Differences in the position of the adenine insertion and in the repeat unit structure are shown in italics a Insertion giving rise to intermediate alleles Int J Legal Med (2010) 124:287–294 293 amplicon length, based on sequenced control cell lines, as References shown in Table S3. In order to better understand the degree of variability in the molecular structure of DXS10148, 1. Szibor R (2007) X-chromosomal markers, past, present and possibly clarify its evolutionary meaning, and define a future. Forensic Sci Int Genet 1:93–99 consensus nomenclature [23], further collection of frequency 2. Szibor R, Hering S, Kuhlisch E, Plate I, Demberger S, Krawczak distribution and sequencing data in other populations (e.g., M, Edelmann J (2005) Haplotyping of STR cluster DXS6801- DXS6809-DXS6789 on Xq21 provides a powerful tool for sub-Saharan Africans, Asians) are needed. kinship testing. Int J Legal Med 119:363–369 Statistical parameters of forensic interest calculated for 3. Hering S, Augustin C, Edelmann J et al (2006) DXS10079, the 21 X-STR loci are shown in Table S4. DXS10074 and DXS10075 are STRs located within a 280-kb In the male subsample, no significant LD was observed region of Xq12 and provide stable haplotypes useful for complex kinship cases. Int J Legal Med 120:337–345 between pairs of markers located within the six clusters of 4. Hundertmark T, Hering S, Edelmann J, Augustin C, Plate I, Szibor linked loci. The p values of pairwise test of LD, total R (2008) The STR cluster DXS10148–DXS8378–DXS10135 number of observed haplotypes, and the allelic combination provides a powerful tool for X-chromosomal haplotyping at of haplotypes observed in each cluster with frequency n>1 Xp22. Int J Legal Med 122:489–492 5. Schaffner SF (2004) The X chromosome in population genetics. are given in Table S5. Nat Rev Genet 5:43–51 Locus by locus population pairwise genetic distances 6. Li WH, Yi S, Makova K (2002) Male-driven evolution. Curr Opin – (FST) between northwestern Algerians and relevant popu- Genet Dev 12:650 656 lation samples (Angola, Mozambique, Uganda, Ghana, 7. Harris EE, Hey J (1999) X chromosome evidence for ancient – – human histories. Proc Natl Acad Sci USA 96:3320 3324 Italy, Portugal, Spain, Kurdistan, and Pakistan) [10, 24 8. Kong A, Gudbjartsson DF, Sainz J et al (2002) A high-resolution 29] are shown in Table S6. As it can be seen, most of the recombination map of the human genome. Nature Genet 31:241– significant FST values were found in comparison with sub- 247 Saharan African populations. The PCA plot synthesizing 9. Tillmar AO, Mostad P, Egeland T, Lindblom B, Holmlund G, Montelius K (2008) Analysis of linkage and linkage disequilib- the relationship between populations, based on a subset of rium for eight X-STR markers. Forensic Sci Int Genet 3:37–41 four unlinked loci (DXS8378, DXS7132, DXS101, and 10. Robino C, Giolitti A, Gino S, Torre C (2006) Development of two DXS8377) whose allele frequencies were available for each multiplex PCR systems for the analysis of 12 X-chromosomal population sample, is shown in Fig. S1. In the plot, STR loci in a northwestern Italian population sample. Int J Legal Med 120:315–318 Algerians cluster with other Eurasian populations and they 11. Becker D, Rodig H, Augustin C (2008) Population genetic are clearly separated from sub-Saharan Africans. These evaluation of eight X-chromosomal short tandem repeat loci using observations are in agreement with a previous study of X- Mentype Argus X-8 PCR amplification kit. Forensic Sci Int Genet chromosomal single-nucleotide polymorphisms suggesting 2:69–74 12. Miller SA, Dykes DD, Polesky HF (1988) A simple salting out a high overall genetic homogeneity for the X chromosome procedure for extracting DNA from human nucleated cells. in the Mediterranean populations [30]. Nucleic Acids Res 16:1215 The obtained results provide the forensic genetics 13. Robino C, Inturri S, Varacalli S, Piccinini A, Gino S, Torre C community with a detailed database of X-STR allele and (2008) Molecular characterization of a null allele at locus DXS8378. Forensic Sci Int: Genet Suppl Ser 1:160–161 haplotype diversity in northern Africa, to be used in 14. Edelmann J, Hering S, Augustin C, Szibor R (2008) Character- deficiency paternity cases and complex kinship testing. isation of the STR markers DXS10146, DXS10134 and However, since precise information regarding linkage and DXS10147 located within a 79.1 kb region at Xq28. Forensic linkage disequilibrium status of X-linked markers must be Sci Int Genet 2:41–46 15. Szibor R, Hering S, Edelmann J (2006) A new web site compiling taken in account in likelihood calculations, further studies forensic chromosome X research is now online. Int J Legal Med both at family and population level are still required [9]. 120:252–254 In the future, the collected data may also prove useful 16. Excoffier L, Laval G, Schneider S (2005) Arlequin ver. 3.0: an in the population genetics field. The simultaneous integrated software package for population genetics data analysis. Evol Bioinform Online 1:47–50 analysis of many independent X-STR haplotypes can 17. Nei M, Roychoudhury AK (1974) Sampling variances of indeed complement phylogenetic data from mitochondrial heterozygosity and genetic distance. Genetics 76:379–390 DNA (mtDNA) and Y chromosome studies [31]. More- 18. Botstein D, White RL, Skolnick M, Davis RW (1980) Construc- over, due to a larger effective population size compared tion of a genetic linkage map in man using restriction fragment length polymorphisms. Am J Hum Genet 32:314–331 with mtDNA and the Y chromosome, analysis of X- 19. Desmarais D, Zhong Y, Chakraborty R, Perreault C, Busque L chromosomal variability potentially allows to investigate (1998) Development of a highly polymorphic STR marker for events in human genetic history much older than those identity testing purposes at the human androgen receptor gene described by haploid markers [32]. (HUMARA). J Forensic Sci 43:1046–1049 20. Krüger J, Fuhrmann W, Lichte KH, Steffens C (1968) Zur Verwendung der sauren Erythrocytenphosphatase bei der Vater- Acknowledgements The continuing support of the Compagnia di schaftsbegutachtung. Dtsch Z Gesamte Gerichtl Med 64:127– San Paolo to C. Torre's laboratory is gratefully acknowledged. 146 294 Int J Legal Med (2010) 124:287–294

21. Kishida T, Tamaki Y (1997) Japanese population data on X- 27. Aler M, Sánchez-Diz P, Gomes I et al (2007) Genetic data of 10 chromosomal STR locus AR. Nippon Hoigaku Zasshi 51:376–379 X-STRs in a Spanish population sample. Forensic Sci Int 173: 22. Clayton TM, Hill SM, Denton LA, Watson SK, Urquhart AJ 193–196 (2004) Primer binding site mutations affecting the typing of STR 28. Tariq MA, Ullah O, Riazuddin SA, Riazuddin S (2008) Allele loci contained within the AMPFlSTR SGM Plus kit. Forensic Sci frequency distribution of 13 X-chromosomal STR loci in Int 139:255–259 Pakistani population. Int J Legal Med 122:525–528 23. Bär W, Brinkmann B, Budowle B et al (1997) DNA recommen- 29. Tariq MA, Sabir MF, Riazuddin SA, Riazuddin S (2009) dations. Further report of the DNA Commission of the ISFH Haplotype analysis of two X-chromosome STR clusters in the regarding the use of short tandem repeat systems. International Pakistani population. Int J Legal Med 123:85–87 Society for Forensic Haemogenetics. Int J Legal Med 110:175– 30. Tomas C, Sanchez JJ, Barbaro A, Brandt-Casadevall C, Hernandez 176 A, Ben Dhiab M, Ramon M, Morling N (2008) X-chromosome SNP 24. Gomes I, Alves C, Maxzud K et al (2007) Analysis of 10 XSTRs analyses in 11 human Mediterranean populations show a high overall in three African populations. Forensic Sci Int Genet 1:208–211 genetic homogeneity except in North-west Africans (Moroccans). 25. Poetsch M, El-Mostaqim D, Tschentscher F, Browne EN, BMC Evol Biol 8:75 Timmann C, Horstmann RD, Von Wurmb-Schwark N (2009) 31. Santos-Lopes SS, Pereira RW, Wilson IJ, Pena SD (2007) A Allele frequencies of 11 X-chromosomal loci in a population worldwide phylogeography for the human X chromosome. PLoS sample from Ghana. Int J Legal Med 123:81–83 ONE 2:e557 26. Pereira R, Gomes I, Amorim A, Gusmao L (2007) Genetic 32. Yotova V, Lefebvre JF, Kohany O et al (2007) Tracing genetic diversity of 10 X chromosome STRs in northern Portugal. Int J history of modern humans using X-chromosome lineages. Hum Legal Med 121:192–197 Genet 122:431–443

Partie II : Etude des marqueurs polymorphes de l’ADN mitochondrial et du chromosome Y dans la population nord-ouest algérienne

Cette partie a fait l’objet d’un article publié dans la revue scientifique en ligne:

PloS one, Impact Factor (2012) = 3.73

Bekada A., Fregel R., Cabrera V. M., Larruga J. M., Pestano J., Benhamamouch S., González A. M. (2013). Introducing the Algerian mitochondrial DNA and Y- chromosome profiles into the North African landscape. PloS one, 8(2), e56775. doi:10.1371/journal.pone.0056775

Introducing the Algerian Mitochondrial DNA and Y- Chromosome Profiles into the North African Landscape

Asmahan Bekada1, Rosa Fregel2,3,4, Vicente M. Cabrera2, Jose´ M. Larruga2, Jose´ Pestano3,4, Soraya Benhamamouch1, Ana M. Gonza´lez2* 1 Department of Biotechnology, Faculty of Sciences, University of Oran, Oran, Algeria, 2 Department of Genetics, Faculty of Biology, University of La Laguna, La Laguna, Tenerife, Spain, 3 Department of Genetics, Faculty of Medicine, University of Las Palmas de Gran Canaria, Las Palmas de Gran Canaria, Gran Canaria, Spain, 4 Forensic Genetics Laboratory, Institute of Legal Medicine of Las Palmas, Las Palmas de Gran Canaria, Gran Canaria, Spain

Abstract North Africa is considered a distinct geographic and ethnic entity within Africa. Although modern humans originated in this Continent, studies of mitochondrial DNA (mtDNA) and Y-chromosome genealogical markers provide evidence that the North African gene pool has been shaped by the back-migration of several Eurasian lineages in Paleolithic and Neolithic times. More recent influences from sub-Saharan Africa and Mediterranean Europe are also evident. The presence of East- West and North-South haplogroup frequency gradients strongly reinforces the genetic complexity of this region. However, this genetic scenario is beset with a notable gap, which is the lack of consistent information for Algeria, the largest country in the Maghreb. To fill this gap, we analyzed a sample of 240 unrelated subjects from a northwest Algeria cosmopolitan population using mtDNA sequences and Y-chromosome biallelic polymorphisms, focusing on the fine dissection of haplogroups E and R, which are the most prevalent in North Africa and Europe respectively. The Eurasian component in Algeria reached 80% for mtDNA and 90% for Y-chromosome. However, within them, the North African genetic component for mtDNA (U6 and M1; 20%) is significantly smaller than the paternal (E-M81 and E-V65; 70%). The unexpected presence of the European-derived Y-chromosome lineages R-M412, R-S116, R-U152 and R-M529 in Algeria and the rest of the Maghreb could be the counterparts of the mtDNA H1, H3 and V subgroups, pointing to direct maritime contacts between the European and North African sides of the western Mediterranean. Female influx of sub-Saharan Africans into Algeria (20%) is also significantly greater than the male (10%). In spite of these sexual asymmetries, the Algerian uniparental profiles faithfully correlate between each other and with the geography.

Citation: Bekada A, Fregel R, Cabrera VM, Larruga JM, Pestano J, et al. (2013) Introducing the Algerian Mitochondrial DNA and Y-Chromosome Profiles into the North African Landscape. PLoS ONE 8(2): e56775. doi:10.1371/journal.pone.0056775 Editor: Luı´sa Maria Sousa Mesquita Pereira, IPATIMUP (Institute of Molecular Pathology and Immunology of the University of Porto), Portugal Received August 20, 2012; Accepted January 15, 2013; Published February 19, 2013 Copyright: ß 2013 Bekada et al. This is an open-access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited. Funding: This research was supported by Grant no. CGL2010–16195 from the Spanish Ministerio de Ciencia e Innovacio´n to AMG and JML, by grant ‘‘Ayuda para el mantenimiento de grupos de investigacio´n consolidados 2012’’ from the University of La Laguna to AMG, and by Algerian grant to BA ‘‘programme boursier de formation a` l’e´tranger au titre de l’anne´e universitaire 2010–2011 pour la cate´gorie PNE.’’ The funders had no role in study design, data collection and analysis, decision to publish, or preparation of the manuscript. Competing Interests: The authors have declared that no competing interests exist. * E-mail: [email protected]

Introduction and Romans, who left their cultural influences with only minor demic impact on the Berber population [3]. However, the Berber On geographic, archaeological and historical grounds, North- language was not seriously threatened until the Islamic Arabs west Africa is considered a distinct spatial-temporal entity [1]. The expanded their religion and culture to the Maghreb, since the end core of this region comprises Morocco, Algeria and Tunisia, but of the 7th century onwards [4]. Widely superseded by Arabic, sometimes also includes Libya and Mauritania. The region was Berber dialects are today confined to the more mountainous and known as Africa Minor by the ancients and as the Maghreb by the desert rural areas of the region. Arabs, the far western region of their Empire. From the Middle Population genetic studies, mainly those using the non- Paleolithic on, while the Neanderthals occupied Europe and recombining Y-chromosome and mitochondrial DNA (mtDNA) Western Asia, anatomically modern humans with their Aterian uniparental polymorphisms, have provided insight into not only industry already flourished in the Maghreb. After a prolonged the structure and relationships among North African and hiatus but still in Paleolithic times, a new backed bladelet industry, neighboring populations but also the most probable origin and named , replaced the Aterian in this area [2]. A date of past immigrations and expansions of several informative wet period beginning around 9,000 years ago brought Saharan lineages in the area. From the beginning, a prominent mtDNA and Mediterranean Neolithic influences to the autochthonous Euroasiatic genetic component was observed in the Northern Capsian Epipaleolithic. It seems that since that time Berber areas occupied by Morocco [5] and Egypt [6], with gradual sub- Afroasiatic dialects gave some cultural homogeneity to the Saharan African influences moving southwards to the Western anthropologically diverse populations of the Maghreb [3]. In Sahara and Mauritania, or to Nubia and the Sudan respectively. historical times, North Africa was affected by the expansion of Populations from the Sahel belt and the Chad basin almost several Mediterranean civilizations, particularly the Phoenicians certainly played an important role in this sub-Saharan-North

PLOS ONE | www.plosone.org 1 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

African connection [7–9]. Comparisons between North African increased the phylogeographic differentiation between Europe and and Mediterranean Europe maternal and paternal gene pools [10– North Africa. Furthermore, in order to obtain more accurate 13] reveal sharp discontinuities and limited gene flow between comparisons, we extended these Y-chromosome fine resolution both areas. Furthermore, Berbers constitute a very heterogeneous analyses of haplogroups E1b (M78) and R1b (M343) to published group showing significant differences even between geographically samples of Iberians and Moroccans [46], Saharawi and Maur- close communities [14–20]. However, an unexpected lack of itanians [47] and Tunisians [15]. This uniparental genetic differentiation between Berber and Arab speaking communities information has been used to integrate Algeria into the overall was found [15,21–23]. North African genetic landscape. These results suggest that the Arabization phenomenon was mainly an acculturation process of the indigenous Berber Materials and Methods population. However, the significantly higher presence of the prominently Arab Y-chromosome J-M267 haplogroup in cosmo- Samples politan compared to rural samples pointed to a substantial male- Blood samples were anonymously obtained from a total of 240 biased Arab influence in North Africa and the Levant [11,15,16], unrelated healthy adult residents in northwest Algeria (Oran area) although it is probable that the diffusion of Islam only reinforced after informed written consent. This study was approved by the previous human displacements [24,25]. Interestingly, wide geo- research ethics committee of the University of La Laguna. DNA graphical longitudinal gradients are detectable overlying local was extracted using the standard salting-out method [48]. For Y- microstructure in North Africa for several uniparental markers Chromosome analysis, DNA from previous surveys were used for [15,17,26,27]. Some of these lineages, such as the mtDNA fine resolution analyses of haplogroups E1b (M78): 26 samples haplogroups U6 [28–30], M1 [29,31,32] and X1 [33] had their from Iberians and Moroccans [46], 6 from Algerians [44], and 4 ancestral roots in the Middle East but expanded in North Africa from Tunisians, and for R1b (M343): 361 samples from Iberians since Paleolithic times with instances of secondary dispersion in and Moroccans [46], 13 from Saharawi and Mauritanians [47], 12 this area. Others, like sub-haplogroup U5b1b [34], sub-hap- from Algerians [44], and 2 from Tunisians. logroups H1 and H3 [20,35,36] and haplogroup V [37] seem to have reached North Africa from Iberia in a post-last glacial Mitochondrial DNA analysis maximum expansion. In concordance, an ancient DNA study Mitochondrial DNA (mtDNA) sequence analysis was performed from Ibero-Maurusian bone remains from Taforalt in Morocco on the regulatory hypervariable segment I region (HVS-1). detected the presence of haplogroups U6, V, T and probably H, Haplogroup diagnostic mutations were analyzed using PCR- pointing to a Paleolithic genetic continuity in Northwest Africa RFLPs and/or SNaPshot multiplex reactions [49,50]. HVS-1 [38]. Additionally, male lineages also provide support to a mtDNA segments were PCR amplified using primers pairs Paleolithic Asia to Africa back migration [39] with Holocene L15840/H16401 as previously described [51]. Successfully am- trans-Saharan spreads as testified by the haplogroup R-V88 plified products were sequenced for both complementary strands TM distribution [40]. Other lineages, E-M81 [26] and E- M78 [41], using the DYEnamic ET Dye Terminator Kit (Amersham TM seem to be of North African origin with Paleolithic and Neolithic Biosciences), and samples were run on MegaBACE 1000 expansions that reached surrounding areas. The presence of these (Amersham Biosciences) according to the manufacturer’s protocol. clades in southwestern Europe has been attributed to trans- To refine the haplogroup assignation made on the basis of HVS-1 Mediterranean contacts without involving the Levant [41,42]. sequences, 16 SNPs were analyzed on 93 chosen samples (See The impressive genetic information gathered from North Africa Supplementary Table S1). is beset with a notable gap, the lack of consistent information for Samples belonging to haplogroup H were assorted into H the Algerian populations. Algeria is the largest country of the subgroups (H1–H15 subhaplogroups) using two SNaPshot multi- Maghreb and, in fact, the largest country of the whole continent. plex reactions as described by Quinta´ns et al. [49] and Grignani et Although at mtDNA sequencing level the first North African al. [50]. A selection of 12 SNPs defining common European sample studied was from an Algerian Berber-speaking Mozabite haplogroups were analyzed by an additional SNaPshot multiplex population [43], it resulted to be a very isolated group not reaction as described by Quinta´ns et al. [49]. Further SNP representative of the whole Algerian population. After that, only a analyses were performed on three samples (ALG101, ALG196 and small sample of miscellaneous Algerians has been analyzed [13]. ALG205) by sequencing (Supplementary Table S1), to genotype Similarly, only small samples of Algerian Arabs and Berbers have SNPs 13934; 5999; 6047; 1811; 14070 and 14139, which are been studied with Y-chromosome binary polymorphisms [26]. To diagnostic positions for subhaplogroups U3a; U499; U4; fill in this gap we analyzed a representative cosmopolitan sample U29394979899; U1 and U3, respectively. Fragments comprising from the Oran area of northwestern Algeria. We chose an urban these positions were PCR amplified and sequenced as previously area because urban populations give more representative infor- described [52]. mation than rural, often isolated, localities [15]. In addition, Oran is considered the second largest city in Algeria and lies near Siga, Haplotype classification one of the main cities of the largest Algerian Berber kingdoms in RFLP analyses and subhaplogroup H nomenclature were as in classical times [3]. In this study we characterized 240 maternally Loogva¨li et al. [53] and Roostalu et al. [54]. Classification into unrelated Algerians from this area by mtDNA HVS-1 region other sub-haplogroups was performed, whenever possible, using sequencing and haplogroup diagnostic coding positions by RFLP the updated (mtDNA tree Build 15; 30-9-2012) nomenclature and SNaPshot multiplexing in order to obtain their maternal proposed by van Oven and Kayser [55]. profiles. The male sub-set of this sample (102 paternally unrelated males) was previously analyzed for Y-chromosomal binary Y-Chromosome analysis markers and short tandem repeat haplotypes [44]. However, in For updated subdivision of haplogroup E we amplified and the present study, this male sample was further genotyped for the analyzed SNPs V12, V13, V22, V32 and V65 as specified by recently described informative Y-chromosome polymorphisms Cruciani et al. [41,56]. For updated subdivision of haplogroup R, within haplogroups E [41] and R [45] whose subdivision has SNP V88 was amplified and analyzed as in Cruciani et al. [40]

PLOS ONE | www.plosone.org 2 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria and SNPs L11, L23, M412, M529, S116, U106 and U152 as in comparisons of partial sequences with other published data. Myres et al. [45]. Samples typed for these markers are detailed in Genetic variation for both uniparental markers was apportioned Figure 1. Haplogroups were formally designated according to within and among geographic regions using AMOVA by means of Karafet et al. [57], and refined following the International Society Arlequin software version 3.5 [60]. Populations from the North of Genetic Genealogy website (http://www.isogg.org/tree/). and South sides of the Mediterranean Basin were considered in However, for markers subdividing E-M78 and R-M343 the assessing the maternal and paternal genetic structure of the North nomenclature proposed by Cruciani et al. [41,56] and Myres et al. West Algerian population. ‘North Africa’ included samples from [45], respectively, were used. To abbreviate, haplogroups were Egypt, Libya, Tunisia, Morocco, Mauritania and , named only by their first letter and terminal marker throughout and ‘South Europe’ included Spain, Portugal, France, Corsica, the text. Italy, Sicily, Sardinia, Balkans and Crete. For more extended geographic comparisons the following areas were taken into Statistical analyses account: the Caucasus, the Arabian Peninsula (including Saudi In addition to our samples, a total of 18050 mtDNA HVS-1 Arabia, Kuwait, UAE, Yemen, Oman and Dubai), Levant sequences from the Mediterranean basin (12675), Middle East (containing samples from Jordan, Palestine, Syria, and Lebanon), (4106) and Caucasus (1269) and a total of 19343 Y-chromosome Turkey, and Iran, as detailed in Supplementary Tables S2 to S5 samples from the same areas (11314, 4448, 3581, respectively) for mtDNA and S6 and S7 for Y-chromosome. were included in the statistical analyses. To overcome micro- Pairwise FST distances between populations were calculated differentiation effects, samples were collapsed into larger areas or from mtDNA and Y-chromosome haplogroup frequencies, and whole countries. In order to keep the highest SNP phylogenetic their significance assessed by a nonparametric permutation test as resolution for the Y-chromosome analysis, sub-haplogroup subdi- implemented in the Arlequin program [60]. Principal component visions in total samples were, sometimes, extrapolated from partial analyses (PCA) were obtained with IBM SPSS Statistic 19 version samples of the same area in which these sub-haplogroups were (SPSS Inc., Chicago, Illinois). typed [58]. However, when this was not possible, frequencies from Phylogenetic relationships among mtDNA HVS-1 sequences of different markers were aggregated and named by the haplogroup subhaplogroup M1 were established using the reduced median most ancestral marker. network algorithm [61]. Haplogroup diversities (h) were calculated according to Nei [59]. For the mtDNA H haplogroup dissection analysis, only HVS-1 positions from 16024 to 16365 were used for genetic

Figure 1. Simplified phylogenetic trees for Y-chromosome sub-haplogroups. A) E-M78 and B) M-R343. doi:10.1371/journal.pone.0056775.g001

PLOS ONE | www.plosone.org 3 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

Results decreasing gradients observed for these lineages, reaching statistical significance in the cases of H1 (r = 20.93; p = 0.008) Algerian mtDNA profile and HV0 (r = 20.83; p = 0.043). Nevertheless, U5b1b haplotypes Pairwise comparisons between our Algerian sample and two have not been found in Algeria yet, although this is a rare lineage ones published previously [13,43] show that the three are in North Africa with its highest peak (6.2%) in the W. Saharan- heterogeneous in their haplogroup frequencies (Table 1). Moza- Mauritanian region (Supplementary Table S2). Neither have we bites are the most differentiated with a p,0.001 value in both detected any representative of haplogroup U5b3, which expanded comparisons, whereas the Oran-miscellaneous Algerian pair is in Italy in Epipaleolithic times reaching nearby Mediterranean only significantly different at p,0.05 level. A detailed inspection of coasts [71]. However, a peculiar U5 haplotype (192 224 261 270) their haplogroup profiles compared to those of surrounding belonging to the U5b2b3 cluster [72] was observed. Until now, it populations (Supplementary Table S2) shows that Mozabites has only exact matches with Hungarians [73,74] and Romani present a high excess of U3 and U6a19293 haplotypes whereas the from Bulgaria [75]. Regarding the sub-Saharan African compo- miscellaneous sample lacks HV0 representatives and has an nent, Algeria (20%) is at the same level as Morocco (20.4%) and outstanding excess of J/J1c/J2, L3e5 and L2a1 lineages. In Egypt (22.9%) but significantly lower (p = 0.003) than Tunisia contrast, Oran frequencies fall within the range expected by its (30.1%) and marginally lower (p = 0.059) than Libya (27.1%). geographic position, presenting only a slight deficit of K* lineages Aside from the widespread haplogroup L2a, the majority (14%) of (p = 0.04) and a notable excess of M1 lineages (p = 0.002), which Algerian L lineages (L1b, L2a1, L2b, L2c, L3b, L3d) are of West could be characteristic of Algeria since it is also shared by the Africa origin. Those from Central Africa (L1c, L3e, L3f) account miscellaneous sample (Supplementary Table S2). For these reasons for an additional 5%, leaving around 1% for those of East African we considered the Oran sample as the best representative of the ancestry (L0, L3*, L4). It has been suggested that these lineages general Algerian pool. However, in spite of their apparent reached North Africa since Holocene times, when climatic differences, the three Algerian samples are joined as a tight cluster amelioration permeated the Saharan desert. However the in a PCA analysis based on haplogroup frequencies (data not historical trans-Saharan slave trade promoted by the Arabs may shown), and for this reason they have been pooled together for have been mainly responsible for their present day incidence large-area comparisons. In addition, Andalusians from Tunisia [9,76]. show closer affinities with Moroccans and Algerians than with The geographic origins and gradients of some of these Tunisians (Figure 2A). In comparison with other Mediterranean haplogroups are graphically reflected in the PCA plot and west Asian samples, the H haplogroup subdivision in the (Figure 2A). The first component clearly separates European Algerian sample shows a typical Maghreb population structure Mediterranean populations from North African. Haplogroups N2, (Supplementary Table S4). Congruently, the most common U2, T2 and I further separate the West Asian samples from western subgroups, H1 (47.8%) and H3 (10.1%), represent 60% European. On the other side, the sub-Saharan African hap- of H lineages. Furthermore, the H1 frequency in Algeria is logroups L3d, L1b, L2a1b9f, L2a1c192, L3b and U6a pull the intermediate between that found in Morocco (51.6%) and Tunisia North African countries to the left, leaving W. Saharan- (29.4%), fitting the eastward-decreasing gradient previously Mauritanian as the most displaced. The second component aligns observed for this subgroup [36]. Thus, for the H haplogroup, Mediterranean countries according to their geographic longitudi- Algerian affinities with the East seem to be weaker than with the nal transect, which continues through West Asia, leaving the West. Subgroups H2a1, H4 and H13a1 account for 42% of H Levant in an intermediate position. Haplogroups H, HV0, T2b, lineages in Egypt but only 6% in Algeria (Supplementary Table and to a lesser degree J2b1 and several U5 subgroups push the S4). In addition, such a characteristic subgroup of the Arabian populations down whereas East African haplogroups such as L3i, Peninsula as H6b (13%) was not found in our Algerian sample. L3x and L2a2 and eastern West-Eurasian haplogroups like N1, Of all North African populations, Eurasian lineages are the R0a and U9 pull them up. most frequent in Algeria (80%) while sub-Saharan Africa origin Pairwise based FST distances between populations were accounts for the remaining 20%. At least two Eurasian lineages, calculated (Supplementary Table S8). Significant mean FST values M1 and U6, had Paleolithic implantation and subsequent were found between our Algerian sample and North African expansions in North Africa, reaching the Sahel and Sudan belts. (0.02360.002), European (0.03660.003) and Middle East It seems that the main focus of distribution of U6 was in the (0.02160.003) populations. Within North Africa, the Algerian Northwest and M1 in the Northeast areas of the Continent [28– lowest genetic distance is observed for Tunisia (FST = 0.016) and 31]. Indeed, the U6 haplogroup frequency is significantly higher in the greatest for Egypt (0.026). Italy (FST = 0.032) and the Balkans Algeria (11.83%) and W. Sahara and Mauritania (11.04%) (FST = 0.032) are the closest areas within the European peninsulas compared to the eastern: Tunisia (5.24%, p,0.0001), Libya while France is the most distant European region (FST = 0.042). (4.08%, p = 0.006) and Egypt (0.77%, p,0.0001). However, the Finally, for the Middle East, the Levant (FST = 0.014) seems to be M1 frequency in Algeria (7.1%) raises an anomalous peak in its the most similar and the Arabian Peninsula (FST = 0.033) the most decreasing gradient from Northeast to Northwest (Supplementary different. In fact, removing the pairwise comparison between Table S2). The rest of the Eurasian lineages in North Africa had a Algeria and Arabia, the mean FST value for the Middle East drops Levantine or Middle Eastern origin and, most probably, had considerably (FST = 0.018+0.001) rising the mean distance of reached Europe and Africa in parallel episodes in which sea-travel Algeria from Europe significantly compared to that from the across the Mediterranean, occurring since Epipaleolithic times, Middle East (p,0.01). played an important role [13,62–66]. However, for some lineages present in North Africa but showing higher frequencies in Western Algerian Y-chromosome profile Europe (for example, H1, H3, HV0 and U5b1b), a direct source in Results for the sub-typing of haplogroups E-M78 and R-M343 the Iberian Peninsula has been put forward, as a result of post in the Iberian Peninsula and Northwest African countries glacial re-expansion [34,35,37,53,67–70]. The observed frequen- including Algeria are presented in Figure 1. In general, data for cies for H1 (47.8%), H3 (10.1%) and HV0 (7.5%) in our Algerian E-M78 agree with the previous analysis [41]. Therefore, the sample lie well within the Northwestern- to Northeastern- African Eurasian E-V13 is the most common sub-group in Iberia,

PLOS ONE | www.plosone.org 4 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

Figure 2. Graphical relationships among the studied populations. PCA plots based on mtDNA (a) and Y-chromosome (b) polymorphism. Codes are as in Supplementary Tables S2 and S6. doi:10.1371/journal.pone.0056775.g002 although one North African E-V65 type has also been detected. For the R-M343 subdivision, the Iberian Peninsula reflects a On the African side, the lack of E-M78 representatives in a total genuine European profile [45] except for the presence of one sample of 189 males from the W. Saharan-Mauritanian area is Sahel R-V88 type. In contrast, all R-M343 detected in W. notable. For the Maghreb countries, the fact that the number of Saharan-Mauritanian belong to sub-group R-V88, reaching a males belonging to para-group E-M78* is the same as those frequency of 7%, similar to those observed in other Sahel samples included in the autochthonous E-V65 group also stands out. [40]. In the Maghreb countries, the frequency of R-V88 drops to around 1%. On the other hand, the presence in this area of

PLOS ONE | www.plosone.org 5 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

Table 1. mtDNA Haplogroup percentage frequencies in the Table 1. Cont. Algerian populations.

Populations Populations Haplogroup miscellaneous [13] NW-Oran1 Mozabites [43] Haplogroup miscellaneous [13] NW-Oran1 Mozabites [43] L2a1b - - 1.18 Sample size 47 240 85 L2a1b9f - 1.25 2.35 H/HV 29.79 30.83 22.35 L2a1c2 - 0.42 - HV1 2.13 - - L2a1(16189) - 0.42 2.35 HV0/HV0a/V - 7.50 8.24 L2b1a - 0.42 - R0a - 1.25 - L2c192 - 2.08 - R* - 0.83 1.18 L1b* 4.26 3.75 - U1a - 0.83 - L1c* - 0.83 - U3b1a - 1.25 10.59 L0f - 0.42 - U4 2.13 1.67 1.18 L0a1 2.13 - - U5* - 0.83 - 1Present study. U5a - 1.67 - doi:10.1371/journal.pone.0056775.t001 U5b5 2.13 - - U6a - 2.50 1.18 representatives of the European sub-groups R-M412, R-S116, R- U6a19293 - 5.00 27.06 U152 and R-M529 points to North-South maritime contacts U6c - 0.83 - across the Mediterranean. U8b/U2c - - 2.35 Supplementary Table S6 presents frequencies of Y-chromo- K* 4.26 1.67 - some haplogroups, as spread out as possible, for the same countries-areas as performed for the mtDNA analysis. Clearly, T - 1.67 - markers E-V65, E-M81 and J1-M267 confirm the geographic and T1a 2.13 3.33 4.71 ethnic identity of Algeria but, while E-M81 represents an T2 - 0.42 - autochthonous group that sharply decreases in Egypt, J1-M267 T2b* 2.13 2.50 - points to a Levantine influence. Haplogroups G-M201, L-M20, T2c - 0.83 - R2-M124, T-M70, J2-M172 and the majority of derived J2 sub- T2h - 0.42 - groups all reflect West Asian influences on Europe with only weak inputs on North Africa. On their part, several European I sub- J/J1c/J2 12.77 2.08 3.53 groups also extend to West Asia with minor gene flow to the J1b2a - 0.42 - African countries. Exceptions to this general pattern are the J2a2a1 - 0.42 - subgroups J2-M67 and R-M412 that have similar frequencies in J2b1 - 0.42 - Algeria as in Europe, and R2-M124 whose frequency in Egypt is I - 0.83 - not significantly different from the mean value of European and W - 1.25 - West Asian areas. These geographic influences are graphically reflected in the PCA analysis (Figure 2B). All the European X 2.13 1.25 - countries are aligned in a diagonal transect running from the M1 12.77 7.08 4.71 Iberian Peninsula to Turkey and the Caucasus, according to their N*/M*/L3* - 0.42 - respective geographic positions, and well separated from the North L3b 2.13 - - African countries. Within North Africa, the Maghreb region L3b(16124!) - 0.42 - appears well differentiated from Egypt, which, reflecting its geographical position, is near to the Levant and the Arabian L3b1a3 - 0.83 3.53 Peninsula. The most influential haplogroups in the first compo- L3b2a - 0.42 - nent separation are: E-M81, E-V65 and R-V88 that pull the L3d* 2.13 1.25 1.18 North African countries together, and J-M172, R-M173, R-M17, L3e1* - 0.42 - R-M124 and R-L23 that pull West Asian countries in the opposite L3e2 - 0.83 2.35 direction. In the second component, haplogroups R-L11, R- L3e5 10.64 0.42 - M529, R-U198, I-M223 and I-M26 are responsible for the spread of the European Mediterranean countries away from Egypt and L3f* - 0.83 - Arabia, which in turn are pulled by J-M267, B-M60, E-V22 and L3f1b* - 1.25 - E-M123. L4b2 - 0.42 - Pairwise based FST distances between populations were L2* - 0.83 - calculated (Supplementary Table S8). The mean FST values L2a - 1.25 - comparing the Algerians with the other North African samples L2a1* 6.38 0.83 - (0.061+0.015), with Europeans (0.197+0.019) and with West Asians (0.159+0.011) also reflects its geographic position. Within L2a1a3 - 0.42 - North Africa, its lowest distance is to W. Sahara-Mauritania (FST = 0.023) and the greatest to Libya (FST = 0.108). Italy

PLOS ONE | www.plosone.org 6 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

Table 2. Geographic components (%) considered in Y-chromosome and mtDNA lineages.

Populations1

component2,3 IP FRC ISS BAL SAM MOR ALG TUN TuAn LIB EGY CAU TUR LEQ IRN ARP

mtDNA EU 56.7 45.9 46.2 24.2 29.8 34.9 29.9 24.6 13.5 28.6 7.9 17.9 11.1 10.2 10.0 3.5 ME 38.1 52.2 51.2 74.5 17.1 31.7 31.4 36.9 21.3 36.8 58.1 80.6 84.0 76.3 85.1 71.4 NA 2.0 0.3 1.3 0.4 11.7 14.7 20.7 10.8 7.7 7.1 9.9 0.4 0.0 2.3 0.4 3.2 EA 0.8 1.0 0.4 0.8 2.1 3.2 1.9 8.0 4.5 6.3 12.4 0.9 3.8 4.1 4.0 12.6 WA 2.4 0.6 1.0 0.3 39.3 15.5 16.1 19.8 18.7 21.2 11.6 0.1 1.0 7.2 0.4 9.1 chrom Y EU 75.3 79.0 55.4 58.8 0.0 3.9 10.3 1.7 - 2.4 3.5 21.5 19.9 19.5 13.3 5.2 ME 16.2 18.7 36.3 39.1 13.8 9.4 29.5 23.5 - 2.4 46.2 77.7 72.3 58.5 80.0 76.4 NA 5.8 0.8 4.4 0.9 55.6 73.9 50.0 68.9 - 50.6 33.0 0.4 1.3 9.6 3.5 3.1 EA 1.8 1.4 3.1 1.2 11.6 5.8 1.9 3.0 - 0.0 11.4 0.5 5.9 6.0 1.4 9.4 WA 0.9 0.1 0.8 0.0 19.1 7.0 8.3 3.0 - 44.6 5.9 0.0 0.6 6.4 1.8 6.0

1IP = Iberian Peninsula; FRC = France+Corsica; ISS = Italy+Sardinia+Sicily; BAL = Balkans+Creta; SAM = Sahara+Mauritania; MOR = Morocco; ALG = Algeria; TUN = Tunisia; TuAn = Tunisian Andalusians; LIB = Libya; EGY = Egypt; CAU = Caucasus; TUR = Turkey; LEQ = Levant (Jordan; Syria; Palestine; Lebanon; )+Iraq; IRN+Kurds = Iran; ARP = Arabian Peninsula (Saudi Arabia; Oman; Yemen; United Arab Emirates; Qatar; Dubai; Kuwait). 2EA = East Africa; EU = Europe; ME = Middle East; NA = North Africa; WA = West Africa. 3Haplogroup assigned to each geographic component are detailed in Supplementary Table S9. doi:10.1371/journal.pone.0056775.t002

(FST = 0.155) is the closest of the European peninsulas and Iberia Table S6). However, E-M81 frequencies in Algeria (44.2%) are the most distant (FST = 0.247), while for West Asia, the Levant still significantly higher (p,0.0001) than in Egypt (11.9%). These (FST = 0.128) is the most similar area to Algeria and the Caucasus results confirm that for both uniparental markers, Egypt and to a the most different (FST = 0.194). lesser extent Libya stand out sharply from the Maghreb [16,27]. Based on genome-wide genetic analysis, up to five differentiated Y-chromosome haplogroup J-M267 frequency is also the genetic components (Maghreb, Near East, Europe, and west and highest in Algeria. The presence of this clear Middle Eastern east sub-Saharan Africa) were recently detected in the ancestry of haplogroup in other areas has been attributed to prehistoric North African populations [77]. Based on phylogeographic and spreads [25,79] and to the historic Islamic rule [15]. The localized relative gene diversity levels [78], we also tentatively decomposed distribution of the two most common haplotypes found in Y-chromosome (Supplementary Table S9) and mtDNA (Supple- Algerians belonging to J1-M267 [44] points to an ancient mentary Table S9) polymorphisms into the same five components implantation of this cluster in the country. However, the notable (Table 2). incidence of J2-M67 is most probably due to Aegean contacts [79,80]. Discussion The unexpected presence of the European male lineages R- Strong microdifferentiation has been detected for both unipa- M412, R-S116, R-U152 and R-M529 in the Mahgreb could be rental markers in Tunisia [15]. It seems to be also the case for the the male counterpart of the maternal gene flow signaled by the Algerian mtDNA pattern as the three samples compared here mtDNA haplogroups H1, H3 and HV0. In fact, there are several showed significant differences among them. However, in spite of haplogroups with clear geographical origins from European or these differences, samples from the same country usually cluster North African sides of the Mediterranean, but also present on the together. A notable exception, for mtDNA, is the case of opposite side. This could be used to estimate the respective levels Andalusian from Tunisia that clustered with Moroccan samples. of gene flow between areas, assuming that their present day The presence in Algeria of a rare U5b2b3 haplotype, of Eastern frequencies in the source countries were the same when they Europe adscription, could be explained as result of the Ottoman spread to the other Mediterranean shore. Thus, mean frequency influence. Although Algeria and W. Sahara-Mauritania show the values for the native North African male clusters E-M81 and E- highest frequencies for mtDNA haplogroup U6 in the Maghreb, V65 in the Maghreb (Morocco, Algeria, Tunisia, Libya), are division into subgroups reveals that whereas the majority of U6 40.03611.66 and 3.4060.60 respectively. The mean values for haplotypes in W. Sahara-Mauritania (7.6%) are included in the the same markers in western-central Mediterranean Europe ancestral cluster U6a, the bulk in Algeria (9.4%) belongs to derived (Iberian Peninsula, France and Corsica, Italy, Sardinia and Sicily) subgroups U6a19293 (Supplementary Table S2). Similarly, al- are 1.8661.28 and 0.2660.8 respectively. Taken together, these though Algeria (7.3%) and Egypt (8.5%) present the highest values would suggest around 5% male Maghreb input in frequencies of the North African haplogroup M1, subdivision of Mediterranean Europe. In turn, E-V13, R-M412, R-S116, and this cluster shows clear phylogeographic differences; whereas 6.4% R-U152 could be used to infer the male European input in the of the Egyptian lineages belong to the East African cluster M1a1, Maghreb, giving a value around 8%. Applying the same none M1a1 was found in the Algerian sample (Figure 3). These reasoning, mtDNA U6 and M1 frequencies on the European side patterns are congruent with the existence of different origin of would indicate the maternal gene flow from the Maghreb, the geographic spread for both haplogroups in the Maghreb and East estimated value being around 10%. However, when we tried to Africa [28,31]. Contrastingly, for the Y-chromosome North calculate the European maternal input into the Maghreb using the African autochthonous lineages E-V65 and E-M81, Algeria shows H1, H3 and HV0 haplogroups, we realized that their respective the lowest frequencies of all Maghreb countries (Supplementary mean frequencies in Mediterranean Europe (38.33+4.31,

PLOS ONE | www.plosone.org 7 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

Figure 3. Reduced median network relating HVS-1 sequences of subhaplogroup M1. The central motif (haplotype HT1) differs from rCRS [90,91] at position 16129 16189 16223 16249 16311. Population codes as in Supplementary Table S2. Numbers along links refer to nucleotide positions minus 16000; suffix indicates a transversion. Black circles correspond to haplotypes observed in Algeria, whereas grey triangles pentagons correspond to lineages found in Egypt. Haplotype observed both in Algeria and Egypt are indicated using a black triangle. Grey circles indicate haplotypes observed in other geographical regions. Size of boxes is proportional to the number of individuals included. HT1 = 13 ALG, 17 ARP, 2 BAL, 8 EGY, 5 IP, 5 ISS, 2 LIB, 18 MOR, 13 TUN, TuAn; HT2 = 6 ALG, ARP, BAL, IRN, LEQ, 2 LIB, 3 MOR, SAM, 2 TUN; HT3 = 2 ALG, ARP, LEQ, 2 MOR; HT4 = 3 ALG, 2 EGY, 3 IP, 2MOR; HT5 = 14 ARP, 3 BAL, 3 CAU, 10 EGY, 4 IP, IRN, 7 ISS, 4 LEQ, 2 LIB, 6 MOR; HT6 = ARP, 16 EGY. doi:10.1371/journal.pone.0056775.g003

17.27+3.57 and 5.23+1.06) are within the same range as those distances between Algeria and Europe and nearly 8 times higher found in the Maghreb (42.05+4.92, 13.1+3.51 and 6.99+0.90). when involving Middle East populations. Gender specific demo- This would imply a 100% European contribution to the maternal graphic features were used to explain these differences [15]. There pool of the Maghreb. The fact that the three markers show similar are also differences in male and female affinities between frequencies on both sides rules out stochastic processes as a populations. Thus, Tunisia is the most related to Algeria at possible explanation, but further analyses, based on complete mtDNA level but W. Sahara-Mauritania is the closest when using mtDNA sequences, are mandatory to investigate alternative Y-chromosome. Moreover, France is the most distant population scenarios. from Algeria based on mtDNA but Iberia is the furthest when Genetic and geographic distances faithfully correlate for both based on Y-chromosome. Finally, in the Middle East, Saudi uniparental markers (Figure 2), indicating populations from both Arabia is the less related population when comparing maternal sides of the Mediterranean remained apart until meeting in the profiles, but from the paternal view, the most distant area is the Levant. This similarity allowed us to confront the main maternal Caucasus. There are also coincidences; Italy is the closest and paternal discriminating contributors to the PCAs spatial European country to Algeria using both uniparental markers. distribution. Some equivalences are expected such as mtDNA U6a Again, similarities and differences are apparent between both and Y-chromosome E-M81 and E-V65 affecting Maghreb uniparental markers when differentiated genetic components of countries, and that the West African mtDNA L clades and Y- Maghreb, Near East, Europe, and west and east sub-Saharan chromosome R-V88 pulls W. Saharan-Mauritanian further over, Africa are taking into account. For the sub-Saharan East African or that the Mediterranean Europe distribution is largely deter- component, Arabia and Egypt harbor the highest frequencies for mined by mtDNA and Y-chromosome lineages with origins and/ both Y-chromosome and mtDNA. However, in the Maghreb, W. or dispersions within Europe. However, these coincidences only Sahara-Mauritania accumulates the maximum male eastern reflect present-day frequencies, not common past histories. contribution and Tunisia the female one. Comparing the sub- Furthermore, in spite of the similarities, differences among male Saharan West African component, the correspondence between populations are significantly greater than among the female. For male and female inputs is perfect; Iberia and Italy show the highest instance, the mean FST distance between Algeria and other influences in Europe, W. Sahara-Mauritania and Libya in North Maghreb countries for Y-chromosome (0.061) is nearly three times Africa and the Levant and Arabia in the Middle East. For the higher than for mtDNA (0.023), 5 times higher when based on European component, Iberia, France and Italy have the greatest

PLOS ONE | www.plosone.org 8 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria representation in both uniparental markers, and for the Middle also Luis et al. [88]. From mtDNA [28–31] and wide genome East it is the Caucasus. Nevertheless, in the Maghreb, the analysis [77] the signals of Paleolithic influences are however European mtDNA contribution in Morocco is the largest whereas evident. As the time to the most recent common ancestor through Y-chromosome influence peaks in Algeria. Finally, the Middle mtDNA is higher than that of the Y-chromosome [89], sex-specific East component shows congruent values for both markers, the demographic processes are probably the main factor behind this Balkans is the region with the greatest Middle East component in difference. A view reconciling the two perspectives would be that Europe; Egypt has the greatest in North Africa and Iran in the male lineages are better suited for detecting more recent human Middle East. A big study concerning Y-chromosome in Iran has expansions whereas the ramifications of mtDNA genealogies been published after this analysis was carried out [81], however extend to Paleolithic times and beyond. haplogroup frequencies for both sets of Iranian samples are rather similar, and we do not think its inclusion would modify largely our Supporting Information conclusions. Recently, it has been reported that the sub-Saharan African Table S1 HVS-1 sequences, SNPs and RFLPs analysis gene flow to Tunisia shows a strong sex bias, involving a results for the North-west Algerian population (N = 240). significantly larger female contribution (p,0.0001) [15]. The (XLS) same tendency holds for all North African populations except Table S2 mtDNA Haplogroup frequencies (%) in the Libya, which could be attributed to insufficient sampling [19]. studied populations. However, significance levels are more moderate in all instances; (XLS) for example, probability values in Algeria (0.025) or in W. Sahara- Mauritania (0.043) are two times lower than for Tunisia. The same Table S3 References of the populations studied in Table sex bias is found in the Middle East, reaching significance in S2. Arabia (p = 0.0005) and in the Caucasus (p = 0.045). In Europe, (XLS) only Italy shows significant differences (p,0.0001) for the gender Table S4 Distribution of H subhaplogroup frequencies contribution of sub-Saharan Africans but contrarily, in this case, (%) in the studied populations. the male input (3.91%) is highest than the female one (1.35%). On (XLS) the basis of uniparental markers [82–84] and massive genomic analysis [77,85], the bulk of the sub-Saharan African gene flow has Table S5 References of the populations studied in Table been attributed to historic events such as Romanization, Islamic S4. role and, even more so, the Arab and Atlantic slave trades. A (XLS) preference for assimilation of females from minority ethnics groups Table S6 Y-chromosome haplogroup frequencies (%) in in patriarchal societies has also been put forward [15,82] to the studied populations. explain the general pattern of sub-Saharan African female (XLS) integration. The case of Italy could be better explained, at least partially, by more ancient sub-Saharan African inputs into Europe Table S7 References of the populations studied in Table than are thought by several authors to have occurred [83,84,86]. S6. However, see Capelli et al. [87] for another point of view. All these (XLS) uniparental peculiarities could be explained supposing: 1, the Table S8 Pairwise linearized FST for mtDNA (above existence of several dispersion foci at different times in western diagonal) and Y-chromosome (below diagonal) hap- Asia, independently influencing the African and European logroups. Mediterranean areas; 2, the spread of independent autochthonous (XLS) lineages in both areas, and 3, bidirectional maritime contacts between areas with minor gene flow. Table S9 MtDNA and Y-chromosome geographic hap- The inclusion of Algeria offers a more complete view of the logroup assignation. North African genetic landscape from maternal and paternal (XLS) perspectives, showing not only spatial gradients for some lineages but also sexual asymmetry in the relative affinities between Author Contributions populations. Perhaps, the strongest sexual discrepancy refers to the Conceived and designed the experiments: AB VMC JML SB AMG. time of the main Middle East and European spreads into North Performed the experiments: AB RF JML JP SB. Analyzed the data: AB Africa, whereas from the Y-chromosome perspective they seem to VMC JML AMG. Contributed reagents/materials/analysis tools: RF JP have occurred since the Neolithic onwards [26,40], although see SB. Wrote the paper: AB VMC JML AMG.

References 1. Newman JL (1995) The peopling of Africa. A geographic interpretation. Yale 6. Krings M, Salem AE, Bauer K, Geisert H, Malek AK, et al. (1999) mtDNA University Press, New Haven and London analysis of Nile River Valley populations: A genetic corridor or a barrier to 2. Wendorf F, Schild R, Close AE, Schwarcz HP, Miller GH, et al. (1994) A migration?. Am J Hum Genet 64:1166–76. chronology for the middle late Pleistocene wet episodes in the eastern Sahara. In: 7. Cerny V, Salas A, Hajek M, Zaloudkova M, Brdicka R (2007) A bidirectional Bar-Yosef O, Kra RS (eds) Late Quaternary Chronology and Paleoclimates of corridor in the Sahel-Sudan belt and the distinctive features of the Chad Basin the Eastern Mediterranean. Journal of Radiocarbon in Association with the populations: a history revealed by the mitochondrial DNA genome. Ann Hum American School of Prehistoric Research, Tucson. pp 147–168 Genet 71:433–52. 3. Brett M, Fentress E (1996) The Berbers. Blackwell Publishers, Oxford 8. Watson E, Forster P, Richards M, Bandelt HJ (1997) Mitochondrial footprints of 4. Murdock GP (1959) Africa: Its peoples and their culture history. McGraw-Hill, human expansions in Africa. Am J Hum Genet 61:691–704. New York 9. Pereira L, Cerny V, Cerezo M, Silva NM, Hajek M, et al. (2010) Linking the 5. Rando JC, Pinto F, Gonzalez AM, Hernandez M, Larruga JM, et al. (1998) sub-Saharan and West Eurasian gene pools: maternal and paternal heritage of Mitochondrial DNA analysis of northwest African populations reveals genetic the Tuareg nomads from the African Sahel. Eur J Hum Genet 18:915–23. exchanges with European, near-eastern, and sub-Saharan populations. Ann 10. Bosch E, Calafell F, Comas D, Oefner PJ, Underhill PA, et al. (2001) High- Hum Genet 62:531–550. resolution analysis of human Y-chromosome variation shows a sharp

PLOS ONE | www.plosone.org 9 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

discontinuity and limited gene flow between northwestern Africa and the Iberian 38. Ke´fi R, Stevanovitch A, Bouzaid E, Be´raud-Colomb E (2005) Diversite´ Peninsula. Am J Hum Genet 68:1019–29. mitochondriale de la population de Taforalt (12.000 ans bp - Maroc): une 11. Capelli C, Redhead N, Romano V, Cali F, Lefranc G, et al. (2006) Population approche ge´ne´tique a` l’e´tude du peuplement de l’Afrique du Nord. Anthro- structure in the Mediterranean basin: a Y chromosome perspective. Ann Hum pologie 43:1–11 Genet 70:207–225. 39. Cruciani F, Santolamazza P, Shen P, Macaulay V, Moral P, et al. (2002) A back 12. Flores C, Maca-Meyer N, Gonzalez AM, Oefner PJ, Shen P, et al. (2004) migration from Asia to sub-Saharan Africa is supported by high-resolution Reduced genetic structure of the Iberian peninsula revealed by Y-chromosome analysis of human Y-chromosome haplotypes. Am J Hum Genet 70:1197–214. analysis: implications for population demography. Eur J Hum Genet 12:855– 40. Cruciani F, Trombetta B, Sellitto D, Massaia A, Destro-Bisol G, et al. (2010) 863. Human Y chromosome haplogroup R-V88: a paternal genetic record of early 13. Plaza S, Calafell F, Helal A, Bouzerna N, Lefranc G, et al. (2003) Joining the mid Holocene trans-Saharan connections and the spread of Chadic languages. pillars of Hercules: mtDNA sequences show multidirectional gene flow in the Eur J Hum Genet 18:800–7. western Mediterranean. Ann Hum Genet 67:312–28. 41. Cruciani F, La Fratta R, Trombetta B, Santolamazza P, Sellitto D, et al. (2007) 14. Brakez Z, Bosch E, Izaabel H, Akhayat O, Comas D, et al. (2001) Human Tracing past human male movements in northern/eastern Africa and western mitochondrial DNA sequence variation in the Moroccan population of the Souss Eurasia: new clues from Y-chromosomal haplogroups E-M78 and J-M12. Mol area. Ann Hum Biol 28:295–307 Biol Evol 24:1300–11. 15. Ennafaa H, Fregel R, Khodjet-El-Khil H, Gonzalez AM, Mahmoudi HA, et al. 42. Trombetta B, Cruciani F, Sellitto D, Scozzari R (2011) A new topology of the (2011) Mitochondrial DNA and Y-chromosome microstructure in Tunisia. human Y chromosome haplogroup E1b1 (E-P2) revealed through the use of J Hum Genet 56:734–741. newly characterized binary polymorphisms. PLoS One 6:e16073 16. Fadhlaoui-Zid K, Martinez-Cruz B, Khodjet-el-khil H, Mendizabal I, 43. Corte-Real HB, Macaulay VA, Richards MB, Hariti G, Issad MS, et al. (1996) Benammar-Elgaaied A, et al. (2011) Genetic structure of Tunisian ethnic Genetic diversity in the Iberian Peninsula determined from mitochondrial groups revealed by paternal lineages. Am J Phys Anthropol 146:271–80. sequence analysis. Ann Hum Genet 60:331–50 17. Fadhlaoui-Zid K, Rodriguez-Botigue L, Naoui N, Benammar-Elgaaied A, 44. Robino C, Crobu F, Di Gaetano C, Bekada A, Benhamamouch S, et al. (2008) Calafell F, et al. (2011) Mitochondrial DNA structure in North Africa reveals a Analysis of Y-chromosomal SNP haplogroups and STR haplotypes in an genetic discontinuity in the Nile Valley. Am J Phys Anthropol 145:107–17. Algerian population sample. Int J Legal Med 22:251–5 18. Loueslati BY, Cherni L, Khodjet-Elkhil H, Ennafaa H, Pereira L, et al. (2006) 45. Myres NM, Rootsi S, Lin AA, Jarve M, King RJ, et al. (2010) A major Y- Islands inside an island: reproductive isolates on Jerba island. Am J Hum Biol chromosome haplogroup R1b Holocene era founder effect in Central and 18:149–53. Western Europe. Eur J Hum Genet 19:95–101. 19. Ottoni C, Larmuseau MH, Vanderheyden N, Martinez-Labarga C, Primativo 46. Santos C, Montiel R, Sierra B, Bettencourt C, Fernandez E, et al. (2005) G, et al. (2011) Deep into the roots of the Libyan Tuareg: a genetic survey of Understanding differences between phylogenetic and pedigree-derived mtDNA their paternal heritage. Am J Phys Anthropol 145:118–24. mutation rate: a model using families from the Islands (Portugal). Mol 20. Ottoni C, Primativo G, Hooshiar Kashani B, Achilli A, Martinez-Labarga C, et Biol Evol 22:1490–1505. al. (2010) Mitochondrial haplogroup H1 in north Africa: an early holocene 47. Fregel R, Gomes V, Gusmao L, Gonzalez AM, Cabrera VM, et al. (2009) arrival from Iberia. PLoS One 5:e13378. Demographic history of Canary Islands male gene-pool: replacement of native 21. Cherni L, Loueslati BY, Pereira L, Ennafaa H, Amorim A, et al. (2005) Female lineages by European. BMC Evol Biol 9:181. gene pools of Berber and Arab neighboring communities in central Tunisia: 48. Miller SA, Dykes DD, Polesky HF (1988) A simple salting out procedure for microstructure of mtDNA variation in North Africa. Hum Biol 77:61–70 extracting DNA from human nucleated cells. Nucleic Acids Res 16:1215 22. Semino O, Magri C, Benuzzi G, Lin AA, Al-Zahery N, et al. (2004) Origin, 49. Quintans B, Alvarez-Iglesias V, Salas A, Phillips C, Lareu MV, et al. (2004) diffusion, and differentiation of Y-chromosome haplogroups E and J: inferences Typing of mitochondrial DNA coding region SNPs of forensic and anthropo- on the neolithization of Europe and later migratory events in the Mediterranean logical interest using SNaPshot minisequencing. Forensic Sci Int 140:251–7. area. Am J Hum Genet 74:1023–34. 50. Grignani P, Peloso G, Achilli A, Turchi C, Tagliabracci A, et al. (2006) 23. Bosch E, Calafell F, Pe´rez-Lezaun A, Clarimo´n J, Comas D, et al. (2000) Subtyping mtDNA haplogroup H by SNaPshot minisequencing and its Genetic structure of north-west Africa revealed by STR analysis. European application in forensic individual identification. Int J Legal Med 120:151–156. journal of Human Genetics 8:360–366 51. Gonzalez AM, Cabrera VM, Larruga JM, Tounkara A, Noumsi G, et al. (2006) 24. Chiaroni J, King RJ, Myres NM, Henn BM, Ducourneau A, et al. (2010) The Mitochondrial DNA variation in Mauritania and Mali and their genetic emergence of Y-chromosome haplogroup J1e among Arabic-speaking popula- relationship to other Western Africa populations. Ann Hum Genet 70:631–657. tions. Eur J Hum Genet 18:348–53. 52. Maca-Meyer N, Gonzalez AM, Larruga JM, Flores C, Cabrera VM (2001) 25. Tofanelli S, Ferri G, Bulayeva K, Caciagli L, Onofri V, et al. (2009) J1-M267 Y Major genomic mitochondrial lineages delineate early human expansions. BMC lineage marks climate-driven pre-historical human displacements. Eur J Hum Genet 2:13 Genet 17:1520–4. 53. Loogvali EL, Roostalu U, Malyarchuk BA, Derenko MV, Kivisild T, et al. 26. Arredi B, Poloni ES, Paracchini S, Zerjal T, Fathallah DM, et al. (2004) A (2004) Disuniting uniformity: a pied cladistic canvas of mtDNA haplogroup H in predominantly neolithic origin for Y-chromosomal DNA variation in North Eurasia. Mol Biol Evol 21:2012–21. Africa. Am J Hum Genet 75:338–45. 54. Roostalu U, Kutuev I, Loogvali EL, Metspalu E, Tambets K, et al. (2007) Origin 27. Coudray C, Olivieri A, Achilli A, Pala M, Melhaoui M, et al. (2009) The and expansion of haplogroup H, the dominant human mitochondrial DNA complex and diversified mitochondrial gene pool of Berber populations. Ann lineage in West Eurasia: the Near Eastern and Caucasian perspective. Mol Biol Hum Genet 73:196–214. Evol 24:436–48. 28. Maca-Meyer N, Gonzalez AM, Pestano J, Flores C, Larruga JM, et al. (2003) 55. van Oven M, Kayser M (2009) Updated comprehensive phylogenetic tree of Mitochondrial DNA transit between West Asia and North Africa inferred from global human mitochondrial DNA variation. Hum Mutat 30:E386–94. U6 phylogeography. BMC Genet 4:15. 56. Cruciani F, La Fratta R, Torroni A, Underhill PA, Scozzari R (2006) Molecular 29. Olivieri A, Achilli A, Pala M, Battaglia V, Fornarino S, et al. (2006) The mtDNA dissection of the Y chromosome haplogroup E-M78 (E3b1a): a posteriori legacy of the Levantine early Upper Palaeolithic in Africa. Science 314:1767–70. evaluation of a microsatellite-network-based approach through six new biallelic 30. Pereira L, Silva NM, Franco-Duarte R, Fernandes V, Pereira JB, et al. (2010) markers. Hum Mutat 27:831–2. Population expansion in the North African late Pleistocene signalled by 57. Karafet TM, Mendez FL, Meilerman MB, Underhill PA, Zegura SL, et al. mitochondrial DNA haplogroup U6. BMC Evol Biol 10:390. (2008) New binary polymorphisms reshape and increase resolution of the human 31. Gonzalez AM, Larruga JM, Abu-Amero KK, Shi Y, Pestano J, et al. (2007) Y chromosomal haplogroup tree. Genome Res 18:830–8. Mitochondrial lineage M1 traces an early human backflow to Africa. BMC 58. Flores C, Maca-Meyer N, Larruga JM, Cabrera VM, Karadsheh N, et al. (2005) Genomics 8:223. Isolates in a corridor of migrations: a high-resolution analysis of Y-chromosome 32. Quintana-Murci L, Semino O, Bandelt HJ, Passarino G, McElreavey K, et al. variation in Jordan. J Hum Genet 50:435–441. (1999) Genetic evidence of an early exit of Homo sapiens sapiens from Africa 59. Nei N (1987) Molecular evolutionary genetics. Columbia University Press, New through eastern Africa. Nat Genet 23:437–41. York 33. Reidla M, Kivisild T, Metspalu E, Kaldma K, Tambets K, et al. (2003) Origin 60. Excoffier L, Lischer HE (2010) Arlequin suite ver 3.5: a new series of programs and diffusion of mtDNA haplogroup X. Am J Hum Genet 73:1178–90. to perform population genetics analyses under Linux and Windows. Mol Ecol 34. Achilli A, Rengo C, Battaglia V, Pala M, Olivieri A, et al. (2005) Saami and Resour 10:564–567. Berbers–an unexpected mitochondrial DNA link. Am J Hum Genet 76:883–6. 61. Bandelt HJ, Forster P, Ro¨hl A (1999) Median-joining networks for inferring 35. Cherni L, Fernandes V, Pereira JB, Costa MD, Goios A, et al. (2009) Post-last intraspecific phylogenies. Mol Biol Evol 16:37–48. glacial maximum expansion from Iberia to North Africa revealed by fine 62. Richards M, Macaulay V, Hickey E, Vega E, Sykes B, et al. (2000) Tracing characterization of mtDNA H haplogroup in Tunisia. Am J Phys Anthropol European founder lineages in the Near Eastern mtDNA pool. Am J Hum Genet 139:253–60. 67:1251–76. 36. Ennafaa H, Cabrera VM, Abu-Amero KK, Gonzalez AM, Amor MB, et al. 63. Francalacci P, Morelli L, Underhill PA, Lillie AS, Passarino G, et al. (2003) (2009) Mitochondrial DNA haplogroup H structure in North Africa. BMC Peopling of three Mediterranean islands (Corsica, Sardinia, and Sicily) inferred Genet 10:8. by Y-chromosome biallelic variability. Am J Phys Anthropol 121:270–279. 37. Torroni A, Bandelt HJ, Macaulay V, Richards M, Cruciani F, et al. (2001) A 64. Gonzalez AM, Brehm A, Perez JA, Maca-Meyer N, Flores C, et al. (2003) signal, from human mtDNA, of postglacial recolonization in Europe. Am J Hum Mitochondrial DNA affinities at the Atlantic fringe of Europe. Am J Phys Genet 69:844–52. Anthropol 120:391–404.

PLOS ONE | www.plosone.org 10 February 2013 | Volume 8 | Issue 2 | e56775 mtDNA and Y-Chromosome in Algeria

65. Falchi A, Giovannoni L, Calo CM, Piras IS, Moral P, et al. (2006) Genetic 78. Underhill PA, Kivisild T (2007) Use of y chromosome and mitochondrial DNA history of some western Mediterranean human isolates through mtDNA HVR1 population structure in tracing human migrations. Annu Rev Genet 41:539–64. polymorphisms. J Hum Genet 51:9–14. 79. Cinnioglu C, King R, Kivisild T, Kalfoglu E, Atasoy S, et al. (2004) Excavating 66. Garcia O, Fregel R, Larruga JM, Alvarez V, Yurrebaso I, et al. (2011) Using Y-chromosome haplotype strata in Anatolia. Hum Genet 114:127–48. mitochondrial DNA to test the hypothesis of a European post-glacial human 80. King RJ, Ozcan SS, Carter T, Kalfoglu E, Atasoy S, et al. (2008) Differential Y- recolonization from the Franco-Cantabrian refuge. Heredity (Edinb) 106:37–45. chromosome Anatolian influences on the Greek and Cretan Neolithic. Ann 67. Achilli A, Rengo C, Magri C, Battaglia V, Olivieri A, et al. (2004) The molecular Hum Genet 72:205–14. dissection of mtDNA haplogroup H confirms that the Franco-Cantabrian glacial 81. Grugni V, Battaglia V, Kashani BH, Parolo S, Al-Zahery N, et al. (2012) refuge was a major source for the European gene pool. Am J Hum Genet Ancient migratory events in the Middle East: new clues from the Y-chromosome 75:910–8. variation of modern Iranians. PLoS One 7(7): e41252. 68. Pereira L, Richards M, Goios A, Alonso A, Albarran C, et al. (2005) High- 82. Richards M, Rengo C, Cruciani F, Gratrix F, Wilson JF, et al. (2003) Extensive resolution mtDNA evidence for the late-glacial resettlement of Europe from an female-mediated gene flow from sub-Saharan Africa into near eastern Arab Iberian refugium. Genome Res 15:19–24. populations. Am J Hum Genet 72:1058–1064. 69. Alvarez-Iglesias V, Mosquera-Miguel A, Cerezo M, Quintans B, Zarrabeitia 83. Malyarchuk B, Grzybowski T, Derenko M, Perkova M, Vanecek T, et al. (2008) MT, et al. (2009) New population and phylogenetic features of the internal Mitochondrial DNA phylogeny in Eastern and Western Slavs. Mol Biol Evol variation within mitochondrial DNA macro-haplogroup R0. PLoS One 4:e5112. 25:1651–8. 70. Rhouda T, Martinez-Redondo D, Gomez-Duran A, Elmtili N, Idaomar M, et 84. Cerezo M, Achilli A, Olivieri A, Perego UA, Gomez-Carballa A, et al. (2012) al. (2009) Moroccan mitochondrial genetic background suggests prehistoric Reconstructing ancient mitochondrial DNA links between Africa and Europe. Genome Res 22:821–826. human migrations across the Gibraltar Strait. Mitochondrion 9:402–7. 85. Moorjani P, Patterson N, Hirschhorn JN, Keinan A, Hao L, et al. (2011) The 71. Pala M, Achilli A, Olivieri A, Kashani BH, Perego UA, et al. (2009) history of African gene flow into Southern Europeans, Levantines, and Jews. Mitochondrial haplogroup U5b3: a distant echo of the epipaleolithic in Italy PLoS Genet 7:e1001373. and the legacy of the early Sardinians. Am J Hum Genet 84:814–21. 86. Casas MJ, Hagelberg E, Fregel R, Larruga JM, Gonzalez AM (2006) Human 72. Malyarchuk B, Derenko M, Grzybowski T, Perkova M, Rogalla U, et al. (2010) mitochondrial DNA diversity in an archaeological site in al-Andalus: genetic The peopling of Europe from the mitochondrial haplogroup U5 perspective. impact of migrations from North Africa in medieval Spain. Am J Phys Anthropol PLoS One 5:e10285. 131:539–551. 73. Egyed B, Brandstatter A, Irwin JA, Padar Z, Parsons TJ, et al. (2007) 87. Capelli C, Onofri V, Brisighelli F, Boschi I, Scarnicci F, et al. (2009) Moors and Mitochondrial control region sequence variations in the Hungarian population: Saracens in Europe: estimating the medieval North African male legacy in analysis of population samples from Hungary and from Transylvania (Romania). southern Europe. Eur J Hum Genet 17:848–852. Forensic Sci Int Genet 1:158–62. 88. Luis JR, Rowold DJ, Regueiro M, Caeiro B, Cinnioglu C, et al. (2004) The 74. Tambets K, Rootsi S, Kivisild T, Help H, Serk P, et al. (2004) The western and Levant versus the Horn of Africa: evidence for bidirectional corridors of human eastern roots of the Saami–the story of genetic ‘‘outliers’’ told by mitochondrial migrations. Am J Hum Genet 74:532–44. DNA and Y chromosomes. Am J Hum Genet 74:661–82. 89. Cruciani F, Trombetta B, Massaia A, Destro-Bisol G, Sellitto D, et al. (2011) A 75. Gresham D, Morar B, Underhill PA, Passarino G, Lin AA, et al. (2001) Origins revised root for the human Y chromosomal phylogenetic tree: the origin of and divergence of the Roma (gypsies). Am J Hum Genet 69:1314–31. patrilineal diversity in Africa. Am J Hum Genet 88:814–8. 76. Harich N, Costa MD, Fernandes V, Kandil M, Pereira JB, et al. (2010) The 90. Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, et al. (1981) trans-Saharan slave trade - clues from interpolation analyses and high-resolution Sequence and organization of the human mitochondrial genome. Nature 290: characterization of mitochondrial DNA lineages. BMC Evol Biol 10:138. 457–65 77. Henn BM, Botigue LR, Gravel S, Wang W, Brisbin A, et al. (2012) Genomic 91. Andrews RM, Kubacka I, Chinnery PF, Lightowlers RN, Turnbull DM, et al. ancestry of North Africans supports back-to-Africa migrations. PLoS Genet (1999) Reanalysis and revision of the Cambridge reference sequence for human 8:e1002397. mitochondrial DNA. Nat Genet 23:147.

PLOS ONE | www.plosone.org 11 February 2013 | Volume 8 | Issue 2 | e56775 Résumé:

Grâce à leur position stratégique dans le bassin méditerranéen, les populations du Maghreb ont fait l’objet de plusieurs études qui témoignent de la complexité de leur structure génétique. La caractérisation génétique de ces populations a été effectuée par de nombreux marqueurs génétiques dont l’ADN mitochondrial (ADNmt) et le chromosome Y qui permettent de déterminer les origines géographiques des populations ancestrales et la composition révélée par le taux de métissage. Des influences eurasiatiques datant du Paléolithique et du Néolithique et de récentes contributions de l'Afrique subsaharienne et de l’Europe méditerranéenne ont été, ainsi, démontré. Cependant, ce scénario génétique est investi avec un écart notable, qui est le manque d'informations consistantes pour l'Algérie, le plus grand pays du Maghreb. La présente étude décrit la distribution de ces marqueurs uniparentaux et des microsatellites STR du chromosome X dans un échantillon de la population urbaine nord-ouest algérienne (n>200). L’analyse de 21 marqueurs X-STRs a été réalisée par PCR multiplex. Les séquences de la région HVSI de l’ADNmt obtenues ont été comparées avec la séquence de référence rCRS (Revised Cambridge Sequence Reference) afin d’identifier les polymorphismes caractérisant les haplogroupes. Pour approfondir cette détermination nous avons analysé les polymorphismes RFLP et SNP, par PCR-RFLP et par miniséquençage SNapShot, respectivement. Concernant l’analyse du chromosome Y, nous avons affiné les résultats, d’une étude précédente dans notre population, par séquençage et détection de 12 polymorphismes SNPs déterminant des sous-groupes des haplogroupes E et R, très répandus en Afrique du Nord et en Europe, respectivement. L’analyse statistique des résultats a été réalisée par les logiciels Arlequin (pour le calcul de l’indice de fixation FST, la diversité génétique (h) et pour l’analyse de la variance moléculaire AMOVA), Network et Phylip (pour la réalisation des arbres phylogénétiques), SPSS (pour les analyses en composantes principales ACP). L’évaluation de la distance génétique sur la base des haplotypes X-STR indique que les Algériens sont proches génétiquement des populations eurasiatiques mais restent assez éloignés des populations de l'Afrique subsaharienne. L’analyse de l’ADN mitochondrial a permis de définir plus de 40 haplogroupes majeurs dont la plus forte fréquence a été observé pour les haplogroupes d’origine eurasiatique : H/HV M1, U6a (30.83%, 7.08%, 6.67%, respectivement). En effet, le composant eurasiatique en Algérie a atteint plus de 80 % pour les deux marqueurs uniparentaux et se traduit par des fréquences élevées (70 %) des haplogroupes du chromosome Y : E-M81 et E-V65. La présence inattendue des dérivées de l’haplogroupe R européen du chromosome Y: R-M412, R-S116, R-U152 et R-M529 en Algérie et le reste du Maghreb semblent constituer les contreparties des sous-groupes de l’ADNmt H1, H3 et HV0. Ceci traduirait les contacts maritimes entre les côtes européennes et nord-africaines de l’ouest de la Méditerranée. Malgré les asymétries sexuelles observées, les profils génétiques uniparentaux des Algériens corrèlent fidèlement entre eux et correspondent parfaitement aux gradients de fréquence des haplogroupes est-ouest et nord-sud observés au nord de l’Afrique. Les résultats de l’analyse du chromosome X sont en accord avec ceux des marqueurs uniparentaux qui estime la contribution féminine et masculine subsaharienne à 20 et 10%, respectivement. Finalement, cette étude devrait être étendue à d’autres échantillons de population, notamment des ethnies berbères, nombreuses sur le grand territoire national algérien, et d’avoir plus de données sur plus de marqueurs de différents loci. C’est bien l’étude de différents marqueurs génétiques croisés à des éléments archéologiques, linguistiques, ethnologiques et démographiques qui permettront d’obtenir une meilleure compréhension de l’histoire des populations d’Algérie et de leurs relations avec d’autres populations nord africaines, eurasiatiques et subsahariennes.

Mots clés : Maghreb, caractérisation génétique, populations ancestrales, Algérie, marqueurs uniparentaux, chromosome X, haplogroupe.

Abstract:

Due to their strategic position in the Mediterranean Basin, the Maghreb populations have been subject of several studies that testifies the complexity of their genetic structure. The genetic characterization of these populations was made by numerous genetic markers among which mitochondrial DNA (mtDNA) and Y chromosome. These markers allow determining the geographical origins of the ancestral populations and the composition revealed by the rate of interbreeding. Eurasian influences dating from the Paleolithic and the Neolithic and recent contributions from Sub-Saharan Africa and Mediterranean Europe were demonstrated. However, this genetic scenario is invested with a notable gap, which is the lack of substantial information for Algeria, the biggest country in the Maghreb. The present study describes the distribution of these uniparental markers and X chromosome microsatellites STRs in a sample of northwest Algerian urban population (n > 200). The analysis of 21 X-STR markers was realized by multiplex PCR. The obtained sequences of the mtDNA HVSI region were compared with the rCRS reference sequence (Revised Cambridge Sequence Reference) to identify polymorphisms characterizing haplogroups. To refine this genotyping, we analyzed RFLP and SNP polymorphisms by PCR-RFLP and by minisequencing SNapShot, respectively. Concerning the Y chromosome analysis, we refined the results of a previous study in our population, by sequencing and detection of 12 SNP polymorphisms determining sub-groups of North African and European widespread haplogroups E and R, respectively. The statistical analysis of the results was realized by Arlequin software (to calculate pairwise FST distances, genetic variety (h) and analysis of molecular variance AMOVA), Network and Phylip (to realize phylogenetic trees), SPSS (for Principal Component Analysis PCA). The evaluation of the genetic distance, based on X-STR haplotypes, indicates that the Algerians are genetically close to Eurasian populations but remain distant enough from Sub-Saharan African populations. Mitochondrial DNA (mtDNA) analysis allowed us to define more than 40 major haplogroups: the strongest frequency of which was observed for the Eurasian haplogroups: H/HV M1, U6a (30.83%, 7.08%, 6.67%, respectively). Indeed, the Eurasian component in Algeria reached more than 80 % for both uniparental markers and is translated by high frequencies (70 %) of Y chromosome haplogroups: E-M81 and E-V65. The unexpected presence of the European Y chromosome haplogroup R subdivision: R-M412, R-S116, R-U152 and R-M529 in Algeria and the rest of the Maghreb seem to constitute the counterparties of the mtDNA subgroups H1, H3 and HV0. This would translate the maritime contacts between the European and North African western sides of the Mediterranean Sea. In spite of the observed sexual asymmetries, the genetic uniparental profiles of Algerians correlate faithfully between them and correspond perfectly to east-west and north-south gradients of the observed haplogroups frequency in North Africa. The X chromosome analysis results are in agreement with those of uniparental markers that consider the female and male Sub-Saharan contribution in 20 and 10 %, respectively. Finally, this study should be spread to other population samples, in particular Berber ethnic groups that are numerous on the wide Algerian national territory, and to have more data on further markers of different loci. In fact, the study of various genetic markers crossed to archaeological, linguistic, ethnological and demographic elements will allow to obtain a better understanding of Algerian populations history and their relations with other North African, Eurasian and Sub-Saharan populations.

Keywords: Maghreb, genetic characterization, ancestral populations, Algeria, uniparental markers, X chromosome, haplogroup.