MARIA DE JESUS TROVOADA DOS SANTOS

CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM BASE EM MARCADORES DO CROMOSSOMA Y E DNA MITOCONDRIAL

Dissertação apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra para obtenção do grau de Doutor em Antropologia, especialidade de Antropologia Biológica

Universidade de Coimbra 2004

ÍNDICE

ÍNDICE DE FIGURAS………………………………………………………………… vii

ÍNDICE DE TABELAS………………………………………………………………… ix

RESUMO………………………..…………………………….……………………...… xi

SUMMARY.....…………………………….………………………... xix

AGRADECIMENTOS……………………………………………………………....… xxvii

I - INTRODUÇÃO 1.1 - Introdução geral………………………….……………….……………..….. 3

1.2 - São Tomé e Príncipe: história e povoamento……………………………... 6 1.2.1 - A Localização……………………..…………….……………...... 6 1.2.2 - A Descoberta………………………..…………….……………...... 7 1.2.3 - Povoamento e resenha histórica ………………………..……...... 8 1.2.3.1 - Ciclo do açúcar………………………………………..………...... 8 1.2.3.2 - Ciclo do café e do cacau…...... 10 1.2.4 - Estrutura populacional………...………………….……...... 12 1.2.5 - Língua……………………………………………………………..…... 15

1.3 - Cromossoma Y e DNA mitocondrial……………………………………… 16 1.3.1 - Cromossoma Y…………………………………………………………. 16 1.3.1.1 - Estrutura e conteúdo génico…………………………..……...... 16 1.3.1.2 - Características chave em estudos evolutivos……..……….…..... 17 1.3.1.3 - Subestruturação geográfica de linhagens do Y……….…..….… 18 1.3.1.4 - Marcadores genéticos ……...... 19 1.3.1.4.1 - Marcadores multialélicos………………………...... 21 1.3.1.4.2 - Marcadores bialélicos…………...... 22 1.3.2 - DNA mitocondrial…………………………………………………….. 24 1.3.2.1 - Organização do genoma mitocondrial…………….…………... 24 1.3.2.2 - Taxa de substituição nucleotídica………….…………..…….… 26 1.3.2.3 - Modo de transmissão………………………………...………...... 27 1.3.2.4 - Heteroplasmia do mtDNA…...... 28 1.3.2.5 - Filogenia de linhagens de mtDNA………………..……………… 29 1.3.3 - Padrões de diversidade do cromossoma Y e do mtDNA em África…... 30 1.3.3.1 - A Expansão do Homem Moderno………………………………... 30 1.3.3.2 - A expansão Bantu…………………………………………...………. 32 1.3.3.3 - Afinidades com a Península Ibérica e a Península Arábica...... 33 1.3.3.4 - África e as descobertas quinhentistas ………………………….... 35

1.4 - Objectivos………………………………………………………………...… 39

II - MATERIAL E MÉTODOS 2.1 - Amostras………………………………………………...……………..…… 43

2.2 - Extracção de DNA…………...…………………...………………………... 44 2.2.1 - Extracção a partir de sangue total……………………………….…….. 44 2.2.1.1 - Extracção por Chelex………………...…………...... 44 2.2.1.2 - Extracção por fenol-clorofórmio……………………...…….…... 45 2.2.2 - Extracção a partir de manchas…………………….…………….…….. 46

2.3 - Marcadores do cromossoma Y…………………………………...……….. 46 2.3.1 - Microssatélites………………………………………………………… 47 2.3.1.1 - Condições de amplificação………………………...…………….. 47 2.3.1.2 - Separação automática de fragmentos de DNA amplificados….. 48 2.3.1.3 - Separação não-automática de fragmentos de DNA amplificados…………………………………………………………... 49 2.3.1.4 - Método de visualização do DNA amplificado……………....…... 49 2.3.1.5 - Genotipagem de STRs……………………………………………… 50 2.3.2 - Marcadores Biológicos…………………………………………………. 50 2.3.2.1 - Condições de amplificação………….…………………….…….. 51

2.3.2.2 - Digestão enzimática e separação dos fragmentos digeridos….. 52 2.3.2.3 - Classificação dos haplogrupos……………………………...……. 53

2.4 - DNA mitocondrial………………………………………………………….. 55 2.4.1 - Amplificação e sequenciação………………….………….…..……….. 55 2.4.2 - Classificação de sequências……………………………………...……. 56

2.5 - Análise estatística………………………………………………...…..….…. 57

III - RESULTADOS E DISCUSSÃO 3.1 - STRs do cromossoma Y………………………...……………………….…. 61 3.1.1 - Análise locus a locus……………………...……………………….….. 61 3.1.2 - Análise haplotípica……………………………...………………….…. 67 3.1.3 - Padrão de partilha……………………………………………………... 71 3.1.4 - Distribuição de diferenças entre pares de haplótipos …………….…… 72 3.1.5 - Diferenciação genética entre populações……………………………… 75 3.1.6 - Estruturação genética em São Tomé e Príncipe inferida com STRs do Y………………………………………………………………………. 77 3.1.7 - Considerações globais sobre o estudo de STRs do Y em São Tomé e Príncipe.. ……………………………………………………………... 79

3.2 - Marcadores bialélicos……………………………………………………... 84 3.2.1 - Perfil de haplogrupos e comparação com outras populações ……… 84 3.2.2 - Padrão de diversidade e comparação entre Angolares, Tongas e Forros 92 3.2.3 - Avaliação da diferenciação genética entre Angolares, Tongas e Forros 95 3.2.4 - Análise conjunta de SNPs e STRs….……………………...………….. 96 3.2.5 - Considerações globais sobre o estudo de marcadores bialélicos do Y em São Tomé e Príncipe…………………………………………….... 99

3.3 - DNA Mitocondrial…………………………………………………………. 101 3.3.1 - Pesquisa de mutações “fantasma”……….………………….…...... 101 3.3.2 - Níveis de diversidade em HVS-I e HVS-II em São Tomé e Príncipe.... 103 3.3.3 - Perfil de haplogrupos em São Tomé e Príncipe…………….……….... 106 3.3.4 - Árvore filogenética de sequências de mtDNA………………………... 108 3.3.5 - Estruturação genética em São Tomé e Príncipe inferida com mtDNA.. 110 3.3.6 - Comparação com outras populações africanas ……….………………. 111 3.3.6.1 - Diversidade molecular…………………………………...……. 112 3.3.6.2 - Padrão de partilha de sequências de mtDNA…………………. 114 3.3.6.3 - Análise de componentes principais……………………...…...... 118 3.3.7 - Considerações globais sobre o estudo de mtDNA em São Tomé e Príncipe…...……………………..………....…….………....………… 120 3.3.7.1 - Padrão de variação de mtDNA em São Tomé e Príncipe……... 120 3.3.7.2 - Achegas do mtDNA sobre a questão da origem dos Angolares. 122 3.3.7.3 - Afinidades genéticas entre Angolares, Forros e Tongas……….. 125 3.3.7.4 - Fluxo génico mediado pelo sexo feminino entre grupos sãotomenses.………....……………....…….………....…………………....…….. 126

IV – CONCLUSÕES…………………………………………………………………... 131

V - BIBLIOGRAFIA………………….………………………………………………. 139

VI - APÊNDICES……………………………………………………………………. 163

Apêndice 1 - Frequências de haplogrupos definidos por marcadores bialélicos utilizadas na análise de componentes principais………………………….. 165

Apêndice 2 - Haplótipos de STRs dentro de haplogrupos definidos por marcadores bialélicos do Y em amostras de Angolares, Forros e Tongas…………….. 167

Apêndice 3 - Frequência de haplogrupos definidos por mtDNA em amostras de Angolares, Forros e Tongas .……………………………………………. 169

ARTIGO 1 Polimorfismos Genéticos de ESD, GLO1, GPT e PGM1 em São Tomé e Príncipe

ARTIGO 2 Evidence for population sub-struturing in São Tomé e Príncipe as inferred from STR analysis.

ARTIGO 3 Pattern of mtDNA Variation in Three Populations from São Tomé e Príncipe.

ÍNDICE DE FIGURAS

Figura 1.1 - Mapa e localização de São Tomé e Príncipe …………………………. 7

Figura 1.2 - Esquema do cromossoma Y ….………………………………………. 17

Figura 1.3 - Esquema da molécula de DNA mitocondrial humano………………... 25

Figura 2.1 - Mapa da ilha de São Tomé com os locais de recolha de amostras…..... 44

Figura 2.2 - Haplogrupos possíveis de discriminar com 14 marcadores bialélicos 54 do Y ………………………………………………………...... Figura 2.3 - Esqueleto filogenético mostrando as sequências de HVS-I e HVS-II do mtDNA ……………………………………………………………. 56 Figura 3.1 - Distribuição de frequências alélicas de sete STRs em amostras populacionais de São Tomé e Príncipe e outras populações ……….… 64 Figura 3.2 - Distribuição do número e da média das diferenças entre pares de haplótipos definidos por STRs do Y ………………………………… 73

Figura 3.3 - Árvore neighbour-joining dos três grupos populacionais sãotomenses e outras populações africanas e portuguesas .………………………... 77 Figura 3.4 - Distribuições de frequências de haplogrupos definidos pelos marcadores bialelicos do Y observadas em São Tomé e Príncipe……. 85 Figura 3.5 - Perfil de haplogrupos na amostra de São Tomé e Príncipe e estimativas de componentes europeu e subsariano …………………... 89 Figura 3.6 - Projecção dos dois componentes principais obtidos com frequência de haplogrupos definidos por marcadores bialélicos do Y ..………...... 92

Figura 3.7 - Distribuição de pares de diferenças e média das diferenças entre pares de haplogrupos ……………………………..……………………….... 94 Figura 3.8 - Median-joining networks de haplótipos definidos por STRs ………... 97

Figura 3.9 - Network representando a weighty variation de sequências de mtDNA. 103 Figura 3.10 - Distribuições do número de diferenças nucleotídicas entre pares de sequências de mtDNA …….………………………………………….. 105

Figura 3.11 - Distribuição de haplogrupos de mtDNA em São Tomé e Príncipe… 107

Figura 3.12 - Árvores filogenéticas de sequências de mtDNA em amostras de São Tomé e Príncipe………………………………………………………. 109 Figura 3.13 - Distribuição de diferenças entre pares de sequências de mtDNA em diferentes amostras populacionais…………..……………………….... 114 Figura 3.14 - Projecção dos dois componentes principais obtidos com frequências relativas de haplogrupos de mtDNA subsarianos……………….……. 120

ÍNDICE DE TABELAS

Tabela 2.1 - Composição de soluções utilizadas no processo de extracção de DNA.. 46

Tabela 2.2 - Sequência e marcação dos primers utilizados na amplificação de sete STRs do cromossoma Y……………….……………………………... 47

Tabela 2.3 - Condições de amplificação dos STRs do cromossoma …….………… 48

Tabela 2.4 - Soluções utilizadas e tempos de incubação na técnica de coloração com nitrato de prata…………………..……………………………….. 50 Tabela 2.5 - Primers, condições de amplificação e tamanho dos fragmentos obtidos para cada marcador……………….…………………………... 51

Tabela 2.6 - Condições da digestão enzimática, substituição nucleotídica e fragmentos resultantes para cada SNP……………………………...…. 53

Tabela 2.7 - Sequência dos primers utilizados na análise das regiões HVS-I e II do DNA Mitocondrial..…………………………………………………… 55

Tabela 2.8 - Condições das reacções de amplificação e de sequenciação das regiões HVS-I e HVS-II…………………………….………………… 55

Tabela 3.1 - Estimativas de frequências alélicas para sete STRs em São Tomé Príncipe………………………………………………………………... 62

Tabela 3.2 - Diversidade génica relativa a sete STRs em amostras de São Tomé e Príncipe e outras populações……………………………..…………… 65

Tabela 3.3 - Valores de FST por locus e médios, relativos a sete STRs do cromossoma Y………………………………………..……………….. 66

Tabela 3.4 - Haplótipos de STRs do cromossoma Y encontrados em Angolares, Forros, e Tongas, e número de matches …………..………………….. 68 Tabela 3.5 - Índices de diversidade haplotípica em São Tomé e Príncipe e outras populações…………………………………………………………… 70

Tabela 3.6 - Valores de RST entre pares de populações………………………… 75

Tabela 3.7 - Percentagem de variação produzida por AMOVA na população sãotomense…………………………………………………………….. 78

Tabela 3.8 - Parâmetros de diversidade em Angolares, Forros, Tongas e na amostra global de São Tomé e Príncipe………………………………. 93

Tabela 3.9 - Percentagem de variação em diferentes níveis hierárquicos de agrupamentos populacionais produzido por AMOVA………………... 95

Tabela 3.10 - Índices de diversidade de sequências HVS-I e HVS-II em populações de São Tomé e Príncipe……………………...………………………… 104

Tabela 3.11 - Percentagem de variação produzida por AMOVA com diferentes níveis de hierarquização dos grupos populacionais sãotomenses……... 110

Tabela 3.12 - Código, proveniência, tamanho das amostras e referências bibliográficas para as populações africanas consideradas neste estudo. 111 Tabela 3.13 - Medidas de diversidade e neutralidade para sequências HVS-I em São Tomé e Príncipe e de outras regiões africanas…………….……… 112

Tabela 3.14 - Sequências sãotomenses partilhadas com outros grupos populacionais africanos…………………………………………...…...... 117

RESUMO

A análise do padrão de variação genética em populações humanas contemporâneas, constitui uma fonte importante de informações quando se procura reconstituir a sua origem e história evolutiva. Entre os múltiplos instrumentos de investigação genética, têm-se destacado os polimorfismos da região não recombinante do cromossoma Y ou do mtDNA, dadas algumas das suas propriedades, nomeadamente, transmissão uniparental, haplóidia e ausência de recombinação. O estudo desses marcadores, tem permitido inferir muitos aspectos da história demográfica de linhagens masculinas e femininas em contextos de investigação muito diversificados, pelo que tem vindo a ser cada vez mais recrutado em numerosas áreas de pesquisa antropológica.

Neste trabalho, utilizou-se esse tipo de marcadores para estudar o arquipélago de São Tomé e Príncipe, uma ex-colónia portuguesa localizada no Golfo da Guiné. A sua história populacional remonta apenas a finais do século XV quando foi descoberto por navegadores portugueses. Na altura era desabitado e os portugueses, apercebendo-se da localização estratégica para as suas actividades comerciais, cedo investiram no povoamento de São Tomé e Príncipe. O projecto português para São Tomé e Príncipe foi transformar o arquipélago, de início, num centro de produção de cana-de-açúcar e entreposto para o comércio de escravos e, a partir do século XIX, num espaço de exploração intensiva da cultura do café e do cacau. A sociedade sãotomense actual, é fruto de um processo de povoamento conturbado e sobre o qual os registos históricos, embora proporcionem os traços gerais, são bastante escassos. Presentemente, sobre a estrutura populacional do arquipélago, é percepção comum a existência de três grupos populacionais, Forros, Tongas e Angolares, que são também uma referência constante

xi Resumo

na bibliografia sobre São Tomé e Príncipe. Forros são todos aqueles cujos antepassados chamados “homens livres”. Tongas são os descendentes dos imigrantes forçados provenientes de Angola, Cabo Verde e Moçambique que, entre o século XIX e meados do XX, entraram em massa no arquipélago para trabalhar nas roças do cacau e do café. Os Angolares constituem um pequeno grupo mas com traços de identidade bem vincados. Até há pouco viviam concentrados na região sudeste da ilha, mas actualmente também se encontram em pequenas povoações dispersas pelo litoral de São Tomé e do Príncipe. Quanto à origem dos Angolares, a documentação existente é bastante imprecisa, pelo que permanecem em aberto algumas hipóteses sobre a questão.

No presente estudo, por recurso a técnicas de PCR, PCR/RFLP e/ou sequenciação directa, analisaram-se os padrões de distribuição de 7 STRs (DYS19, DYS389I, DYS389II, DYS390, DYS391, DYS392 e DYS393) e 14 marcadores bialélicos (YAP, SRY8299, 92R7, SRY1532, SRY2627, Tat, sY81, M9, LLy22g, 12f2, M109, M112, M150 e M168) do cromossoma Y e de variações de sequência em HVS-I e HVS-II do mtDNA, em amostras de Angolares, Forros e Tongas, tendo em vista os seguintes objectivos: - avaliar o nível de subestruturação populacional actualmente existente em São Tomé e Príncipe; - entender como se geraram os padrões de distribuição de diversidade observados e inferir os factores de maior impacto nesses padrões; - estudar as afinidades de São Tomé e Príncipe com populações africanas e outras que pudessem contribuir para o esclarecimento do passado genético do arquipélago; - contribuir para a caracterização fina da diversidade genética no continente africano.

De forma a possibilitar o enquadramento dos resultados obtidos, utilizaram-se dados, recolhidos da bibliografia, de outras amostras populacionais europeias e africanas. Relativamente aos STRs do cromossoma Y, as distribuições alélicas encontradas para cada marcador em São Tomé e Príncipe diferem significativamente das observadas em populações europeias mas, pelo contrário, tendem a enquadrar-se bem nos padrões comuns em populações africanas. Também quanto à variância do número médio de

xii Resumo

repetições, um parâmetro em que, para STRs do Y, as populações africanas se distinguem das europeias, o valor encontrado na amostra global de São Tomé e Príncipe (0.886) é elevado e de uma ordem de grandeza que, em geral, apenas se regista em africanos. Estes resultados reflectem a forte contribuição de escravos para o povoamento do arquipélago, cuja proveniência terá sido a faixa ocidental atlântica do continente africano.

No entanto, os STRs do Y também manifestam sinais de que a contribuição europeia para o gene pool masculino da população de São Tomé e Príncipe não foi irrelevante. O STR que individualmente melhor reteve essa influência foi DYS390, um marcador com elevada capacidade para diagnosticar populações europeias e africanas. O segundo alelo mais frequente (13.6%) em São Tomé e Príncipe é DYS390*24, um alelo muito raro em populações africanas subsarianas, mas comum em europeus, nomeadamente do Norte e Centro de . Outros indícios desse contributo surgiram da análise do padrão de partilha de haplótipos do Y definidos pelos 7 STRs. Na amostra global do arquipélago, num total de 103 cromossomas Y, encontraram-se 79 haplótipos distintos, o que se traduziu num nível de diversidade haplotípica elevado (0.987±0.006), como se verifica na maioria das populações. No sentido de procurar inferir a origem geográfica das linhagens sãotomenses, investigou-se o padrão de matches com os registos contidos numa base de dados de populações de origem europeia e com os de outra que se construiu com populações africanas. Alguns haplótipos sãotomenses apresentam numerosos matches com populações europeias, incluindo portuguesas, o que leva a crer que a sua presença em São Tomé e Príncipe tivesse resultado de introgressão mediada, muito provavelmente, por homens portugueses. Com base em STRs não se estimou a fracção do componente genético de São Tomé e Príncipe de presumível origem europeia, mas parece ser a presença desse componente, associada ao facto de o aporte de linhagens africanas ter sido originário de áreas de recrutamento bastante dispersas, que explica a observação de um valor muito elevado para a diferença média entre pares de haplótipos sãotomenses (6.19±2.97).

Sobre os grupos populacionais sãotomenses, Forros e Tongas compartilham basicamente o mesmo padrão de variação ao nível de STRs do Y e, consequentemente, não diferem geneticamente entre si (RST = - 0.067, P>5%). Pelo contrário, os Angolares

xiii Resumo

distinguem-se de Tongas e Forros pela clara redução de diversidade, o que se observou em diferentes parâmetros de avaliação: são os Angolares que apresentam os valores mais baixos de heterozigotia média por STR (0.504±0.298), de diversidade haplotípica (0.967±0.030), diversidade génica (0.504±0.298), da variância média do número de repetições (0.554) e do número médio de diferenças entre pares de haplótipos (4.69±2.39). São sinais que indiciam uma certa microdiferenciação dos Angolares e que se reflectiu na observação de distâncias genéticas significativas não só relativamente a

Forros (RST = 0.916, P<5%) ou Tongas (RST =0.853, P<5%), mas também relativamente a qualquer das restantes populações africanas com que se compararam. Em conformidade, quando se aplicou AMOVA para investigar o grau de subestruturação populacional no interior de São Tomé e Príncipe, detectou-se uma percentagem significativa de variação devida a diferenças entre grupos (FCT=0.0324, P<5%) quando os Angolares foram confrontados com Tongas e Forros. Assim, encontraram-se nos Angolares traços de uma certa diferenciação genética que poderá ter decorrido de efeitos de deriva génica, endogamia, ou efeito de fundador, ou seja, os esperados em grupos populacionais pequenos que mantiveram algum isolamento e escassos contactos com grupos populacionais circunvizinhos. Todas as fontes históricas referem essas circunstâncias para os Angolares até há relativamente pouco tempo.

A análise dos marcadores bialélicos do cromossoma Y, permitiu detectar em São Tomé e Príncipe a presença dos seguintes haplogrupos: E3a, B2a1, B2b, B*(xB2a,b), P*(xR1a,R1b3f), CR*(xDE,J,K) e E*(xE3a). Os quatro primeiros, altamente específicos de África subsariana, representam a fracção maioritária das linhagens presentes em São Tomé e Príncipe. E3a constitui 69.1% dos cromossomas Y sãotomenses, e atinge a frequência mais elevada, 78.6%, entre os Angolares e a mais baixa nos Tongas, 59.1%. Os haplogrupos B2a1, B2b e B*(xB2a,b), em conjunto representando 6.5% dos cromossomas Y sãotomenses, não se encontraram nos Forros mas estavam presentes em 5.4% dos Angolares e em 13.7% dos Tongas. Quanto a P*(xR1a,R1b3f), um haplogrupo muito comum na Europa e virtualmente ausente em África, encontrou-se em 11.5% dos indivíduos da amostra global de São Tomé. CR*(xDE,J,K), é também um haplogrupo que não se encontra habitualmente em africanos mas que se detectou em 5.7% dos sãotomenses. Atendendo à filogeografia de P(xR1a,R1b3f) e CR*(xDE,J,K), a explicação mais provável para a sua presença na

xiv Resumo

população actual de São Tomé e Príncipe é de terem sido introduzidos por indivíduos masculinos de origem europeia e, portanto, a frequência combinada dos dois haplogrupos - 17.3% - constitui uma estimava do valor mínimo do componente genético europeu em São Tomé e Príncipe. 7.2% dos cromossomas Y sãotomenses eram do haplogrupo E*(xE3a). Trata-se de um haplogrupo muito heterogéneo, incluindo no padrão de distribuição geográfica pois encontra-se espalhado por toda a África, mas também pelo Médio Oriente e Europa. Por ser impossível inferir a origem geográfica de cromossomas E*(xE3a) sem recorrer a uma caracterização molecular mais fina, utilizou-se uma extrapolação para inferir que o aporte português de linhagens em São Tomé e Príncipe incluiria cerca 3.1% de haplogrupos tipo E*(xE3a). Assim, estimou-se em 20.7%, a fracção de linhagens masculinas de origem europeia actualmente existente em São Tomé e Príncipe. Esta proporção supera substancialmente o que está documentado sobre a reduzida fracção de europeus relativamente a africanos registada em diferentes períodos no arquipélago e o desfasamento traduz a grande variância no sucesso reprodutivo dos indivíduos que contribuíram para o povoamento de São Tomé e Príncipe.

O componente europeu atinge 27.2% entre os Forros, o grupo populacional maioritário no arquipélago, é de 21.4% nos Tongas e apresenta a proporção mais baixa nos Angolares, 14.7%. É um resultado que denuncia novamente os contactos menos intensos entre os Angolares e outros habitantes de São Tomé, neste caso europeus, e que se explica pela história de isolamento em que o grupo se manteve durante muito tempo. Quanto a haplótipos definidos por marcadores bialélicos do Y, os Angolares distinguem-se outra vez pelos baixos níveis de diversidade, quer no que respeita à proporção de haplogrupos diferentes (8.93%) quer nos níveis de diversidade de haplogrupos (0.376±0.080), génica (0.098±0.068) ou número médio de pares de diferenças entre haplogrupos (1.375±0.860). Em oposição, para os mesmos parâmetros os Tongas registam os valores mais elevados, o que se pode entender pela grande dispersão geográfica das regiões de origem dos seus ancestrais. Angola, Cabo Verde e Moçambique foram as fontes de fornecimento de serviçais pelo que, de certa forma, os Tongas representam uma sub-amostragem da região subsariana de África geograficamente bastante mais abrangente que a representada pelos Forros, cujos ancestrais foram mais restritivamente recrutados na faixa continental atlântica entre os

xv Resumo

actuais Costa de Marfim e Angola. Compreende-se assim algum excesso de diversidade dos Tongas relativamente aos Forros. Não obstante estas observações, com base em haplogrupos definidos por marcadores bialélicos do Y não se detectam distâncias genéticas estatisticamente significativas entre Angolares, Forros ou Tongas: FST Forros/

Tongas = 0.008, P=0.27; FST Forros/ Angolares = 0.003, P=0.26; FST Tongas/ Angolares = 0.032, P=0.09.

A fim de investigar o padrão de variação das linhagens maternas em São Tomé e Príncipe, analisaram-se em amostras de Angolares, Forros e Tongas sequências de HVS-I e HVS-II do DNA mitocondrial. Quanto aos níveis de diversidade em HVS-I e HVS-II, novamente os Angolares se distinguem de Forros ou Tongas pela redução de heterozigotia média e proporção de haplogrupos diferentes. Nos Angolares o número médio de diferenças entre sequências é um pouco mais elevado do que nos dois outros grupos populacionais, mas o padrão de distribuição de pares de diferenças angolar é mais irregular e difere significativamente do esperado assumindo um modelo de expansão populacional, ao contrário do que se observa em Forros ou Tongas. Sobre a diferenciação genética entre os três grupos populacionais, os dados de mtDNA apontam no mesmo sentido que os de STRs do Y e indicam que existem diferenças significativas entre Angolares e Forros (FST=0.037, P=0.04) ou Angolares e Tongas

(FST=0.030, P=0.04), e ausência de diferenciação entre Forros e Tongas (FST =0.01, P=0.14). Quando se aplica AMOVA a sequências de mtDNA, a percentagem de variação devida a diferenças entre grupos também atinge o valor mais elevado quando os Angolares são confrontados com Forros+Tongas (FCT=0.024) mas porém, ao contrário do observado com STRs, essa proporção não atinge níveis de significância estatística. Estas observações sugerem que entre os grupos populacionais sãotomenses não se verificaram restrições tão marcadas do fluxo génico mediado pelo sexo feminino como o do mediado pelo sexo masculino, o que poderá ter decorrido, por um lado, de uma certa generalização em São Tomé e Príncipe de sistemas de acasalamento poligâmicos, com consequente diminuição relativa do tamanho efectivo da população masculina e, por outro, de uma prática antiga entre os Angolares, e persistente durante séculos, de procurarem mulheres fora da comunidade.

xvi Resumo

As sequências de mtDNA sãotomenses, pertenciam a 32 haplogrupos distintos todos específicos de regiões subsarianas, o que significa que o impacto europeu no pool de linhagens femininas de São Tomé e Príncipe foi virtualmente nulo. O desequilíbrio relativamente ao observado para linhagens paternas, testemunha o forte enviezamento do tipo de cruzamentos entre europeus e africanos e que se entende pelo facto de ter sido sempre muito reduzido o número de mulheres europeias que foi para São Tomé e Príncipe e por um contexto social que, estimulando os cruzamentos entre homens europeus e mulheres africanas, era muito estigmatizador das ligações recíprocas. Na amostra global sãotomense, os quatro haplogrupos mais frequentes são L1b, L1c, L2a e L3e1*, que no conjunto representam 56 % do total das sequências, enquanto que 33% pertencem a sete haplogrupos que ocorrem com frequências mais moderadas, L1a, L2b, L2c, L3*, L3b, L3d e L3e2. Pelas características filogeográficas, pode concluir-se que predominam em São Tomé e Príncipe ou haplogrupos que são típicos de África Central e/ou Ocidental ou outros que se encontram amplamente disseminados pelo continente africano. Portanto, o perfil de linhagens de mtDNA de São Tomé e Príncipe sugere uma origem principal a partir dum substrato típico do centro/sudoeste atlântico de África, o que vai ao encontro com o que está documentado sobre as áreas de fornecimento dos escravos transportados para São Tomé e Príncipe no período que antecedeu o ciclo do café e do cacau.

No sentido de obter achegas adicionais sobre a origem geográfica das linhagens de mtDNA sãotomenses, efectuou-se uma análise de matches entre estas e as contidas numa base de dados construída com sequências de diversas populações africanas, tendo- se detectado uma frequência de partilha muito elevada com sequências de Cabo Verde, em especial do grupo NO de ilhas. Esta observação parece ser o reflexo do recente influxo migratório que se registou em São Tomé e Príncipe, iniciado no século XIX com a exploração das culturas do café e do cacau, e que envolveu a entrada de numerosos serviçais de Angola, Moçambique e Cabo Verde, mas em que apenas os de proveniência cabo-verdiana incluíam uma quota feminina relevante. A análise do padrão de partilha revela ainda que os Angolares são os que partilham menor proporção (43.8%) de linhagens de mtDNA com outras populações africanas o que constitui mais um indicador de que o grupo registou um fluxo génico bastante mais limitado que Forros ou Tongas.

xvii Resumo

Entre os Angolares, o haplogrupo mais bem representado é L1c, e dentro deste, o sub- grupo L1c1a só aparece mesmo em sequências angolares. O haplogrupo tem uma distribuição geográfica que sugere ter tido origem na região compreendida entre Angola e o delta de Congo, uma região que permanece ainda por caracterizar quanto a mtDNA, mas que poderá ter sido uma das fontes principais de antepassados dos Angolares. Não obstante a redução de diversidade nos Angolares comparativamente a Forros e Tongas, o reportório de linhagens de mtDNA angolares é bastante variado, o que se traduz numa média elevada do número de diferenças entre pares de haplótipos, resultado que parece mais compatível com um cenário envolvendo a entrada sucessiva de linhagens múltiplas e heterogéneas, ou seja, o previsto assumindo a hipótese sobre a origem dos Angolares que considera serem os descendentes dos escravos fugitivos das plantações que ao longo do tempo foram consolidando uma comunidade relativamente isolada de outros habitantes de São Tomé e Príncipe, hipótese que os dados linguísticos também favorecem.

xviii

SUMMARY

Analysis of patterns of genetic variation in contemporaneous human populations represents an important source of information for reconstructing their origin and evolutionary history. Among the research tools available attention has been progressively centred on polymorphisms of the non-recombining region of the Y- chromosome or the mtDNA, due to their shared properties of uniparental transmission, haploidy and absence of recombination. The study of these markers affords important clues about the demographic history of male and female lineages and is being recruited in numerous areas of anthropologic research.

In this work, the two kinds of markers were used to study the archipelago of São Tomé e Príncipe, a former Portuguese colony located in the Gulf of Guinea. Its population history traces back to the end of the XV century when it was discovered by Portuguese navigators. The archipelago was uninhabited and the Portuguese, recognising its strategic location for their commercial activities, early invested in the archipelago settlement. At the beginning, the Portuguese project for São Tomé e Príncipe was to transform the islands in a centre of sugar production and warehouse for the trade of slaves and, from the XIX century on, in a place of intensive exploration of coffee and cacao’ cultures. The present-day Sãotomean society is the result of a complex process of peopling about which the historic records are rather scarce and vague. Nowadays, concerning the population structure of the archipelago is a common perception the existence of three population groups, Angolares, Forros and Tongas, which are also systematically referred to in the bibliography on São Tomé e Príncipe. Forros are the Sãotomeans whose ancestor have the origin in the archipelago and include the descents

xix Summary of the first freedman slaves. Tongas have as ancestors the forced immigrants coming from Angola, Cabo-Verde and Mozambique who, between the XIX century and middle of the XX, entered in mass into the archipelago to work in the cacao and coffee productions. Although the Angolares are a very small group, they show the strongest signals of identity. Until few times ago, they lived concentrated in the Southeast region of São Tomé but presently they are also spread through small villages located in the coasts of São Tomé and of Príncipe. Concerning the Angolares’ origin, the historical documentation is not conclusive and some hypotheses about the question remain opened.

In this study PCR, PCR/RFLP and/or sequenciation direct methods were used to analyse the distribution patterns of 7 STRs (DYS19, DYS389I, DYS389II, DYS390, DYS391, DYS392 and DYS393) and 14 biallelic markers (YAP, SRY8299, 92R7, SRY1532, SRY2627, Tat, sY81, M9, LLy22g, 12f2, M109, M112, M150 and M168) of the Y chromosome and sequence variation in HVS-I and HVS-II of mtDNA, in samples from Angolares, Forros and Tongas, having as main objectives: - to evaluate the level of populational sub-structure that presently characterises São Tomé e Príncipe; - to understand how the observed patterns of diversity were generated and to make inferences about the factors with greatest impact in those patterns; - to study the genetic affinities of São Tomé e Príncipe with African and others populations that could bring clues about the genetic past of the archipelago; - to contribute to the refinement of the genetic characterisation of . Relatively to the STRs of the Y chromosome, the allelic distributions found for each marker in São Tomé e Príncipe significantly differed from the observed in European populations, and clearly tended to fit well in the patterns commonly registered in African populations.

Also with respect to the variance in the mean number of repeats in Y-STRs, a parameter that usually assumes distinct values in African and European populations, the value found in the whole sample of São Tomé e Principe (0.886) was high and of an order of magnitude that, in general, is only observed in Africans. These results reflect the high contribution of slaves to the archipelago’ settlement, salves whose main origin was the Atlantic fringe of the African continent.

xx Summary

However, the Y-STRs also revealed signals that the European contribution to the Sãotomean male gene pool was not irrelevant. The STR that individually better captured this influence was DYS390, a marker with high ability to diagnose European and African populations. The second more frequent allele (13.6%) in São Tomé e Príncipe was DYS390*24, which is very rare in sub-Saharan populations but is common in Europeans, including from the North and Centre of Portugal. Others signs of this contribution were evidenced by the analysis of patterns of shared haplotypes defined by the 7 Y-STRs. In the whole sample of the archipelago, containing 103 Y-chromosomes, 79 distinct haplotypes were found and the level of haplotypic diversity was very high (0.987±0.006), as it is usual in most populations. In order to look for the geographic origin of the Sãotomean Y-STRs lineages, it was examined the pattern of matches with entries logged in a database for populations of European descent and in other one constructed for African populations. Some Sãotomean haplotypes presented numerous matches with Europeans, including Portuguese, indicating that their presence in São Tomé e Príncipe was the result of introgression likely mediated by Portuguese men.

Probably, it is the presence of the European component together with the fact that the African lineages were originated from a considerably dispersed area of recruitment, that explain the very high value observed for the mean difference between pairs of Sãotomean Y-STR haplotypes (6.19±2.97).

Focusing on the Sãotomean population groups, Forros and Tongas basically shared the same pattern of variation at Y-STRs and, consequently, they did not showed significant genetic differences (RST = - 0.067, P>5%). By the contrary, Angolares could be distinguished from Tongas and Forros by a clear reduction of diversity that was assessed by different parameters: they presented the lowest values of mean heterozigosity for Y-STR (0.504±0.298), of haplotypic diversity (0.967±0.030), gene diversity (0.504±0.298), variance of the mean number of repeats (0.554) and mean number of differences between pairs of haplotypes (4.69±2.39). These are evidences of a certain microdifferentiation of the Angolares that was reflected in the detection of significant genetic distances with Forros (RST=0.916, P<5%) or

xxi Summary

Tongas (RST =0.853, P<5%), and also with any of the remaining African populations with which Angolares were compared. In conformity, when AMOVA was applied to investigate the degree of population sub- structuring in São Tomé e Príncipe, a statistically significant percentage of variation due to differences between groups was detected (FCT=0.0324, P<5%) when the Angolares were confronted with Tongas and Forros. The slight genetic differentiation found within Angolares, seems to be due to endogamy, genetic drift or founder effect, as expected for small groups that live in relative isolation and with scarce contacts with surrounding populations. All historic sources refer to these circumstances for the Angolares until very recently.

The analysis of biallelic markers of the Y-chromosome, led to detect in São Tomé e Príncipe the presence of the following haplogroups: E3a, B2a1, B2b, B*(xB2a,b), P*(xR1a,R1b3f), CR*(xDE,J,K) and E*(xE3a). The first four are highly specific of sub- Saharan Africa and represented the major fraction of the lineages found in São Tomé e Príncipe. E3a was found in 69.1% of Sãotomean Y-chromosomes and reached the highest frequency, 78.6%, among the Angolares and the lowest one, 59.1%, among the Tongas. The haplogroups B2a1, B2b and B*(xB2a,b), globally comprising 6.5% of the Sãotomean chromosomes, were absent in Forros and were present in 5.4% of the Angolares and 13.7% of the Tongas.

Concerning P*(xR1a, R1b3f), a haplogroup very common in Europe and virtually absent in Africa, it represented 11.5% of the whole sample of São Tomé. CR*(xDE, J, K), a haplogroup also usually not found in Africans, was detected in 5.7% of the Sãotomeans. Considering the filogeography of P(xR1a, R1b3f) and CR*(xDE, J, K), the more likely explanation for their presence in São Tomé e Príncipe is to have been introduced by European males and, therefore, the joint frequency of the two haplogroups - 17.3% - constitutes an estimation for the minimum value of the European genetic component in São Tomé e Príncipe. 7.2% of Sãotomean Y-chromosome belonged to haplogroup E*(xE3a). This is a very heterogeneous haplogroup, including in the pattern of geographic distribution since it is spread throughout Africa and also in the Middle East and Europe. Due to the impossibility to infer the geographic origin of chromosomes E*(xE3a) without a refinement of their molecular characterisation, an

xxii Summary extrapolation was made to infer that among the São Tomé e Príncipe lineages of Portuguese ancestry, approximately 3.1% were E*(xE3a). Therefore, the yielded estimate for the male fraction of European origin in the present-day São Tomé e Príncipe population was 20.7%. This proportion is substantially greater than the reduced fraction of Europeans relatively the Africans recorded in different periods for the archipelago, and the differential translates the high variance in the reproductive success of the individuals that contributed for the São Tomé e Príncipe’ peopling. The European component reached 27.2% in Forros, the more numerous population group of the archipelago, 21.4% in Tongas and the lowest proportion, 14.7%, in Angolares. This result supports again the weaker contacts between the Angolares and other São Tomé inhabitants, in this case Europeans, which can be understood by the long history of considerable isolation of the group.

Relatively to haplotypes defined by Y-biallelic markers, once more the Angolares exhibited the lowest levels of diversity, either at the proportion of different haplogroups (8.93%), haplogroup diversity (0.376±0.080), gene diversity (0.098±0.068) or mean number of differences between pairs of haplogroups (1.375±0.860). In opposition, for the same parameters the Tongas registered the highest values, which can be the consequence from the large geographic scattering of the original regions of their ancestors. Angola, Cabo Verde and Mozambique were the main sources of contract labourers for the Sãotomean plantations and then, in a certain way, the Tongas represent a sub-sampling of sub-Saharan Africa geographically more heterogeneous than the represented by Forros, whose ancestors were more restrictively recruited in the Atlantic fringe between present-day Ivory Coast and Angola. This can explain the slight excess of diversity of Tongas comparatively to Forros. Notwithstanding these observations, based upon haplogroups defined by Y-biallelic markers, genetic distances between Angolares, Forros or Tongas were not statistically significant: FST Forros/Tongas = 0.008, P=0.27; FST Forros/Angolares = 0.003, P=0.26;

FST Tongas/Angolares = 0.032, P=0.09.

In order to investigate the pattern of variation of maternal lineages in São Tomé e Príncipe, HVS-I and HVS-II sequences of mitochondrial DNA were analysed in samples from Angolares, Forros and Tongas.

xxiii Summary

Regarding levels of diversity in HVS-I and HVS-II, the Angolares were again distinct from Forros or Tongas due to decreased mean heterozigosity and proportion of different haplogroups. In Angolares, the mean number of differences between sequences was somewhat higher than in the two other population groups, but the Angolar pattern of distribution of pairwise differences was more irregular and significantly differed from the expected assuming a model of population expansion, contrarily to the observed in Forros or Tongas.

The data from mtDNA produced identical results to those derived from Y-STRs concerning the genetic differentiation between the three Sãotomean groups, revealing significant differences between Angolares and Forros (FST=0.037, P=0.04) or Angolares and Tongas (FST=0.030, P=0.04), and the absence of significant differentiation between

Forros and Tongas (FST=0.01, P=0.14). When AMOVA was applied to the mtDNA data, the percentage of variation due differences between groups also reached the highest value when Angolares were compared with Forros+Tongas (FCT=0.024), but even so, contrarily of the observed with STRs, this proportion did not attained level of statistical significance. These observations suggest that among the Sãotomean groups did not exist such marked restrictions to the gene flow mediated by the female sex as the restrictions to the gene flow mediated by the male sex. For this finding might have accounted the common trend to polygamic matting systems in São Tomé e Príncipe, with consequent relative decrease on the effective population size of males, and the old and persistent practice along centuries among Angolares of looking for women outside the community.

The Sãotomenses mtDNA sequences belonged to 32 distinct haplogroups, all being specific from sub-Saharan regions, which means that the European impact in the São Tomé e Príncipe female pool was virtually nil. The discrepancy relatively to the observed for the paternal lineages, testifies the strong sex bias in the matting type between Europeans and Africans occurred in the archipelago, that can be explained by the fact that the number of European women arriving at São Tomé e Príncipe was always extremely reduced and by the social context that strongly encouraged the crossing between European men and African women and repressed the reciprocal unions.

xxiv Summary

In the Sãotomean sample, the four most frequent haplogroups were L1b, L1c, L2a and L3e1*, that together represented 56 % of sequences, while 33% of sequences belonged to seven haplogroups occurring with more moderate frequencies, L1a, L2b, L2c, L3*, L3b, L3d and L3e2. From the mtDNA filogeographic pattern, it was possible to deduce that in São Tomé e Príncipe are predominant either haplogroups typical from Central and/or Western Africa or others widely spread in the African continent. Therefore, the profile of mtDNA lineages in the archipelago suggests a main origin from a substratum characteristic from the Atlantic Central/Western Africa, which fully meets the documented concerning the areas that supplied the slaves brought to São Tomé e Príncipe during the period that preceded the coffee and cacao cycle.

Aiming to obtain additional clues about the geographical origin of the mtDNA lineages found in São Tomé e Príncipe, it was investigated the pattern of matches between Sãotomean sequences and those contained in a database constructed with African sequences from other populations. The frequency of shared sequences with Cabo Verde was rather high, specially with the NO group of islands, and the finding seems to reflect the recent migration influx that occurred in São Tomé e Príncipe, initiated in the XIX century with the exploration of the coffee and cacao cultures, and that involved the entrance of thousands of workers from Angola, Mozambique and Cabo Verde. In the immigrants’ waves, the female quote was only similar to the male one in that of Caboverdean provenance. The analysis of shared mtDNA haplotypes also showed that Angolares were the Sãotomeans that shared the least proportion (43.8%) of lineages with others Africans, which constitutes another evidence that the group registered a more limited gene flow than Forros or Tongas.

Within Angolares, the more frequent haplogroup was L1c and the sub-cluster L1c1a was only detected in sequences from the group. The haplogroup presents a geographical distribution that suggests to have been originated in the region between Angola and the Congo Mouth, an area that still remains uncharacterised for mtDNA, but that might have been an important source of Angolares’ ancestors. Despite the reduction of diversity in Angolares comparatively to Forros and Tongas, their repertory of mtDNA lineages is rather diverse, as expressed in high mean number

xxv Summary of pairwise differences between haplotypes, and this result seems more compatible with a scenario involving successive inputs of multiple and heterogeneous lineages within the group, that is, the predicted assuming the hypothesis for the Angolares’ origin that presumes they are the descents of the fugitive slaves from the plantations that along the time have consolidated a relatively isolated community from other São Tomé e Príncipe inhabitants, hypothesis that the linguistics data also support.

xxvi

AGRADECIMENTOS

Após um longo e árduo percurso cabe-me agora a doce tarefa de agradecer a todos aqueles que de algum modo tornaram possível a concretização desta tese.

Ao Prof. Dr. Augusto Abade, orientador da tese, pelo apoio e pelas facilidades concedidas ao longo dos trabalhos.

Um agradecimento muito especial a minha co-orientadora a Prof. Dra. Maria João Prata pelos ensinamentos e por ter acompanhado a realização deste trabalho, dando-me um apoio permanente, disponibilidade, incentivo e amizade durante toda a sua realização, que permitiram levar a bom termo esta tese.

Ao Prof. Dr. António Amorim, a quem não podia deixar de expressar a minha mais profunda gratidão pelos valiosos comentários e por ter desde o início apoiado e incentivado o Projecto de investigação genética de São Tomé e Príncipe.

À Doutora Leonor Gusmão pelos incentivos, apoio, amizade e acolhimento, durante as minhas digressões ao Porto, que muito contribuíram para a concretização dos trabalhos conducentes a esta tese. Aos seus filhos, gostaria de agradecer por me terem feito sentir parte integrante da família. Foi maravilhosa a convivência com eles.

À Dra Cíntia Alves e à Doutora Luísa Pereira pela disponibilidade e apoio incondicionais que facilitaram a minha integração na equipa de trabalho em que estão integradas, no IPATIMUP.

xxvii Agradecimentos

Ao Doutor Licínio Manco pelo apoio e companheirismo demonstrados durante a realização dos trabalhos no Departamento de Antropologia da Universidade de Coimbra.

Ao Doutor Francisco Corte Real e ao Prof. Dr. Sobrinho Simões por terem consentido a realização dos trabalhos no Instituto de Medicina Legal de Coimbra e no IPATIMUP, respectivamente.

À Dra Conceição de Vide, à Dra Ana Mónica Carvalho e respectiva equipa de trabalho, por terem facilitado e tornado agradável a minha passagem pelo Instituto de Medicina Legal de Coimbra.

Ao Prof. Dr Jorge Rocha pela cedência de algumas amostras, o que permitiu aumentar a nossa amostragem.

Ao Dr. António Lima, ex-Ministro da Saúde de São Tomé e Príncipe por ter autorizado aí, a realização deste trabalho e à Dra. Julieta Espírito Santo pelas valiosas sugestões e apoio dados desde o início deste projecto.

À população sãotomense que muito gentilmente acedeu à doação do seu sangue, sem o qual, este trabalho não teria sido possível. Aos Delegados de Saúde, aos técnicos de laboratório e aos agentes sanitários pelas facilidades concedidas. Às Dr Fernanda Dias, à Dra. Evangelina Boamorte pela colaboração prestada durante as colheitas.

Às Comissões Científica e Executiva do Departamento de Antropologia, pelas facilidades concedidas.

Os meus sinceros agradecimentos ao Centro de Investigação em Antropologia da Universidade de Coimbra, à Fundação Calouste Gulbenkian, à Fundação do BCP e à casa de Cultura da Língua Portuguesa da Universidade do Porto pelos apoios concedidos.

xxviii Agradecimentos

Uma palavra muito especial à toda minha família, em especial à minha mãe, à minha irmã e às minhas sobrinhas, por terem estado sempre presentes, nos momentos angustiantes e nos mais felizes.

Aos meus queridos filhos por terem suportado toda a minha falta de paciência nos momentos de maior ansiedade, e me terem conferido forças para chegar ao fim.

Finalmente, a todos os que de algum modo tornaram possível a realização desta tese.

xxix

À Nini e ao Davy

Na elaboração desta dissertação, foram utilizados resultados já publicados e que abaixo são discriminados. Em todos eles, a signatária participou na obtenção, análise e discussão dos resultados, bem como na elaboração da sua forma publicada. O conteúdo dos mesmos foi parte integrante do tema da sua tese de Doutoramento.

Trovoada MJ, Manco L, Gusmão L, Santos MT, Abade A, Amorim A, Prata MJ (2001) Polimorfismos Genéticos de ESD, GLO1, GPT e PGM1 em São Tomé e Príncipe. Antropologia Portuguesa. 18: 143-150.

Trovoada MJ, Alves C, Gusmão L, Abade A, Amorim A, Prata MJ (2001) Evidence for population sub-struturing in São Tomé e Príncipe as inferred from Y chromosome STR analysis. Ann. Hum. Genet. 65: 271-283.

Trovoada MJ, Pereira, L, Gusmão L, Abade A, Amorim A, Prata MJ (2003) Pattern of mtDNA Variation in Three Populations from São Tomé e Príncipe. Ann. Hum. Genet. 65: 271-283. 68:40-54.

I – INTRODUÇÃO ______

1.1 – INTRODUÇÃO GERAL

Desde há muito que se reconhece que a análise genética de populações humanas contemporâneas constitui uma ferramenta extremamente importante em diversas áreas de investigação antropológica, nomeadamente na tentativa de reconstrução do nosso passado evolutivo. A sua capacidade de resolução foi melhorando à medida que aumentou o espectro de marcadores genéticos possível de investigar. Desde a fase dos marcadores serológicos, antes de 1970, à dos polimorfismos proteicos e do complexo de histocompatibilidade das décadas 70 e 80, passando pelos primeiros marcadores moleculares ainda nos anos 80 e 90, até aos nossos dias, em que se pode dissecar finamente a variação em segmentos genómicos específicos, os avanços foram extraordinários. Para os avanços mais recentes, em muito contribuíram os progressos nas tecnologias de genotipagem estimulados pelo Projecto do Genoma Humano. O crescimento das fontes de informação genética foi acompanhado pela expansão do número de questões para que foi mobilizada a análise genética, sendo de destacar, na área da Genética Populacional, as que envolvem inferências sobre episódios demográficos do passado evolutivo das populações, como bottlenecks, expansões, migrações ou misturas populacionais. Para esse tipo de problemas, o estudo de haplótipos do DNA mitocondrial (mtDNA) ou da região não-recombinante do cromossoma Y, tem revelado ser um instrumento privilegiado. Devido à ausência de recombinação e transmissão uniparental, é relativamente simples recuperar as relações evolutivas entre linhagens de mtDNA ou do cromossoma Y, o que associado ao conhecimento cada vez mais detalhado dos padrões de distribuição geográfica tem permitido um tipo de abordagem que Avise et al. (1987) designaram por filogeográfica. Pelas características referidas, cada um desses dois genomas comporta-se como um

3 I-Introdução locus único, o que pode representar uma insuficiência em estudos evolutivos. No entanto, ambos têm proporcionado inferências consistentes, muitas vezes suportadas por estudos independentes, e em acordo com dados arqueológicos, históricos e outras fontes de informação genética (Cavalli-Sforza e Feldman, 2003). África é um continente com uma história rica e de importância crucial para a compreensão da origem e evolução da espécie humana. Foi em África que surgiu o género Homo, foi no leste africano que surgiram os primeiros homens modernos que empreenderiam uma milenar jornada de dispersão e colonização de todas as regiões do globo, foi em África que há pouco mais de quinhentos anos se iniciou uma das maiores movimentações humanas dos tempos modernos que envolveu o tráfico de milhões de escravos africanos para a Europa e Américas. O continente africano contém uma extraordinária diversidade genética, cultural, linguística e étnica (http://www.ethnologue.com). Não obstante, as populações africanas permanecerem do ponto de vista genético sub-estudadas comparativamente a populações de outras regiões. A maioria dos estudos inclui marcadores genéticos avulsos, poucos indivíduos e, geralmente, incide sobre as populações africanas mais divergentes (Tishkoff e Williams, 2002). Desconhece-se ainda muito sobre os padrões de distribuição da diversidade genética em África, quer à escala continental quer a escalas geográficas mais restritas. Numa perspectiva mundial, a atenção dos estudos genéticos tem-se centrado em acontecimentos bastante remotos por se assumir que os ocorridos mais recentemente, sobretudo a partir dos últimos 500 anos, são fáceis de recuperar pela consulta de arquivos históricos (Jobling e Tyler-Smith, 2003). Porém, para a maioria das populações da África subsariana, para além de não existir documentação escrita pré- quinhentos, a posterior, resultante de registos efectuados pelos europeus, é geralmente bastante precária. É o que acontece relativamente a São Tomé e Príncipe. A história deste pequeno arquipélago localizado no Golfo da Guiné remonta apenas a finais do século XV quando foi descoberto por navegadores portugueses. Portanto, uma história breve de pouco mais de cinco séculos, mas complexa e conflituosa, que retrata muito do que foi a presença europeia em África. O projecto português para São Tomé e Príncipe foi transformar o arquipélago, de início, num centro de produção de cana-de-açúcar e entreposto para o comércio de escravos e, a partir do século XIX, num espaço de exploração intensiva da cultura do

4 I-Introdução café e do cacau. Este modelo de organização resultaria no afluxo de uma fracção, sempre minoritária, de colonos europeus, e na entrada de vagas maciças de africanos, escravos ou imigrantes forçados, consoante o contexto social que ao longo do tempo foi mudando. A sociedade sãotomense actual, africanizada (Henriques, 2000), é fruto deste processo de povoamento conturbado e sobre o qual os registos históricos, embora proporcionem os traços gerais, são bastante escassos. Pouca informação existe sobre o volume de tráfico de escravos e a sua proveniência nos séculos que se seguiram ao povoamento das ilhas. Por vezes, a documentação é vaga ou contraditória e assim se entende que, apesar da curta trajectória de povoamento do arquipélago persistam dúvidas sobre a origem dos Angolares, um dos três grupos étnicos de São Tomé e Príncipe. Presentemente, sobre a estrutura populacional do arquipélago, é percepção comum a existência de três grupos populacionais, Forros, Tongas e Angolares, que são também uma referência constante na bibliografia etno-histórica sobre São Tomé e Príncipe (Ambrósio, 1984; Neves, 1989; Henriques, 2000). A distinção entre Forros e Tongas resulta essencialmente de uma construção social recente. Consideram-se Forros todos os sãotomenses cujos ascendentes têm raízes no arquipélago, em oposição aos Tongas, descendentes dos milhares de serviçais que, a partir do século XIX, foram recrutados de Cabo Verde, Moçambique e Angola para os trabalhos nas roças do café e do cacau. É bem mais antigo e persistente, o registo de um grupo populacional, designado de Angolares, vivendo em relativo isolamento no sudeste de São Tomé, que ainda actualmente, embora tendendo a ser assimilado no tecido social e económico da ilha, preserva hábitos e tradições próprios, incluindo a língua, um crioulo apenas falado pelos Angolares. Mas sobre a sua origem, as fontes históricas não têm permitido dar resposta às incertezas que ainda perduram. No que diz respeito a São Tomé e Príncipe, existe já um número considerável de dados relativos a sistemas clássicos (Santos et al., 1996; Manco et al., 1999; Trovoada et al., 2001), marcadores moleculares autossómicos (Prata et al., 1997; Seixas et al., 1999; Albarrán et al., 1998; Pereira et al., 2000a, Gusmão et al., 2001; Tomás et al., 2002) e até mtDNA (Mateu et al., 1997), que têm contribuído para o conhecimento da história genética geral de São Tomé e Príncipe, mas nenhum dos trabalhos referidos foi desenhado para avaliar a subestruturação interna no arquipélago. Com o desenvolvimento dos trabalhos que conduziram a esta tese, procurou-se aprofundar o grau de caracterização genética de São Tomé e Príncipe, analisando o padrão de

5 I-Introdução diversidade de linhagens de mtDNA ou do cromossoma Y em amostras de indivíduos identificados como Forros, Tongas e Angolares. Recorreu-se à documentação histórica disponível para tentar compreender a variação genética observada, e espera-se ter contribuído para reforçar o papel da análise genética como instrumento de reconstituição histórica.

1.2 - SÃO TOMÉ E PRÍNCIPE: HISTÓRIA E POVOAMENTO

1.2.1 - A Localização

São Tomé e Príncipe, o segundo país mais pequeno de África, é um arquipélago situado no Golfo da Guiné, composto por duas ilhas principais e vários ilhéus (Figura 1.1). A ilha de São Tomé, com cerca de 857 km2 de superfície, encontra-se a cerca de 180 milhas da costa africana e a extremidade sul fica imediatamente acima do Equador. A ilha do Príncipe, com uma área de 114 km2, situa-se a 82 milhas a norte de São Tomé, e a cerca de 160 milhas do continente africano. Adjacentes à ilha de São Tomé existem alguns ilhéus, dos quais os mais importantes são, a Sul, o das Rolas (Gago Coutinho), a NE o das Cabras, e a Este, o de Santana e um aglomerado de 18 rochas denominado o rochedo das Sete Pedras. Junto à ilha do Príncipe encontram-se os ilhéus Boné de Jokei, Caroço, Bom-Bom e Pedras Tinhosas. Além das duas ilhas principais e dos ilhéus, esteve também sob administração de São Tomé e Príncipe, até 1960, o Forte de São João Batista de Ajudá, localizado no antigo Reino do Daomé, actual Benin. O arquipélago faz parte de um alinhamento vulcânico, orientado na direcção NE-SO, com cerca de 2.000 km de comprimento, onde se encontram também localizadas as ilhas de Ano Bom/Pagalu e Bioko/Fernando Pó e, no continente, as montanhas dos Camarões.

6 I-Introdução

Figura 1.1 - Mapa e localização de São Tomé e Príncipe

1.2.2 - A Descoberta

Apesar de persistirem algumas dúvidas quanto ao ano da descoberta e descobridores, a maioria das fontes situa o descobrimento das ilhas de São Tomé e Príncipe entre 1470 e 1471 nos dias 21 de Dezembro e 17 de Janeiro, dias dedicados a Santo Tomé e Santo Antão, respectivamente. Santo Antão terá sido o nome inicial da ilha do Príncipe, renomeada posteriormente em homenagem ao Príncipe D. João. O descobrimento tem sido atribuído a João de Santarém e Pêro Escobar. As fontes mais antigas sobre a história de São Tomé e Príncipe referem que as ilhas eram desabitadas na altura da descoberta, facto que até há pouco era aceite consensualmente. Recentemente, porém, colocou-se a hipótese, pouco fundamentada, da existência de uma população autóctone na ilha de São Tomé antes da chegada dos navegadores portugueses, a propósito da questão da origem dos Angolares que será abordada no ponto 1.2.4.

7 I-Introdução

1.2.3 - Povoamento e resenha histórica

Na curta história do arquipélago, destacam-se duas fases: a do ciclo do açúcar e a do ciclo do cacau e do café, que acompanharam mudanças importantes nos tecidos social, demográfico e económico de São Tomé e Príncipe.

1.2.3.1 - Ciclo do açúcar

Este ciclo teve início logo após a ocupação das ilhas pelos portugueses, que aí desenvolveram um projecto económico organizado em duas vertentes: plantação de açúcar e centro de concentração e redistribuição de escravos. A cultura de cana-de- açúcar, introduzida em 1501 a partir da ilha da , a produção da pimenta e a exportação de , eram no século XVI a principal fonte de rendimento de São Tomé. A ilha iria transformar-se numa região com alta concentração de escravos, alguns - escravos de “quarto”- com fixação na ilha de carácter permanente, que seriam ocupados em tarefas domésticas ou agrícolas como a monocultura da cana do açúcar, e outros - escravos de “resgate”- que permaneciam pouco tempo em São Tomé onde eram armazenados e posteriormente traficados para o Brasil, como um dos destinos principais. A baía de Ana Chaves iria ser o maior porto negreiro da África Ocidental (Costa, 1982), antes do tráfico ser despachado via feitoria da Mina, situada no actual Gana. A ilha de São Tomé esteve entregue a vários donatários antes de 1521, ano em que passou para o domínio directo da Coroa Portuguesa. A primeira tentativa de povoamento ter-se-á iniciado em 1485, quando D. João II doou a capitania da ilha ao primeiro donatário - o fidalgo João de Paiva. Em 1490, a capitania passou para João de Pereira, fidalgo da casa real e um dos primeiros moradores, em reconhecimento dos serviços que anteriormente prestara à Coroa. Em Julho de 1493, em virtude do seu falecimento, a capitania é doada a Álvaro Caminha, a quem se deve o grande impulso no processo de povoamento de São Tomé (Tenreiro, 1961; Neves, 1989). O povoamento da ilha foi assegurado por dois grupos cuja convivência se viria a manifestar bastante conflituosa (Henrique, 2000): o grupo europeu, hegemónico mas

8 I-Introdução numericamente minoritário, e o grupo africano, formado pelos escravos recrutados pelos europeus para o abastecimento da mão-de-obra necessária aos engenhos de açúcar e para o comércio transatlântico. O primeiro grupo, quase exclusivamente constituído por indivíduos do sexo masculino, era muito heterogéneo e incluía portugueses, livres ou degredados e, em menor fracção, outros europeus, nomeadamente, castelhanos, holandeses, genoveses e franceses. Alguns judeus expulsos de Portugal terão tido como destino São Tomé. É referido por várias fontes que a maior leva única que deu entrada no arquipélago, ocorreu pouco antes do virar do século XV, e incluiu cerca de 2000 crianças judias mandadas retirar a famílias expulsas pelos Reis Católicos e aceites em Portugal, das quais, em 1499, já só sobreviriam cerca de 600 (Tenreiro, 1961). O segundo grupo, de impacto demográfico muito superior, era composto pelos africanos oriundos de regiões diversas do litoral atlântico, que ao longo do tempo se foram deslocando para Sul - de início, do Golfo da Guiné (Costa da Mina, Benin, Togo, Gana e Gabão especialmente), mais tarde abrangendo também a região do Manicongo e, ainda mais tarde, do Norte de Angola (Tenreiro, 1961; Almeida, 1966; Henriques, 2000). Por volta de 1550 a população de São Tomé rondaria cerca de 10 mil habitantes, dos quais o número de europeus não ultrapassaria o milhar, número que regrediria permanentemente nos séculos seguintes (Tenreiro, 1961). A ilha do Príncipe só começou a ser povoada em 1500 quando a respectiva capitania foi doada a António Carneiro; todo o esforço de desenvolvimento demográfico foi feito à sombra da ilha de São Tomé. Desde o início do século XVI, com a utilização de escravos na exploração da cana-de-açúcar e com a intensificação do tráfico negreiro, São Tomé viu crescer um clima de hostilidade e de conflitos sociais iminentes. Cedo se registaram tentativas de rebeliões por parte dos negros, mas as primeiras movimentações foram facilmente contidas devido à falta de organização, ao excesso de espontaneidade e ao carácter localizado das mesmas. À violenta repressão dos colonos, os escravos respondiam com um número crescente de fugas para zonas interiores de floresta mais inacessíveis, onde, escapando ao controlo colonial, podiam viver com mais aproximação aos seus padrões culturais. A partir dos locais de refúgio - os quilombos, aplicando o termo mais tarde utilizado no Brasil para designar realidades sociais equivalentes, e depois de atingirem um nível de organização mínimo, os escravos fugidios e revoltados desencadeavam

9 I-Introdução ataques aos engenhos açucareiros. Incêndios às plantações, mortes, raptos de mulheres, intensificaram-se durante todo o século XVI, contribuindo fortemente para destabilizar a economia de plantação. Para os europeus, a adaptação às condições do arquipélago revelar-se-ia muito complicada, devido à elevada taxa de mortalidade e debilitação por malária. A fama de São Tomé, depressa propagada, tornava difícil a renovação da população europeia (Caldeira, 1999). Paralelamente, a convivência entre os grupos sociais dominantes deteriorava-se em consequência de vários focos de conflito entre poder civil e religioso. No final do século, uma crise de desentendimento entre o poder político e o eclesiástico, facilita aquela que será a maior revolta de escravos em São Tomé (Tenreiro, 1961; Neves, 1989). A perturbação instala-se na ilha, levando muitos produtores de açúcar a partir para o Brasil, onde a produção florescia, os conflitos sociais estavam ainda apaziguados e os lucros se adivinhavam maiores. Devido à agitação existente em São Tomé, a capital foi até transferida para a ilha do Príncipe, situação que se manteve até 1852 (Tenreiro, 1961). Depois do auge do período açucareiro na primeira metade do século XVI, na segunda metade a produção de açúcar começa a sofrer sérias flutuações cujas causas se podem atribuir às constantes convulsões sociais, à dificuldade em controlar ataques piratas e de potências europeias, e à concorrência comercial de outros centros produtores, destacando-se, a partir de finais do século, o Brasil (Henriques, 2000). Desse modo, e não obstante o papel económico do tráfico de escravos, assiste-se a um declínio rápido das actividades produtivas das ilhas. Ao entrar na segunda metade do século XVII, a maioria das plantações de cana-de-açúcar entrou em derrocada e foi total ou parcialmente abandonada, encerrando-se assim o ciclo do açúcar.

1.2.3.2 - Ciclo do café e do cacau

O período de estagnação económica que se instalou em São Tomé e Príncipe, prolongou-se até ao século XIX, altura em que a introdução da cultura do café logo seguida da do cacau irá marcar o início de novo ciclo de desenvolvimento. Por volta de 1800 o café é introduzido no arquipélago, e pouco depois, em 1822, será a vez do cacau. A intensificação das duas culturas, mas sobretudo a do cacau, irá acarretar profundas transformações na vida económica e social do país. Assiste-se ao renascer de uma

10 I-Introdução prosperidade que havia desaparecido, não obstante o ambiente social continuar a não ser muito favorável aos novos desafios de desenvolvimento. No princípio do século, São Tomé e Príncipe vivia ainda a crise demográfica consequente à recessão económica dos séculos XVII e XVIII, em parte motivada pela retirada para o Brasil dos grandes proprietários das plantações da cana-de-açúcar. Durante esses dois séculos, muitos “homens livres”, negros chamados “filhos da terra” (ver ponto 1.2.4) reforçam o estatuto social, tornando-se detentores de terras aráveis abandonadas. O conflito de interesses entre estes e a leva de colonos portugueses atraída pela introdução das novas culturas será difícil de ultrapassar. Os colonos acabarão por extorquir grande parte das terras que pertenciam aos “homens livres”, a quem restaram parcelas de terreno insignificantes. Poucos anos depois, recuperar-se-ia e adaptar-se-ia o sistema de divisão em grandes unidades de exploração, conhecidas por “roças”, que havia sido implementado para a produção sacarina. O sistema de roças exigia um enorme reforço de mão-de-obra que os colonos não conseguiam recrutar entre os sãotomenses pela resistência oferecida em regressar a uma condição social e de trabalho que há muito haviam definitivamente superado. O recurso à importação de novos escravos estava fora de questão face às pressões internacionais contra o esclavagismo que preconizavam a urgente abolição da escravatura, o que em Portugal ocorreria oficialmente em 1869. Uma espécie de escravatura disfarçada (Carreira, 1982) foi a solução encontrada para suprir as recentes necessidades de mão-de-obra. A partir de 1879, Portugal passou a firmar contratos de trabalho com imigrantes provenientes de outras colónias (na altura) portuguesas em África, vinculando-os coercivamente a um estilo de trabalho forçado. Tratava-se, na realidade, de uma forma de imigração também forçada, que resultou na entrada em São Tomé e Príncipe de milhares de trabalhadores, trazidos de Cabo Verde, Moçambique e Angola. Aproximadamente entre 1900 e 1920, entraram no arquipélago mais de 23 000 caboverdianos, 21 000 angolanos e 29 000 moçambicanos, e a geografia do recrutamento iria manter-se, com volumes oscilantes mas sempre expressivos, até aos anos 70 (Carreira, 1982; Davidson, 1988). Os repatriamentos previstos nos contratos de trabalho foram frequentemente incumpridos, e assim, a entrada desse contingente de trabalhadores em São Tomé e Príncipe, dará início a nova fase de crescimento demográfico no arquipélago. Em Julho de 1975, São Tomé e Príncipe torna-se um país independente.

11 I-Introdução

Actualmente, o arquipélago conta com cerca de 175 000 habitantes, tendo registado a partir de 1985, um índice de crescimento populacional da ordem dos 2.3%.

1.2.4 - Estrutura Populacional

A maioria das fontes sobre a estrutura populacional de São Tomé considera, para além dos europeus e antes do segundo quartel do Século XIX, a existência de: - Filhos da terra - descendentes dos primeiros negros livres fixados no arquipélago; - Angolares - descendentes de escravos negros; - outros escravos negros envolvidos em trabalhos domésticos ou nas fazendas agrícolas. Posteriormente, e até 1962 (em fins de 1961 dá-se a abolição do indigenato) as referências passam a considerar: - Filhos da terra ou Forros -incluindo, inicialmente, os descendentes dos primeiros negros livres e de todos aqueles a quem tinha sido concedida carta de alforria e, a partir de 1875 com a declaração do fim da escravatura em São Tomé e Príncipe, num sentido mais lato, todos os indivíduos, mulatos ou negros, naturais de São Tomé e Príncipe exceptuando os Angolares; - Angolares; - Serviçais - contratados temporariamente em Angola, Cabo Verde e Moçambique para trabalhar nas roças; - Tongas - os descendentes dos serviçais nascidos na ilha. Para a ilha do Príncipe eram referenciados os mesmos grupos com a excepção dos Angolares. Actualmente entre os sãotomenses é percepção normal a existência de três grupos populacionais, Angolares, Forros e Tongas, que continuam a ser mencionados na bibliografia sobre o arquipélago (Ambrósio, 1984; Neves, 1989; Henriques, 2000). Forros são todos aqueles cujos antepassados têm raízes no arquipélago. Neles se incluem os descendentes dos primeiros africanos libertados pelos portugueses - os “homens livres” - que na fase inicial do povoamento tiveram um papel importante no desenvolvimento de toda a arquitectura social e económica de São Tomé e Príncipe. Admite-se que entre as gerações iniciais de “filhos da terra”, houvesse um número

12 I-Introdução razoável de mestiços, já que o incentivo ao acasalamento entre homens europeus e mulheres africanas, era uma estratégia de povoamento daquela altura (Tenreiro, 1961). O poder colonial, não só promovia a mestiçagem como procurava valorizar socialmente os mestiços dela resultante. Tongas são os descendentes dos imigrantes forçados que, sobretudo entre o final do século XIX e meados do XX, entraram em massa no arquipélago. Para muitos serviçais, o regresso à terra natal findos os contratos temporários de trabalho foi comprometido por razões diversas, entre as quais as condições económicas extremamente precárias, restando-lhes como “opção”, novamente forçada, a fixação em São Tomé e Príncipe. Para esta onda de imigrantes, os contributos mais significativos vieram de Angola, Cabo Verde e Moçambique, e quanto ao último, os Makua da região Norte terão constituído uma fracção importante (Nascimento, 2002). Traços mais marcados de identidade são encontrados entre os Angolares. Concentrados de início na região sudeste da ilha, actualmente são cerca de 10 000 (Seibert, 1999) e vivem em pequenos povoamentos dispersos ao longo do litoral de São Tomé, (Ribeira Afonso, Pantufo, Praia Melão, Praia das Conchas, Neves e São João da Vargem) e até do Príncipe (Lapa), tendo como actividade tradicional a pesca. Possuem uma estrutura hierárquica social e funcional que parece assentar no compartilhar de uma herança cultural, passando pela não-aceitação de poderes coercivos; falam o Angolar, um crioulo que lhes é exclusivo. Segundo Henriques (2000), a primeira referência escrita aos Angolares é feita apenas em 1841 por Cunha Matos, que assinala expressamente a sua presença no sudeste da ilha, perto da Angra de São João. Posteriores registos etno-históricos remetem frequentemente para o período entre 1574 e 1595 e para as revoltas que então desencadearam, envolvendo ataques e destruição de engenhos de açúcar de que resultaram severos prejuízos. É-lhes atribuído um padrão de organização típico de sociedades africanas, sendo liderados pelo lendário Rei dos Angolares, que foi capturado na altura. Em trabalhos sobre São Tomé e Príncipe, as referências aos Angolares são uma constante a par de explicações mais ou menos verosímeis quanto à sua origem. A inexistência de suporte documental consistente faz com que permaneça por esclarecer cabalmente a questão da origem dos Angolares, sobre a qual três versões se confrontam. Segundo a versão mais antiga, que também corresponde ao registo de uma tradição oral vulgarizada na ilha, os Angolares seriam descendentes dos sobreviventes de um

13 I-Introdução naufrágio que teria ocorrido perto da costa sul de São Tomé em meados do século XVI. Tratar-se-ia de um navio negreiro proveniente de Angola com destino ao Brasil, e os náufragos ter-se-iam abrigado nas zonas mais recônditas e de densa vegetação do sul da ilha, constituindo o núcleo fundador do grupo. A maior debilidade desta versão é a ausência de qualquer referência ao sucedido em documentos oficiais da época, sendo difícil de entender que, a ter ocorrido, não tivesse despoletado o relato da ocorrência ou o registo de previsíveis medidas tomadas por parte das entidades administrativas da ilha. Uma interpretação recente (Cruz, 1975), em que as motivações político-ideológicas levam Seibert, 1999, a referi-la como “hipótese da prioridade africana”, sugere que São Tomé possuiria anteriormente à (re) descoberta quinhentista uma população africana já radicada, que se considera ser os Angolares. Como os primeiros portugueses que desembarcaram na ilha começaram por se fixar em Ana Ambó e só depois foram para a região Norte da actual baía de Ana Chaves, tal teria possibilitado aos Angolares a deslocação progressiva para as zonas mais isoladas do sudeste da ilha, onde se concentraram mantendo-se muito tempo incógnitos e afastados do contacto com outros habitantes até cerca do século XIX. O facto de os Angolares possuírem uma língua, alegadamente Bantu, e um sistema de organização próprios é considerado indicativo de uma ancestralidade étnica única, invocando-se até supostas afinidades morfológicas com duas tribos pertencentes à grande família dos Bantu – os Mussorongos do NO de Angola e os Kimbundos, das regiões interiores de Luanda (Galhano, 1962). Para além da improbabilidade de uma população autóctone conseguir escapar, durante quase um século, ao conhecimento dos europeus que se estabeleceram em São Tomé, outros argumentos de sustentação desta hipótese, nomeadamente os linguísticos, são destituídos de qualquer suporte investigativo sério. A explicação mais plausível para a existência, abundantemente documentada desde o século XVI, de um significativo grupo populacional vivendo nas zonas mais recônditas da floresta tropical e escapando ao controle oficial (os “negros do mato”, como começaram por ser referenciados), é de que seja fruto do grande número de escravos fugitivos que procurava escapar à violência do trabalho nas roças açucareiras. Desde cedo que há registo de numerosas fugas, algumas bem organizadas, e normalmente em rescaldo das revoltas nas fazendas. É bem provável que, paulatinamente, numa área de refúgio mais inacessível no sudeste da ilha, se fosse formando uma comunidade de africanos auto-libertados cujo número ia aumentando, a

14 I-Introdução que mais tarde se dará a designação de Angolares. A partir do foco de resistência, organizam assaltos às fazendas, o que se revelará um elemento altamente perturbador e instigará, ao longo dos séculos, severas expedições punitivas (Caldeira, 1999). A evidência linguística parece corroborar esta hipótese. O Angolar, é um crioulo estrutural e lexicalmente próximo dos outros dois falados no arquipélago, e o seu substrato vocabular tem origem predominante no Português (80-90%, segundo Lorenzino, 1998). No Angolar, o peso lexical africano não é significativamente superior ao registado nos outros crioulos, como seria de esperar se o Angolar tivesse origem primordial numa língua Bantu. O componente africano nos três crioulos é de línguas Kwa ou Bantu ocidentais, ambas da família Niger - Congo. Kwa é um conjunto de línguas que abrange o litoral-interior da área que se estende do Gana até à Nigéria, e do enorme grupo Bantu, o Ki(shi)kongo e o Kimbundu, são línguas faladas na região do Congo e Angola (Hagemeijer, 1999). Segundo Lorenzino (1998), o Angolar distingue- se dos outros crioulos sãotomenses por 80% do seu léxico africano ser de origem Kimbundo. O mesmo autor sustenta que o Angolar resultou apenas de uma relexificação da língua falada nas fazendas à custa da impregnação com vocábulos Kimbundo. Por outro lado, de acordo com a análise lexical e fonética, há indicações que o Angolar foi o último dos três crioulos a autonomizar-se e estabilizar-se no arquipélago (Hagemeijer, 1999). Assim, este tipo de evidência sugere uma origem linguística recente e heterogénea, o que parece reforçar a ideia de os Angolares serem os descendentes dos marrones, como eram conhecidos os escravos que fugiam dos engenhos de açúcar.

1.2.5 - Língua

A língua oficial em São Tomé e Príncipe é o Português, falado por mais de 95% da população. Cerca de 85% da população fala também o Forro ou Sãotomense, que é, dos três crioulos falados no arquipélago, o mais difundido. O Principense, ou Lung´iye como é localmente conhecido, é falado no Príncipe mas actualmente está quase extinto sendo utilizado por pouco mais de um milhar de pessoas (Hagemeijer, 1999). O Angolar é o crioulo exclusivamente falado pelos Angolares e calcula-se em 5 000 o número mínimo de falantes (Hagemeijer, 1999). O substrato dos três crioulos é uma mistura de um componente minoritário de línguas Kwa e Bantu ocidentais e uma fracção maioritária, 80-93% (Lorenzino, 1998),

15 I-Introdução de português antigo e moderno. O Angolar compartilha 70% de similaridade lexical com o sãotomense e 67% com o Principense e a fracção do léxico não partilhada é, essencialmente, de origem Bantu (http://www.ethnologue.com).

1.3 - CROMOSSOMA Y E DNA MITOCONDRIAL

1.3.1 - Cromossoma Y

A análise da variação de DNA do cromossoma Y, tem revelado ser um importante instrumento de estudo em diferentes áreas de investigação, pelo que tem sido amplamente utilizada em genética forense (Gil et al., 2001; Jobling et al., 2001), genética médica (Jobling e Tyler-Smith, 2000; Krausz et al., 2001), reconstrução genealógica e evolução humana (Sykes e Irven, 2000; Underhill, et al., 2001). Em particular na última área, a perspectiva masculina que o cromossoma Y proporciona, tem dado contributos fundamentais para reconstituir a história evolutiva das populações humanas contemporâneas e inferir como diferentes factores - demográficos, culturais, históricos, entre outros - têm interagido na modelação da sua estrutura genética (Perez- Lezaun et al., 1997; Jobling e Tyler-Smith, 2000).

1.3.1.1 - Estrutura e conteúdo génico

O cromossoma Y, o segundo mais pequeno cromossoma do genoma humano (~60 Mb), é uma molécula linear que representa cerca de 2% - 3% do genoma haplóide (Figura 1.2). Análise citogenética baseada em técnicas de bandas, permitiu identificar diferentes regiões no cromossoma: nas extremidades teloméricas encontram-se duas pequenas porções pseudoautossómicas, PAR1 e PAR2 (PAR - pseudoautosomal region), que delimitam uma extensa região haplóide não recombinante, NRY (non-recombining portion of the Y); esta representa cerca de 95% do cromossoma e contém uma porção eucromática e outra heterocromática de tamanho altamente polimórfico. A culminar um período de grande esforço de investigação sobre o mapeamento do cromossoma Y (Tilford et al., 2001), e tirando partido dos avanços nas tecnologias genómicas e do DNA recombinante, foi recentemente publicada a sequência quase completa da região NRY (Skaletsky et al., 2003), também designada de MSY (male-

16 I-Introdução specific region of the Y) face à descoberta de alguns acontecimentos de recombinação na região (Rozen, 2003). O conhecimento dessa sequência, para além de proporcionar um melhor quadro sobre a estrutura e organização do cromossoma Y, contribuiu para actualizar o catálogo de genes localizados no Y.

Yp Centrómero Yq

PAR I NRPY PAR II (~2.6 Mb) (~0.32 Mb) Eucromatina Heterocromatina

~ 60MB

Figura 1.2 - Esquema do cromossoma Y. NRY - Região não recombinante; Yp - braço curto; Yq - braço longo; PAR I e II - região pseudoautossómica I e II.

Sabe-se que só essa região contém 78 genes codificantes que colectivamente codificam 27 proteínas distintas. A maioria desses genes encaixa em duas categorias funcionais: os que se expressam ubiquamente no corpo ou em alguns órgãos; e outros que se expressam quase exclusivamente nos testículos. Entre os últimos, e enumerando apenas alguns, encontram-se genes que estão envolvidos na espermatogénese e/ ou cuja delecção está associada a casos de infertilidade masculina, AZFa, AZFb e AZFc (Graves, 2000; Ferlin et al., 2003) e o gene SRY, que determina o sexo masculino (Quintana-Murci e Fellous, 2001; Graves, 2002).

1.3.1.2 - Características chave em estudos evolutivos

O interesse que a análise de polimorfismos do cromossoma Y suscitou em estudos sobre origem e evolução de populações humanas, prende-se com algumas características específicas deste cromossoma. Tem herança uniparental por via paterna, transmitindo-se apenas de pai para filho. Ao contrário de outros cromossomas, escapa, em quase toda a sua extensão, a fenómenos de recombinação meiótica. A ausência de recombinação em NRY implica que, na região, a única fonte de variação é a mutação e, por isso,

17 I-Introdução preservará o registo da sua história mutacional. Outra consequência de não haver recombinação meiótica é que os haplótipos, isto é, as combinações de não-alelos ao longo da região, passarão em bloco e, portanto, intactos de geração em geração. Assim, recorrendo a polimorfismos com taxas de mutação baixa, é possível recuperar a filogenia das sequências e procurar traçar a história das linhagens paternas numa população. Ainda outra peculiaridade do cromossoma Y, é o seu baixo efectivo populacional. Assumindo para a população humana uma proporção de sexos de 1:1, o tamanho efectivo de cromossomas Y é um quarto de qualquer autossoma, um terço relativamente ao X, e igual ao do, também haplóide, genoma mitocondrial. O reduzido efectivo populacional permite compreender a considerável estruturação geográfica que se regista ao nível da variação do cromossoma Y e que tem permitido desvendar muitas rotas de migrações antigas. No entanto, torna o cromossoma Y particularmente sensível à deriva génica, fenómeno que envolve alterações aleatórias de frequência de haplótipos entre gerações por mero efeito amostral. A deriva génica acelera a diferenciação de linhagens masculinas entre populações, conferindo grande utilidade ao cromossoma Y na investigação de acontecimentos passados e na avaliação de afinidades populacionais. Porém, por efeitos de deriva, as frequências haplotípicas podem alterar-se rapidamente com o decorrer do tempo e induzir enviezamentos sobre inferências quanto a aspectos demográficos das histórias populacionais (Jobling e Tyler-Smith, 2003) como bottlenecks, expansões ou misturas populacionais.

1.3.1.3 - Subestruturação geográfica de linhagens do Y

Em média, a distância genética entre duas populações é tanto maior quanto maior o afastamento geográfico entre elas, mas o grau de estruturação geográfica parece ser influenciado pelo comportamento de migração de homens e mulheres. Para populações europeias com determinada distância entre si, o nível de diferenciação genética inferido com base no cromossoma Y é não só bastante superior ao inferido com autossomas, o que está de acordo com os efectivos populacionais relativos, mas também superior ao inferido com mtDNA, apesar do idêntico efectivo populacional (Seielstad et al., 1998). Esta diferença tem sido atribuída ao facto da patrilocalidade ser normal na maioria das sociedades europeias. Quando um homem e uma mulher casam e não são do mesmo

18 I-Introdução local, a tendência é para ser a mulher e não o homem a abandonar a terra natal. Consequentemente, a taxa de migração das mulheres é superior à dos homens, tendendo estes a permanecer perto do local de nascimento. Este comportamento pode explicar a maior diferenciação local de linhagens do cromossoma Y relativamente às de mtDNA, registada não só na Europa mas também em ilhas do sudoeste asiático (Kayser et al., 2001a) ou na Nova Guiné (Kayser et al., 2003) onde a patrilocalidade é usual. Em oposição, na Tailândia, onde se pratica a matrilocalidade, verifica-se uma diferenciação aumentada nas linhagens mitocondriais e reduzida nas do cromossoma Y (Oota et al., 2001). Explicações alternativas podem concorrer para a observação de estruturação populacional diferencial para linhagens femininas e masculinas, sendo de destacar, entre outras, a prática de poligamia, comum em muitas sociedades humanas, e que estando associada a elevada variância do sucesso reprodutivo dos homens, avaliado pelo número de descendentes dos indivíduos de sexo masculino, acarreta efeitos populacionais semelhantes à redução do número efectivo de homens (Seielstad et al., 1998). As histórias demográficas de homens e mulheres podem ser muito diferentes e ter mudado substancialmente ao longo do tempo. Recentemente, Dupanloup et al. (2003), procuraram reconciliar a observação, na maioria das populações humanas, de sinais de expansão populacional nos padrões de diversidade do mtDNA ou de microssatélites do Y, com a aparente não detecção de crescimento populacional em análises baseadas em SNPs (single nucleotide polymorphisms) do Y, invocando a capacidade diferencial das três baterias de marcadores em reter (para idênticos tamanhos amostrais) sinais de acontecimentos demográficos passados, e admitindo uma mudança relativamente recente quanto ao sistema de acasalamento humano. Consideram que, desde o Pleistoceno, o crescimento da população humana registou mais cedo o início da expansão do número efectivo de mulheres que o de homens, em resultado da mudança de práticas ancestrais poligâmicas para outras tendencialmente monogâmicas. A alteração é remetida para o Neolítico, e poderá ter acompanhado a tendência que então se registou para a sedentarização das populações humanas.

1.3.1.4 - Marcadores genéticos

À medida que em estudos de genética e evolução humana, cresceu o interesse pela análise do cromossoma Y e se renovaram as tecnologias, cresceu também o número de

19 I-Introdução variações polimórficas da NRY potencialmente úteis. Actualmente, com o projecto de sequenciação em fase avançada, aproximamo-nos do conhecimento detalhado do número e tipo de variações do cromossoma Y e o cenário afasta-se muito da “aridez de variação” como começou por ser caracterizado (Goodfellow et al., 1985). Tal como para outras regiões genómicas, os polimorfismos do cromossoma Y classificam-se em duas categorias: marcadores multialélicos e marcadores bialélicos. Os últimos são polimorfismos de baixa taxa de mutação que, no cromossoma Y, definem linhagens monofiléticas designadas por haplogrupos, enquanto que os multialélicos são polimorfismos de mutação elevada que permitem definir um número mais ou menos elevado de haplótipos dentro de haplogrupos, podendo ser usados para avaliar níveis de diversidade intra-haplogrupos ou para estimar a idade do ancestral comum mais recente de um conjunto de cromossomas.

20 I-Introdução

1.3.1.4.1 - Marcadores multialélicos

Nesta categoria, incluem-se os polimorfismos de sequências repetidas em tandem. Convencionalmente subdividem-se em microssatélites (designação sinónima de short tandem repeat - STR) se o motivo de repetição possui entre 2 a 5 pares de bases, e minissatélites se a unidade de repetição é maior. Esta sub-divisão reflecte não apenas as diferenças estruturais entre os polimorfismos, mas sobretudo as diferenças quanto a taxas médias de mutação e mecanismos geradores de diversidade alélica. Devido à elevada mutabilidade e aos complexos processos mutacionais que lhes estão associados, minissatélites do Y, como o MSV1, têm sido de utilidade limitada em estudos de evolução humana, em oposição ao interesse que os STRs têm despertado. A estimativa de taxa média de mutação para os microssatélites é de 2x10-3 por locus por geração (Jobling et al., 1999) e, especificamente para tetranucleotídicos do Y, de 3.17x10-3 por locus por geração (Kayser et al., 2000). A taxa é, no entanto, muito variável de marcador para marcador ou até de alelo para alelo, dependendo do número de repetições (Jin et al., 1996), da composição em bases das unidades de repetição, da sequência das regiões flanqueadoras (Santibáñez-Koref et al., 2001) e do tipo de genoma em que os microssatélites estão inseridos (Eisen e Hanawalt, 1999). Esta grande variabilidade das taxas de mutação é particularmente crítica quando a diversidade de STRs é usada para datar linhagens, contribuindo, a par de outros factores, para aumentar o grau de incerteza das estimativas obtidas. Apesar de se admitir que os mecanismos mutacionais subjacentes aos STRs são mais simples que os dos minissatélites, sabe-se ainda pouco sobre eles. Slipped-strand mispairing tem sido apontado como um dos principais processos moleculares responsável pelo elevado polimorfismo dos STRs (Tautz e Schlötterer, 1994). O facto de o padrão de variação alélica de muitos STRs encaixar razoavelmente no modelo single-stepwise mutation, em que se assume que um alelo se origina do ancestral por um passo mutacional simples, tem sido considerado favorável ao mecanismo explicativo (Jorde et al., 1995; Perez-Lezaun et al., 1997). Outros fenómenos, nomeadamente crossing-over desigual durante a meiose, poderão estar na origem de novos alelos que apresentam alterações mais drásticas de estrutura ou do número de repetições (Smith, 1976; Stephan, 1989).

21 I-Introdução

Actualmente, conhecem-se no cromossoma Y entre 100 a 200 STRs potencialmente úteis em genética ou evolução humana, para além dos cerca de 30 tri, tetra ou pentanucleotídicos com dados já publicados (Jobling e Tyler-Smith, 2003). A análise de alguns desses STRs tornou-se um procedimento de rotina em numerosas investigações de âmbito forense, em que a avaliação do significado de um match depende da frequência populacional de um dado perfil genético. São de referir os notáveis esforços da comunidade forense no estabelecimento daquela que é hoje a maior base de dados de STRs do Y, sujeita a criterioso controlo de qualidade e de acesso público em (http://ystr.org), onde estão já disponíveis dados relativos a populações europeias, americanas, asiáticas e africanas, por ordem aproximada de representação numérica actual. Apesar da construção dessa base de dados ter obedecido a critérios de interesse essencialmente forense, ela representa presentemente um valioso recurso instrumental em diversas áreas antropológicas. Uma dificuldade compartilhada em investigações forenses e em outros campos é a elevada frequência de homoplasia que se encontra em STRs. Por possuírem uma alta taxa de mutação, não são muito raros os fenómenos de recorrência que originam alelos/haplótipos idênticos por estado mas não por descendência. Como o tamanho da população humana é grande, espera-se que em cada geração surjam novas sequências homoplásicas, a um ritmo ainda desconhecido, mas que, a não serem consideradas em análises forenses, podem comprometer a interpretação da observação de um match. Por outro lado, a elevada taxa de mutação e, logo, de recorrência dos STRs, faz com que facilmente se perca a sequência de acontecimentos que diversificam os haplótipos, pelo que, ao contrário do que se passa com marcadores bialélicos, só tem sido possível recuperar filogenias de haplótipos definidos por STRs ou (a) em escalas geográficas relativamente restritas e, por vezes, ancorando os haplótipos em SNPs, ou (b) mobilizando um pequeno número de STRs e, mesmo assim, obtendo árvores com bastantes ambiguidades (Forster et al., 2000).

1.3.1.4.2 - Marcadores bialélicos

Nesta categoria incluem-se polimorfismos como os SNPs (single nucleotide polymorphisms), que resultam da substituição de uma base por outra na sequência do DNA, e os decorrentes de inserções/delecções, nomeadamente de elementos Alu, em

22 I-Introdução determinada posição no cromossoma. Caracterizam-se por taxas de mutação muito baixas, pelo que, com raras excepções, surgem por acontecimentos únicos de que resultam apenas dois alelos, o ancestral e o mutado/derivado, e daí serem designados de marcadores bialélicos. As excepções são consequência de mutações recorrentes (reversões ou mutações paralelas) que, mesmo admitindo a mais baixa estimativa de taxa de substituição nucleotídica, 2x10-8 por base por geração (Nachman e Crowell, 2000), é possível que ocorram ainda que com muita raridade. Algumas bases de dados (por exemplo, http://www.ensembl.org) listam milhares de SNPs do cromossoma Y, e ainda que alguns possam ser apenas artefactos (Jobling, 2003), é vasto o repertório de SNPs potencialmente interessantes em estudos antropológicos. Hoje em dia, estão já razoavelmente bem caracterizados mais de 200 marcadores bialélicos da região NRY. Por resultarem de acontecimentos únicos e ocorrerem na região não-recombinante do Y, isto significa que: (a) os indivíduos que actualmente apresentam uma mesma mutação compartilharam, num passado mais ou menos remoto, um ancestral comum por via paterna; e (b) os limites da distribuição da mutação pelo globo correspondem aos limites da dispersão daquela linhagem masculina. É ainda por serem acontecimentos únicos e raros, mas temporalmente desfasados, que à medida que vão surgindo vão gerando combinações haplotípicas novas, monofiléticas, cujo registo sequencial é em grande parte possível de recuperar. Assim, foi recentemente apresentada pelo Y Chromosome Consortium, 2002 (YCC: http://ycc.biosci.arizona.edu), aquela que é considerada a mais robusta, ainda que não definitiva, filogenia de 153 haplogrupos do cromossoma Y definidos por 245 marcadores bialélicos que, em 2003, o YCC volta a publicar apenas com pequenas revisões (Jobling e Tyler-Smith, 2003). É também o YCC que, em 2002, propõe e recomenda um sistema de nomenclatura uniforme, de forma a neutralizar as dificuldades inerentes à multiplicação de nomenclaturas alternativas a que se assistiu nos últimos anos, e a permitir que, independentemente dos painéis de marcadores bialélicos utilizados, os resultados de diferentes grupos de investigação possam ser rapidamente integrados. Ao longo dos últimos anos, acumulou-se uma grande quantidade de dados sobre marcadores bialélicos e começa agora a emergir um cenário filogeográfico a nível mundial bastante consistente dos principais haplogrupos do Y. No entanto, é ainda impreciso o quadro da distribuição geográfica fina de muitas linhagens, permanecendo

23 I-Introdução por caracterizar um grande número de populações e sendo necessário complementar muitos dados avulso que têm sido publicados. No futuro, o conhecimento mais profundo do padrão de distribuição da diversidade de marcadores bialélicos do Y, proporcionará uma base mais sólida para esclarecer muitas questões em aberto relativas à origem e evolução das populações humanas.

1.3.2 - DNA mitocondrial

Relativamente a muitas propriedades, pode considerar-se que o equivalente feminino do cromossoma Y é o mtDNA. Trata-se também de um genoma haplóide, não recombinante, mas que se transmite exclusivamente por via materna. Assim, em estudos de evolução humana, o mtDNA constitui uma janela na tentativa de recuperação das histórias populacionais femininas. Estas, não são necessariamente idênticas às masculinas, mas o passado evolutivo das populações foi só um, pelo que muitas das questões que se procura investigar pela análise genética, podem ser melhor clarificadas se comparar dados de mtDNA com os de cromossoma Y, a par de outro tipo de loci. Os trabalhos pioneiros de mtDNA em estudos de evolução humana, devem-se à equipa de Alan Wilson e surgem em 1980 quando Brown e seus colaboradores reportam a existência de padrões de enzimas de restrição de mtDNA específicos de diferentes populações. É a mesma equipa que, ainda nessa década, lançará definitivamente a Antropologia na era molecular com um dos trabalhos mais polemizados publicado nas últimas décadas. Cann et al. (1987), sugerem que o último ancestral comum dos homens actuais poderá ter vivido em África há menos de 200 mil anos, hipótese que ficará ligada à simplificação confusa de “Eva mitocondrial”. Desde então, a análise de mtDNA não parou de ser mobilizada para áreas cada vez mais diversificadas, em que tem vindo a dar contributos fundamentais.

1.3.2.1 - Organização do genoma mitocondrial As mitocôndrias são organitos que constituem a central celular da cadeia da fosforilação oxidativa (OXPHOS), que é a principal via metabólica de produção de ATP. Cada célula possui 10 a 100 mitocôndrias, e cada mitocôndria contem entre 0 a 11 cópias de mtDNA (Cavelier et al., 2000). O mtDNA é uma molécula grande, 0.5 μm-10 μm, de

24 I-Introdução cadeia dupla e circular (Figura 1.3), conformação que lhe confere grande estabilidade à degradação.

Figura 1.3 - Esquema da molécula de DNA mitocondrial humano, adaptado de Wallace, 1994.

A sequência completa do genoma mitocondrial foi publicada em 1981, por Anderson et al., e é conhecida por Cambridge Reference Sequence (CRS), por ser relativamente a ela que passaram a ser reportadas as alterações nucleotídicas encontradas noutras sequências. Posteriormente, foi ressequenciada e ligeiramente revista, Andrews et al., 1999. Cada molécula de mtDNA contém ~16 600 nucleótidos, sendo diferente a distribuição de tipo de bases nas duas cadeias. Numa predominam purinas e na complementar pirimidinas. Devido ao comportamento diferencial em gradiente de densidade, as cadeias costumam ser referidas por cadeia H (heavy) e cadeia L (light), respectivamente. Cerca de 90% do mtDNA é codificante e compreende 37 genes, 13 dos quais codificam proteínas envolvidas na cadeia da fosforilação oxidativa. Dos restantes genes,

25 I-Introdução

22 codificam RNAs de transferência e 2 RNAs ribossómicos, que participam no processo de tradução proteica no interior da mitocôndria. Uma região não-codificante de aproximadamente 1.2 Kb (7% do genoma mitocondrial), espalha-se de ambos os lados de uma posição arbitrariamente referida por “o” (origem de replicação) e é designada por região controlo, ou D-Loop (displacement loop). É nessa região que se encontram sinais de início de replicação da cadeia pesada e promotores de transcrição de ambas as cadeias do mtDNA (Shadel e Clayton, 1997) que poderão determinar a exposição de locais de ligação a proteínas envolvidas nos processos (Fisher et al., 1992). D-Loop decorre da fase inicial da replicação, quando a primeira cadeia recém-sintetizada se liberta da cadeia parental formando uma estrutura tridimensional em ansa.

1.3.2.2 - Taxa de substituição nucleotídica

A taxa de substituição do genoma mitocondrial é cerca de 5 a 10 vezes superior à do DNA nuclear (Brown et al., 1982). Esta taxa elevada poderá resultar de uma frequência aumentada de incorporação errada de nucleótidos ou de baixa eficiência de reparação da polimerase de DNA (Lansman e Clayton, 1975). Estudos sobre a fidelidade da polimerase do mtDNA (polγ), indicam que a taxa de erro é de 1 em cada 1-20 milhões de nucleótidos, o que representa uma taxa de incorporação errada muito superior à esperada para a replicação de DNA nuclear (1 em cada 109 - 1010 pb), podendo explicar a elevada frequência de mutação no mtDNA (Johnson e Johnson, 2001). Para o mesmo efeito também pode concorrer a elevada taxa de renovação de mitocôndrias nos tecidos, que implica muitos ciclos de replicação e, portanto, muitas oportunidades para a ocorrência de erros. Toda a região controlo acumula substituições a uma taxa 2.8 (Cann et al., 1984) a 5 (Aquadro e Greenberg, 1983) vezes superior à da porção codificante do mtDNA. No interior de D-Loop, a taxa de mutação é particularmente elevada em dois segmentos conhecidos por região hipervariável I e II (HVS-I e HVS-II) que compreendem as posições 16024-16383 e 73-340, respectivamente (Vigilant et al., 1989, 1991). Devido à hipervariabilidade, HVS-I e HVS-II têm constituído o alvo preferencial em estudos de mtDNA, o que resultou na acumulação de uma grande quantidade de dados, frequentemente utilizados para fazer inferências filogenéticas e

26 I-Introdução calibrar acontecimentos das histórias populacionais. Todavia, as taxas de mutação de HVS-I e HVS-II permanecem ainda bastante incertas. Estimativas recentes têm produzido valores muito díspares que apontam para taxas 5 a 30 vezes superiores à do mtDNA codificante. Essas disparidades poderão, entre outros factores, estar relacionadas: (a) com o tipo de métodos utilizados - genealógicos (taxas de substituição entre 0.32-2.5/posição/milhão de anos, Parsons et al., 1997; Sigurðardóttir et al., 2000) ou filogenéticos (taxas de substituição entre 0.025-0.26/posição/milhão de anos, ver: Parsons et al., 1997); e (b) com os padrões intrínsecos de mutabilidade das regiões que se caracterizam por uma grande heterogeneidade de posição para posição (Excoffier e Yang, 1999), com algumas posições apresentando taxas de substituição extremamente elevadas (Maddison, 1992 in Ingman, 2003; Wakeley, 1993).

1.3.2.3 - Modo de transmissão

O mtDNA tem herança uniparental sendo transmitido por via materna (Giles et al., 1980). Este modo de transmissão decorre de usualmente, na passagem inter-geracional de mitocôndrias, só participarem as mães através das mitocôndrias existentes nos oócitos. Os oócitos maduros humanos contêm cerca de 100 000 a 200 000 mitocôndrias (Marchington et al., 1997), dispersas por todo o citoplasma, enquanto que os espermatozóides contêm apenas entre 50 a 100, concentradas na base do flagelo (Ankel- Simons e Cummins, 1996). Por isso, normalmente na altura da fecundação as mitocôndrias paternas não penetram o óvulo (Sphuhler, 1988). Esporadicamente, quando tal acontece, o número é tão baixo relativamente aos milhares de mitocôndrias maternas que, por simples efeito de diluição, acentuado com as subsequentes divisões mitóticas, a contribuição paterna pode considerar-se, em geral, irrelevante. Por outro lado, há indicações de que as mitocôndrias paternas são activamente eliminadas após fertilização (Kaneda et al., 1995; Boore, 1997). A ubiquitina, que se expressa na superfície da mitocôndria, parece marcar as mitocôndrias paternas como estranhas, tornando-as alvo de destruição selectiva no embrião com 2 - 4 células (Sutovsky et al., 2000). Mesmo que este mecanismo não seja infalível, a taxa de sobrevivência de mitocôndrias paternas no ovo é extremamente baixa ou nula, não comprometendo, portanto, a assunção de herança materna para o mtDNA (Parsons et al., 1997; Torroni et al., 1998).

27 I-Introdução

A natureza clonal da transmissão do mtDNA suscitou recentemente outra controvérsia, em consequência de algumas observações interpretadas como sugestivas de ocorrência de recombinação neste genoma: por um lado um excesso de homoplasia nas análises filogenéticas (Eyre-Walker et al., 1999; Halgelberg et al., 1999) e, por outro, o padrão de desequilíbrio de ligação (LD) na molécula mitocondrial (Awadalla et al., 1999). Estes últimos resultados foram particularmente criticados pelo pequeno número de posições nucleotídicas analisadas, pela qualidade da amostra e pelas medidas de LD usadas (Jorde e Bamshad, 2000; Kivisild et al., 2000; Kumar et al., 2000). Em resposta às críticas, Awadalla et al. (2000), insistem na consistência entre os padrões de LD que detectam e a hipótese de recombinação, embora admitam que, a ocorrer, seja um acontecimento muito pouco frequente. Mas não dando por encerrada a questão, Eyre-Walker e Awadalla (2001), apresentam alguns dos possíveis mecanismos de quebra da clonalidade de transmissão do mtDNA.

1.3.2.4 - Heteroplasmia do mtDNA

O grande número de cópias de mtDNA e a elevada taxa de mutação deste genoma extranuclear, são responsáveis pela ocorrência de heteroplasmia, situação em que num mesmo indivíduo co-existem sub-populações de sequências de mtDNA de tipo diferente. Os primeiros casos reportados de heteroplasmia, estavam relacionados com mutações patogénicas de mtDNA causadoras de doenças mitocondriais raras (Larsson e Clayton, 1995). Logo se constatou que os indivíduos afectados eram portadores de proporções muito variáveis de moléculas de mtDNA mutadas, de que dependia a severidade clínica da patologia (Chinnery et al., 1997). Por outro lado, mulheres heteroplásmicas transmitiam um número imprevisível de moléculas mutadas, o que constituía (e constitui) uma grande dificuldade em termos de aconselhamento genético. É neste contexto que começam a surgir modelos sobre a transmissão de mutações heteroplásmicas do mtDNA humano (Wallace, 1994; Bendall et al., 1996; Jenuth et al., 1996). Entretanto, somam-se os indícios de que um mecanismo fundamental nesse processo envolve efeitos aleatórios de deriva - bottlenecks mitocondriais - que ocorrem durante as divisões celulares, principalmente da oogénese, mas também da fase inicial do desenvolvimento embrionário e mesmo de outras fases pós-zigóticas (Poulton et al., 1998; Brown et al., 2001). Esse mecanismo, permite explicar a imprevisibilidade e

28 I-Introdução variabilidade dos padrões de segregação quer de patologias mitocondriais - incluindo a perda de heteroplasmia, e consequente fixação de uma sequência, numa só passagem geracional, (Lightowlers et al., 1997), ou casos, como um recentemente reportado por Schwartz e Vissing (2003), em que moléculas de mtDNA de origem materna e paterna foram encontrados em diferentes tecidos -, quer de mutações não patológicas. Em indivíduos normais relativamente a doenças mitocondriais, tem-se assumido que o geral é existir apenas um tipo de moléculas de mtDNA (homoplasia). No entanto, essa visão tem sido questionada em consequência de alguns resultados que apontam para uma variabilidade de sequência intra-individual superior ao suspeitado, e das indicações que, a nível de indivíduo, a proporção de heteroplasmia pode variar não só de tecido para tecido (sendo particularmente usual em cabelos), como dentro do próprio tecido e também em função da idade (Grzybowski, 2000). Muitas heterogeneidades de sequência ocorrem na região controlo (Bendall et al., 1996), onde foram identificados locais que constituem hot spots heteroplásmicos e que incluem algumas das posições reportadas como mais polimórficas em HVS-I, por exemplo 16294 e 16311 (Grzybowski, 2000), ou traços homopoliméricos com interrupções como, em HVS-I, o traço de policitosinas entre 16184 e 16193 interrompido por T em 16189 (Anderson, 1981) e, em HVS-II, o traço de policitosinas entre 303 a 315 interrompido por T em 309; em ambos os casos a heteroplasmia envolve uma transição de T para C, sugerindo que ocorra por slippage replicativo. Pelas implicações na casuística forense, heteroplasmia e suas consequências, constituem actualmente um dos tópicos de debate entre a comunidade forense (Budowle et al., 2002; D’Eustachio, 2002), mas apesar de poderem ser factores perturbadores de algumas análises, não comprometem a utilidade do mtDNA nessa área de aplicação.

1.3.2.5 - Filogenia de linhagens de mtDNA

Tal como acontece em NRY, as mutações são a única fonte de variação no mtDNA e as novas combinações haplotípicas que vão sendo geradas também só são quebradas por outras mutações. Assim, é igualmente possível recuperar em grande extensão, a filogenia das linhagens femininas. Comparativamente ao Y, analisam-se, habitualmente, muito mais posições nucleotídicas no mtDNA o que, aliado à elevada taxa de substituição deste genoma,

29 I-Introdução permite discriminar um elevadíssimo número de sequências mitocondriais. Por isso se considera que o mtDNA proporciona uma elevada resolução em estudos evolutivos e populacionais. Mas pelo facto de a taxa de mutação para além de elevada, ser muito variável de posição para posição, nem todas as posições são igualmente informativas na reconstrução filogenética, em particular aquelas muito ou hipervariáveis. Conjuntos de sequências molecularmente relacionadas e que compartilham núcleos específicos de mutações em posições relativamente estáveis, são designados por haplogrupos. A filogenia dos principais haplogrupos do mtDNA humano está hoje bem estabelecida e existe um conhecimento razoável dos respectivos espectros de distribuição geográfica (bastante mais completo que o de haplogrupos do Y). Comparando os esqueletos filogeográficos das linhagens masculinas e femininas humanas (ver, por exemplo, Fig. 4 de Cavalli-Sforza e Feldman, 2003) sobressai a grande semelhança das estruturas gerais, o que só reforça a validade da informação filogenética que se pode extrair do mtDNA e do cromossoma Y.

1.3.3 - Padrões de diversidade do cromossoma Y e do mtDNA em África

1.3.3.1 - A Expansão do Homem Moderno

O estudo de populações africanas no contexto da Antropologia molecular, começou por ser estimulado para tentar esclarecer algumas etapas mal documentadas do passado evolutivo remoto das populações humanas contemporâneas. O género Homo iniciou a expansão para fora de África há cerca de 1.8 milhões de anos (m.a.) e progressivamente, em função da acessibilidade e condições climáticas, foi colonizando outras regiões do Velho Mundo. Esta primeira grande migração humana está bem patenteada no registo fóssil: há vestígios de Homo erectus na Geórgia (Cáucaso) e em Java (Sudeste Asiático) desde ∼1.8 - 1.6 m.a. atrás, e na Europa os vestígios mais antigos, representados por Homo heidelbergense, datam de há ∼800 000 anos. As características anatómicas de homem moderno mais antigas aparecem no registo fóssil de África de leste, em espécimes com ∼160 000 anos. Do Paleolítico Superior surge no registo arqueológico uma utensilagem que indica que populações de Homo sapiens estavam já dispersas por toda a Europa, Ásia e Oceânia, desde os ∼60 000 - 40 000 anos atrás, ocupação que os achados fósseis também documentam. Sobre a

30 I-Introdução origem destas populações de homem moderno, existem visões discordantes que, num exercício de simplificação, se costumam apresentar em dois modelos. Segundo um, elas descendem das populações locais de homens arcaicos de quem receberam uma contribuição genética significativa; fluxo migratório inter-populacional, teria evitado uma diferenciação regional acentuada - hipótese multiregional. O outro modelo, reclama que a população ancestral de homens modernos, surgida em África, protagonizou uma segunda grande expansão para fora do continente, iniciada na primeira metade dos últimos 100 000 anos, e em sucessivas vagas migratórias foi substituindo as populações instaladas nas regiões que ia alcançando; a contribuição genética destas para as populações de homens modernos poderá ter sido nula ou irrelevante - hipótese “out of Africa”. Para este debate, as evidências da Antropologia Física têm suscitado interpretações pouco conclusivas. Tem havido mais consenso interpretativo (ainda que não unanimidade, ver, entre outros, Relethford, 1998) quanto às achegas obtidas com estudos de mtDNA ou cromossoma Y, dado que em muitos aspectos parecem favorecer o segundo modelo. A primeira grande divisão nas filogenias das linhagens do cromossoma Y ou do mtDNA, separa sequências africanas de não-africanas, indicando que as primeiras são as mais divergentes e, portanto, as mais antigas. Por outro lado, estimativas do tempo decorrido desde o ancestral comum mais recente (TMRCA) das linhagens mitocondriais apontam para datas não inferiores a ~230 000 anos (Cavalli- Sforza e Feldman, 2003), não obstante a margem de incerteza e dispersão dos valores obtidos (é de referir o trabalho pioneiro de Cann et al., 1987, que obtêm para TMRCA a idade de 190 mil anos, muito criticada devido a algumas irregularidades estatísticas e, quanto a trabalhos mais recentes, Ingman et al., 2000, 171 mil anos, com base em sequências completas de mtDNA, ou Tang et al., 2002, 238 ou 190 mil anos, assumindo 25 ou 20 anos por geração, respectivamente). Estimativas correspondentes para a região NRY, indicam que o ancestral comum mais recente das linhagens masculinas actuais tem menos de 100 000 anos (Cavalli-Sforza, 2003), ainda que a gama de estimativas também seja ampla (por exemplo, Thomson, et al., 2000, obtêm uma estimativa de TMRCA para linhagens definidas por SNPs de 59 mil anos; Tang et al., 2002; 91 ou 109 mil anos, assumindo 25 ou 20 anos por geração, respectivamente, e baseando-se também em SNPs; ou Pritchard et al., 1999, 46 mil anos, com base em STRs do Y).

31 I-Introdução

Portanto, mtDNA e cromossoma Y, convergem na indicação de que as linhagens femininas e masculinas actuais surgiram em África, e apesar das diferenças quanto ao TMRC dos dois genomas, o intervalo de valores revela que o início da diversificação de ambas as linhagens foi recente, caindo num período que se afasta muito do previsto assumindo a hipótese multirregional da origem do homem moderno, que deveria remeter para a primeira grande expansão geográfica do género Homo há cerca de 1.8 milhões de anos. Os resultados referidos são muito mais consistentes com a hipótese “out of Africa” segundo a qual uma população ancestral subsariana originou todas as populações de homens modernos através de uma cadeia de migrações para o Médio Oriente, Europa, Ásia, Oceânia e, por último, América. No mesmo sentido apontam resultados de DNA autossómico ou do cromossoma X, que indicam que as populações africanas são as mais diversas, ancestrais e possuem maior número de haplótipos comparativamente a populações não-africanas, tendendo estas a conter sub-conjuntos da diversidade genética presente em África, como é de esperar por efeitos de bottlenecks ocorridos durante a recente expansão para fora de África (ver revisão de Tishkoff e Williams, 2002).

1.3.3.2 - A expansão Bantu

Muito depois da migração do homem para fora de África, teve início uma extraordinária movimentação humana no interior do continente africano, que iria redesenhar profundamente o respectivo mapa da distribuição da variabilidade genética. Durante o Holoceno, o clima estável e ameno permitiu o desenvolvimento da agricultura que muitas populações adoptariam como estilo de vida. Em África, a transição para este padrão de subsistência parece ter ocorrido lentamente, sobretudo na forma sedentarizada, mas entre os 8 000 - 5 000 anos A.C. aparecem vestígios que atestam a sua dispersão, bem como a de práticas pastorícias (por vezes antecedendo as agrícolas) primeiro pelo Nordeste africano (que é comparável, em termos de vestígios arqueológicos, à região do Próximo oriente) e depois por toda a savana sariana do Norte de África. A agricultura (de savana) chegou mais tarde às zonas subsarianas de floresta tropical, e pensa-se ter sido levada por vagas migratórias de povos que falavam línguas Bantu. A migração teve início cerca de 3 000 A.C. a partir dum território que compreende actualmente a região sudeste da Nigéria e noroeste dos Camarões. Alguns

32 I-Introdução grupos deslocaram-se lentamente para leste, ao longo da orla setentrional da floresta equatorial, na direcção dos Grandes Lagos da África Oriental, onde chegaram cerca de 1 000 A.C., inflectindo então para Sul. A partir do núcleo original de dispersão, uma outra vaga desloca-se pela faixa ocidental da floresta, chegando ao rio Congo cerca de 400 A.C., e continua até atingir o Norte da actual Namíbia, onde se presume ter sido detida pela aridez do Calaári. Alguns grupos desviam-se então para leste, seguindo o curso dos rios, e acabam por convergir com a vaga cuja rota de dispersão fora o leste africano (Iliffe, 1995). Nesta migração milenar, os povos Bantu juntam a cultura de cereais à agricultura de floresta pré-existente e, pelo menos quando atingem a região dos Grandes Lagos, tinham já incorporado uma outra técnica - o trabalho do ferro. A expansão Bantu e a disseminação da sua cultura, tiveram um impacto profundo sobre as populações de caçadores-recolectores preexistentes. A contribuição desses povos para o fundo genético masculino dos Pigmeus estimou-se em >50%, dos !Kung em 45% e dos Khwe em 58% (Underhill, 2002). Algumas linhagens do cromossoma Y retiveram bem os sinais desta expansão: (a) o haplogrupo E, a que pertence a maioria das linhagens africanas, tem um gradiente de frequência e diversidade decrescente no sentido Sul do continente, e os haplogrupos mais antigos, A e B, são raros em África e apenas se encontram entre grupos actuais de caçadores- recolectores, onde se encontram bem representados (Jobling e Tyler-Smith, 2003); (b) relativamente a linhagens definidas por STRs do cromossoma Y, Thomas et al. (2000), identificam nos padrões de dispersão, frequência e diversidade de um haplótipo definido por 5 STRs e seus derivados por um passo mutacional, sinais diagnósticos da expansão Bantu, interpretação posteriormente reforçada pelos resultados de Pereira et al. (2002). Também ao nível das linhagens femininas, as análises filogeográficas sugerem que pelo menos a dispersão subsariana dos haplogrupos L3b (Watson et al., 1997), L1a2 (Soodyall et al., 1996; Salas et al., 2002) e L3e1a (Bandelt et al., 2001), está fortemente associada às migrações e expansões demográficas dos povos de línguas Bantu ocorridas nos últimos milénios.

1.3.3.3 - Afinidades com a Península Ibérica e a Península Arábica

Outros acontecimentos da história ou pré-história de África, que envolveram movimentações intra-continentais ou com populações de regiões geograficamente

33 I-Introdução próximas, deixaram marcas firmes nos padrões de diversidade genética. As afinidades do Norte de África com a Europa peri-mediterrânea têm merecido considerável atenção, em particular com a Península Ibérica, onde a barreira geográfica entre os continentes é mais ténue, sendo apenas ~15 km no estreito de . No entanto, a análise molecular indica que o fluxo genético entre o Norte de África e a extremidade atlântica da Europa parece ter sido bastante moderado e envolveu aportes bidireccionais desiguais. Bosch et al. (2001), recorrendo a uma aproximação filogeográfica, estimam que a contribuição de cromossomas Y europeus para o fundo genético norte africano rondará 4%, enquanto que o Noroeste de África contribuiu com cerca de 7% para os cromossomas Y ibéricos. Os mesmos resultados sugerem que pelo menos a introdução da maioria de cromossomas africanos na Península Ibérica resultou de fluxo genético relativamente recente, remetendo para um intervalo temporal (~700 anos) coincidente com as invasões muçulmanas da Península. Dados de mtDNA apontam igualmente para fluxo genético restrito entre as regiões, havendo indicações de que muitas linhagens europeias no Norte de África poderão ter sido introduzidas na sequência da expansão demográfica do Neolítico (Rando et al., 1998). Quanto ao componente africano nas linhagens femininas da Península Ibérica, existe alguma dúvida sobre o impacto relativo das contribuições mediadas por migrações pré-históricas ou da história mais ou menos recente (Pereira et al., 2000c; González et al., 2003). Também devido à proximidade geográfica, estreitos contactos foram estabelecidos entre África e a Península Arábica. Actualmente, cerca de 10 - 15% das linhagens femininas em populações árabes têm origem subsariana, havendo indicações que o fluxo genético mais intenso ocorreu nos últimos ~2 500 anos (Richards et al., 2003). Pelo contrário, é menos expressivo o vestígio de linhagens masculinas subsarianas nas mesmas populações. Tudo indica que a presença de linhagens africanas na Arábia é o resultado, a longo prazo, do intenso tráfico de escravos negros controlado pelos árabes que, desde tempos remotos, se estabeleceu em corredores ligando a África de Leste, o Sara e a Península Arábica. Por outro lado, a diferença detectada no fluxo genético feminino e masculino reflecte, consistentemente, as características deste comércio intra e intercontinental de escravos. Normalmente era constituído por mais mulheres e crianças do que viria a acontecer posteriormente durante o mercado atlântico de escravos (Klein, 1999). Os homens negros, entre os quais muitos eunucos, eram

34 I-Introdução essencialmente recrutados para o trabalho manual ou para reforçar o potencial humano em expedições militares e, por conseguinte, o seu sucesso reprodutivo era quartado (Richards et al., 2003). Era diferente o interesse comercial na importação de escravas negras, sendo muito de natureza sexual e daí estimular-se o seu potencial reprodutivo. A assimilação de mulheres africanas na população árabe, está bem patenteada pela representatividade actual de linhagens femininas subsarianas. Migrações recentes e mais localizadas, que trouxeram linhagens de origem não- africana para o continente, podem também ser parcialmente recuperadas mesmo quando o arquivo documental é vago ou virtualmente inexistente. Os Lemba, também chamados “judeus negros” do Sul de África, vivem em clãs dispersos pelo território do actual Malawi, Zimbabwe e África do Sul. Presentemente, as suas práticas religiosas são muito sincretistas e diversificadas mas com pouco a ver com o judaísmo usualmente praticado, embora outras práticas culturais evoquem costumes judaicos. De acordo com uma tradição oral dos Lemba, persistente mas de antiguidade incerta, seriam de origem judaica tendo vindo de “Sena do Norte” num processo migratório acidentado iniciado há mais de 2000 anos. Sena é imprecisamente localizado no Yemen, Judeia, Egipto ou Etiópia. Apesar de não haver qualquer registo que clarifique a sua origem, pelo menos a tradição oral é consistente com os dados da análise genética que indicam que cerca de 67.7% de linhagens do Y de indivíduos que se auto-identificam como Lemba são de origem semita e os restantes de origem Bantu ou outra (Thomas et al., 2000). Os mesmos dados indicam, porém, que pelo menos algumas linhagens semitas poderão ter sido introduzidas em sequência de episódios migratórios mais recentes que a antiguidade conjecturada na tradição oral.

1.3.3.4 - África e as descobertas quinhentistas

Finalmente, é de referir o impacto genético de acontecimentos da história moderna muito recente, protagonizados em África mas com extensas e complexas repercussões não só no modelo de desenvolvimento do continente mas também do Novo Mundo: trata-se das descobertas quinhentistas e do subsequente intenso fluxo de movimentação de pessoas que se iria prolongar durante quase cinco séculos. A partir do século XV, com a chegada dos exploradores e comerciantes europeus, o mapa de distribuição populacional em África iria sofrer uma enorme reconfiguração. Nas viagens de

35 I-Introdução navegação pela (ou em direcção à) orla atlântica do continente africano, iriam ser descobertas muitas ilhas até então desabitadas. Os portugueses, pioneiros nas explorações transatlânticas, viram nestas ilhas pontos estratégicos para o desenvolvimento das suas actividades económicas e comerciais, e empenharam-se no seu povoamento. As estratégias e trajectórias de povoamento, muito condicionadas pela posição geográfica e pela disponibilidade em recursos humanos, foram tão diversificadas como as molduras populacionais que actualmente existem em arquipélagos como Açores, Madeira, Cabo Verde ou São Tomé e Príncipe, todos descobertos em quinhentos. Mas, ao contrário das expectativas atendendo ao facto de serem episódios recentes, a documentação sobre as respectivas histórias de povoamento, é por vezes vaga e repleta de lacunas. Por isso, a análise do mtDNA e do cromossoma Y, constitui uma importante fonte de informação, complementar a outras igualmente importantes, que em conjunto podem proporcionar um entendimento mais cabal da origem e evolução das populações dos arquipélagos. É neste contexto que se insere o estudo que agora se apresenta sobre São Tomé e Príncipe e outros similares sobre os Açores (Oliveira, 2001; Santos et al., 2003) e Cabo Verde (Brehm et al., 2002; Gonçalves et al., 2003). Quanto aos Açores, a análise do mtDNA e do cromossoma Y revela a existência de um fundo de linhagens ibérico com traços de outros contributos europeus, particularmente do Norte da Europa. Uma fracção pequena de linhagens é de origem africana, reflectindo o envolvimento de mouros e negros no povoamento de algumas ilhas, e há também vestígios de linhagens presumivelmente introduzidas por judeus. Em Cabo Verde o panorama é completamente diferente. Há grandes afinidades entre o espectro geral de linhagens femininas e o registado na faixa atlântica de África a Norte do Equador, e apenas cerca de 2% de sequências de mtDNA parecem ter sido directamente introduzidas por mulheres europeias. Porém, quanto às linhagens paternas, mais de metade (53.5%) pertencem a haplogrupos característicos de populações europeias ou do Médio Oriente (Gonçalves et al., 2003). Isto significa que a população de Cabo Verde, na visão correntemente assumida como paradigma de população crioula, resultou de um padrão de miscigenação muito específico, em que marcadamente predominou o cruzamento entre homens europeus e mulheres africanas.

36 I-Introdução

Estas e outras histórias de povoamento ou colonização, processaram-se em paralelo com a expansão marítima dos portugueses que iriam transformar África em centro de abastecimento para o tráfico transatlântico de escravos, actividade que teria um desenvolvimento imprecedente e que cedo atrairia a concorrência de outras potências europeias. Os primeiros escravos da África Ocidental foram sobretudo para a Península Ibérica e para os arquipélagos em fase de povoamento. Na primeira metade de quinhentos, os portos de Lisboa e Sevilha eram os centros de um próspero comércio a partir dos quais os escravos africanos eram amplamente distribuídos pelo Mediterrâneo Ocidental. Estes escravos eram utilizados sobretudo em actividades tradicionais, mas foi em alguns arquipélagos outrora desabitados que seria iniciado um novo modelo de trabalho escravo, com a utilização pelos europeus de escravos africanos nas plantações. O modelo expandiu-se rapidamente e logo nas primeiras décadas do século XV, iriam começar os carregamentos directos de escravos para as Américas, em especial para o Brasil, onde as plantações floresciam e a necessidade de mão-de-obra acabaria por absorver grande fracção do tráfico negreiro. Sobre o volume de tráfico, baseado em registos de escravos que desembarcaram nas Américas, Curtin (1969) calcula que entre 1451 e 1870 chegaram às Américas cerca de 9 400 000 escravos e num estudo posterior Eltis et al. (1999), reavalia em aproximadamente 11 milhões os escravos africanos que atravessaram o Atlântico entre 1519 e 1867. Quase dois terços dos escravos exportados para as Américas eram do sexo masculino. Os locais de origem dos escravos deslocaram-se a pouco e pouco para o Sul. Os primeiros vinham essencialmente da Senegâmbia, da costa da Alta Guiné (entre a Guiné-Bissau e a Libéria actuais). Em meados do século XVII, os escravos partiam também da Costa do Ouro e da baía de Benin. No século XVIII, estenderam-se à baía do Biafra (sobretudo o delta do Níger), Congo, Angola e finalmente Moçambique (Iliffe, 1995). O comércio atlântico de escravos africanos, teve um papel fundamental no repovoamento pós-quinhentista das Américas, como se poderá ilustrar com o exemplo brasileiro. Entre 1500 e 1972, 58% dos imigrantes que entraram no Brasil eram europeus, 40% africanos e 2% asiáticos (Callegari-Jacques e Salzano, 1999, citado em Alves-Silva et al., 2000). Com base no estudo de mtDNA e cromossoma Y, Pena et al. (2000), procuram traçar o “retrato molecular” da população branca brasileira, e os resultados que obtêm indicam que a grande maioria das linhagens masculinas (~90%)

37 I-Introdução dos brancos brasileiros é de origem europeia, enquanto a maioria das linhagens femininas (~60%) é ameríndia ou africana. A distribuição das patrilinhagens europeias é muito semelhante à registada em Portugal (que contribuiu com a fracção maioritária dos imigrantes europeus) e as diferenças mais acentuadas são relativas a haplótipos sobretudo frequentes na região mediterrânea o que parece testemunhar a expressiva entrada no Brasil de italianos, espanhóis e sírio-libaneses. Não detectaram a presença de linhagens paternas ameríndias e as subsarianas representam apenas uma pequena fracção das patrilinhagens da população branca. As linhagens de mtDNA revelam proporções gerais de 33% de linhagens ameríndias, 28% africanas e 39% europeias, mas com variações consideráveis de região para região do Brasil de acordo com o padrão esperado dada a história de colonização de cada uma. Na Europa, o influxo de escravos africanos foi incomparavelmente menor, mas com alguma relevância na Península Ibérica onde, no século XV em algumas cidades portuárias portuguesas e castelhanas, os africanos podiam representar 10% ou mesmo 15% da população (Klein, 1999). Se os vestígios dessa presença são virtualmente inexistentes no fundo de linhagens masculinas de populações ibéricas actuais, estão ainda bem marcados ao nível das linhagens maternas em que, no caso da população portuguesa, cerca de 7% são de origem subsariana e de presumida introdução recente (Pereira et al., 2000c). Sugestivamente, em relação a essas e outras linhagens subsarianas encontradas por toda a Europa, a esmagadora maioria dos matches detectados é com sequências de mtDNA presentes em populações da África Ocidental, enquanto que as sequências subsarianas encontradas em populações americanas também apresentam matches com outras do sudeste do continente africano (Pereira et al., 2001). Esta observação é o reflexo da dinâmica de desenvolvimento do comércio de escravos. A grande maioria dos escravos trazida para a Europa, veio durante as fases iniciais do estabelecimento da rota triangular de escravos, altura em que o recrutamento ainda não tinha chegado à costa índica. Só bem mais tarde é que escravos traficados em Moçambique iriam engrossar o mercado negreiro, numa fase em que se destinava quase exclusivamente às Américas, compreendendo-se, assim, a quase ausência de partilha de sequências de mtDNA entre a Europa e o leste africano.

38 I-Introdução

1.4 - OBJECTIVOS

Face ao potencial da análise do mtDNA e do cromossoma Y em estudos antropológicos e ao incipiente estado de caracterização genética de São Tomé e Príncipe no geral e, em particular, dos grupos populacionais que a percepção comum sãotomense de alguma forma hierarquiza, entendeu-se ser relevante: - estudar em Angolares, Forros e Tongas, o padrão de distribuição de linhagens definidas por: - STRs e marcadores bialélicos do cromossoma Y e; - variações de sequência em HVS-I e HVS-II do mtDNAtendo em vista: - avaliar o nível de subestruturação populacional actualmente existente em São Tomé e Príncipe; - entender como se geraram os padrões de distribuição de diversidade das linhagens masculinas e femininas no arquipélago e inferir dos factores de maior impacto nesses padrões; - estudar as afinidades de São Tomé e Príncipe com populações africanas e outras que pudessem contribuir para o esclarecimento do passado genético do arquipélago; e, numa perspectiva mais ampla: - contribuir para a caracterização fina da diversidade genética no continente africano.

39

II - MATERIAL E MÉTODOS ______

2.1 - AMOSTRAS

Todas as amostras foram obtidas sob consentimento informado. Solicitou-se aos voluntários que respondessem a um breve inquérito, com o objectivo de recolher informações sobre identidade, naturalidade, residência, sexo e naturalidade dos pais, avós e bisavós. Colheu-se um total de 239 amostras, ou de sangue obtido por punção venosa anticubital e armazenado em tubos contendo como anticoagulante EDTA (ácido etilenodiaminotetracético 10% p/v) na proporção de 0.1ml por 5ml de sangue, ou de manchas sanguíneas em retalhos de tecido de algodão, secos à temperatura ambiente e armazenados individualmente em saquetas devidamente identificadas. As colheitas foram efectuadas em laboratórios de análises clínicas dos Centros de Saúde dos Distritos de Caué, Lobata e Mézochi, no Hospital de São João dos Angolares, ou directamente em roças agrícolas, nomeadamente, Dr. Agostinho Neto, Morro Peixe, Poiso Alto, Boa Entrada e Monte Café. Todos os indivíduos envolvidos neste estudo eram do sexo masculino, não aparentados e naturais e residentes em São Tomé e Príncipe. Na Figura 2.1, indica-se os locais onde se procedeu à recolha das amostras. A colheita contou com a colaboração dos Delegados de Saúde e Técnicos laboratoriais e as deslocações às roças foram efectuadas sob coordenação de Técnicos de Saúde. O enquadramento num de três grupos populacionais foi feito com base nos seguintes critérios: - Angolares - indivíduos cuja família directa descendia há pelo menos três gerações de Angolares; teve-se em conta a auto-identificação no grupo e a língua ou actividades culturais dominantes nas comunidades visitadas;

43 II-Material e Métodos

- Forros - descendentes de naturais de São Tomé e Príncipe há pelo menos três gerações;- Tongas - indivíduos descendentes de serviçais oriundos de Cabo-Verde, Moçambique e Angola.

Figura 2.1 – Mapa da Ilha de São Tomé com os locais de recolha de amostras. Angolares ( ), Forros ( ) e Tongas ( )

2.2 - EXTRACÇÃO DE DNA

O DNA foi extraído a partir de sangue total ou manchas em tecido, usando o método de Chelex ou de fenol-clorofórmio. As amostras de DNA extraído, foram conservadas a 5 0C, para posterior utilização.

2.2.1 - Extracção a partir de sangue total

2.2.1.1 - Extracção por Chelex

Previamente ao processo de extracção de DNA, promovia-se a lise dos glóbulos vermelhos por choque osmótico, efectuando-se o seguinte procedimento:

44 II-Material e Métodos

- adição de 1 ml de água desionizada a 20 μl de sangue total e incubação à temperatura ambiente durante 30 minutos; - centrifugação a 12 000 g durante 4 minutos; - rejeição do sobrenadante para a obtenção da fracção sedimentar contendo os glóbulos brancos e DNA livre.

A extracção do DNA foi efectuada segundo o método descrito por Lareu et al. (1994) e consistiu basicamente no seguinte: - adição de 200 μl de uma solução de Chelex a 5%; - incubação a 56 0C durante 30 minutos; - vortex a alta velocidade durante 5-10 segundos; - incubação a 100 0C durante 8 minutos; - vortex a alta velocidade durante 5-10 segundos; - centrifugação a 12 000 g durante 4 minutos.

2.2.1.2 - Extracção por fenol-clorofórmio

Antes da extracção, a lise das células foi obtida do seguinte modo: - descongelação de alíquotas de sangue a temperatura ambiente; - ressuspensão de 100 μl de coágulos em 500 μl de tampão de lise DLB (ver Tabela 2.1); - adição de 50 μl de SDS a 10% e 5 μl de proteinase K (20 mg/ml); - incubação a 56 0C durante toda a noite com agitação suave. O método de extracção por fenol-clorofórmio utilizado foi o descrito em Valverde et al. (1993), e compreendeu os passos: - adição de 20 μl de NaCl 5 M e de 575 μl de fenol: clorofórmio: álcool isoamílico (25:24:1); - homogeneização dos tubos por inversão, durante cerca de 1 hora a temperatura ambiente; - centrifugação durante3 minutos a 12 000 rpm; - trasladação da fase superior para outro tubo; - adição de 575 μl de clorofórmio: álcool isoamílico (24:1);

45 II-Material e Métodos

- homogeneização dos tubos por inversão, durante cerca de 1 hora a temperatura ambiente centrifugação 3 minutos a 12 000 rpm; - trasladação da fase superior para outro tubo; - adição 1 ml de etanol a 96% a -20 0C e misturar suavemente por inversão; - precipitação de DNA durante 15 minutos a - 80 0C; - centrifugação durante 15 minutos a 12 000 rpm; - rejeição do sobrenadante e secagem por evaporação do pellet; - ressuspensão em 100 μl de água ou TE (ver Tabela 2.1) a 56 0C, entre 2 - 16 horas até a completa homogeneização dessa solução.

Tabela 2.1 - Composição de soluções utilizadas no processo de extracção de DNA.

Tampão Composição DLB 10mM Tris-HCl, pH=7.4; 10mM EDTA, pH=8.0; 5 M NaCl TE 10 mM Tris-HCl, pH=7.5; 1 mM EDTA, pH=8.0

2.2.2 - Extracção a partir de manchas

No caso de extracções de DNA a partir de manchas, os procedimentos foram idênticos, (ao ponto 2.2.1), substituindo-se o sangue total por cerca de 1 cm2 de tecido cortado em pequenos pedaços.

2.3 - MARCADORES DO CROMOSSOMA Y

Neste trabalho estudaram-se 7 STRs e 14 marcadores bialélicos do cromossoma Y. Todos foram analisados por técnicas de PCR e as reacções de amplificação foram efectuadas nos termocicladores Stratagene 40 ou “Biometra UNO II”.

46 II-Material e Métodos

2.3.1 - Microssatélites

Foram os seguintes os STRs analisados: DYS19, DYS389I, DYS389II, DYS390, DYS391, DYS392 e DYS393. Os respectivos GeneBank accession numbers, estão indicados na tabela 2.2.

2.3.1.1 - Condições de amplificação

Os STRs foram amplificados individualmente ou em sistemas multiplex. Neste caso recorreu-se a um pentaplex para co-amplificar DYS19, DYS389I, DYS389II, DYS390 e DYS393 de acordo com as condições descritas em Gusmão et al. (1999) e a um duplex para a co-amplificação de DYS391 e DYS392 segundo condições descritas em Brión et al. (2000). Na tabela 2.2, encontra-se a sequência dos primers e marcações utilizados nas amplificações. Em cada reacção foram amplificados cerca de 10 ng de DNA genómico. A reacção pentaplex consistiu de12.5 μl de uma solução final contendo:

- 1.25 μl de tampão 10x PCR (concentração final de 50 mM KCl, 1.5 mM MgCl2 e 10 mM Tris-HCl, pH 9.0); - 0.5 unidades de Taq Gold Polimerase (Perkin - Elmer); - 200 μM de cada um dos quatros desoxinucleótidos trifosfatados (dNTPs), (dATP, dCTP, dGTP e dTTP).

Tabela 2.2 - Sequência e marcação dos primers utilizados na amplificação de sete STRs do cromossoma Y

Gene Bank Sequência de primers Locus STR Referência accession (5´-3´) TET- cta ctg agt ttc tgt tat agt DYS19 X77751 Kayser et al. (1997) atg gca tgt agt gaa gga ca TET - cca act ctc atc tgt att atc tat *DYS389I/II G09600 Kayser et al. (1997) tct tat ctc cac cca cca ga 6FAM - tat att tta cac att ttt ggg cc DYS390 G09611 Kayser et al. (1997) pentaplex pentaplex tga cag taa aat gaa cac att gc HEX - gtg gtc ttc tac ttg tgt caa tac DYS393 G09601 Kayser et al. (1997) aac tca agt cca aaa aat gag g 6FAM - cta ttc att caa tca tac acc ca DYS391 G09613 Kayser et al. (1997) gat tct ttg tgg tgg gtc tg HEX - tca tta atc tag ctt tta aaa aca a duplex duplex DYS392 G09867 Kayser et al. (1997) aga ccc agt tga tgc aat gt *marcador bilocus em que o mesmo par de primers amplifica os loci DYS389I e YS389II

47 II-Material e Métodos

As concentrações dos primers foram: - 0.4 μM DYS19; - 0.12 μM DYS389I e II; - 0.12 μM DYS390; - 0.2 μM DYS393.

Para a amplificação do sistema duplex, usou-se cerca 10 ng de DNA num volume de reacção de 12.5 μl contendo:

- 1.25 μl de tampão 10x PCR (concentração final de 50 mM KCl, 1.5 mM MgCl2 e 10 mM Tris-HCl, pH 9.0); - 0.5 unidades de Taq DNA polimerase; - 200 μM de cada dNTP; - 0.25 μM de cada primer. Após reacções de PCR, foi feita a separação electroforética dos produtos amplificados recorrendo ou a sistemas automáticos de separação e leitura de fragmentos ou a sistemas manuais.

Tabela 2.3 - Condições de amplificação dos STRs do cromossoma Y

Condições de amplificação

Desnaturação Extensão Número de Locus STR Desnaturação Annealing Extensão inicial final ciclos DYS19 DYS389I/II 94 0C - 5´ 94 0C - 1´ 55 0C - 1´30´´ 72 0C - 2´ 72 0C - 10´ 35 Ciclos DYS390 pentaplex pentaplex DYS391

DYS392 95 0C - 5´ 95 0C - 1´ 56 0C - 1´30´´ 72 0C - 2´ 72 0C - 10´ 30 Ciclos DYS393 duplex

2.3.1.2 - Separação automática de fragmentos de DNA amplificados

A análise automática de fragmentos efectuou-se num ABI PRISM® 377 Genetic Analyser (AB Applied Biosystems) seguindo as instruções do Manual do Utilizador. O pellet foi ressuspenso em formamida desionizada e azul de dextrano (25 mM EDTA, pH 8.0 e 50 mg/ml de azul de dextrano) e TAMRA 500, o padrão interno de tamanho, na

48 II-Material e Métodos proporção 1:5. Antes da corrida, as amostras foram desnaturadas por aquecimento a 95 0C durante 30 minutos, sendo de imediato colocadas em gelo. As amostras foram então aplicadas em gel PAGE a 6% e corridas em sequenciador automático ABI PRISM 377 DNA Sequencer. As condições electroforéticas foram Pré-Run: 1 kV; 35mA, 50mW de laser power, 60´; Run: 3 kV; 60mA, 40mW de laser power; 5 horas. Os resultados foram analisados usando uma matriz (Set C) gerada com as matrizes padrão 6-FAM, TET, HEX, e TAMRA. O tamanho dos fragmentos foi determinado automaticamente pelo programa GeneScan® Analysis Software v.2.1.

2.3.1.3 - Separação não-automática de fragmentos de DNA amplificados

Os produtos de PCR foram submetidos a electroforese horizontal em géis de poliacrilamida e utilizando a diacrilpiperazina como crosslinker. Usou-se o sistema de tampões descrito por Luís e Caeiro (1995). O tampão das pontes e o do gel eram constituídos por 0.125 M Tris/HCl e 0.375 M Tris/Glicina a pH 8.8, respectivamente. Directamente sobre o gel, foram aplicadas tiras de papel (10 cm x 1.5 cm) “Whatman” (Cat. Nº 3017915) embebidas em tampão das pontes. Para controlo de migração, adicionou-se à solução electrolítica catódica algumas gotas de solução do corante azul de bromofenol em corridas de fragmentos de DNA pequenos, e xileno de cianol em corridas de fragmentos maiores. A separação electroforética decorreu sob uma diferença de potencial constante de 150 V/cm, numa placa de arrefecimento, durante 2 a 3 horas à temperatura de 8 0C (a corrida era interrompida quando o corante atingia o ânodo).

2.3.1.4 - Método de visualização do DNA amplificado

Quando se usaram sistemas não-automatizados, após a separação electroforética os fragmentos de DNA foram visualizados usando a coloração com nitrato de prata, segundo o método descrito por Budowle et al. (1991). O método consistia na passagem sequencial do gel pelas soluções e com os tempos de incubação que se descrevem na Tabela 2.4.

49 II-Material e Métodos

Tabela 2.4 - Soluções utilizadas e tempos de incubação na técnica de coloração com nitrato de prata.

Soluções utilizadas Tempo de incubação Etanol 10% 10 minutos Ácido nítrico 1% 5 minutos Água desionizada 30 segundos (2 vezes) Nitrato de prata 0.2% 20 minutos Água desionizada 30 segundos (2 vezes) Carbonato de sódio 0.28 M e Formaldeído 0.02% Até visualização das bandas Ácido acético 10% 30 segundos Água desionizada Várias lavagens

2.3.1.5 - Genotipagem de STRs

Para determinar, automática ou manualmente, o tamanho dos fragmentos amplificados, foram usados como referências ladders alélicos sequenciados. Procurou-se usar ladders contendo pelo menos os alelos mais comuns reportados para populações europeias e africanas. Os alelos foram designados de acordo com o número de repetições, segundo as recomendações da DNA Commission of the International Society of Forensic Genetics (ISFG), 2001. A nomenclatura usada foi a proposta por de Knijff et al. (1997), excepto para DYS389I e DYS389II em que se utilizou a recomendada pelo Forensic Y- User Group (http://ystr.org). Atendendo a que com o mesmo par de primers se amplificavam dois fragmentos incluindo DYS389I e DYS389I + DYS389II, para inferir o tamanho dos alelos de DYS389II subtraiu-se ao tamanho do maior fragmento o número de repetições correspondente a DYS389I.

2.3.2 - Marcadores bialélicos

Estudaram-se por PCR-RFLPs, 14 marcadores bialélicos do cromossoma Y que se apresentam na Tabela 2.5, bem como as sequências dos primers e respectivas condições de amplificação.

50 II-Material e Métodos

Tabela 2.5 - Primers, condições de amplificação e tamanho dos fragmentos obtidos para cada marcador

Condições de amplificação Locus Sequência de Primer Fragmentos Y-BM (5´- 3´) Desnatura Nº (pb) Desnaturação Annealing Extensão ção Inicial Ciclos YAP cag ggg aag ata aag aaa ta 940C-30´´ 540C-30´´ 720C-30´´ 33 -150 Hammer e act gct aaa agg gga tgg at ↓ +455 Horai (1995)

SRY aca gca cat tag ctg gta tga c 940C-30´´ 620C-30´´ 720C-60´´ 33 Santos et al. 8299 tct ctt tat ggc aag act tac g 509 (1999a)

sY81 agg cac tgg tca gaa tga ag 940C-30´´ 60 0C-30´´ 720C-60´´ 32 Seielstad et al. aat gga aaa tac agc tcc cc 209 (1994)

12f2 tct tct aga att tct tca cag aat tg 940C-30´´ 590C-30´´ 720C-30´´ 33 ±500 Rosser et al., ctg act gat caa aat gct tac aga tc ↓ 0 (2000)

SRY tcc tta gca acc att aat ctg g 940C-30´´ 590C-30´´ 720C-30´´ 34 167 Kwok et al. 1532 aaa tag caa aaa atg aca caa ggc (1996)

cca ccc agt ttt atg cat ttg 0 0 0 Jobling e LLy22g 94 C-30´´ 55 C-60´´ 72 C-60´´ 33 850 ata gat ggc gtc ttc atg agt Tyler-Smith (2000) Tat gac tct gag tgt aga ctt gtg a 940C-30´´ 600C-30´´ 720C-30´´ 33 112 Zerjal et al.. gaa ggt gcc gta aaa gtg tga a (1997)

92R7 gac ccg ctg tag acc tga ct 940C-30´´ 620C-30´´ 720C-60´´ 33 709 Hurles et a.l. gcc tat cta ctt cag tga ttt ct (1999) 0 0 0 SRY agg tct ttt ttg cct tct ta 94 C-30´´ 54 C-30´´ 72 C-120´´ 33 1242 Veitia et al. 2627 atg cac ggt ttc ttt tga (1997) gca gca tat aaa act ttc agg 0 0 0 Hurles et al. M9 94 C-30´´ 58 C-30´´ 72 C-30´´ 33 341 aaa acc taa ctt tgc tca agc (1998)

M109 ggg tat caa atg tct tca acc t 950C-2´ 940C-30´´ 580C-30´´ 720C-30´´ 32 312 Underhill et ggg aat ttc ctg cta ctt gc al. (2001)

M112 act ttt tcc aac agt tat ttt tga 950C-2´ 940C-30´´ 580C-30´´ 720C-30´´ 32 445 Underhill et cct act ttc ccc ctc ttc tg al. (2001)

M150 gca gtg gag atg aag tga gac 950C-2´ 940C-30´´ 580C-30´´ 720C-30´´ 32 289 Underhill et ccta ctt tcc ccc tct tct g al. (2001)

M168 agt ttg agg tag aat act gtt tgc t 950C-30´´ 600C-30´´ 720C-60´´ 35 473 Underhill et aat ctc ata ggt ctc tga ctg ttc al. (2001)

2.3.2.1 - Condições de amplificação

Cada reacção de amplificação, excepção de M109, M112 e M150, foi realizada num volume final de 12.5 μl que continha: - 200 μM de cada desoxinucleotídeo trifosfato (dATP, dCTP, dGTP e dTTP); - 0.25 μM de cada primer;

- 1.25 μl de tampão 10x PCR (concentração final de 50 mM KCl, 1.5 mM MgCl2 e 10 mM Tris-HCl, pH 9.0); - 0.5 unidades de Taq DNA polimerase (DNA polimerase de Thermus aquaticus - Perkin-Elmer); - 1-3 μl do DNA extraído (5-10 ng/μl).

51 II-Material e Métodos

No caso de M109, M112 e M150 a reacção de amplificação foi realizada num volume final de 25 μl que continha: - 200 μM dNTPs

- 1.5 mM MgCl2

- 1x tampão - 0.5 unidades de Taq DNA polimerase recombinante (Invitrogene).

O marcador 12f2 foi amplificado juntamente com o sY81, que serviu de controlo positivo nas amostras que apresentavam a delecção 12f2, permitindo confirmar se ocorreu amplificação. Dado que em YAP, o polimorfismo envolve uma inserção/delecção Alu, e em 12f2 possivelmente uma inserção/delecção de um segmento de DNA, para estes dois marcadores a discriminação dos alelos era imediatamente dada pelo tamanho dos fragmentos amplificados. Nos restantes marcadores, as variações polimórficas afectam locais de reconhecimento de enzimas de restrição, pelo que se recorreu à análise dos padrões de digestão com enzimas apropriadas (também indicadas na Tabela 2.6) para a detecção dos dois estados alélicos.

2.3.2.2- Digestão enzimática e separação dos fragmentos digeridos

Nas reacções de digestão, adicionou-se a 2 μl de produto amplificado, 5 unidades de enzima de restrição em tampões recomendados pelos fabricantes, de forma a perfazer um volume final de 5 μl. As reacções decorreram a 37 0C, durante um período mínimo de 60 minutos. Os produtos de amplificação ou digestão foram separados por electroforese horizontal, usando o procedimento descrito no ponto 2.3.1.3 em géis de poliacrilamida T:9%, C:5%, à excepção do que se utilizou para o sistema SRY2627 que foi T:6%, C:4%. Para a visualização dos fragmentos de DNA recorreu-se ao método descrito no ponto 2.3.1.4. A classificação das amostras foi feita por comparação com controlos previamente tipados.

52 II-Material e Métodos

Tabela 2.6 - Condições da digestão enzimática, substituição nucleotídica e fragmentos resultantes para cada SNP

Digestão Sequência de Fragmentos Marcador Polimorfismo reconhecimento (bp) Enzima de restrição Buffer BSA (5´-3´) G 362 + 147 SRY-8299 BsrBI 1 U 1x - GAG▼CGG ↓ A 509 A 68 + 102 + 39 sY81 NlaIII 2 U 2x 2x CATG▼ ↓ G 68 + 141 A 167 SRY-1532 DraIII 1 U 1x 1x CACNNN▼TG ↓ G 112 + 55 C 500 + 230 + 120 LLy22g HindIII 1 U 1x - A▼AGCTT ↓ A 650 + 500 + 230 + 120 T 85 + 27 Tat NlaIII 2 U 1x - CATG▼ ↓ C 112 C 197 + 512 92R7 HindIII 2 U 1x - A▼AGCTT ↓ T 709

↓ C 1242 SRY-2627 BsiHKAI 1 U 1x 1x T 298 + 944

C 67 + 181 + 92 M9 HinfI 1 U 1x - G▼ANTC ↓ G 248 + 92 C 289 + 81 + 103 M168 HinfI 1 U 1x - G▼ANTC ↓ T 289 + 184

Quanto aos marcadores M109, M112 e M150, foram analisados por sequenciação. As reacções de sequenciação foram efectuadas usando o Kit de sequenciação dRodamina Terminator Cicle (AB, Applied Biosystems) seguindo as instruções do Manual do Utilizador. A detecção e análise desses marcadores foram efectuadas num ABI 3100 Genetic Analyser (AB Applied Biosystems).

2.3.2 - Classificação dos haplogrupos

Em conjunto, os 14 marcadores bialélicos analisados permitem definir os haplogrupos indicados na Figura 2.2, que passarão a ser referidos de acordo com a nomenclatura recomendada pelo Y Chromosome Consortium, 2003.

53 II-Material e Métodos

The Y Underhill Jobling and Chromosome et al., Tyler-Smith Consortium (2000) (2000)

Y*(xBR) I 7 e 27 A

B*(xB2a,b)

B2a*(xB2a1) II 2 e 6 B M150 C→ T M109 B2a1 C →T Y M112 B2b G → A C CR*(xDE,J,K) V e VI 2, 10, 15, 35 e 36

D D IV 4

SRY-1532 YAP E*(xE3a) 21 e 25 SRY- M1 10831ª DYS287 A→ G Alu- → Alu+ SRY-8299 III M40 M168 SRY4064 G → A sY81 E3a 8 E M2 C→ T DYS271 A→G 12f2 J J VI 9 Presente→Ausente

K*(xN,P) VII e VIII 5, 13, 20, 23, 24, 26 e 28

N*(xN3) 12 LLY22g VIII C → A M9 N Tat N3 16 C→ G M46 K T→C

P*(x R1a,R1b3f) IX e X 1 e 18

SRY1532 SRY10831b R1a 3 e 29 92R7 G → A IX G → A P SRY2627 R1b3f 22 M167 C→T R

Figura 2.2 - Haplogrupos possíveis de discriminar com 14 marcadores do Y. A nomenclatura de acordo com a recomendação do YCC, (2003) e equivalência com outros sistemas previamente utilizados encontram-se nas três últimas colunas. A negrito encontram-se os marcadores estudados e em itálico os respectivos sinónimos. A vermelho assinalam-se as alterações nucleotídicas.

54 II-Material e Métodos

2.4 - DNA MITOCONDRIAL

2.4.1 - Amplificação e sequenciação

Após a amplificação das regiões HVS-I e HVS-II do mtDNA, os produtos de PCR foram purificados em colunas MicrospinTM S-300 HR (Pharmacia), de acordo com as instruções do fabricante. Este procedimento tinha como finalidade remover restos de Taq, primers, dNTPs e fragmentos curtos de DNA parcialmente amplificados, que podiam interferir com a reacção de sequenciação. As sequências dos primers e as condições de amplificação e de sequenciação estão indicadas nas Tabela 2.7 e Tabela 2.8, respectivamente.

Tabela 2.7 - Sequência dos primers utilizados na análise das regiões HVS-I e II do DNA mitocondrial

Locus Sequência de Primers Referência mitocondrial (5´- 3´) L15997 (cac cat tag cac cca aag ct) HVS-I Pereira et al. (2000b) H16401 (tga ttt cac gga gga tgg tg ) L48 (ctc acg gga gct ctc cat gc) HVS-II Pereira et al. (2000b) H408 (ctg tta aaa gtg cat acc gcc a)

De forma a testar o sucesso da amplificação, os produtos de PCR foram corridos em gel de poliacrilamida T9C5, e visualizados com coloração de prata, segundo procedimentos já descritos em 2.3.1.3 e 2.3.1.4, respectivamente. Efectuou-se de seguida a reacção cíclica didesoxinucleotídica de sequenciação, usando o Kit de sequenciação Big -DyeTM Terminator (AB Applied Biosystems) e cada um dos primers mencionados na Tabela 2.7, de forma a obter para ambas as regiões sequências com direcção directa e reversa.

Tabela 2.8 - Condições das reacções de amplificação e de sequenciação das regiões HVS-I e HVS-II

Desnaturação Extensão Número Condições Desnaturação Annealing Extensão inicial final de ciclos

Amplificação 95 0C - 1´ 95 0C - 10´´ 60 0C - 30´´ 72 0C - 30´´ 15 0C - 10´ 35

0 0 0 0 0 HVS-I

HVS-II Sequenciação 96 C - 4´ 96 C -15´´ 50 C - 9´´ 60 C -2´ 60 C - 10´ 30

55 II-Material e Métodos

Após reacção de sequenciação, os produtos de extensão foram purificados recorrendo a um protocolo baseado em precipitação por MgCl2 e etanol. O pellet foi ressuspenso em formamida ou formamida desionizada e azul de dextrano, conforme o sequenciador utilizado. As amostras foram então aplicadas em gel PAGE a 6% e corridas em sequenciador automático ABI PRISM 377 DNA Sequencer, ou ABI 3100 Genetics Analyser, e a análise de sequências foi efectuada recorrendo a software específico de aparelho, respectivamente ABI PRISM 377 - 18 Data Collection Software e DNA sequencing Analysis 3.7 software.

2.4.2 - Classificação de sequências

Na Figura 2.3, apresenta-se compilada a informação relativa a HVS-I e HVS-II, no esqueleto filogenético de sequências L, que representa uma adaptação do apresentado por Salas et al. (2002).

L3b1 L3b2 16124 16311 L3f1 L2b1 L3 L3b L2a1b 16292 L3d1 16362 L3g 16362 L3d2 16290 L3f 16319 L2 L2b 16256 16278 16362 16189 16355 16311 L3d 16278 L2a1 16213 L3d3 16286 16304 16311 16209 L2a1a 16309 16311 16114A 16293T 16124 L3e4 L2a 16129 16114A 1 6264 16294 L3* 16145 L3e L2d2 16239 16265T 16292 L2d 16399 L2* 16278 16327 16320 16355 189 L3e3 16390 200 L3e2 16129 325 16172 16189 L2/3* N 16233 M L3e1 198 16189 16300 L2c L3e2b 16354 16264 16187 16185 L2d1 16318 L3e2a L2c2 16325D 16189 L3e1a L2c1 16311 L3e1b L1e2 16362 247 16355 L1e 16166 16148 16254 16111 16129 L1* 16311 L1e1 16230 16129 16129 16243 16294 L1d1 16294 L1d 16169 16172 16126 16360 L1c2 16129 186A 16286G 16234 16327 16148 16264 189C 16209 316 16265C L1f 16172 16270 L1c 16188G 16214 L1d2 185T 16187 16278 16291 16320 16293 16215 073 L1b 189 L1c3 L1k L1 236 L1c1 16293 L1a 16166C 16274 16168 L1a1 L1b1 16278 16129 L1k1 L1c1a L1a1a L1a2 16214 16223 16234 16249

L1c1a1

Figura 2.3 - Esqueleto filogenético mostrando as sequências de HVS-I e HVS-II do mtDNA

56 II-Material e Métodos

A classificação de sequências de mtDNA em haplogrupos foi feita de acordo com o descrito por Watson et al. (1997), Rando et al. (1998), Macaulay et al. (1999), Richards et al. (2000); Bandelt et al. (2001), Pereira et al. (2001) e Salas et al. (2002).

2.5 - ANÁLISE ESTATÍSTICA

Utilizou-se o programa ARLEQUIN versão 2.000 (Schneider et al., 2000), para: - estimar, pelo método de contagem directa, frequências génicas ou haplotípicas e respectivos desvios padrões; - calcular índices de diversidade genética; - obter medidas de distância genética inter-populacional e efectuar testes exactos de diferenciação populacional; - estimar médias e distribuições de pares de diferenças entre haplótipos definidos por marcadores bialélicos do Y ou variações de mtDNA; - efectuar análise de variância molecular - AMOVA; - testar desvios ao modelo de equilíbrio populacional e/ou neutralidade selectiva pela aplicação das estatísticas “Tajima´s D” e “Fu´s Fs” em amostras de mtDNA.

Para avaliar afinidades populacionais com base em microssatélites do Y, usaram-se

RSTs, considerando o quadrado do somatório das diferenças de tamanho entre haplótipos. Os valores obtidos foram agrupados pelo método de Neighbour-Joining (Saito e Nei, 1987), utilizando a rotina Neighbour do pacote de programas PHYLIP 3.5c (Felsenstein, 1993). A robustez da árvore foi avaliada por 1000 bootstraps de iteração e recorreu-se ao programa Treeview (Page, 1996) para a sua visualização. Ainda quanto a microssatélites, para calcular média e distribuição de diferenças entre pares de haplótipos, contou-se cada alteração de uma unidade de repetição entre microssatélites como uma diferença.

Para marcadores bialélicos do Y, as distâncias genéticas foram obtidas por FSTs ponderando diferenças mutacionais entre pares de haplótipos. As networks dos haplótipos definidos por STRs do Y, foram construídas com o algorítmo mediam joining e ω =0, do pacote de programas NETWORK4.0.0.0 (http://www.fluxus-engineering.com).

57 II-Material e Métodos

Relativamente ao mtDNA, nas análises restritas ao arquipélago mobilizou-se toda a informação obtida quanto a variação de sequência, que incluiu a registada entre as posições nucleotídicas 16 051 a 16 390 para HVS-I, e 73 a 349 para a HVS-II, referenciando de acordo com a CRS de Anderson et al. (1981). Nas comparações com outras populações, apenas se considerou a informação relativa a HVS-I entre as posições 16 090 a 16 365, por ser muito reduzido o número de trabalhos com dados sobre segmentos mais extensos de HVS-I ou sobre HVS-II. As distâncias genéticas entre populações foram avaliadas com base em valores de FSTs obtidos após 1000 permutações da informação introduzida. Para obter uma aproximação à filogenia das sequências de mtDNA encontradas em São Tomé e Príncipe, utilizou-se a rotina Dnadis do pacote PHYLIP 3.5c para calcular distâncias moleculares entre sequências assumindo o modelo “Kimura 2-parâmetros” e considerando a proporção de 15:1 de transições e transversões. De seguida usou-se a rotina Neighbour do mesmo pacote para obter a representação filogenética e a árvore foi visualizada com o Treeview. Os dados sobre outras populações foram compilados da bibliografia. Entre outros estudos comparativos, e para SNPs do Y e mtDNA, os dados foram mobilizados para proceder à análise de componentes principais, que se efectuou recorrendo ao programa POPSTR, com o objectivo de se inferir as afinidades entre as populações. Nesta abordagem, usaram-se ou frequências de todos os haplogrupos em diferentes populações ou, alternativamente no caso do mtDNA, frequências relativas dentro do lote de haplogrupos de tipo L. O nível de significância considerado para rejeitar hipóteses nulas, foi sempre P<0.05.

58

III - RESULTADOS E DISCUSSÃO ______

3.1 - STRs DO CROMOSSOMA Y

3.1.1 - Análise locus a locus

Neste trabalho estudaram-se sete STRs do cromossoma Y, DYS19, DYS389I, DYS389II, DYS390, DYS391, DYS392 e DYS393. Para cada um, as estimativas de frequências alélicas registadas em Angolares, Forros, Tongas e na amostra global de São Tomé e Príncipe estão apresentadas na Tabela 3.1. Em seis dos STRs estudados, o padrão de distribuição das frequências alélicas era unimodal, observando-se relativamente ao alelo preponderante uma diminuição gradativa da frequência de alelos que diferiam entre si por uma unidade de repetição. Muitos STRs com padrões unimodais bastante regulares, apresentam alelos predominantes distintos em diferentes grandes grupos populacionais humanos, o que lhes confere grande utilidade em estudos de Genética populacional, em particular quando se pretende investigar misturas entre populações. É o caso do STR DYS390, o único no conjunto dos STRs agora estudados em São Tomé e Príncipe, em que no padrão de variação se desenhava uma certa bimodalidade. Como irá ser discutido mais à frente, na amostra global de São Tomé, referindo a amostra numericamente mais bem representada, DYS390*21 era o alelo preponderante, mas registou-se um segundo pico de frequência, ainda que bastante inferior, ao nível do alelo DYS390*24. Comparando as distribuições alélicas nos 7 STRs entre Angolares, Forros e Tongas, podem constatar-se as semelhanças dos padrões de variação, particularmente entre Forros e Tongas. Os Angolares tendem a apresentar jogos de frequências um pouco diferenciados dos dois outros grupos populacionais sãotomenses. Note-se, por exemplo, que para DYS389II o alelo mais comum nos Angolares é DYS389II*18, logo

61 III-Resultados e Discussão

seguido de DYS389II*17, alelos que Forros e Tongas compartilham como segundo e primeiro mais frequentes, respectivamente. Uma inversão idêntica de frequências observa-se em DYS391.

Tabela 3.1 - Estimativas de frequências alélicas para sete STRs em Angolares Forros, Tongas e amostra global de São Tomé Príncipe.

Locus Alelo Angolares (N=21) Forros (N=38) Tongas (N=44) São Tomé (N=103) DYS19 12 0.048±0.048 - - 0.010±0.010 13 0.048±0.048 0.053±0.037 0.091±0.044 0.068±0.025 14 0.190±0.088 0.184±0.064 0.136±0.052 0.165±0.037 15 0.619±0.109 0.421±0.081 0.500±0.076 0.495±0.050 16 0.048±0.048 0.158±0.060 0.136±0.052 0.126±0.033 17 0.048±0.048 0.158±0.060 0.136±0.052 0.126±0.033 18 - 0.026±0.026 - 0.010±0.010

DYS389I 8 - - 0.068±0.038 0.029±0.017 9 0.238±0.095 0.132±0.056 0.114±0.048 0.146±0.035 10 0.762±0.095 0.579±0.081 0.659±0.072 0.650±0.047 11 - 0.289±0.075 0.159±0.056 0.175±0.038

DYS389I I 15 - - 0.114±0.048 0.049±0.021 16 0.095± 0.066 0.184±0.064 0.159±0.056 0.155± 0.036 17 0.381±0.109 0.500±0.082 0.477±0.076 0.466±0.049 18 0.429± 0.111 0.263±0.072 0.250±0.066 0.291±0.045 19 0.095±0.066 0.053±0.037 - 0.039±0.019

DYS390 20 - - 0.023±0.023 0.010± 0.010 21 0.714±0.101 0.684±0.076 0.591±0.075 0.650±0.047 22 0.286±0.101 - 0.045±0.032 0.078±0.027 23 - 0.026±0.026 0.159±0.056 0.078±0.027 24 - 0.184±0.064 0.159±0.056 0.136±0.034 25 - 0.079±0.044 0.023±0.023 0.039±0.019 26 - 0.026±0.026 - 0.010± 0.010

DYS391 9 - - 0.023±0.023 0.010± 0.010 10 0.429±0.111 0.632±0.079 0.659±0.072 0.602±0.048 11 0.524±0.112 0.316±0.076 0.318±0.071 0.359±0.048 12 0.048±0.048 0.053±0.037 - 0.029±0.017

DYS392 10 0.048±0.048 - 0.023±0.023 0.019±0.014 11 0.857±0.078 0.737±0.072 0.750±0.066 0.767±0.042 12 - 0.079±0.044 0.091±0.044 0.068±0.025 13 - 0.105±0.050 0.091±0.044 0.078±0.027

14 0.095±0.066 0.079±0.044 0.023±0.023 0.058±0.023 15 - - 0.023±0.023 0.010±0.010

DYS393 12 - 0.079±0.044 0.068±0.038 0.058±0.023 13 0.571±0.111 0.526±0.082 0.614±0.074 0.573±0.049 14 0.286±0.101 0.289±0.075 0.227±0.064 0.262±0.044 15 0.143±0.078 0.079±0.044 0.091±0.044 0.097±0.029 16 - - - - 17 - 0.026±0.026 - 0.010±0.010

62 III-Resultados e Discussão

Por outro lado, para a maioria dos STRs, o número de alelos por locus encontrado em Angolares é inferior ao encontrado em Forros e Tongas. Avaliada por este parâmetro, a redução de diversidade em Angolares é particularmente acentuada para o locus DYS390, já que no grupo apenas foram encontrados 2 dos 7 alelos detectados na amostra global de São Tomé e Príncipe. O valor mais elevado quanto à média de alelos por locus registou-se nos Forros. Na Figura 3.1, as estimativas de frequências génicas para os sete STRs agora obtidas nos grupos populacionais sãotomenses, são confrontadas com as reportadas para outras populações utilizadas como referência, nomeadamente, do Centro e Norte de Portugal e de outras ex-colónias portuguesas em África. Como a figura ilustra, quatro dos sete STRs estudados, DYS19, DYS389II, DYS390 e DYS392, têm uma elevada capacidade para diagnosticar populações europeias e africanas, na medida em que os alelos mais comuns nas primeiras são, em geral, bastante menos frequentes nas segundas, e vice- versa. DYS19*14, DYS389II*16, DYS390*24 e DYS392*13 têm frequência muito elevada em populações europeias mas baixa ou intermédia em populações africanas. Pelo contrário, nas últimas predominam os alelos DYS19*15, DYS389II*17, DYS390*21 e DYS392*11, alelos que em europeus não ultrapassam valores intermédios de frequência. Os restantes três marcadores, DYS389I, DYS391 e DYS393, são bastante menos informativos na discriminação de populações europeias das africanas. Assim, se se atender, em particular, aos primeiros quatro STRs referidos, verifica-se que as distribuições alélicas agora registadas nas amostras de São Tomé e Príncipe diferem muito das encontradas nas populações portuguesas do Norte e Centro, e se enquadram bem melhor nos padrões registados em Angola, Moçambique e Guiné-Bissau, e de um modo geral, na gama de valores reportados para populações africanas (de Knijff et al., 1997). No entanto, há também sinais de que a contribuição europeia para o gene pool masculino da população actual de São Tomé e Príncipe não terá sido irrelevante. DYS390 parece ser o STR que, individualmente, melhor reflecte essa influência. Como já se referiu, apresenta na amostra global de São Tomé uma distribuição bimodal. O alelo mais frequente, DYS390*21, é-o também noutras populações africanas. Porém, o segundo alelo mais frequente, DYS390*24, que na amostra global de São Tomé chega aos 13.6%, é muito raro em populações africanas subsarianas, mas muito frequente em

63 III-Resultados e Discussão europeus, nomeadamente no Norte e Centro de Portugal, como se pode ver na Figura 3.1.

DYS19 DYS389I

1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 0 12 13 14 15 16 17 18 8 9 10 11 12

DYS389II DYS390 1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 0 14 15 16 17 18 19 20 21 22 23 24 25 26 27

DYS391 DYS392 1 1 0.8 0.8 0.6 0.6

0.4 0.4

0.2 0.2 0 0 9101112 10 11 12 13 14 15

DYS393 1

0.8

0.6

0.4

0.2 0 11 12 13 14 15 16 17 Angolares Forros Tongas São T o m é Angola Norte Cabo Verde Guiné Bissau Moçambique Portugal Centro Portugal Norte

Figura 3.1 - Distribuição de frequências alélicas de sete STRs em amostras populacionais de São Tomé e Príncipe, outras populações africanas e populações portuguesas. Eixo do X: número de unidades de repetição. Eixo do Y: frequências alélicas.

64 III-Resultados e Discussão

Assim, a elevada frequência que atinge em São Tomé e Príncipe, representa, a par de outros que irão ser apresentados, um bom indicador do impacto europeu no componente genético masculino da população actual de São Tomé e Príncipe. Da análise da Figura 3.1, sobressai ainda o padrão de distribuição de frequências de Cabo Verde. As características são intermédias entre os padrões típicos de populações europeias e africanas, o que reflecte o elevado grau de miscigenação que ocorreu durante o processo de povoamento deste arquipélago. Na Tabela 3.2, podem comparar-se os valores de heterozigotia, locus a locus ou médios, registados nas amostras estudadas com os reportados para outras populações. Nas amostras sãotomenses, os loci DYS19 e DYS389II foram aqueles que apresentaram diversidade génica mais elevada, à semelhança do que tende a verificar-se nas restantes populações africanas que constam da tabela. Em contrapartida, DYS392 foi o STR em que se registou nível de heterozigotia mais baixo, o que também acontece nas restantes populações africanas e que contrasta com o que se observa nas duas amostras portuguesas que, para este locus, se caracterizam por elevada diversidade.

Tabela 3.2 - Diversidade génica relativa a sete STRs em amostras de São Tomé e Príncipe e outras populações.

Diversidade Génica Média dos 7 População DYS DYS DYS DYS DYS DYS DYS STRs 19 389I 389II 390 391 392 393 Angolares 0.600 0.381 0.686 0.429 0.567 0.267 0.600 0.504±0.298 Forros 0.755 0.579 0.661 0.504 0.512 0.445 0.643 0.586±0.332 Tongas 0.702 0.535 0.687 0.611 0.475 0.429 0.572 0.573±0.324 Angola 0.602 0.554 0.653 0.356 0.450 0.040 0.533 0.455±0.266 Cabo Verde 0.766 0.643 0.681 0.772 0.578 0.498 0.508 0.635±0.354 Guiné-Bissau 0.716 0.636 0.587 0.644 0.307 0.117 0.617 0.518±0.299 Moçambique 0.722 0.658 0.697 0.653 0.503 0.158 0.589 0.568±0.323 Portugal Centro 0.642 0.457 0.576 0.607 0.649 0.660 0.571 0.595±0.334 Portugal Norte 0.494 0.597 0.554 0.500 0.510 0.560 0.374 0.517±0.295

Relativamente à média de diversidade considerando a informação conjunta dos sete STRs, a gama de valores que constam da Tabela 3.2 não indicia a existência de diferenças marcadas de variabilidade entre populações europeias e africanas. No mesmo sentido apontam os resultados obtidos por Pritchard et al. (1999), num estudo alargado a um leque mais vasto de populações humanas, sobre o padrão de variabilidade de STRs do cromossoma Y.

65 III-Resultados e Discussão

Quanto aos três grupos populacionais de São Tomé e Príncipe, é nos Angolares que se detecta o valor mais baixo de heterozigotia média (0.504±0.298), enquanto que em Forros e Tongas os níveis de heterozigotia média são mais elevados e semelhantes entre si (0.586±0.332 e 0.573±0.324, respectivamente). Assim, este resultado reforça o sinal, já anteriormente referido, de que os Angolares se caracterizam por uma certa redução de diversidade genética relativamente aos dois outros grupos populacionais do arquipélago. No sentido de obter uma primeira aproximação ao grau de heterogeneidade genética entre Angolares, Forros e Tongas, foram calculados valores de FST considerando os três grupos populacionais sãotomenses. Os resultados por locus e média relativa aos sete STRs apresentam-se na Tabela 3.3.

Tabela 3.3 - Valores de FST por locus e médios, relativos a sete STRs do cromossoma Y.

DYS loci Grupo Média nos Populacional DYS DYS DYS DYS DYS DYS DYS 7 STRs 19 389I 389II 390 391 392 393

Sãotomenses -0.008 0.026 -0.002 0.042* 0.017 -0.006 -0.020 0.006

Africanos 0.017* 0.016 0.007 0.099* 0.017 0.057* 0.005 0.029*

O grupo sãotomense inclui os Angolares, Forros e Tongas; o africano compreende adicionalmente Angola, Cabo Verde, Guiné-Bissau e Moçambique. * P< 0.05.

Com excepção do valor de FST obtido para o locus DYS390, que era estatisticamente significativo, os valores de FST registados nos restantes STRs e o valor médio considerando os sete loci (0.006), eram muito baixos, e não atingiam nível de significância estatística. Este resultado indica que, entre os três grupos populacionais de São Tomé e Príncipe, não existe heterogeneidade genética acentuada. Para possibilitar uma certa contextualização da magnitude dos valores registados, calcularam-se novos valores de FST considerando adicionalmente as amostras de Angola, Cabo Verde, Guiné-Bissau e Moçambique, e os resultados também constam na Tabela 3.3. Como se pode verificar, mesmo incluindo um conjunto de populações africanas geograficamente muito dispersas, o valor médio de FST, apesar de

66 III-Resultados e Discussão estatisticamente significativo, pode ainda considerar-se baixo (0.029) o que significa que será relativamente reduzido o nível médio de diferenciação genética entre as populações africanas consideradas nesta análise. Esta dedução, é absolutamente consistente com os resultados de Jorde et al. (2000), obtidos num estudo envolvendo populações à escala mundial, que lhes permitiu concluir que, em média, as populações africanas são menos diferenciadas ao nível de STRs do cromossoma Y, do que populações de outros continentes.

3.1.2 - Análise haplotípica

Na tabela 3.4, discriminam-se os haplótipos definidos pelos sete STRs (DYS19, DYS389I, DYS389II, DYS390, DYS391, DYS392 e DYS393) e frequências absolutas registadas em Angolares, Forros e Tongas. Por sua vez, na Tabela 3.5, apresentam-se diversos parâmetros de diversidade haplotípica referentes às amostras sãotomenses investigadas e a outras populações de referência. No conjunto, as amostras dos três grupos populacionais, representam um total de 103 cromossomas Y da população de São Tomé e Príncipe, entre os quais se encontraram 79 haplótipos distintos. A maioria constitui ocorrências únicas num dos três grupos populacionais, o que se reflecte nos elevados valores de diversidade haplotípica observados em Angolares, Forros ou Tongas. Índices de diversidade haplotípica muito elevados são, aliás, comuns na maioria das populações, incluindo todas as que constam da Tabela 3.5. Apesar de tudo, o nível de variabilidade haplotípica nos Angolares (0.967) é o mais baixo não apenas dos grupos populacionais de São Tomé, como também das outras populações que aparecem na Tabela 3.5, exceptuando Angola que regista um valor de diversidade idêntico ao dos Angolares. Em contrapartida, os Forros apresentam o mais elevado nível de diversidade haplotípica (0.994) entre os sãotomenses, e um dos mais elevados entre as restantes populações de referência. Ao contrário do que se referiu no ponto anterior sobre os níveis médios de variabilidade inferidos com base em STRs do Y, em populações africanas a variância do número médio de repetições para os mesmos marcadores, é, em geral, superior à de populações não-africanas (Pritchard et al., 1999). Os dados apresentados na Tabela 3.2 também corroboram essa tendência.

67 III-Resultados e Discussão

Tabela 3.4 - Haplótipos de STRs do cromossoma Y encontrados em Angolares, Forros, e Tongas, e número de matches com outras populações africanas, duas portuguesas, com registos contidos numa base de dados Caucasóides (http://ystr.charite.de) -[∴]- e com a amostra de indivíduos africanos de Pritchard et al., 2000 (http://www.stats.ox.ac.uk/) -[∴ ∴].

Loci Populações/ Matches

∴ ∴∴

DYS 19 DYS 389I DYS 389I DYS 390 DYS 391 DYS 392 DYS 393 Angolares Forros Tongas Angola Cabo-Verde Guiné-Bissau Moçambique Portugal Centro Portugal Norte Africanos Caucasóides H1 12 10 18 21 11 11 131 H2 13 9 17 24 10 11 13 1 3 2 5 H3 13 10 17 21 11 13 13 1 H4 13 10 17 24 10 11 13 1 40 H5 13 10 17 24 11 11 13 1 1 5 H6 13 10 18 21 10 11 131 H7 13 10 18 21 11 11 13 1 1 H8 13 10 18 24 11 11 12 1 H9 14 9 16 24 10 13 13 1 8 H10 14 9 16 24 11 13 12 1 2 H11 14 9 16 25 10 14 13 1 3 H12 14 9 17 22 10 11 141 5 H13 14 9 17 22 11 11 142 H14 14 9 17 22 11 14 141 H15 14 10 16 24 10 14 13 1 1 8 H16 14 10 16 24 11 12 13 1 1 1 7 H17 14 10 16 24 11 13 13 1 4 4 5 191 H18 14 10 17 21 10 13 14 1 H19 14 10 18 24 10 11 13 1 5 4 H20 14 11 17 23 9 11 13 1 1 H21 14 11 17 23 10 11 12 1 H22 14 11 17 23 10 15 12 1 7 H23 14 11 17 24 11 13 13 1 1 1 4 H24 14 11 17 25 10 14 13 1 H25 15 8 15 21 10 13 13 1 H26 15 8 15 23 10 12 13 2 H27 15 9 15 21 11 11 13 1 H28 15 9 16 21 10 11 13 1 1 H29 15 9 17 21 10 11 141 1 1 1 H30 15 9 18 23 12 11 14 1 H31 15 9 19 21 10 11 13 1 H32 15 10 16 21 10 11 141 H33 15 10 16 22 10 11 14 1 1 H34 15 10 16 24 10 11 14 1 1 H35 15 10 16 24 10 13 13 1 2 2 22 H36 15 10 17 21 10 10 131 H37 15 10 17 21 10 11 12 1 1

68 III-Resultados e Discussão

Tabela 3.4. - Continuação.

H38 15 10 17 21 10 11 13 1 5 1 2 H39 15 10 17 21 10 11 14 1 3 3 5 1 2 1 1 H40 15 10 17 21 10 11 15 1 2 1 3 H41 15 10 17 21 10 11 17 1 H42 15 10 17 21 11 11 13 1 2 1 1 H43 15 10 17 21 12 11 13 1 H44 15 10 17 22 10 11 151 H45 15 10 17 22 12 11 151 H46 15 10 18 21 10 11 13 1 1 2 7 2 2 4 1 H47 15 10 18 21 10 11 14 1 1 2 1 H48 15 10 18 21 11 11 13 4 3 3 2 6 1 H49 15 10 18 21 11 14 131 H50 15 10 19 21 10 11 131 1 H51 15 10 19 21 11 11 131 H52 15 11 17 21 10 11 13 1 1 1 1 1 1 H53 15 11 17 21 10 11 14 1 2 1 H54 15 11 17 21 10 11 15 1 H55 15 11 18 25 10 11 13 1 1 H56 16 9 17 21 10 11 14 1 1 H57 16 9 17 22 11 11 13 1 H58 16 10 16 21 10 11 15 1 1 H59 16 10 16 24 10 11 13 1 18 H60 16 10 16 26 11 12 13 1 H61 16 10 17 21 10 11 13 1 1 1 H62 16 10 17 21 11 11 14 1 1 1 H63 16 10 18 20 11 12 13 1 H64 16 10 18 21 11 11 13 1 1 1 H65 16 10 18 25 11 11 14 1 3 H66 16 11 15 23 10 11 13 1 H67 16 11 18 21 10 11 13 1 H68 17 10 16 21 10 11 151 H69 17 10 16 21 11 11 12 1 H70 17 10 17 21 10 11 14 1 1 1 3 1 H71 17 10 17 21 10 12 14 1 H72 17 10 17 21 11 10 15 1 H73 17 10 18 21 11 11 13 1 H74 17 10 18 23 10 14 13 1 H75 17 11 17 21 10 11 14 2 1 H76 17 11 17 21 10 11 15 1 1 5 H77 17 11 17 21 10 12 14 1 H78 17 11 17 21 11 11 14 1 H79 18 11 17 21 10 11 14 1

69 III-Resultados e Discussão

A variância do número médio de repetições em Forros e Tongas enquadra-se na gama dos valores mais elevados que constam da Tabela 3.5 e que se referem a populações africanas. Mais uma vez, no que respeita aos grupos sãotomenses, distinguem-se os Angolares já que também quanto a este parâmetro se caracterizam por menor variabilidade.

Tabela 3.5 - Índices de diversidade haplotípica em São Tomé e Príncipe e outras populações.

Nº Variância do Diversidade Diversidade População N haplótipos número médio haplotípica Génica* diferentes de repetições* 1. Angolares [a] 21 17 0.967±0.030 0.504±0.298 0.554 2. Forros [a] 38 35 0.994±0.008 0.586±0.332 1.043 3. Tongas [a] 44 37 0.991±0.008 0.573±0.324 0.863 São Tomé (1-3) 103 79 0.987±0.006 0.566±0.316 0.886 4. Angola [b] 50 32 0.967±0.014 0.455±0.266 0.637 5. Cabo Verde[b] 47 34 0.978±0.011 0.635±0.354 0.925 6. Guiné-Bissau [b] 33 27 0.977±0.018 0.518±0.299 0.497 7. Moçambique [b] 37 30 0.987±0.010 0.568±0.323 1.058 África (1-7) 270 167 0.989±0.002 0.566±0.314 0.866 África [c] 229 154 0.995±0.001 0.620±0.340 1.135 8. Portugal C [d] 50 43 0.992±0.007 0.595±0.334 0.685 9. Portugal N [e] 55 39 0.980±0.009 0.517±0.295 0.527 Portugal (8 + 9) 105 77 0.990±0.004 0.556±0.312 0.602 Europeus [c] 46 37 0.985±0.010 0.503±0.289 0.505 [a]: este estudo; [b]: Corte Real et al. (2000); [c]: Pritchard et al. (1999); [d]: Carvalho et al. (2000); [e]: González-Neira et al. (2000). * médias dos 7 STRs.

Na amostra global de São Tomé, sobressai a frequência relativamente elevada - 9.7% - do haplótipo H48. Aparece nos três grupos populacionais, mas é entre Angolares que está mais bem representado atingindo o valor de 19%. Os segundos haplótipos mais comuns em São Tomé e Príncipe são H39 e H46, representando, cada um, 3.9% dos cromossomas Y sãotomenses. Estes três haplótipos, e outros que se encontraram com menor frequência na amostra analisada, fazem parte de um conjunto com grandes afinidades moleculares, e que se tem admitido ser um marcador da expansão Bantu em África sub-equatorial. Thomas et al. (2000), verificam que em populações Bantu do

70 III-Resultados e Discussão leste de África, são preponderantes os haplótipos 15-21-10-11-13, ou os seus derivados por um passo mutacional, definidos pelos STRs DYS19, DYS390, DYS391, DYS392 e DYS393, o que os leva a deduzir que esse núcleo de haplótipos representa a assinatura da expansão Bantu em direcção ao leste africano. O mesmo conjunto de haplótipos, sinaliza igualmente a rota de dispersão de povos faladores de línguas Bantu via ocidente africano (Pereira et al., 2002). Em São Tomé e Príncipe, aquele que é considerado o haplótipo fundador nessa expansão populacional (15-21-10-11-13), representa 10.7% da amostra analisada. Se considerarmos os 5 haplótipos detectados que diferem daquele por uma mutação (15-21-10-10-13, 15-21-10-11-12, 15-21-10-12-13, 15-21-10-11-14 e15-21-11- 11-13), no total representam 35% dos cromossomas Y de São Tomé e Príncipe, e ambos os valores são da ordem dos registados em populações fortemente marcadas pela expansão Bantu. Por conseguinte, este resultado indica que para o povoamento de São Tomé e Príncipe foi muito significativo o contributo de populações do continente africano com manifesta influência Bantu, influência que, indirectamente, a população sãotomense incorporou.

3.1.3 - Padrão de Partilha

Com o objectivo de se investigar a origem dos haplótipos detectados em São Tomé e Príncipe, fez-se a análise do padrão de partilha haplotípica (a) com as populações de referência já mencionadas, e, adicionalmente, (b) com 20 populações de origem europeia que, em 2001, constavam da base de dados de STRs do Y - http://ystr.charite.de - contendo na altura 3589 registos haplotípicos, e (c) com a amostra populacional de escala mundial estudada por Pritchard et al. (1999), que continha 229 haplótipos africanos e cujos resultados estavam acessíveis em http://www.stats.ox.ac.uk/~pritchard/data. O exercício de análise foi efectuado tendo em consideração a grande desproporção numérica entre linhagens masculinas Caucasóides e Africanas comparadas. Nas últimas colunas da direita da Tabela 3.4, está discriminado o número de matches entre haplótipos detectados em São Tomé e Príncipe e os das amostras atrás referidas. Relativamente aos grupos sãotomenses, os Tongas partilham o maior número de haplótipos com outras populações: 43% dos seus 37 haplótipos são partilhados por homens de origem europeia e 49% também se encontram em outras populações

71 III-Resultados e Discussão africanas. Em contrapartida os Angolares são os que partilham menos haplótipos: apenas 4 dos 17 haplótipos aparecem também em Caucasóides e/ou Africanos. Entre os haplótipos sãotomenses partilhados, destaca-se o elevado número de matches que H4, H17, H35 e H59 apresentam. Quanto a H4 e H17, presentes apenas nos Tongas, encontraram-se 40 e 191, respectivamente, registos iguais na base de dados de linhagens Caucasóides, e na mesma base de dados, para os haplótipos H35 e H59, presentes nos Forros, registaram-se, por ordem respectiva, 22 e 18 matches. Dois destes quatro haplótipos - H17 e H35 - apresentam matches múltiplos com linhagens do norte e centro de Portugal. Por outro lado, os 4 haplótipos estão ausentes nas amostras africanas consideradas, à excepção de H17 que aparece em Cabo Verde mas que se pode explicar pela intensa miscigenação que ocorreu neste arquipélago. Assim, apenas pelo padrão de partilha, pode deduzir-se que os 4 haplótipos são bastante específicos de populações europeias, pelo que é de admitir que a sua presença em São Tomé e Príncipe seja o resultado de introgressão, mediada, muito provavelmente, por homens portugueses. De origem europeia parecem ser também os haplótipos H2, H5, H9, H10, H11, H12, H15, H16, H22 e H23. Embora apresentem um número menor de matches com linhagens europeias, se se atender aos alelos que contêm nos STRs DYS390 e/ou DYS392 (muito informativos como auxiliares na discriminação de populações europeias e africanas) e à ausência de haplótipos idênticos nas amostras africanas (exceptuando, novamente, Cabo Verde), afigura-se bastante improvável serem de origem africana. Quanto aos outros haplótipos não exclusivos de São Tomé e Príncipe, a maioria apresenta matches com linhagens de Angola, Guiné-Bissau, Cabo Verde, Moçambique ou com as da amostra de africanos de Pritchard et al. A origem africana desses haplótipos também não deixa grandes dúvidas. Para aqueles haplótipos que apresentavam apenas um ou outro match e, por vezes, simultaneamente com amostras africanas e europeias, não foi possível inferir, com segurança aceitável, a sua mais provável origem geográfica.

3.1.4 - Distribuição de diferenças entre pares de haplótipos

Na Figura 3.2, estão graficamente representadas as distribuições do número de diferenças observadas entre pares de haplótipos - mismatch distributions - registadas em

72 III-Resultados e Discussão

Angolares, Forros, Tongas, na amostra global de São Tomé e nas amostras africanas que se usaram como referência. Ao contrário do que acontece nas outras amostras, em que as distribuições de diferenças entre os pares de haplótipos são tendencialmente unimodais, em Moçambique observa-se um afastamento deste padrão já que se registam várias modas e apenas se esboça um ligeiro pico de frequência ao nível de um número elevado de diferenças entre haplótipos.

Angolares Forros 0,25 0,25 0,2 0,2 0,15 0,15 0,1 0,1 0,05 0,05 0 0 0 2 4 6 8 101214 0 2 4 6 8 10 12 14 Mpd =4.69±2.39 Mpd=6.74±3.25

Tongas S.Tomé e Príncipe 0,25 0,25 0,2 0,2 0,15 0,15 0,1 0,1 0,05 0,05 0 0 02468101214 0246810121416 Mpd=6.23±3.02 Mpd=6.19±2.97

Guiné Bissau Cabo Verde 0,25 0,2 0.25 0.2 0,15 0.15 0,1 0.1 0.05 0,05 0 0 02468101214 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Mpd=4.63±2.33 Mpd=6.85±3.29

Moç ambique Angola 0,25 0.25 0,2 0,15 0.15 0,1

0.05 0,05 0 -0.05 02468101214 0 2 4 6 8 101214 Mpd=6.59±3.18 Mpd=4.62±2.30

Figura 3.2 - Distribuição do número de diferenças entre pares de haplótipos definidos por STRs do Y e média das diferenças entre pares de haplótipos (Mpd). Eixo dos X: número médio de diferenças entre os haplótipos. Eixo dos Y: frequências.

73 III-Resultados e Discussão

A análise populacional de mismatch distributions tem sido sobretudo aplicada em estudos envolvendo SNPs. Para este tipo de marcadores, existem modelos bastante robustos que permitem antever como acontecimentos demográficos passados afectam a quantidade e a distribuição da diversidade molecular em populações actuais (Harpending et al., 1998; Schneider e Excoffier, 1999). Porém, a dinâmica populacional da variação de microssatélites só tem sido alvo de atenção mais recente (Kimmel et al., 1998; Gonser et al., 2000) e ainda não há modelos bem estabelecidos para prever distribuições de pares de diferenças no contexto evolutivo de STRs do cromossoma Y. Relativamente a SNPs, espera-se que populações que registaram no passado expansões demográficas acentuadas apresentem curvas de mismatch distribution unimodais e regulares, enquanto que, pelo contrário, distribuições de pares de diferenças multi-modais e irregulares são uma assinatura previsível para aquelas que se mantiveram relativamente estáveis em termos de tamanho populacional. A adequação destas previsões tem sido demonstrada com os resultados obtidos em populações africanas para o mtDNA. Populações em que a agricultura ou pastorícia constituem o modo de subsistência típico, são caracterizadas por distribuições de pares de diferenças entre sequências de mtDNA em forma de “sino” (bell-shaped), enquanto que padrões muito irregulares (ragged) só se têm encontrado em populações actuais de caçadores- recolectores (Watson et al., 1996). Assim, efectuando para mismatch distributions de STRs um paralelismo interpretativo idêntico ao aplicado para SNPs, os padrões unimodais detectados em Angola e Guiné-Bissau indicam tratarem-se de populações que registaram expansões consideráveis das linhagens masculinas definidas por STRs. Os padrões de distribuição observados em Cabo Verde ou na amostra global de São Tomé e Príncipe são muito parecidos. Ambos são unimodais e regulares, à semelhança dos de Angola ou Guiné-Bissau, no entanto, o número médio de diferenças entre pares de haplótipos é, comparativamente, muito superior. Este padrão entende-se dada a história de povoamento dos dois arquipélagos. Em ambos, pouco depois da descoberta quinhentista, foi iniciado um processo de povoamento que envolveria intensa mistura populacional. Em Cabo Verde, a miscigenação entre europeus e africanos, e em particular a que decorreu do cruzamento de homens europeus com mulheres africanas, atingiria

74 III-Resultados e Discussão

níveis muito significativos, explicando-se assim que em média dois haplótipos caboverdianos sejam muito diferentes entre si. Em São Tomé e Príncipe, a contribuição europeia foi bastante menor mas, em contrapartida, o aporte africano foi originário de áreas de recrutamento mais dispersas sendo, pois, de admitir maior heterogeneidade no pool de linhagens africanas e, daí, o elevado valor médio observado quanto a diferenças entre haplótipos sãotomenses. A mismatch distribution encontrada em Moçambique é a mais difícil de explicar. Um simples efeito amostral ou a existência de marcada subestruturação populacional poderiam traduzir-se em distribuições como a registada. No entanto, o desconhecimento da composição étnica da amostra moçambicana não permite mais avanços para além das hipóteses adiantadas.

3.1.5 - Diferenciação genética entre populações

Na Tabela 3.6, apresentam-se as estimativas de distâncias genéticas entre os três grupos sãotomenses e outras populações usadas como referência. São distâncias avaliadas por

valores de RSTs corrigidos e calculados com base na soma de quadrados de diferenças de tamanhos.

Tabela 3.6 - Valores de RST entre pares de populações.

Cabo- Guiné- Portugal População Angolares Forros Tongas Angola Moçambique Verde Bissau Centro Forros 0.916* Tongas 0.853* -0.067 Angola 0.488* 0.153 0.179 Cabo Verde 2.903** 0.924** 0.734** 2.164** Guiné-Bissau 1.410** 0.539* 0.834** 0.137 3.479** Moçambique 1.202** -0.013 0.038 0.212 0.749** 0.811** Portugal Centro 8.243** 4.489** 4.484** 7.233** 1.332** 8.928** 4.539** Portugal Norte 10.048** 6.090** 5.925** 9.052** 2.079** 11.076** 5.889** 0.005 * P < 0.05 ** P < 0.01

Se se excluir Cabo Verde, a distância genética média entre pares de populações africanas é de 0.524. Tomando este valor como referência para o nível médio de diferenciação entre populações africanas, podem considerar-se relativamente elevados os valores de distância registados entre Angolares/Forros (0.916) ou Angolares/Tongas (0.853), que atingem mesmo níveis de significância estatística (P=0.036 e P=0.018,

75 III-Resultados e Discussão respectivamente). Pelo contrário, não há sinais de diferenciação genética entre Forros e Tongas. Por conseguinte, entre os grupos sãotomenses, os Angolares distinguem-se pelo nível já significativo de diferenciação genética. De igual forma, todas as distâncias genéticas entre Angolares e as outras populações com que foram confrontados, incluindo todas as africanas, eram estatisticamente significativas, o que também contrasta com os resultados das comparações envolvendo Forros ou Tongas. Tal como os Angolares, os outros dois grupos sãotomenses diferenciam-se claramente das populações portuguesas, mas relativamente às populações africanas não manifestam diferenças significativas com Angola ou Moçambique. No que respeita às amostras do Norte e Centro de Portugal, sobressai a grande homogeneidade genética ao nível dos STRs do Y, o que está de acordo com o que tem sido reportado para as regiões, e fazendo a média das distâncias obtidas nos pares de comparações envolvendo as duas amostras portuguesas e as africanas, chegou-se ao valor de 7.166. Para este cálculo, também não foi considerada a amostra de Cabo Verde, dadas as suas peculiaridades genéticas. De facto, a distância média de Cabo Verde relativamente às restantes populações do continente africano é de 1.825, e relativamente às duas amostras portuguesas é de 1.705. São valores indicativos de que, se se atender à variação de STRs do cromossoma Y, o arquipélago está geneticamente equidistante, grosso modo, de populações africanas e europeias. A par de outros, este resultado constitui um claro testemunho genético da intensa miscigenação entre europeus e africanos de que é fruto a população actual de Cabo Verde. Na Figura 3.3, representam-se graficamente as relações genéticas, inferidas pela análise de STRs do Y, entre as populações comparadas. Trata-se de uma árvore filogenética construída por neighbour-joining, que se obteve após 1000 iterações de bootstrap. A topologia da árvore discrimina inequivocamente o grupo de populações africanas do grupo que contém as duas populações portuguesas. A posição intermédia que Cabo Verde ocupa, reflecte bem a ancestralidade mista dos caboverdianos, sendo até impossível distinguir, com este tipo de abordagem, qual dos contributos, europeu ou africano, teve mais impacto no gene pool masculino do arquipélago. Finalmente é de destacar, no grupo africano, o pequeno tamanho dos ramos, sugerindo um nível apenas moderado de divergência entre populações, e o facto de Angola, Guiné-Bissau e Angolares estarem posicionados na extremidade da árvore.

76 III-Resultados e Discussão

Portugal Centro

Portugal Norte

Cabo Verde

Moçambique Tongas Forros

Angolares Angola Guiné - Bissau

Figura 3.3 - Árvore neighbour-joining dos três grupos populacionais sãotomenses e outras populações africanas e portuguesas.

Esta posição parece resultar dos níveis de diversidade relativamente reduzidos que caracterizam as três populações, já que são aquelas que apresentam os valores mais baixos em diversos parâmetros, nomeadamente, número médio de diferenças entre pares de haplótipos, diversidade haplotípica e diversidade génica.

3.1.6 - Estruturação genética em São Tomé e Príncipe inferida com STRs do Y

Com o objectivo de avaliar pormenorizadamente a estrutura populacional de São Tomé e Príncipe, aplicou-se AMOVA de quatro modos diferentes: - tratando Angolares, Tongas e Forros como um único grupo; ou - confrontando cada grupo populacional com o grupo que continha os dois restantes, o que permite 3 possibilidades, a saber: - Angolares versus Forros + Tongas - Forros versus Angolares + Tongas - Tongas versus Angolares + Forros. Os resultados desta análise estão apresentados nas Tabela 3.7 e da sua interpretação decorre, como seria de esperar, que a percentagem de variação atribuível a

77 III-Resultados e Discussão diferenças no seio das populações é extremamente elevada, suplantando de longe a que se pode atribuir as diferenças entre grupos ou entre populações dentro de grupos. Entre grupos, a percentagem de variação assume valores negativos, excepto quando se separa Angolares de não-Angolares (Tongas + Forros). Neste caso, a percentagem de variação devida a diferenças entre populações é a mais baixa observada (-1.02%) mas, em contrapartida, a fracção devida a diferenças entre grupos (3.24%) atinge nível de significância estatística. Com o objectivo de avaliar se para este resultado não estaria a contribuir, em excesso e de forma aleatória, algum STR em particular, fixámos a hierarquia Angolares versus Tongas + Forros, e efectuámos uma espécie de jacknifing correndo repetidamente AMOVA, mas excluindo de cada vez um ou mais STRs. O valor relativo

à percentagem de variação entre grupos (FCT) só deixou de ser estatisticamente significativo quando os STRs DYS389I, DYS390 e DYS391 foram simultaneamente excluídos da análise, o que nos levou a concluir que embora aqueles três STRs sejam os que concorrem com contribuições parciais mais importantes, apenas o seu efeito combinado explica a diferenciação genética observada entre Angolares e os outros dois grupos sãotomenses. Assim, os resultados de AMOVA indicam que ao nível das linhagens definidas por STRs do Y, existe subestruturação populacional em São Tomé e Príncipe, que é determinada pelo padrão de diversidade registado nos Angolares.

Tabela 3.7 - Percentagem de variação produzida por AMOVA com diferentes níveis de hierarquização dos grupos populacionais sãotomenses.

Variação (%) Comparação To vr An+Fo Fo vr An+To An vr To+Fo An+To+Fo Dentro das populações 99.98 99.84 97.78 99.36 Entre populações 2.67 1.93 -1.02 0.64 Entre grupos -2.65 -1.77 3.24* - An: Angolares; Fo: Forros; To: Tongas. *Nível de significância: 5%.

78 III-Resultados e Discussão

3.1.7 - Considerações globais sobre o estudo de STRs do Y em São Tomé e Príncipe

Expostos e parcialmente discutidos os resultados obtidos em São Tomé e Príncipe com STRs do cromossoma Y, procuraremos agora analisá-los globalmente e enquadrá-los no contexto de diversidade do continente africano e depois, no da micro-escala geográfica do arquipélago em estudo. Pelas características do padrão de distribuição de frequências dos STRs DYS19, DYS389I, DYS389II, DYS390, DYS391, DYS392 e DYS393, observado em São Tomé e Príncipe, pode concluir-se que o arquipélago se caracteriza por um fundo substancial de linhagens africanas mas com sinais que evidenciam que o aporte europeu não foi, de todo, discipiente. As informações históricas sobre o povoamento de São Tomé e Príncipe apontam para uma considerável dispersão geográfica quanto à origem das linhagens africanas que entraram no arquipélago. Seria de admitir, portanto, que um fundo dominante e diversificado de linhagens africanas acrescido de fracção razoável de linhagens europeias, se traduzisse num inequívoco excesso de diversidade genética. Ora, ao nível dos STRs do Y, a maioria dos índices de diversidade registados em São Tomé, enquadra-se, mas não ultrapassa, a gama dos valores mais elevados entre as populações comparadas, gama onde se incluem populações europeias ou africanas. Assim, estes resultados vão ao encontro dos obtidos por Pritchard et al. (1999), que, ao analisar os níveis de diversidade de STRs do Y, constatam que populações africanas não se caracterizam por um excesso marcado de variabilidade comparativamente a populações de outros continentes, ao contrário do que se verifica em outro tipo de marcadores genéticos. Como o esquema amostral usado por Pritchard et al. era muito diferente do nosso, e no sentido de avaliar melhor a consistência das deduções, calcularam-se diversos índices de diversidade para uma amostra que designámos de “África” em que amalgamámos os dados de São Tomé, Angola, Cabo Verde, Guiné-Bissau e Moçambique. Os resultados constavam já da Tabela 3.5, tal como os obtidos por Pritchard et al. e ainda os que se calcularam com base numa amostra mista de europeus estudada por González-Neira et al. (2000).

79 III-Resultados e Discussão

Comparando as duas amostras de África, a de Pritchard et al. apresenta índices de diversidade ligeiramente mais elevados que a nossa, o que se entende dado tratar-se de uma amostragem populacional ainda mais heterogénea, mas os valores, quer de diversidade haplotípica, diversidade génica ou variância no número de repetições, são de idêntica ordem de grandeza. Se compararmos os mesmos índices com os registados nas amostras de europeus, a única diferença clara entre europeus e africanos reside na variância média do número de repetições, que tende a ser bastante mais elevada em africanos. Para outros índices, nomeadamente diversidade haplotípica e génica, não há diferenças nítidas entre populações europeias e africanas, que são igualmente caracterizadas por grande diversidade ao nível de STRs do Y, à semelhança do que acontece na maioria das populações humanas. O padrão de diversidade de STRs do Y à escala mundial, compreende-se dada a dinâmica evolutiva deste tipo de marcadores. Uma vez que associam elevada taxa de mutação - responsável por convergência frequente do tamanho de novos alelos - a baixo efectivo populacional, tendem a reter menos “memória” de acontecimentos do passado evolutivo (Perez-Lezaun et al., 1999) que outro tipo de marcadores de transmissão uniparental, como SNPs do Y ou mtDNA. É pelos mesmos motivos que se explica a ausência de marcada subestruturação à escala macrogeográfica para STRs do cromossoma Y (de Knijff et al., 1997; Kayser et al., 2001b) e, consequentemente, a obtenção de valores de GSTs baixos a nível inter- continental (África, Ásia, Europa) com esses marcadores, em oposição ao que acontece, por exemplo, com SNPs do Y que produzem GSTs equivalentes elevados, traduzindo uma grande especificidade geográfica (Hammer et al., 2003). A reduzida subestruturação geográfica de STRs do Y, permite entender que alguns haplótipos agora detectados em São Tomé e Príncipe tivessem sido igualmente encontrados simultaneamente em populações europeias e africanas e em proporções que não possibilitaram inferir com segurança a possível origem geográfica. Foi por isso, e começando já a debruçarmo-nos sobre São Tomé Príncipe, que optámos por não usar resultados de STRs do Y para tentar quantificar o grau de mistura entre europeus e africanos, não obstante termos assumido como provável ou até muito provável a origem europeia de muitos dos haplótipos detectados.

80 III-Resultados e Discussão

Reservaremos esse exercício para haplogrupos definidos por marcadores bialélicos que, tendo em vista essa finalidade, são muito mais informativos, conforme se apresentará no ponto 3.2. Não é de estranhar a presença de linhagens masculinas europeias no arquipélago. Durante o período inicial de colonização, a miscigenação foi bastante incentivada funcionando como uma estratégia de povoamento para promover o aumento rápido da população. Por outro lado, várias fontes referem que os mulatos, que chegaram a constituir uma fracção considerável da população, detinham um estatuto social privilegiado e a par do grupo europeu dominante, sempre minoritário, desempenharam um papel importante durante a primeira fase de colonização, em que o cultivo de cana- de-açúcar e o “armazenamento” de escravos para o tráfico transcontinental, eram as principais actividades das ilhas. Porque foi sempre muito reduzido o número de mulheres europeias em São Tomé e, sobretudo, devido ao forte condicionalismo cultural, a miscigenação foi quase exclusivamente fruto do cruzamento entre homens europeus com mulheres africanas. Este enviezamento sexual do padrão de cruzamentos, ficou bem registado no gene pool de São Tomé e Príncipe, como se entenderá quando apresentarmos os resultados obtidos com mtDNA. Passando à análise dos grupos populacionais de São Tomé e Príncipe, começaremos por destacar a semelhança entre Forros e Tongas quanto aos padrões de variação nos sete STRs estudados. A ausência de sinais de heterogeneidade genética entre os dois grupos indica que a percepção usual que continua a distinguir Forros e Tongas, se baseia essencialmente numa construção social cujas raízes se prendem na história recente do arquipélago. A designação Forro atribui-se aos sãotomenses que se considera serem descendentes dos “filhos da terra”, os antigos escravos libertos ao longo de séculos, ou africanos desde sempre livres, que tiveram um papel fundamental no povoamento e nas actividades de desenvolvimento das ilhas (Tenreiro, 1961; Henrique, 2000). Há poucas fontes sobre a origem geográfica dos africanos que foram levados para São Tomé e Príncipe. Mas é de admitir que os pontos de recrutamento se tenham deslocado progressivamente para Sul, à medida que se expandiam as regiões que os portugueses exploravam nas actividades comerciais. A bacia do Rio Níger e a região do Benin, terão sido os primeiros locais de fornecimento de escravos para São Tomé, mas desde o início

81 III-Resultados e Discussão do século XVI até ao XVII, o Reino do Congo logo seguido de Angola, tornar-se-iam os principais mercados a que os portugueses recorriam para o abastecimento negreiro. A partir do século XVII, a influência de São Tomé e Príncipe no comércio de escravos sofreu fortes restrições, só lhe sendo permitido o abastecimento no Golfo da Guiné, com o Gabão como limite meridional. Assim, presume-se que os africanos que foram chegando a São Tomé e Príncipe, fossem oriundos de uma faixa do litoral atlântico africano que pode balizar-se entre Elmina, no actual Gana, e Angola. A idealização de Forro como entidade social, começa apenas a moldar-se no século XIX, altura em que principiaram a entrar no arquipélago vagas maciças de trabalhadores contratados para as recém introduzidas culturas do cacau e do café. Já tinha sido abolido o tráfico de escravos, e São Tomé vivia o rescaldo de dois séculos de estagnação económica após o auge e declínio do período açucareiro. As novas culturas iriam ter um desenvolvimento extraordinário, exigindo um esforço de mão-de-obra que era impossível suprir entre os naturais do arquipélago. Recorreu-se então à contratação de mão-de-obra exterior e em levas sucessivas entraram em São Tomé milhares e milhares de indivíduos, recrutados essencialmente de Cabo Verde, Angola e Moçambique. Findos os contratos de trabalho, muitos dos repatriamentos previstos acabam por não se cumprir, e os serviçais que se fixam no arquipélago, e que representam um estrato social e economicamente desfavorecido, começam a ser tratados por Tongas, designação que os seus descendentes herdariam. Assim, pode considerar-se que, num certo sentido, as linhagens africanas actualmente presentes em Forros ou Tongas representam duas sub-amostragens do stock de linhagens paternas do continente africano, efectuadas com bastante desfasamento temporal. Ambas as sub-amostragens incorporaram conjuntos diversificados de linhagens, mas pelo facto de em África haver pouca subestruturação quanto a STRs do Y, compreende-se que Forros e Tongas não manifestem sinais de heterogeneidade, nem entre si, nem relativamente a outras populações nomeadamente de África sub-equatorial como Angola ou Moçambique. Em suma, a hierarquização social que persiste em São Tomé e Príncipe quanto a Forros e Tongas, não têm nenhum paralelo genético ao nível do pool de linhagens masculinas definidas por STRs, relativamente ao qual os dois grupos compartilham essencialmente o mesmo perfil.

82 III-Resultados e Discussão

Pelo contrário, quando se avaliam as afinidades populacionais com a mesma bateria de marcadores, os Angolares manifestam traços de alguma microdiferenciação relativamente não só aos dois outros grupos sãotomenses mas também a qualquer das restantes populações africanas comparadas. A diferenciação decorre essencialmente de uma redução de diversidade que se observa no grupo. Foi nos Angolares que se registaram os níveis mais baixos de variabilidade em STRs do Y quanto a diversos parâmetros, como diversidade genética, diversidade haplotípica ou número médio de diferenças entre pares de haplótipos. Esta redução de diversidade, pode ser imputada a efeitos de deriva génica induzidos pelo pequeno tamanho do efectivo populacional angolar, endogamia, efeito de fundador, ou uma combinação de todos os factores. No fundo, são os sinais esperados para qualquer grupo populacional pequeno e fechado, que manteve algum isolamento e escassos contactos com grupos populacionais circunvizinhos. O padrão de diversidade registado entre os Angolares é consistente com os dados etnohistóricos sobre este grupo populacional. Como se referiu na Introdução, a origem dos Angolares é uma questão que ainda permanece em aberto e sobre a qual recapitularemos as duas hipóteses que têm merecido mais atenção. Uma delas poderá representar o registo de uma lenda antiga que efabula os Angolares como os descendentes de escravos sobreviventes de um naufrágio que terá ocorrido ainda durante o Século XVI. Os náufragos ter-se-iam escondido na região mais inacessível da ilha de São Tomé, onde fundaram um núcleo populacional que conseguiu escapar ao controlo colonial. A credibilidade desta versão está fortemente comprometida pela ausência, quer nos arquivos documentais da época quer nos posteriores, de qualquer referência oficial ao suposto naufrágio. Pelo contrário, desde muito cedo que há relatos de fugas de escravos dos engenhos de açúcar que se refugiavam nas zonas mais recônditas do sudeste da ilha de São Tomé. É muito provável que seja nestes foragidos, cujo número ia progressivamente aumentando, que esteja a origem duma comunidade a que mais tarde se passou a designar de Angolares. Quando atingiram um nível de organização mínimo, desencadeavam ataques ás plantações, instigando rebeliões e contribuindo para criar um clima de instabilidade que as autoridades da ilha não conseguiram dominar. A insubordinação e resistência dos Angolares tornaram-se temidas e, face à incapacidade do regime colonial para os desintegrar, a comunidade

83 III-Resultados e Discussão foi-se consolidando mantendo-se relativamente isolada dos outros habitantes de São Tomé. Foi esse isolamento que permitiu que entre os Angolares se estabelecesse uma identidade de grupo que, ainda hoje, apesar de viverem dispersos por comunidades radicadas no litoral de São Tomé e do Príncipe de estarem razoavelmente integrados no tecido social e económico da ilha, ainda está patente nas tradições culturais, nas actividades a que preferencialmente se dedicam, e até na própria língua. Terá sido certamente a história marcada por algum isolamento de outros sãotomenses, que resultou na redução de diversidade no gene pool definido por STRs dos Y dos Angolares, e que de algum modo os diferencia geneticamente de Forros e Tongas.

3.2 - MARCADORES BIALÉLICOS

3.2.1 - Perfil de haplogrupos e comparação com outras populações

Com os 14 marcadores de tipo bialélico examinados, nomeadamente YAP, SRY8299, 92R7, SRY1532, SRY2627, Tat, sY81, M9, LLy22g, 12f2, M109, M112, M150 e M168 seria possível identificar, em princípio, 16 haplogrupos distintos. Destes, encontraram-se 7 em São Tomé e Príncipe, conforme está apresentado na Figura 3.4 onde também consta a distribuição de frequências em Angolares, Forros, Tongas e na amostra global do arquipélago. Quatro dos sete haplótipos detectados, E3a, B2a1, B2b e B*(xB2a,b), são considerados altamente específicos de África subsariana e no conjunto representam a fracção maioritária das linhagens presentes em Angolares, Forros, Tongas e, consequentemente, na amostra total analisada. Neste conjunto, sobressai o haplogrupo E3a. Representa 69.1% dos cromossomas Y sãotomenses e, discriminando por grupo populacional, atinge o valor mais elevado entre os Angolares, onde se encontra em 78.6% dos indivíduos, e o mais baixo entre os Tongas onde ocorre com frequência de 59.1%. E3a, é definido pelo alelo derivado em sY81, num fundo genético que inclui as mutações derivadas em SRY-1532, M168, YAP e SRY-8299. O haplogrupo apresenta uma localização geográfica muito restrita pois está praticamente confinado a África,

84 III-Resultados e Discussão sendo especialmente frequente em populações subsarianas, sobretudo da região ocidental, onde é de longe o haplogrupo mais comum atingindo frequências superiores a 65% (Cruciani et al., 2002; Scozzari et al., 1999, Gonçalves et al., 2003).

Y*(xBR)

J

K*(xN,P) D

R1b3f R1a N3 N*(xN3) B2a*(xB2a1) B2b E3a E*(xE3a) CR*(xDE,J,K) B2a1 P*(xR1a,R1b3f) N B*(xB2a,b)

Angolares 56 5 44 2 2 3 Forros 39 7 26 4 2 Tongas 44 4 26 4 4 4 1 1 São Tomé 139 16 96 10 8 4 1 4

Figura 3.4 - Distribuições de frequências de haplogrupos definidos pelos marcadores biallicos do Y observadas em Angolares, Forros, Tongas e na amostra total de São Tomé e Príncipe.

Em populações do Burkina Faso ou do Sul dos Camarões, E3a chega mesmo aos 90% (Cruciani et al., 2002). O padrão actual de distribuição geográfica de E3a, sugere ter resultado de uma expansão populacional relativamente recente, e tem-se associado a dispersão do haplogrupo à difusão da agricultura por povos de língua Bantu (Underhill et al., 2001), num movimento com foco na região Centro-Ocidental e direccionado para o Sul do continente africano via dois corredores, um pela faixa ocidental e outro pela oriental. Por conseguinte, os valores de E3a agora detectados em São Tomé e Príncipe são os comuns em populações da região geográfica, em que o arquipélago se localiza. Os três outros haplogrupos tipicamente subsarianos detectados no arquipélago, B2a1, B2b e B*(xB2a,b), pertencem a um dos grupos - B - mais divergentes, e portanto mais

85 III-Resultados e Discussão antigos, na árvore filogenética de marcadores bialélicos do cromossoma Y. Em conjunto representam 6.5% dos cromossomas Y sãotomenses, estando ausentes nos Forros, presentes em 5.4% dos Angolares e chegando aos 13.7% nos Tongas. A distribuição de haplogrupos B em África, permanece ainda num estado bastante incipiente de caracterização, mas parece não obedecer a um padrão de contornos muito claros. B*(xB2a,b), é um haplogrupo muito raro e até agora apenas foi encontrado em poucas populações subsarianas, nomeadamente entre os Bamileke, do Sul dos Camarões, os Mossi, de Burkina Faso (Cruciani et al., 2002) e num indivíduo de uma amostra de 303 moçambicanos (Sánchez-Diz, 2003). Comparativamente, os subgrupos B2a ou B2b são bastante mais comuns e disseminados em África, e existem, quanto aos dois, diferenças marcadas de frequência entre, por um lado, os Khoisan (Khwe e San) e povos das florestas da África Central (i.e., Biaka, Mbuti e Lisongo), e por outro, as restantes populações africanas onde foram detectados. Entre os primeiros (Khoisan e povos das florestas) são predominantes haplogrupos que compartilham o alelo derivado em M112 e que define o subgrupo B2b (Cruciani et al., 2002). A frequência de B2b na maioria destes grupos populacionais ronda os 20 - 30% e o valor mais elevado até hoje encontrado foi entre os Hadzabe, um grupo de caçadores-recolectores do Norte-Centro da Tanzânia (Knight et al., 2003). Em oposição, nas outras populações africanas estudadas, B2b está ausente e os cromossomas do grupo B apresentam maioritariamente a mutação M150, que define o subgrupo B2a e que ocorre, em geral, com frequências muito mais moderadas que B2b. Dentro do subgrupo B2a, a presença do alelo derivado em M109 discrimina o haplogrupo B2a1 que constitui, dentro do subgrupo, o haplogrupo mais comum tendo sido encontrado em diversos grupos populacionais dos Camarões (Cruciani et al., 2002), do leste africano e em populações Bantu do Sul do continente (Underhill et al., 2000). Em populações do Senegal, da Guiné-Bissau e de Cabo Verde, não foram encontrados quaisquer cromossomas do grupo B (Semino et al., 2002; Gonçalves et al., 2003). É interessante constatar que entre os Angolares, 5.4% dos cromossomas sejam de tipo B*(xB2a,b). Constitui a frequência mais elevada até agora registada para este haplogrupo, o que pode ser consequência de efeitos de deriva no seio deste grupo populacional, representando assim mais uma marca genética de um certo isolamento

86 III-Resultados e Discussão que caracterizou a história dos Angolares. Entre os Bamileke, do Sul dos Camarões, o haplogrupo ocorre com frequência de 4%, e mais para Sul, numa amostra da população de Cabinda, não foi detectada a sua ocorrência (Leonor Gusmão/Sandra Beleza, comunicação pessoal). Assim este resultado, pode indicar que as regiões que correspondem actualmente aos Camarões e sua vizinhança, podem ter constituído locais importantes de recrutamento de escravos que participaram no povoamento de São Tomé e Príncipe. É ainda de sublinhar a elevada frequência (13.7%) com que haplogrupos de tipo B aparecem entre os Tongas. Como já se referiu, são considerados Tongas os descendentes dos serviçais que a partir do século XIX foram contratados para trabalhar nas roças do cacau e do café. Angola, Moçambique e Cabo Verde, foram os grandes fornecedores destes imigrantes forçados. Dado que em Cabo Verde não há cromossomas do grupo B (Gonçalves et al., 2003), a sua presença actual em São Tomé e Príncipe só pode ter sido mediada por Angolanos ou Moçambicanos. Em Moçambique, a frequência de B*(xB2a,b) e B2a* estimou-se em 0.33% para cada, de B2a1 em 9.24% e de B2b em 4.62% (Sánchez-Diz, 2003), o que totaliza 14.52% de haplogrupos tipo B. Embora não haja, de momento, dados sobre a distribuição do grupo B em Angola, é de admitir que também possa estar aí relativamente bem representado. Para além de haplogrupos de tipo B, que se consideram altamente específicos de regiões subsarianas, foram ainda detectados em São Tomé e Príncipe representantes dos grupos P*(xR1a,R1b3f), CR*(xDE,J,K) e E*(xE3a). O primeiro, P*(xR1a,R1b3f), que na amostra global de São Tomé se encontrou em 11.5% dos indivíduos, é um haplogrupo muito vulgar na Europa. As frequências mais elevadas registam-se na Europa Ocidental (na Irlanda atinge mesmo os 98.5%) e observa-se um gradiente decrescente de frequência em direcção ao Oriente, havendo fortes indicações de que o haplogrupo possa ser representativo do gene pool europeu pré-Neolítico (Semino et al., 1996; Rosser et al., 2000). O segundo, CR*(xDE,J,K), é um grupo heterogéneo que contém alguns haplogrupos (C, F*, G, H e I) com relações filogenéticas pouco estreitas mas que se caracterizam por, em geral, estarem ausentes do continente africano. Inclui tipos de haplogrupos que estão praticamente confinados à Europa (F*, G, I), a par de outros, como os do grupo C, muito comuns e disseminados na Ásia mas virtualmente ausentes da Europa Ocidental. Assim, o padrão de distribuição geográfica de CR*(xDE,J,K) não

87 III-Resultados e Discussão passa de uma amálgama dos individualmente apresentados pelos seus constituintes e que, em conjunto, fazem com que CR*(xDE,J,K) seja especialmente frequente e disperso na Ásia, e na Europa se encontre apenas com frequências moderadas ou baixas, sendo o último o caso da Península Ibérica. Atendendo à filogeografia de P*(xR1a,R1b3f) e CR*(xDE,J,K), a sua presença na população actual de São Tomé e Príncipe só pode ter sido introduzida por indivíduos masculinos de origem europeia, o que nos permite estimar o valor mínimo do componente genético europeu em São Tomé e Príncipe em 17.3%, que representa a soma da frequência com que ocorrem P*(xR1a,R1b3f) e CR*(xDE,J,K). Heterogéneo, incluindo no padrão de distribuição geográfica, é também o último grupo de haplogrupos detectado em São Tomé - E*(xE3a). Em termos globais, encontra-se espalhado por toda a África, apresentando frequências muito elevadas em populações do Norte do continente (superior a 65% nos Berberes), Bosch et al., 2001. Também aparece no Médio Oriente e Europa onde as frequências tendem a diminuir no sentido Sul-Norte (Rosser et al., 2000). Na faixa ocidental da Península Ibérica detecta- se um claro gradiente decrescente desde o Sul de Portugal (24.5%) até ao Norte na Galiza (9.6%), Pereira et al., 2000c. Contudo, o grupo contém tipos de sequências com padrões de distribuição geográfica muito distintos, nomeadamente E1, E2 e E3b. Os dois primeiros, aparecem essencialmente em África subsariana mas com representatividade muito diferente de população para população (Cruciani et al., 2002). E3b2(xE3b2a,b) é o grupo característico do Norte de África. Outros haplogrupos de tipo E3b observam-se no leste africano e alguns estão até bem representados entre os Khoisan (Semino et al., 2002, Cruciani et al., 2002). Face a esta diversidade, é difícil inferir a origem geográfica dos cromossomas E*(xE3a) de São Tomé e Príncipe sem recorrer a uma caracterização molecular mais fina destes haplogrupos e sem dispor de dados equivalentes relativos a populações africanas que pudessem ter contribuído para o povoamento do arquipélago. Porém, é de admitir que os portugueses tenham sido um dos veículos de introdução, já que em Portugal E*(xE3a) ocorre com uma frequência relativamente elevada. No sentido de obter uma aproximação grosseira à proporção de cromossomas E*(xE3a) sãotomenses de origem europeia, recorremos à extrapolação apresentada em Pereira et al., 2002: se 17.3% de cromossomas P*(xR1a, R1b3f) + CR*(xDE,J,K) correspondem a 22.76% de componente português, já que em Portugal os dois grupos

88 III-Resultados e Discussão totalizam 76% (0.173/0.760=0.2276), é provável que tivesse entrado no arquipélago proporção equivalente de linhagens E*(xE3a); dado que ocorrem com frequência de 0.135 em Portugal (Pereira et al., 2002) espera-se que tenha entrado no arquipélago cerca de 3.1% deste tipo de sequências. Adicionando este valor à frequência dos dois haplogrupos europeus, chega-se ao valor de 20.7%, que representa a estimativa da fracção de linhagens masculinas de origem europeia actualmente existentes em São Tomé e Príncipe. A soma da frequência de cromossomas E3a e do grupo B é de 77.5%, que corresponderá à proporção de equivalentes de origem subsariana. Assim, restam 1 - (0.207+0.775) = 0.018, ou seja 1.8% de sequências que não foram alocadas no componente europeu ou subsariano. Iterou-se a extrapolação para Angolares, Forros e Tongas e os resultados das estimativas obtidas da proporção de mistura entre europeus e africanos em cada grupo bem como na amostra total de São Tomé apresentam-se na Figura 3.5.

Angolares Forros Tongas 14.7% 27.2% 21.4%

83.9% 66.7% 72.7%

São Tomé e Príncipe

20.4% P*(xR1a,R1b3f) CR*(xDE,J,K) E*(xE3a) E3a B2a1 B2b B*(xB2a,b) 75.5%

Figura 3.5 - Perfil de haplogrupos em Angolares, Tongas, Forros e na amostra total de São Tomé e Príncipe e estimativas de componentes europeu (direita superior dos círculos) e subsariano (esquerda inferior dos círculos) nas quatro amostras populacionais. O complementar à soma dos valores apresentados, corresponde à frequência de sequências que não se alocaram nos componentes europeu ou subsariano.

89 III-Resultados e Discussão

Os Angolares são os que apresentam menor proporção - 14.7% - de mistura com europeus, distinguindo-se também quanto a este aspecto dos Tongas e Forros. Mais um sinal do isolamento relativo que caracterizou a história inicial deste grupo e que terá proporcionado menos contactos com europeus. No entanto, o valor obtido é por si suficientemente elevado, e mesmo admitindo que os cromossomas europeus entre os Angolares resultem essencialmente de ligações com outros sãotomenses já miscigenados, o resultado é indiciador das fortes interacções dos Angolares com outros habitantes do arquipélago, ainda que estabelecidas numa fase posterior àquela do isolamento mais cerrado durante a qual se gerou a identidade de grupo. Nos Forros, o componente europeu é quase o dobro - 27.2% -, e nos Tongas apenas um pouco mais baixo - 21.4%. Cremos que o valor detectado nos Forros é a melhor aproximação ao grau de miscigenação que ocorreu no arquipélago. São considerados Forros todos os naturais do arquipélago (exceptuando os Angolares) que não sejam descendentes das vagas mais recentes de imigrantes que entraram em São Tomé e Príncipe oriundos de Cabo Verde, Angola e Moçambique. Por conseguinte, reflectirão melhor a história da mistura populacional entre europeus e africanos que São Tomé e Príncipe registou. Até porque miscigenação recente entre Tongas e Portugueses deve ter sido insignificante já que os serviçais que entraram em São Tomé como contratados para os trabalhos nas roças eram essencialmente do sexo masculino (Nascimento, 2002). De facto, a quota de mulheres moçambicanas e angolanas que entrou nessa vaga rondaria os 7 - 10% e 4 - 6%, respectivamente, e embora o ratio de sexos para os caboverdianos se aproximasse mais dos 50%, no global o número de mulheres nas plantações era francamente minoritário comparativamente ao de homens (Carreira, 1982). Ora o processo de miscigenação caracterizou-se sempre por um enorme enviezamento no padrão de sexos, sendo muito vulgar o cruzamento entre homens europeus e mulheres africanas e apenas esporádico o recíproco. O número de mulheres que chegou a São Tomé na vaga de serviçais foi muito reduzido, sendo pois pouco provável que a miscigenação ocorrida nesta fase tivesse tido impacto relevante no gene pool dos Tongas. O componente europeu que se detecta neste grupo, foi essencialmente o mediado pelos trabalhadores contratados de origem cabo-verdiana, dado que em Cabo Verde a miscigenação foi muito intensa como atesta a presença de 53.5% de linhagens

90 III-Resultados e Discussão masculinas de origem não-subsariana no arquipélago (Gonçalves et al., 2003). A par de caboverdianos, também entraram massivamente em São Tomé e Príncipe angolanos e moçambicanos, mas com eles a entrada de cromossomas europeus deve ter sido reduzida, já que em Moçambique a sua frequência é muito baixa (∼7%, segundo Pereira et al., 2002, com base numa amostra de 103 moçambicanos, ou 1.65%, segundo Sánchez-Diz, 2003, num estudo que incluiu 303 indivíduos), e em Angola é de prever um cenário semelhante. No sentido de enquadrar o padrão de haplogrupos observado em São Tomé e Príncipe num contexto de diversidade geograficamente mais amplo, efectuou-se uma análise de componentes principais com base nas frequências agora registadas e as reportadas para outros grupos populacionais. Os dados utilizados apresentam-se no Apêndice 1. A projecção dos dois componentes principais, que condensam 66.7% da variação total, está ilustrada na Figura 3.6. Como se pode observar, definem-se nitidamente quatro grupos de populações: as do Norte de África, as duas europeias, as dos Khoisan e um grupo mais heterogéneo que inclui as restantes populações consideradas com excepção da de Cabo Verde. O grupo de linhagens com mais influência na posição das amostras de Khoisan (Ju|´hoansi e Khwe), é o de tipo A, o grupo mais antigo na árvore filogenética de haplogrupos do Y. Apenas se encontrou com frequências relativamente elevadas em grupos isolados de caçadores-recolectores, como é caso dos Ju|´hoansi e Khwe, e alguns grupos populacionais da Etiópia e do Sudão, distribuição que indica tratarem-se de linhagens muito antigas que sobreviveram a acontecimentos populacionais mais recentes (Underhill et al., 2001; Semino et al., 2002). Para a posição das populações norte-africanas, o mais determinante é a elevada frequência de sequências E*(xE3a), enquanto que o grupo P é o que mais pesa no posicionamento de Portugal e Galiza. As populações que compartilham elevada frequência de E3a agrupam-se na parte centro/esquerda do diagrama, sobressaindo neste conjunto Angolares, Forros e Tongas que, pela comparativamente elevada frequência de CR*(xDE,J,K) e P, são arrastados para uma posição mais inferior. Neste conjunto, incluem-se populações muito diversas, Biaka, Moçambique ou populações insulares ou continentais da faixa ocidental de África. A incapacidade de resolver com mais precisão as afinidades genéticas entre estas populações, poderá resultar de para esta análise, pela ausência de dados disponíveis para todas as amostras, não ter sido possível lidar com

91 III-Resultados e Discussão informação molecular mais pormenorizada sobre alguns haplogrupos, nomeadamente os contidos na classe E3a ou E*(xE3a).

Be 0.3 Ar Ju 0.2 Kh Ma

0.1 Gui

Bia Se -0.3 -0.2 -0.1 0.1 0.2 0.3 Mo CV -0.1 To An Fo -0.2

Ga -0.3 Po

Figura 3.6 - Projecção dos dois componentes principais obtidos com frequência de haplogrupos definidos por marcadores bialélicos do Y. Abreviaturas e fontes dos dados: An: Angolares (este trabalho); Fo: Forros (este trabalho); To: Tongas (este trabalho); Ar: Árabes, Marrocos (Scozzari et al., 2001); Be: Berberes, Marrocos (Scozzari et al., 2001); Bi: Biaka, Pigmeus (Underhill et al., 2000); CV: Cabo Verde (Gonçalves et al., 2003); Ga: Galiza (Brion et al., 2003); Gui: Guiné-Bissau (Gonçalves et al., 2003); Ju: Ju|´hoansi/Sekele/!Kung (Underhill et al., 2000); Kh: Khwe (Cruciani et al., 2002); Ma: Maghrebis, Marrocos (Brion et al., 2003); Mo: Moçambique (Sánchez-Diz, 2003); Po: Portugal (Sandra Beleza, comunicação pessoal); Se: Senegal (Semino et al., 2002).

Finalmente é de referir a posição destacada de Cabo Verde que fica projectada numa posição isolada e exterior a qualquer dos 4 conjuntos populacionais mencionados, o que denuncia a intensa mistura populacional que ocorreu neste arquipélago.

3.2.2 - Padrão de diversidade e comparação entre Angolares, Tongas e Forros

Na Tabela 3.8 apresentam-se vários parâmetros de diversidade inferidos com base nos perfis de haplogrupos do Y detectados em Angolares, Forros, Tongas e na amostra global de São Tomé e Príncipe.

92 III-Resultados e Discussão

Tabela 3.8 - Parâmetros de diversidade em Angolares, Forros, Tongas e na amostra global de São Tomé e Príncipe.

Número de Diversidade Número médio de Diversidade N haplogrupos de pares de diferenças génica diferentes (%) haplogrupos entre haplogrupos Angolares 56 5 (8.93) 0.376±0.080 0.098±0.068 1.375±0.860 Forros 39 4 (10.26) 0.524±0.082 0.128±0.084 1.789±1.057 Tongas 44 7 (15.91) 0.631±0.076 0.159±0.099 2.222±1.250 São Tomé e Príncipe 139 7 (5.04) 0.503±0.048 0.127±0.082 1.777±1.035

Quanto aos níveis de diversidade registados no seio de cada grupo populacional, mais uma vez os Angolares se distinguem dos Forros ou Tongas. Os primeiros apresentam uma nítida redução de diversidade, quer no que respeita à proporção de haplogrupos diferentes quer nos níveis de diversidade de haplogrupos ou génica. Estes valores, comparativamente baixos de diversidade, reflectem o facto de o perfil de haplogrupos nos Angolares ser claramente dominado por linhagens de tipo E3a, que representam 78.6% dos cromossomas Angolares. Reforçam-se assim os indícios de que nos Angolares existem marcas que caracterizam grupos populacionais que são, ou foram - como melhor se aplicará ao grupo em causa, relativamente fechados e com escassos contactos com populações vizinhas. Em oposição, os níveis de diversidade mais elevados encontram-se entre os Tongas. Os sete haplogrupos distintos detectados neste estudo estão presentes no grupo, com jogos de frequências que resultam nos valores mais elevados de diversidade de haplogrupos ou génica. É provável que este resultado se explique pela grande dispersão geográfica de onde foram originários os ancestrais dos Tongas. Como já se referiu, Angola, Cabo Verde e Moçambique foram as grandes fontes de origem dos serviçais. Assim, e de certa forma, os Tongas representam uma sub-amostragem da região subsariana de África geograficamente bastante mais abrangente que a representada pelos Forros, cujo recrutamento se restringiu essencialmente à faixa continental atlântica entre os actuais Benin e Angola, compreendendo-se assim algum excesso de diversidade dos Tongas relativamente aos Forros. Em conformidade, é entre os Tongas que em média os haplogrupos diferem mais entre si (número médio de diferenças entre haplótipos = 2.222±1.250) e, pelo contrário,

93 III-Resultados e Discussão entre os Angolares os haplogrupos são os que divergem menos uns dos outros (1.375±0.860). Na Figura 3.7, estão representadas as distribuições de diferenças entre pares de linhagens registadas nas amostras investigadas.

Angolares Forros

0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 0123456 0123456

Mpd=1.375±0.860 Mpd=1789±1.057

Tongas São T o m é

0,4 0,6 0,4 0,2 0,2 0 0 01234567 01234567

Mpd=2.222±1.250 Mpd=1.777±1.035

Figura 3.7 - Distribuição de pares de diferenças e média das diferenças entre pares de haplogrupos (Mpd). Eixo dos X: número de diferenças entre haplogrupos. Eixo dos Y: frequências.

Em consonância com o seu perfil de haplogrupos, os Angolares registam a percentagem mais elevada de haplogrupos idênticos entre si (número de diferenças = 0). A respectiva curva de distribuição de pares de diferenças é bimodal, com picos de frequência em 0 e 5 diferenças, distinguindo-se do que se observa nos Forros, Tongas ou na amostra global de São Tomé e Príncipe, cujas curvas de distribuição apresentam semelhanças manifestas pela trimodalidade com picos de frequência em 0, 3 e 5 diferenças. Nestas três amostras, o acentuado pico de frequência no último valor, resulta de compartilharem uma razão entre sequências europeias e subsarianas muito mais elevada do que a que se observa entre os Angolares.

94 III-Resultados e Discussão

3.2.3 - Avaliação da diferenciação genética entre Angolares, Tongas e Forros

No sentido de avaliar o grau de diferenciação genética entre os três grupos populacionais de São Tomé e Príncipe quanto aos haplogrupos detectados com marcadores bialélicos do Y, calcularam-se valores de FST entre pares de populações mas não se encontraram distâncias genéticas estatisticamente significativas. O valor de FST entre Forros e Tongas foi de 0.008 (P=0.27), entre Forros e Angolares de 0.003 (P=0.26) e entre Tongas e Angolares de 0.032 (P=0.09). Apesar da ausência de heterogeneidades genéticas significativas, efectuou-se a análise de subestruturação populacional aplicando AMOVA hierarquicamente segundo o procedimento descrito e efectuado para os STRs. Os resultados obtidos estão sumariados na Tabela 3.9.

Tabela 3.9 - Percentagem de variação em diferentes níveis hierárquicos de agrupamentos populacionais produzido por AMOVA.

Variação (%) Comparação To vr An+Fo Fo vr An+To An vr To+Fo An+To+Fo

Dentro das populações 97.62 99.43 98.29 98.41

Entre as populações 0.03 3.25 1.23 1.59

Entre os grupos 2.35 -2.68 0.48 -

An: Angolares; Fo: Forros; To: Tongas. Nível de significância: 5%.

Nenhum dos valores de partição de diversidade obtidos por AMOVA era estatisticamente significativo. No entanto, os resultados produzidos com os marcadores bialélicos podem sugerir uma certa contradição com os obtidos na análise equivalente com STRs. De facto, o valor mais elevado de percentagem de variação entre grupos

(FCT) foi agora registado quando se considerou os Tongas separadamente dos Angolares+Forros, enquanto que com STRs o valor mais elevado (e até estatisticamente significativo) se detectou quando os Angolares eram separados de Forros+Tongas. Os resultados de AMOVA obtidos com os marcadores bialélicos indicam que, a maior diferenciação se observa quando os Tongas são confrontados com Angolares+Forros, o que naturalmente traduz o facto da maior distância genética se ter

95 III-Resultados e Discussão encontrado entre Tongas e Angolares e a menor entre Forros e Angolares. No fundo, o que parece estar a pesar mais neste conjunto de resultados, é a presença nos Tongas de um leque de haplogrupos mais alargado e com maior variabilidade do que os que se observam nos Angolares ou Forros. Porém, o número de haplogrupos definidos por marcadores bialélicos é muitíssimo mais restrito do que o que é possível obter com STRs (ou mtDNA, como se apresentará no ponto 3.3) e, por isso, os primeiros são potencialmente bastante menos informativos para detectar diferenças entre populações que compartilham fortes laços de ancestralidade, como de resto parece evidenciar o facto de não se detectarem quaisquer valores significativos com marcadores bialélicos, ao contrário do que se registou com STRs.

3.2.4 - Análise conjunta de SNPs e STRs

Relativamente a uma sub-amostra dos indivíduos tipados para os marcadores bialélicos, foi possível conjugar a informação relativa aos haplótipos definidos por STRs. Os haplótipos (definidos pelos STRs) encontrados em diferentes haplogrupos (definidos pelos marcadores bialélicos) encontram-se discriminados no Apêndice 2. Efectuámos então uma análise filogenética dos haplótipos de STRs, utilizando o algorítmo Median Joining, com ε=0 e peso=0 em DYS389I e II. Num primeiro ensaio, utilizaram-se todos os haplótipos detectados num total de 88 indivíduos, mas não se considerou o grupo populacional onde se encontraram. Num segundo, restringimos a análise a haplótipos dentro do haplogrupo E3a, o único com representatividade numérica suficiente para permitir a individualização, e incluímos a informação do grupo populacional em que se observaram. Os resultados apresentam-se na Figura 3.8. Na network representada na Figura 3.8A, distinguem-se perfeitamente os haplótipos pertencentes ao haplogrupo E3a dos que se incluem no haplogrupo P*(xR1a,R1b3f). Assim, independentemente do background definido pelos marcadores bialélicos, os STRs permitem delimitar estes dois grupos, contendo sequências, de uma forma geral, filogeneticamente bastante relacionadas no interior de cada um, mas muito afastadas entre os dois grupos. Esta observação traduz, no fundo, o facto de tanto o haplogrupo E3a como o P*(xR1a, R1b3f) se caracterizarem por elevado nível de subestruturação geográfica, com o

96 III-Resultados e Discussão primeiro estando virtualmente confinado a África subsariana, onde surgiu e diversificou o espectro de haplótipos de STRs, enquanto que o cenário evolutivo de P*(xR1a, R1b3f) se desenrolou na Eurásia.

Figura 3.8 - Median-joining networks de haplótipos definidos por STRs. A - haplótipos de 88 sãotomenses. B - haplótipos dentro do haplogrupo E3a de 15 Angolares, 23 Forros e 24 Tongas. O comprimento dos ramos é proporcional ao número de mutações e a área dos círculos proporcional ao número de indivíduos. Círculos assinalados com *, apresentam a combinação de STRs associada ao haplótipo Bantu

Quanto às 5 linhagens de tipo B incluídas nesta análise, com representantes B*(xB2a,b), B2a1 e B2b, caracterizam-se por haplótipos de STRs molecularmente muito heterogéneos e apesar de, tal como as E3a, serem também tipicamente

97 III-Resultados e Discussão subsarianas, não compartilham afinidades marcadas com este grupo de cromossomas. Tal compreende-se pelo facto de o grupo B representar um conjunto de linhagens africanas muito antigas, que foi em grande extensão substituído pelo das linhagens que estiveram associadas à expansão Bantu. A maioria dos haplótipos de STRs dos 8 cromossomas E*(xE3a) considerados, tende a agrupar-se filogeneticamente, mas há também haplótipos molecularmente muito afastados, o que constitui o reflexo de em E*(xE3a) estarem, como já se referiu, incluídos diversos subgrupos que manifestam considerável descontinuidade geográfica, mas que não foi possível discriminar com a resolução molecular utilizada neste trabalho. Finalmente no que se refere aos 5 haplótipos de tipo CR*(xDE,J,K), destaca-se a grande dispersão quanto à localização na network, apesar de dois apresentarem o mesmo fundo de STRs. Dos restantes 3, um compartilha o mesmo haplótipo com um cromossoma P*(xR1a, R1b3f), outro com um cromossoma E3a e o terceiro é bastante divergente no conjunto dos outros haplótipos. Esta heterogeneidade molecular é consistente com a observação de Brion et al., 2003, que detectam para este grupo o nível mais elevado de diversidade haplotípica comparativamente a outros haplogrupos presentes em populações ibéricas e magrebinas, o que se explica por CR*(xDE,J,K) conter subgrupos muito antigos (Bosch et al., 1999, Brion et al., 2003), pelo que, consequentemente, puderam acumular muita divergência molecular quanto ao painel de STRs. Na Figura 3.8B, apresenta-se uma network obtida apenas com haplótipos de cromossomas E3a encontrados em Angolares, Tongas e Forros, que se construiu com o objectivo de avaliar se havia alguma especificidade na distribuição dos haplótipos por grupo populacional sãotomense. Como a figura ilustra, o haplótipo mais comum é um derivado por um passo mutacional do haplótipo Bantu, este é o segundo mais comum e o terceiro é um outro seu derivado também por uma única mutação. Os três são compartilhados por Angolares, Forros e Tongas. Outros haplótipos são aleatoriamente compartilhados apenas por dois dos três grupos populacionais (sobretudo por Forros e Tongas, o que decorrerá de estarem numericamente mais bem representados), e ainda outros aparecem isoladamente ou em Angolares ou Forros ou Tongas. O haplótipo mais divergente de tipo E3a foi encontrado num Angolar.

98 III-Resultados e Discussão

Numa visão global, não se vislumbra, pois, qualquer conjunto particular de haplótipos que prevaleça nalgum dos três grupos populacionais de São Tomé e Príncipe, observação que vai ao encontro do resultado apresentado no ponto 3.1, que indica que, no arquipélago, a variação ao nível dos STRs do Y se caracteriza apenas por um moderado grau de estruturação entre Angolares, por um lado e, por outro, Forros e Tongas.

3.2.5 - Considerações globais sobre o estudo de marcadores bialélicos do Y em São Tomé e Príncipe

Neste ponto, iremos fazer um breve balanço dos resultados obtidos com os marcadores bialélicos do Y, confrontá-lo com o equivalente apresentado no capítulo anterior relativo a STRs do mesmo cromossoma e, assim, apresentar a imagem global que captámos sobre o panorama de diversidade das linhagens masculinas em São Tomé e Príncipe. O facto de os marcadores bialélicos, evoluírem a uma taxa bastante mais lenta que a dos STRs, permite que as sequências definidas pelos primeiros, preservem melhor os acontecimentos mutacionais do seu percurso evolutivo, proporcionando obter uma robusta aproximação à filogenia de haplogrupos do Y. É também por isso que a diversidade ao nível de marcadores bialélicos se caracteriza por um nível de subestruturação geográfica bastante mais acentuado que a de marcadores de tipo STR, em particular quando se está a considerar uma esfera de observação macro-geográfica. Foi a marcada especificidade geográfica dos haplogrupos do Y, que permitiu obter agora uma quantificação, que requer ainda algum refinamento, da proporção de mistura entre componentes genéticos europeu e africano que se observa actualmente em São Tomé e Príncipe. O valor obtido, quando se considera a amostra total analisada, aponta para cerca de 75.5% de linhagens subsarianas e 20.4% de linhagens europeias. Entre os Forros, o segmento populacional maioritário no arquipélago e que se foi formando com o desenrolar da trajectória interna de povoamento, o componente europeu chega mesmo aos 27.2%. É um valor que consideramos surpreendentemente elevado e que leva a relativizar a noção generalizada de arquipélago “africanizado” que se tem sobre São Tomé e Príncipe (Henriques, 2000). Assim, a expressão numérica do

99 III-Resultados e Discussão grau de miscigenação que ocorreu em São Tomé e Príncipe permite precisar o que as fontes históricas referem sobre o assunto. Apesar de os europeus serem a classe socialmente dominante, o seu peso demográfico foi sempre muito reduzido e apenas terá tido algum relevo na fase inicial do povoamento, isto é, entre finais do século XV e inícios do XVI, altura em que se deu o maior afluxo de imigrantes europeus. Mesmo nesse período áureo, o seu número nunca se terá aproximado sequer do milhar, e a partir daí, a fama negativa de São Tomé e Príncipe gerada pela agressividade ambiental para os europeus, criou sérios obstáculos à renovação da população europeia, pelo que esta regrediria permanentemente, de tal modo que para meados do século XVIII, algumas estatísticas dão conta para São Tomé da presença de apenas cerca de 80 brancos numa população total que rondaria os 10 500 habitantes (Caldeira, 1999). A dificuldade em atrair povoadores europeus, cedo levaria à promoção da miscigenação como estratégia não só de expansão da população mas também de colonização já que se procurava valorizar socialmente o grupo de mulatos dela resultante. Sobre o número de mulatos, não obstante a ambiguidade da classificação, terá tido a máxima expressão na fase inicial do povoamento e rondaria as 3 centenas no começo do século XVII, mas depois também tende a descer à medida que os europeus abandonam o território (Caldeira, 1999). Por outro lado, no contexto social da altura, o cruzamento entre homens europeus e mulheres africanas era não só instigado como socialmente tolerado o que resultaria numa introdução expressiva de linhagens masculinas europeias. De tal modo, que a proporção desse tipo de linhagens actualmente presente em São Tomé e Príncipe, supera substancialmente o que está documentado sobre a fracção de europeus relativamente a africanos registada em diferentes períodos no arquipélago. Os europeus constituíram sempre uma fatia muito reduzida da população sãotomense. O considerável desfasamento entre a proporção de europeus e a proporção de linhagens que introduziram no arquipélago reflecte bem a grande variância no sucesso reprodutivo dos indivíduos que contribuíram para o povoamento de São Tomé e Príncipe. Comparando a magnitude do componente europeu nos três grupos populacionais sãotomenses, a proporção mais baixa foi encontrada entre os Angolares onde é apenas cerca de metade (14.7%) da registada nos Forros. É um resultado que denuncia contactos menos intensos com os habitantes europeus de São Tomé e que se explica pela história de isolamento em que o grupo se manteve durante muito tempo.

100 III-Resultados e Discussão

Apesar de relativamente às linhagens definidas por marcadores bialélicos do Y, os Angolares não diferirem significativamente de Forros ou Tongas, os primeiros são os que apresentam os níveis mais reduzidos de diversidade genética em todos os parâmetros avaliados. Reforçam-se assim os resultados obtidos com STRs e portanto, no global, quanto ao padrão de diversidade das linhagens masculinas, encontram-se nos Angolares traços que caracterizam grupos populacionais pequenos e relativamente fechados, embora no que respeita ao grupo sãotomense se tratem de sinais relativamente moderados, o que se entende dado que desde há algum tempo que os Angolares têm vindo a quebrar o isolamento em que outrora se mantiveram. Por fim, é de comentar a ausência na amostra sãotomense de cromossomas do grupo J, um haplogrupo particularmente frequente entre os Judeus. Diversas fontes referem que, sobretudo na fase inicial do povoamento, chegaram às ilhas muitos judeus expulsos de Portugal, havendo menção sistemática a uma importante leva única de cerca de 2000 crianças órfãs de pais judeus. Sabe-se que desta leva, alguns anos após a chegada, poucas terão sobrevivido, provavelmente em consequência de crises de malária, que aliás era responsável por uma grande mortalidade entre os portugueses que iam para São Tomé. Não temos conhecimento sequer do número grosseiro dos judeus que terá entrado em São Tomé, mas actualmente não encontramos quaisquer vestígios que possam atestar do seu impacto no desenvolvimento demográfico do arquipélago.

3.3 - DNA MITOCONDRIAL

As sequências de HVS-I e HVS-II de 103 sãotomenses e respectiva distribuição em Angolares, Forros e Tongas, encontram-se discriminadas no Apêndice 3.

3.3.1 - Pesquisa de mutações “fantasma”

No sentido de averiguar se artefactos ou erros sistemáticos, ainda que inadvertidos, eventualmente ocorridos no decorrer do processo de sequenciação poderiam comprometer a qualidade das sequências de mtDNA obtidas, aplicámos a estratégia de controlo sugerida por Bandelt et al. (2002). A estratégia visa a detecção de mutações

101 III-Resultados e Discussão

“fantasma”, designação atribuída a falsas mutações que constituam meros erros de leitura e que é de admitir poderem ser cometidos em consequência de falhas diversas inerentes ao procedimento técnico de obtenção de sequências de mtDNA. Parte-se do princípio que esse tipo de mutações gera um padrão diferente do associado a verdadeiras mutações. Sabe-se que a grande maioria das transições em HVS-I ocorre num pequeno número de posições (Hasegawa et al., 1993), e os outros tipos de mutações (fora de locais poli-C) são sistematicamente pouco frequentes. Por outro lado, se uma mutação artificial for detectada numa posição mais que uma vez numa dada amostra, é de esperar incompatibilidades com as bases detectadas em diversas outras posições. A presença de mutações fantasma pode tornar-se aparente se se construírem median networks de sequências, filtrando as posições altamente variáveis (speedy transitions), isto é, excluindo-as da análise, e considerando apenas o restante tipo de mutações (weighty mutations). Desta forma, incompatibilidades mutacionais manifestar- se-ão pela presença nas networks de muitos quadrados ou cubos, ao contrário do padrão esperado na ausência de mutações fantasma em que é de prever reduzida homoplasia nas networks geradas com o mesmo tipo de filtragem (Bandelt et al., 2002). Apenas se aplicou esta estratégia para aferir a fiabilidade da variação observada em HVS-I, já que, na altura, só havia dados disponíveis para essa região sobre as posições que se deveriam considerar speedy transitions e quanto à diferenciação de peso a atribuir às weighty mutations (http://www.stats.gla.ac.uk/~vincent/fingerprint/index.html). Num primeiro ensaio, a network obtida para a variação em HVS-I apresentou alguma reticulação secundária que era, basicamente, devida à presença de transversões alternativas nos locais 114, 265 e 286. As duas transversões diferentes detectadas naqueles três locais, já tinham sido anteriormente descritas em populações africanas (Graven et al., 1995; Pereira et al., 2001; Salas et al., 2002) e, portanto, não são privativas da amostra que analisámos. Quando estas três posições de variação não binária foram tratadas como binárias, obteve-se a árvore que se apresenta na Figura 3.9, e em que se pôde constatar que após a filtragem das speedy transitions, o haplótipo mais frequente na amostra sãotomense correspondia à sequência de referência Cambridge. A network apresentava ainda um triângulo, indicando ambiguidade na alteração mutacional que envolve a posição 114, e um rectângulo envolvendo os locais 265/286. Mas globalmente, é uma árvore bastante harmoniosa e não evidencia sinais de variação

102 III-Resultados e Discussão artificial em alguma posição nucleotídica particular. Portanto, a avaliar pelo padrão de variação retido na network, não encontrámos indicações de que mutações fantasmas pudessem estar a afectar os resultados de sequenciação obtidos.

n = 103 h = 22

Figura 3.9 - Network representando a weighty variation de sequências de mtDNA, entre as posições 16051 a 16365, detectadas na amostra de São Tomé e Príncipe. Cada unidade de comprimento de ligação entre sequências corresponde a uma weighty transition excepto quando assinalada por “ - “ que indica transversão ou “ = “que indica delecção. A área dos nós é proporcional ao número de haplótipos. n = tamanho da amostra; h = número de haplótipos atendendo às weighty mutations.

3.3.2 - Níveis de diversidade em HVS-I e HVS-II em São Tomé e Príncipe

Na Tabela 3.10 apresentam-se diversos índices de diversidade que foram calculados para HVS-I e HVS-II nos três grupos populacionais de São Tomé e Príncipe e na amostra global analisada. De acordo com o que tem sido sistematicamente reportado, os valores de diversidade em HVS-I são, para a maioria dos índices, mais elevados que em HVS-II. Comparando os três grupos populacionais entre si, verifica-se que os Angolares se distinguem novamente de Forros ou Tongas, pelos reduzidos níveis de diversidade, particularmente no que se refere à heterozigotia média e à proporção de haplogrupos diferentes.

103 III-Resultados e Discussão

No entanto, nos Angolares, o número médio de diferenças entre sequências é ligeiramente mais elevado do que nos Forros ou Tongas, o que significa que a redução de diversidade no grupo não corresponde a um aumento médio da afinidade molecular entre as suas linhagens de mtDNA.

Tabela 3.10 - Índices de diversidade de sequências HVS-I e HVS-II em populações de São Tomé e Príncipe.

Locus População K(K/N) S(S/l) H(SE) M

Angolares 16 (53.3) 39 (11.4) 0.912±0.037 9.11 Forros 29 (82.9 46 (13.5) 0.988±0.010 8.25 HVS-I Tongas 28 (73.7) 56 (16.5) 0.984±0.009 9.14 São Tomé 62 (60.2 70 (20.6) 0.985±0.004 8.94

Angolares 17 (56.7) 22 (8.2) 0.913±0.038 7.70 Forros 27 (77.1) 29 (10.8) 0.985±0.010 5.99 HVS-II Tongas 22 (57.9) 24 (9.0) 0.967±0.012 6.27 São Tomé 52 (50.5) 32 (11.9) 0.979±0.005 6.75

Angolares 18 (60.0) 60 (9.9) 0.919±0.038 16.68 HVS-I Forros 30 (85.7) 75 (12.3) 0.992±0.008 14.23 + Tongas 29 (76.3) 80 (13.2) 0.986±0.009 15.41 HVS-II São Tomé 70 (68.0) 102 (16.7) 0.988±0.004 15.67 K = número de sequências diferentes e, entre parêntesis, percentagem relativa ao tamanho da amostra (N) S = número de locais polimórficos e, entre parêntesis, percentagem relativa ao tamanho da sequência (l) H = diversidade de sequências ± desvio padrão M = média do número de diferenças entre pares de sequências

Esta particularidade ficou bem evidenciada quando se compararam os padrões de mismatch distribution em Angolares, Forros e Tongas. Estão apresentados na Figura 3.10, e os perfis nela ilustrados referem-se à variação observada em HVS-I e HVS-I + HVS-II. Para além das distribuições individuais em cada grupo populacional, também se apresenta a da amostra total sãotomense. Observando a curva relativa a HVS-I, é entre os Angolares que se encontra, simultaneamente, o número mais elevado de sequências idênticas (nº de diferenças entre sequências=0), e uma outra moda ao nível do número mais elevado de diferenças entre sequências. O raggedness coefficient (RC) da distribuição em HVS-I nos Angolares é elevado, 0.085, e difere estatisticamente do valor esperado assumindo um modelo de expansão populacional (P< 0.001). Embora seja questionável se este modelo permite formular uma hipótese nula apropriada face à história complexa de povoamento de São

104 III-Resultados e Discussão

Tomé e Príncipe, é de alguma forma sugestivo que à luz do mesmo modelo, as distribuições equivalentes em Forros, Tongas ou na amostra global de São Tomé não apresentem, relativamente aos valores esperados, diferenças estatisticamente significativas. As distribuições em Forros ou Tongas, são bastante mais regulares (RC: 0.007 e 0.011, respectivamente), e o padrão registado na amostra global sãotomense é bell shaped (RC: 0.005) e muito semelhante ao anteriormente encontrado por Mateu et al. (1997), numa outra amostra populacional de São Tomé e Príncipe. Considerando a informação simultânea de HVS-I e de HVS-II, de um modo geral a irregularidade das distribuições tende a acentuar-se, mas diferenças significativas quanto às expectativas assumindo o modelo de expansão populacional, também apenas se registam nos Angolares.

HVS-I

0.3 0.2 0.1

Frequencia (%) 0 0 2 4 6 8 101214161820

HVS-I + HVS-II

0.15 0.1

0.05 0 02468101214161820222426283032 Nº de diferenças nucleotídicas

Angolares Forros Tongas São Tomé

Figura 3.10 - Distribuições do número de diferenças nucleotídicas entre pares de sequências em HVS-I e HVS-I + HVS-II de mtDNA, em Angolares, Forros, Tongas e na amostra total de São Tomé e Príncipe .

105 III-Resultados e Discussão

3.3.3 - Perfil de haplogrupos em São Tomé e Príncipe

No total de 103 sãotomenses analisados, foram encontradas 71 sequências diferentes que pertenciam a 32 haplogrupos distintos (ver Apêndice 3 e Figura 3.11). Todos eles são específicos de regiões subsarianas e, portanto, não se detectou nenhuma sequência de possível origem europeia. Na amostra global de São Tomé e Príncipe, quatro tipos de haplogrupos, L1b, L1c, L2a e L3e1*, ocorrem com frequência consideravelmente elevada (10%, foi o limite mínimo assumido), e no conjunto representam 56 % do total das sequências. L1b, é um grupo que se encontra particularmente concentrado na África Ocidental, mas também se estende pelo Norte e Centro de África (Salas et al., 2002). O padrão filogeográfico de L1c permanece ainda num estado bastante incipiente de caracterização. Até agora, a maioria das sequências L1c foi encontrada na África Central, e apenas umas poucas no sudeste e oeste do continente. Provavelmente devido a efeitos de deriva génica, o haplogrupo atinge frequências muito elevadas entre os Biaka (Pigmeus da região ocidental da República Centro Africana) e entre os Bubi do Bioko. Recentemente, Salas et al. (2002), constatam que mais de 1/3 de sequências L1c contidas na sua base de dados pertenciam a Afro-Americanos e muito poucas apresentavam matches com sequências de indivíduos do continente africano. Como o tráfico de escravos para as Américas teve proveniência esmagadora de regiões da costa ocidental de África, e atendendo a que sobre a faixa ocidental a Sul do Equador não dispunham de caracterizações populacionais sobre mtDNA, dispondo já de dados sobre a costa oriental, sugerem que a origem de L1c ocorreu, provavelmente, entre a África Central e a costa ocidental atlântica do continente. L2a1 é um subgrupo de L2a, a classe de haplogrupos mais frequente e disseminada em África. O subgrupo está bem representado em africanos do sudeste mas o seu local de origem parece ter sido África Ocidental (Salas et al., 2002). Finalmente, o último dos haplogrupos mais frequentes em São Tomé e Príncipe, L3e1*, trata-se do mais antigo e diverso grupo de sequências de mtDNA de tipo L3. Encontra-se por toda a África subsariana, mas tem-se assumido que surgiu na África Central/Ocidental e que a dispersão para as regiões meridionais do continente acompanhou a expansão Bantu (Bandelt et al., 2001)

106 III-Resultados e Discussão

Sete haplogrupos, representando no conjunto 33% da amostra analisada, surgem com frequências entre os 3 e 7%: L1a, L2b, L2c, L3*, L3b, L3d e L3e2. Todos, à excepção do primeiro, ou estão disseminados pelo continente ou são típicos de África Ocidental. Pelo contrário, L1a tende a estar mais concentrado na África Oriental, região onde presumivelmente surgiu. O pacote de haplogrupos raros, aqueles que aparecem apenas uma ou outra vez na amostra global sãotomense, é diverso e inclui, por exemplo, linhagens específicas da costa atlântica ocidental (L3e4), da África Oriental (L1e), ou da região sul/oriental de África (como L3e1a, um haplogrupo muito vulgar entre Bantus ou Khoisan, Bandelt et al., 2001).

Figura 3.11 - Distribuição de haplogrupos de mtDNA em São Tomé e Príncipe.

Debruçando-nos agora sobre os perfis de haplogrupos detectados individualmente em cada um dos três grupos populacionais sãotomenses (Figura 3.11), o que apresenta mais singularidades comparativamente ao da amostra global é o

107 III-Resultados e Discussão registado nos Angolares. Caracteriza-se pela presença de uma redução considerável do número de haplogrupos e pela frequência particularmente elevada de sequências L3e1* e L1c, que, no conjunto, representam 60% do seu pool de linhagens mitocondriais. Pelo contrário, é basicamente o mesmo o perfil de haplogrupos em Forros e Tongas. Registam-se, naturalmente, diferenças menores quanto à frequência de haplogrupos específicos, mas o leque e nível de diversidade de haplogrupos são muito semelhantes nos dois perfis.

3.3.4 - Árvore filogenética de sequências de mtDNA

O conjunto de 71 linhagens distintas (considerando a informação das duas regiões hipervariáveis) detectado na amostra global de São Tomé e Príncipe, foi utilizado para construir, por neighbour joining, uma árvore de sequências de mtDNA, cuja representação gráfica se apresenta na Figura 3.12A. Pode ser comparada com a obtida por Mateu et al. (1997), Figura 3.12B, num estudo que envolveu uma amostra diferente de São Tomé e Príncipe mas em que não se discriminaram Angolares, Forros e Tongas, e que se baseou apenas na análise da variação em HVS-I. A árvore que agora obtivemos é globalmente semelhante à publicada por Mateu et al. (1997), ainda que a introdução de informação relativa a HVS-II tendesse a produzir ramos de maior comprimento. Em contrapartida, possibilitou uma melhor definição das diferentes classes e subclasses de haplogrupos. Para além da clara estruturação de haplogrupos, a árvore que se ilustra na Figura 3.12 também mostra que o agrupamento das sequências de mtDNA agora detectadas em São Tomé e Príncipe, ultrapassa amplamente a afiliação em grupos populacionais já que sequências de Angolares, Forros e Tongas se encontram aleatoriamente dispersas pelas classes de haplogrupos que se distinguem na árvore.

108 III-Resultados e Discussão

L2a1 L2c L2a1a L2c1 L2c2 L3e2a L3e2b A L3e3

L3e1 L3* L3e1a L2b1 L2d2 L3e4 L3b L3b1 L3b2 L3d L1c2 L3d1 L3f L3f1

L1a

L1c3

L1c1 L1e

L1b1 L1b L1c1a L1a1

L1a1a L1c1a1

B

Figura 3.12 - Árvores filogenéticas de sequências de mtDNA em amostras de São Tomé e Príncipe. A - Árvore baseada nos resultados obtidos neste trabalho incluindo informação de HVS- I e HVS-II. B - Árvore apresentada por Mateu et al. (1997), considerando apenas HVS-I. - Forros; ● - Tongas; ∆ - Angolares

109 III-Resultados e Discussão

3.3.5 - Estruturação genética em São Tomé e Príncipe inferida com mtDNA

Calcularam-se os valores de FST entre pares dos três grupos populacionais sãotomenses, tendo-se detectado diferenças estatisticamente significativas entre Angolares e Forros

(FST=0.037, P=0.04) e Angolares e Tongas (FST=0.030, P=0.04), mas não era significativa a distância genética entre Forros e Tongas (FST =0.01, P=0.14). Efectuou-se de seguida AMOVA aplicando o sistema de hierarquização de grupos populacionais já descrito na apresentação dos resultados de STRs ou marcadores bialélicos do Y, e os resultados produzidos com sequências de mtDNA constam da Tabela 3.11.

Tabela 3.11 - Percentagem de variação produzida por AMOVA com diferentes níveis de hierarquização dos grupos populacionais sãotomenses.

Variação (%) Comparação To vr An+Fo Fo vr An+To An vr To+Fo An+To+Fo Dentro das populações 97.95 97.76 96.55 97.45 Entre populações 3.78 3.23 1.01 2.55* Entre grupos -1.73 -1.00 2.44 - An: Angolares; Fo: Forros; To: Tongas. *Nível de significância: 5%.

Em consonância com os valores de pares de FST que em cima apresentámos, quando Angolares, Forros e Tongas foram integrados num único grupo, o valor de FST observado era baixo (0.0255) mas significativamente maior que zero (P=0.02), o que indica que em São Tomé e Príncipe e quanto às linhagens de mtDNA, a proporção de variação atribuída a diferenças entre grupos populacionais assume valores estatisticamente já significativos. Contudo, quando aplicámos AMOVA confrontando cada grupo populacional com os restantes dois, a percentagem de variação entre grupos nunca atingiu níveis de significância estatística, embora alcançasse o valor mais elevado (0.0244) quando os Angolares eram confrontados com Forros+Tongas. Consequentemente, foi com esta hierarquização que se registou o valor mínimo para a proporção de variação entre grupos populacionais (0.0101).

110 III-Resultados e Discussão

3.3.6 - Comparação com outras populações africanas

Na Tabela 3.12, estão indicados o código de designação, a proveniência, o tamanho amostral e a fonte bibliográfica das populações africanas com as quais se compararam os resultados agora obtidos. Nesse exercício comparativo, apenas foi considerada a variação em HVS-I entre as posições 16090-16365, porque só para esse fragmento havia dados disponíveis para todas as amostras.

Tabela 3.12 - Código, proveniência, tamanho das amostras e referências bibliográficas para as populações africanas consideradas neste estudo.

Código Proveniência das amostras Tamanho da amostra Referência África Norte SAH Sahara Oeste 25 Rando et al. (1998) MA Mauritânia 30 Rando et al. (1998) MO Marrocos 32 Rando et al. (1998) BM Marrocos (Berber) 60 Rando et al. (1998) EGI Egipto 68 Krings et al. (1999) Côrte-Real et al. (1996) MZB Algéria (Mozabite) 85 Macaulay et al. (1999) África Ocidental HA+KA Niger (Hausa e Kanuri) 20+14 Watson et al. (1997) FUL Nigéria (Fulbe) 60 Watson et al. (1997) SON+TU Nigéria (Songhai e Tuareg) 10+23 Watson et al. (1997) Watson et al. (1997); YOR Nigéria (Yoruba) 21+14 Vigilant et al. (1991) SEN Senegal 50 Rando et al. (1998) SER Senegal (Serer) 23 Rando et al. (1998) WO Senegal (Wolof) 48 Rando et al. (1998) MAN Senegal (Mandenka) 119 Graven et al. (1995) CVNO Cabo Verde NO 108 Brehm et al. (2002) CVSE Cabo Verde SE 184 Brehm et al. (2002) África Central MBU República Democrática do Congo (Mbuti) 20 Vigilant et al. (1991) BIA República Centro Africana (Biaka) 17 Vigilant et al. (1991) BIO Guiné Equatorial (Bubi) 45 Mateu et al. (1997) STM São Tomé e Príncipe 50 Mateu et al. (1997) ANG São Tomé e Príncipe (Angolares) 30 Este estudo FOR São Tomé e Príncipe (Forros) 35 Este estudo TON São Tomé e Príncipe (Tongas) 38 Este estudo ST São Tomé e Príncipe 103 Este estudo África Oriental TK Quénia (Turkana) 36 Watson et al. (1997) KIK Quénia (Kikuyu) 25 Watson et al. (1997) SO Somália 27 Watson et al. (1997) NUB Núbia 80 Krings et al. (1999) SUD Sudão Sul 76 Krings et al. (1999) MOÇ Moçambique 109 Pereira et al. (2001) África Sul KNG1 Botsuana (!Kung) 25 Vigilant et al. (1991) KNG2 África do Sul (!Kung) 43 Chen et al. (2000) KWE África do Sul (Khwe) 31 Chen et al. (2000)

111 III-Resultados e Discussão

3.3.6.1 - Diversidade molecular

Várias medidas de diversidade molecular foram estimadas para as diferentes amostras populacionais em comparação, conforme se apresenta na Tabela 3.13.

Tabela 3.13 - Medidas de diversidade e neutralidade para sequências HVS-I (16090 a 16365) em populações de São Tomé e Príncipe e de outras regiões africanas.

População N K(K/N) S(S/l) H(SE) M Tajima´s D [p] Fu’s Fs [p]

África Norte

SAH 25 20 (80.0) 29 (10.5) 0.973±0.022 5.11 -1.25 [0.09] -12.41 [0]*** MA 30 22 (73.3) 28 (10.1) 0.970±0.018 5.83 -0.63 [0.29] -11.48 [0]*** MO 32 29 (90.6) 44 (15.9) 0.988±0.014 5.84 -1.70 [0.01]* -25.01 [0]*** BM 60 38 (63.3) 47 (17.0) 0963±0.015 4.44 -1.88 [0.02]** -25.74 [0]*** EGI 68 59 (86.8) 66 (23.9) 0.993±0.005 6.82 -1.70 [0.01]* -25.07 [0]*** MZB 85 29 (34.1) 35 (12.7) 0.942±0.010 4.73 -1.01 [0.15] -11.14 [0.002] ** África Ocidental HA+KA 34 30 (88.3) 41 (14.9) 0.991±0.010 6.19 -1.38 [0.08] -24.70 [0]*** FUL 60 38 (63.3) 43 (15.6) 0.972±0.010 6.82 -0.87 [0.19] -23.15 [0]*** SON+TU 33 29 (87.9) 41 (14.9) 0.992±0.009 7.26 -1.02 [0.15] -21.30 [0]*** YOR 34f 32 (94.1) 44 (15.9) 0.996±0.008 7.31 -1.16 [0.10] -25.01 [0]*** Tabela SEN 50 42 (84.0) 41 (14.9) 0.987±0.008 6.24 -1.08 [0.15] -25.22 [0]*** SER 23 21 (91.3) 40 (14.5) 0.992±0.015 8.09 -0.98 [0.15] -11.98 [0]*** WO 43 39 (90.7) 42 (15.2) 0.991±0.006 7.50 -0.71 [0.27] -24.97 [0]*** MAN 110 a 46 (41.8) 47 (17.0) 0.963±0.008 6.23 -0.94 [0.17] -24.53 [0]*** CVNO 108 28 (25.9) 32 (11.6) 0.908±0.013 5.84 -0.13 [0.47] -5.58 [0.09] CVSE 184 101 (54.9) 69 (25.0) 0.984±0.003 6.29 -1.45 [0.04]* -24.85 [0]*** África Central MBU 13 a 5 (38.5) 19 (6.8) 0.756±0.097 7.13 0.70 [0.78] 3.76 [0.95] BIA 17 8 (47.1) 20 (7.2) 0.890±0.043 7.81 1.27 [0.90] 1.67 [0.80] BIO 45 16 (35.6) 30 (10.9) 0.910±0.020 7.09 0.11 [0.60] -0.55 [0.46] STM 50 32 (64.0) 46 (16.7) 0.973±0.011 7.86 -0.80 [0.24] -14.52 [0] *** ANG 30 16 (53.5) 36 (13.0) 0.913±0.037 8.74 -0.14 [0.52] -1.34 [0.30] FOR 35 29 (82.9) 41 (14.9) 0.988±0.010 7.52 -0.88 [0.20] -18.66 [0] *** TON 38 28 (73.7) 52 (18.8) 0.984±0.009 8.55 -1.11 [0.13] -12.61 [0] *** ST 103 61 (59.2) 63 (22.8) 0.985±0.004 8.36 -0.99 [0.16] -24.68 [0] *** África Oriental TK 36 32 (88.9) 54 (19.6) 0.991±0.010 9.66 -0.94 [0.17] -20.75 [0*** SO 27 24 (88.9) 41 (14.9) 0.992±0.013 6.90 -1.32 [0.08] -16.25 [0]*** KIK 25 23 (92.0) 45 (16.3) 0.993±0.013 7.96 -1.27 [0.09] -14.55 [0]*** NUB 80 50 (62.5) 64 (23.2) 0.974±0.008 7.88 -1.29 [0.08] -24.83 [0]*** SUD 76 63 (82.9) 73 (26.4) 0.993±0.004 8.33 -1.47 [0.04]* -24.77 [0] *** MOÇ 109 49 (45.0) 57 (20.6) 0.960±0.008 7.78 -0.89 [0.19] -23.62 [0] *** África Sul KNG1 24 a 9 (37.5) 16 (5.8) 0.830±0.053 2.97 -1.09 [0.13] -1.27 [0.25] KNG2 43 12 (27.9) 31 (11.2) 0.812±0.045 7.30 0.07 [0.63] 1.84 [0.79] KWE 31 10 (32.30) 34 (12.3) 0.884±0.028 8.75 0.10 [0.45] 3.00 [0.91] N = tamanho da amostra K = número de sequências diferentes e, entre parêntesis , percentagem relativa ao tamanho amostral S = número de locais polimórficos e, entre parêntesis, percentagem relativa ao tamanho da sequência = l H = diversidade de sequências ± desvio padrão M = número médio de diferenças entre pares de sequências a (algumas sequências não foram consideradas na análise pela ausência de informação quanto a muitas posições) * P< 0.05 ** ***

112 III-Resultados e Discussão

Repare-se que os elevados níveis de diversidade em Forros, Tongas e na amostra global de São Tomé e Príncipe são semelhantes aos registados na maioria das populações continentais de África da faixa atlântica Centro-Ocidental onde, geograficamente, São Tomé e Príncipe se localiza. Pelo contrário, e ainda na mesma faixa, os níveis mais reduzidos de diversidade encontram-se entre os Angolares ou outras populações insulares como a do grupo NO de Cabo Verde ou a do Bioko. Assim, não é de estranhar, que os parâmetros Tajima´s D ou Fu’s Fs nos Angolares, assumissem valores negativos baixos (não chegando a atingir nível de significância estatística em Fu´s Fs), encaixando-se na gama de valores mais elevados registados para estes parâmetros e que só se encontram ou em populações insulares como, mais uma vez, a do grupo NO de Cabo Verde ou a do Bioko, ou em pequenos grupos populacionais fechados como os Pigmeus da floresta central de África (BIA e MBU) ou grupos Khoisan do sul do continente (KNG1, KNG2, KWE). As restantes populações africanas, incluindo Forros e Tongas, são caracterizadas por valores francamente negativos para Tajima´s D ou Fu´s Fs, o que tem sido consensualmente interpretado como um sinal de populações que registaram expansões demográficas. Sinais de expansão demográfica, ou a sua ausência, também ficam retidos nos padrões de distribuição de diferenças entre pares de sequências de mtDNA. Na Figura 3.13 apresentam-se essas distribuições para algumas populações aleatoriamente escolhidas entre aquelas com valores situados nos extremos da gama de variação em Tajima´s D ou Fu’s Fs. Populações com valores muito baixos, como a do Egipto (EGI), dos Mandenka do Senegal (MAN), do Sudão (SUD) ou Moçambique (MOÇ), caracterizam-se por curvas de distribuição bastante regulares e aproximadamente bell- shaped, padrão previsível em populações que registaram expansões demográficas acentuadas. Em contrapartida, em populações com valores elevados de Tajima´s D ou Fu’s Fs, as mismatch distributions são muito mais irregulares, multi-modais, e observam-se em grupos populacionais pequenos, relativamente fechados e que se têm mantido demograficamente estáveis. Como a Figura 3.13 ilustra, é o que se verifica entre os Pigmeus Mbuti (MBU) e Biaka (BIA), ou num grupo !Kung (KNG2).

113 III-Resultados e Discussão

ANG FOR TON 0.3 0.15 0.15 0.2 0.1 0.1 0.1 0.05 0.05 0 0 0 0246810121416 0 2 4 6 8 1012141618 0 2 4 6 8 1012141618

S.TOMÉ EGI MA N 0.15 0.15 0.2 0.1 0.15 0.1 0.1 0.05 0.05 0.05 0 0 0 0 2 4 6 8 10 12 14 16 18 0 2 4 6 8 10121416 0 2 4 6 8 10 12 14 16 18

SUD 0.15 MOÇ CV NO 0.15 0.2 0.1 0.1 0.15 0.1 0.05 0.05 0.05 0 0 0 0 2 4 6 8 101214161820 0 2 4 6 8 10 12 14 16 18 012345678910111213

0.3 MBU 0.25 KNG2 0.2 BIA 0.25 0.2 0.15 0.2 0.15 0.15 0.1 0.1 0.1 0.05 0.05 0.05 0 0 0 02468101214 02468101214 0 2 4 6 8 1012141618

Figura 3.13 - Distribuição de diferenças entre pares de sequências de mtDNA em diferentes amostras populacionais. Eixo dos X: número de diferenças entre sequências. Eixo dos Y: frequências.

3.3.6.2. - Padrão de partilha de sequências de mtDNA

No sentido de procurar determinar a origem geográfica das linhagens de mtDNA que entraram em São Tomé e Príncipe, efectuámos uma análise de matches entre as sequências sãotomenses e as de uma base de dados construída com sequências HVS-I das populações africanas referenciadas na Tabela 3.12. Contudo, para evitar demasiada dispersão, agrupámos algumas amostras com base num critério de proximidade geográfica, salvo para aquelas provenientes de áreas onde, de acordo com as fontes históricas, pudesse ter ocorrido recrutamento de escravos para o arquipélago. Na Tabela 3.14, estão discriminados o tipo e número de vezes que sequências de sãotomenses eram compartilhadas pelos grupos populacionais considerados. Na legenda indicam-se os agrupamentos de amostras efectuados. Atendendo à informação contida em HVS-I entre as posições 16090-16365, a amostra total sãotomense continha 60 sequências diferentes, das quais 34 (56.7%) eram partilhadas por outros africanos. Destas, 19 estavam presentes nos Forros,

114 III-Resultados e Discussão correspondendo a 65.5% dos seus distintos haplótipos, 17 (60.7%) em Tongas, e apenas 7 nos Angolares, o que significa que apenas 43.8% das matrilinhagens Angolares são compartilhadas por indivíduos de outras populações não sãotomenses (ver 4 últimas colunas da direita na Tabela 3.14). Portanto, confrontando os três grupos de São Tomé e Príncipe, são os Angolares que apresentam a percentagem mais baixa de sequências partilhadas e, consequentemente, a proporção mais elevada de linhagens privadas. Mais um indicador de que o grupo registou um fluxo génico bastante mais limitado que Forros ou Tongas. Quanto aos matches registados, é de comentar a sua consistência com o padrão de frequência e distribuição geográfica de haplogrupos específicos. Por exemplo, para as 4 sequências sãotomenses partilhadas pertencentes ao haplogrupo L1a, um haplogrupo frequente e de presumível origem no leste africano, registaram-se 101 matches, dos quais 93 com sequências contidas no grupo designado Este ou em Moçambique. Em contrapartida, uma sequência sãotomense de tipo L3e1a, um haplogrupo geralmente bastante raro, era partilhada apenas por 8 africanos, 6 dos quais incluídos no grupo Sul, zona onde o haplogrupo atinge a frequência mais elevada. Relativamente às regiões/populações consideradas, aquela com a qual São Tomé e Príncipe partilhava menos haplótipos era a do Norte de África. Apenas 5.2% dos diferentes haplótipos contidos no conjunto de amostras da região, apresentavam matches com sequências sãotomenses, e as sequências partilhadas pertenciam, em geral, a haplogrupos amplamente distribuídos em África. Relativamente às regiões/populações subsarianas, os Pigmeus e o Este (que incluía as amostras do leste de África com excepção de Moçambique) eram as que partilhavam menor proporção de sequências com São Tomé, logo seguida do grupo referido como Sul, em que se juntaram as 3 amostras de Khoisan. Em comparação, os restantes grupos considerados, apresentavam frequências de matches com São Tomé e Príncipe bastante elevadas, sendo de destacar os valores particularmente altos registados para o Bioko, que compartilhava 31.1% das suas sequências e 31.3% dos haplótipos diferentes com sãotomenses, e para Cabo Verde NO, em que os valores correspondentes eram 42.6% e 28.6%, respectivamente. Quanto a Cabo Verde, uma análise mais detalhada permitiu constatar que dos sete haplótipos mais frequentes no arquipélago, assim considerados quando a frequência amostral excedia 3% (Brehm et

115 III-Resultados e Discussão al., 2002), quatro (um L3b, outro L1c e dois L3e4) estão também presentes em São Tomé e Príncipe. Três desses 7 haplótipos são especialmente frequentes no grupo NO das ilhas e os 4 haplótipos caboverdianos mais frequentes partilhados apresentam matches com 6 sequências de Forros ou Tongas. Merece ainda referência a elevada percentagem de sequências moçambicanas, 41.1%, que também se encontram em São Tomé e Príncipe, embora representem apenas 13.6% de haplótipos diferentes partilhados. Naturalmente que o primeiro valor terá que ser relativizado dado que o tamanho da amostra de Moçambique é superior ao de qualquer outra região/população comparadas. Mas não se pode excluir a possibilidade de que este resultado, e em particular o referido para Cabo Verde NO, sejam parcialmente fruto do intenso fluxo imigratório que se iniciou em meados do século XIX e que resultaria na entrada no arquipélago de milhares de trabalhadores originários de Angola, Cabo Verde e Moçambique. Só entre 1901 e 1928, 50 000 angolanos e 43 000 moçambicanos foram contratados como serviçais com destino às roças e estima-se em cerca de 80 000 o número de caboverdianos com idêntico destino, para o período compreendido entre 1900 e 1970 (Carreira, 1982). A conotação com o recente influxo de serviçais moçambicanos é, porém, pouco consistente com o facto de a proporção de mulheres que integraram essa vaga de imigrantes ter sido muito reduzida relativamente à maioria de indivíduos do sexo masculino (Nascimento, 2002). Dos serviçais que foram para São Tomé e Príncipe no período de 1904 a 1922, Moçambique concorreu com apenas 7.2% de mulheres (Carreira, 1982) e o desequilíbrio no ratio de sexos dos moçambicanos que desembarcaram em São Tomé foi uma constante enquanto se manteve o fluxo migratório. Portanto, outra explicação terá que ser encontrada para a elevada frequência de matches registada entre sequências moçambicanas e sãotomenses e que pode traduzir apenas o compartilhar de um fundo genético característico da faixa africana a Sul do Equador. Para poder fundamentar a validade desta hipótese, será fundamental dispor de dados relativos a mtDNA sobre regiões do Ocidente africano compreendendo as actuais República Democrática do Congo e Angola, de momento inexistentes, já que, por um lado, toda a faixa constituiu um importante centro de recrutamento de escravos levados para São Tomé e Príncipe e, por outro, quanto ao mais recente contingente de angolanos que entrou no arquipélago para trabalhar nas roças do cacau e café, a percentagem de mulheres foi até inferior à referida para os moçambicanos (Carreira, 1982).

116 III-Resultados e Discussão

Tabela 3.14 - Sequências sãotomenses partilhadas com outros grupos populacionais africanos.

Norte Senegal SE-Cabo Verde NO-Cabo Verde Niger/Nigéria Pigmeus Bioko Este Moçambique Sul Angolares Forros Tongas SãoTomé N 300 231 184 108 161 30 45 244 416 98 30 35 38 103 Nº hapl. dif. 154 120 101 28 107 13 16 164 132 26 16 29 28 60 L1a 1 52 1 1 L1a 4 1 22 2 2 L1a 2 2 12 2 1 1 2 L1a 3 1 1 L1b 1 10 1 7 2 1 3 3 L1b 3 3 2 1 2 1 3 L1b 3 1 1 L1c 1 3 12 2 2 L1c 3 2 3 3 L1c 8 4 2 2 L1c 1 1 1 L2a 4 3 2 5 2 4 4 1 2 2 L2a 1 1 35 2 2 L2a 1 1 1 L2a 1 6 4 1 3 1 3 10 2 1 3 L2b 3 1 1 2 2 L2b 1 1 1 L2c 1 1 1 1 L2c 2 1 2 1 1 L2c 2 1 1 L2d 1 1 1 L3* 1 1 1 3 1 1 L3* 1 1 1 2 L3b 1 1 3 3 1 1 L3b 1 6 13 2 10 1 2 2 L3b 1 2 1 1 1 L3d 1 1 1 1 3 4 L3e1* 1 1 15 1 1 L3e1a 2 6 1 1 L3e2a 2 5 2 1 2 1 1 2 4 L3e2b 1 1 1 L3e3 1 10 1 1 2 L3e4 6 2 15 1 1 1 1 L3e4 1 11 1 1 Nº matches 16 53 43 46 33 3 14 27 171 11 9 24 26 58 % matches 5.3 22.9 23.4 42.6 20.5 10.0 31.1 11.1 41.1 11.2 30.0 68.6 68.4 56.3 Nº matches dif 8 17 18 8 12 1 5 10 18 3 7 19 17 34 % matches dif. 5.2 14.2 17.8 28.6 11.2 7.7 31.3 6.1 13.6 11.5 43.8 65.5 60.7 56.7

N = tamanho da amostra; Nº hapl. dif. = número de haplótipos diferentes; Nº matches = número total de matches com sequências sãotomenses; % matches = proporção de matches relativamente ao tamanho da amostra; Nº matches dif. = número de haplótipos diferentes compartilhados; % matches dif. = proporção de haplótipos diferentes compartilhados relativamente ao número de haplótipos diferentes da amostra. Composição das amostras de acordo com os códigos que constam da Tabela 3.12: Norte: SAH+ MA+ MO+ BM+ EGY+ MZB Senegal: SEN+ SER+ WO+ MAN SE Cabo Verde: CVSE NO Cabo Verde: CVNO Niger/Nigéria: HA + KA+-FUL+ SON+ TU+YOR Pigmeus: MBU + BIA Bioko: BIO Este: TK+ SO+ KIK+ NUB + SUD Moçambique: MOZ + amostra estudada por Salas et al., 2002 Sul: KNG1 +KNG2 + KWE

117 III-Resultados e Discussão

Pelo contrário, parece fazer sentido relacionar a elevada frequência de matches entre sequências sãotomenses e cabo-verdianas com a entrada maciça em São Tomé e Príncipe de serviçais naturais de Cabo Verde. Os dados relativos a essa emigração forçada indicam a entrada de 35.9%, de mulheres cabo-verdianas para o período de1904 a 1922, proporção que em anos subsequentes poderá ter sido até superior, já que, por exemplo, relativamente a finais dos anos 40, estatísticas oficiais reportam a presença no arquipélago de um número de caboverdianas superior ao de trabalhadores com a mesma origem do sexo masculino (Carreira, 1982). Aliás a quota feminina nas plantações de São Tomé e Príncipe era praticamente suprida por mulheres caboverdianas, sendo encorajada a sua ligação com homens de diferentes origens (Carreira, 1982). Assim, se nos fixarmos na frequência de sequência partilhadas com as amostras que amalgamámos em Senegal, e que está numericamente mais bem representada que os grupos NO ou SE de Cabo Verde, afigura-se verosímil atribuir o excesso de matches com sequências sãotomenses registado nos dois grupos de Cabo Verde, em especial no NO, a este influxo recente de caboverdianos em São Tomé e Príncipe. As ilhas de São Vicente, São Nicolau, Santo Antão, as 3 que integram o grupo NO de Cabo Verde, e Santiago, a ilha maior, mais populosa e uma das que está incluída no grupo SE de Cabo Verde, foram as que mais contribuíram para a vaga de imigrantes que desembarcaram em São Tomé e Príncipe, o que não parece justificar a desigualdade acentuada quanto à proporção de matches com sequências sãotomenses registada para os grupos NO e SE de Cabo Verde. Talvez essa disparidade resulte da circunstância de que, quanto ao padrão de variação de linhagens de mtDNA, o grupo NO de Cabo Verde comparativamente ao SE se caracterize por uma acentuada redução de diversidade genética (Brehm et al., 2002).

3.3.6.3 - Análise de componentes principais

Com base nas frequências de haplogrupos registadas em Angolares, Forros, Tongas e em todas as populações africanas usadas como referência, efectuou-se uma análise de componentes principais (PC), que revelou que os três grupos populacionais de São Tomé e Príncipe ficavam agrupados no conjunto que incluía as populações de África Oriental/ Central/Ocidental. Este conjunto, distinguia-se claramente de outros dois que

118 III-Resultados e Discussão continham as populações do Norte e do Sul de África, mas no entanto, no seu interior a resolução populacional não era muito satisfatória. Remodelámos então a análise, restringindo-a a populações que no ensaio anterior ficaram integradas no grupo Oriental/Central/Ocidental e trabalhámos exclusivamente com frequências relativas de haplogrupos subsarianos (a inclusão de todos os haplogrupos produziu sinais menores mas irrelevantes no contexto desta análise). Por outro lado, e no sentido de obter um quadro de resultados mais conciso, quando dispúnhamos de diferentes amostras da mesma região, nomeadamente do Senegal, Nigéria e Quénia, amalgamámo-las numa amostra global representativa da região. Na Figura 3.14, apresenta-se a projecção dos dois primeiros componentes principais obtidos na análise, que no conjunto condensam 54% da variância total. Podem observar-se 3 grupos de populações. Aquele que ocupa o quarto inferior/esquerdo do plano e que para além da amostra bem individualizada dos Biaka contém a população Bubi da ilha do Bioko e os Angolares; outro, posicionado do quarto inferior/direito do plano e que integra as populações de África de leste com excepção de Moçambique; e ao centro da metade superior do plano, o grupo que compreende as restantes populações consideradas da faixa ocidental atlântica, e onde se integram Forros, Tongas e a amostra de São Tomé e Príncipe estudada por Mateu et al. (1997). Se ignorarmos os Biaka, devido à sua posição extremamente marginalizada, observa-se no segundo PC um gradiente bastante consistente que reflecte a localização de populações no eixo NO/SE de África. L1c é o haplogrupo que mais contribui tanto para PC1 como para PC2, sendo responsável por 31% e 23% da variância total, respectivamente. É um haplogrupo que atinge uma frequência particularmente elevada entre os Biaka e é ele o responsável pelo arrastamento do Bioko e dos Angolares, onde também ocorre com frequência bastante elevada, na direcção dos Pigmeus. Relativamente a PC1, o segundo haplogrupo com maior impacto é L3*, sendo determinante no posicionamento das populações do leste de África. Quanto a PC2, destacam-se adicionalmente as contribuições de dois haplogrupos: L1a, na gama de valores negativos, e L2c, na dos positivos. L1a representa 23.5% das duas únicas linhagens encontradas entre os Biaka e é também muito vulgar em África Oriental; L2c é especialmente frequente no Senegal mas quase não se encontra no leste de África.

119 III-Resultados e Discussão

0,3

0,2

0,1

0

PC1 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 -0,1

-0,2

-0,3

-0,4

-0,5 PC2

STM CVNO CVSE Bioko Angolares Forros Tongas Senegal Nigéria Quénia Moçambique Somália Níger Sudão Nubia Biaka

Figura 3.14 - Projecção dos dois componentes principais obtidos com frequências relativas de haplogrupos de mtDNA subsarianos. SMT: São Tomé e Príncipe (Mateu et al., 1997); CVNO: Cabo Verde NO; Cabo Verde SE.

Nesta teia de relacionamento entre populações e haplogrupos, é interessante reparar na quase sobreposição entre Cabo Verde, sobretudo o grupo SE, e o Senegal. Forros e Tongas afastam-se um pouco deste grupo, ocupando numa posição intermédia entre as populações atlânticas mais a Norte e as populações de África Oriental. Angolares é o grupo sãotomense que mais se distingue, por evidenciar grandes afinidades com o Bioko e por ser, de todas as populações consideradas nesta análise, a que mais se aproxima dos Biaka.

3.3.7 - Considerações globais sobre o estudo de mtDNA em São Tomé e Príncipe

3.3.7.1 - Padrão de variação de mtDNA em São Tomé e Príncipe

O elevado nível de diversidade de mtDNA agora registado na amostra global de São Tomé e Príncipe, reforça o resultado anteriormente reportado por Mateu et al., 1997, para uma amostra diferente do mesmo arquipélago e indica que, apesar da insularidade, São Tomé e Príncipe reteve um nível substancial de diversidade, o que se explica pelo

120 III-Resultados e Discussão influxo ciclíco de linhagens provenientes de regiões diversas e que foram transportadas pelos indivíduos que ao longo dos últimos 5 séculos foram chegando ao arquipélago. Entre eles, incluem-se os colonos europeus, preponderantemente portugueses, que desempenharam um papel essencial no povoamento e no desenvolvimento das estruturas políticas, sociais e económicas do arquipélago. Não obstante, o impacto europeu no pool de mtDNA sãotomense parece ter sido virtualmente nulo, como atesta a ausência de haplogrupos europeus nas amostras analisadas. Sem excepção, todas as linhagens encontradas pertenciam a haplogrupos com distribuição geográfica confinada a África subsariana, testemunhando um background de linhagens maternas totalmente africano. Esta observação contrasta com o registado para outras regiões genómicas. Como apresentámos no ponto 3.1.1, detectámos em São Tomé e Príncipe bastantes haplótipos definidos por STRs do cromossoma Y que, sem grande margem de dúvida, eram de origem europeia. No ponto seguinte, sobre marcadores bialélicos do Y, marcadores caracterizados por acentuada subestruturação macro-geográfica, apresentámos uma estimativa para o componente europeu na amostra total sãotomense que rondava os 20.4%. É um valor, por si, bastante elevado, sobretudo se confrontado com o equivalente feminino que é nulo. Mas no conjunto, os resultados agora aferidos com base em linhagens maternas e paternas, são absolutamente concordantes com os recentemente derivados com marcadores autossómicos por Tomás et al. (2002), que estimam em 10.7% a contribuição genética europeia em São Tomé e Príncipe, ou seja, quase a média dos valores agora obtidos com mtDNA e cromossoma Y. A ausência de linhagens femininas europeias em São Tomé e Príncipe significa, pois, que a fracção genética de origem europeia actualmente existente no arquipélago foi basicamente mediada por indivíduos do sexo masculino. Este desequilíbrio explica- se, em parte, pelo facto de ter sido sempre muito reduzido o número de mulheres europeias que foi para São Tomé e Príncipe. Por outro lado, o défice de mulheres europeias associado ao contexto social da altura, altamente estigmatizador de ligações entre mulheres europeias e homens africanos, resultaria em cruzamentos deste tipo apenas esporádicos, enquanto que os recíprocos eram não só tolerados como muito estimulados.

121 III-Resultados e Discussão

O quadro genético que se extraiu do mtDNA e do cromossoma Y afigura-se um reflexo nítido desta faceta do processo de povoamento de São Tomé e Príncipe. Sobre o local de origem das linhagens de mtDNA presentes em São Tomé e Príncipe, o perfil de haplogrupos detectado na amostra global sãotomense, aponta para um pool de linhagens maternas com origem principal a partir dum substrato típico do centro/sudoeste atlântico de África (ver Figura 3.14). Porém, a ausência de uma caracterização mais fina quanto ao mtDNA nas populações dessa faixa territorial impede que, de momento, se possam extrair deduções mais pormenorizadas sobre as regiões que poderão ter dado os contributos mais significativos para o pool de sequências sãotomenses. Apesar de tudo, este enquadramento grosseiro num substrato de tipo centro/sudoeste atlântico, é congruente com o que se sabe sobre as áreas de fornecimento dos escravos transportados para São Tomé e Príncipe no período que antecedeu o ciclo do café e do cacau, áreas que terão abrangido, essencialmente, a faixa atlântica balizada, grosso modo, entre o Cabo das Palmas, na Costa do Marfim, e o rio Cuanza, em Angola (Caldeira, 1999). Outros sinais do perfil de haplogrupos sãotomense, não deixam iludir a intricada história demográfica do arquipélago e alguns parecem decorrer do fluxo migratório mais recente que se encetou no século XIX com a exploração das culturas do café e do cacau. Referimo-nos à presença em São Tomé e Príncipe de muitas sequências compartilhadas com Cabo Verde e que parece ser consequência do influxo recente de serviçais cabo-verdianas. Na realidade, o papel de Cabo Verde no desenvolvimento inicial da população sãotomense deve ter sido nulo, já que nessa altura era também premente em Cabo Verde a consolidação do povoamento que, no que respeita ao componente africano, foi conseguida à custa de escravos recrutados na região da Senegâmbia, região que, pelo contrário, não constituiu centro abastecedor daqueles que foram levados para São Tomé e Príncipe.

3.3.7.2 - Achegas do mtDNA sobre a questão da origem dos Angolares

Quanto à questão da origem dos Angolares, relativamente à qual enunciámos no ponto 1.2.4 da INTRODUÇÃO as três versões comuns sobre o assunto, cremos que os dados de mtDNA poderão fornecer pistas fundamentais para o esclarecimento do problema, embora de momento, a ausência de uma caracterização filogeográfica mais fina, em

122 III-Resultados e Discussão particular na orla atlântica centro/ocidental de África, condicione muito o valor do enquadramento interpretativo possível. Entre os Angolares, o haplogrupo mais bem representado era L1c, um haplogrupo com uma distribuição geográfica muito sintomática e que sugere que a sua origem geográfica poderá ter ocorrido na região compreendida entre Angola e o delta de Congo (Salas et al., 2002), região que permanece ainda por caracterizar quanto ao mtDNA. Sabe-se que toda essa região foi crucial para as actividades dos portugueses relacionadas com o tráfico negreiro e terá fornecido uma fracção substancial dos escravos recrutados para o povoamento de São Tomé e Príncipe (Pinto e Carreira, 1979; Henriques, 2000). A representatividade de L1c agora detectada, não só entre os Angolares mas também na amostra global sãotomense, parece reforçar o cenário proposto para a origem de L1c, e admitindo-o, a referida região poderá ter sido uma das fontes principais de antepassados dos Angolares. No entanto, o facto de o espectro de sequências L1c Angolares ser bastante diversificado, parece indicar que o aporte de linhagens envolveu considerável dispersão geográfica dentro da hipotética área de origem de L1c. Ainda quanto a este haplogrupo, é de sublinhar que apenas entre os Angolares se tenham encontrado sequências do subgrupo L1c1a. Até agora, este tipo de linhagens só foi detectado esporadicamente entre moçambicanos e entre os Biaka, o grupo ocidental de Pigmeus, onde, pelo contrário, aparece com frequência muito elevada. Embora o suprimento de escravos para São Tomé e Príncipe possa ter atingido algumas zonas interiores do continente africano, nenhuma fonte refere a entrada de Pigmeus em São Tomé e Príncipe. Assim, afigura-se altamente provável que o subgrupo esteja também bem representado em regiões da faixa africana atlântica a Sul do Equador e, a ser assim, o refinamento dessa distribuição afigura-se do maior interesse para se poder inferir a origem das linhagens L1c1a que se encontram entre os Angolares. O haplogrupo que predomina em segundo lugar nos Angolares é L3e1*, representado por uma só linhagem mas compartilhada por 8 indivíduos, o que denuncia um nítido efeito de fundador. De novo, o postulado local de origem de L3e1* é África Central/Ocidental, ou seja, uma das áreas de filogeografia ainda muito pouco estudada, mas que coincide com a presumível faixa de recrutamento de escravos levados para São Tomé e Príncipe.

123 III-Resultados e Discussão

As outras linhagens encontradas entre os Angolares com frequência moderada ou baixa pertencem a haplogrupos ou amplamente dispersos em África ou típicos da orla central/ ocidental, excepto uma linhagem de tipo L1a1a, que por ser de um subgrupo predominante no leste/sudeste africano, resultará, provavelmente, de uma introdução mais recente nos Angolares. Remetendo-nos sucintamente às versões sobre a origem dos Angolares, e pondo de parte, pela inverosimilhança, a “hipótese da prioridade africana”, os Angolares poderiam ser (a) os descendentes dos náufragos de um navio negreiro proveniente de Angola, ou (b) o grupo que se foi formando à custa dos escravos foragidos das plantações da cana-de-açúcar e que se refugiaram nas florestas da região do sudeste de São Tomé, onde, escapando ao controlo colonial, se foram estabelecendo e organizando. À luz da primeira hipótese pressupõe-se um pequeno núcleo fundador e, portanto, seria de prever que nos Angolares predominassem linhagens de origem confinada a uma região bastante restrita e, presumivelmente, caracterizadas por forte relacionamento molecular. À luz da segunda, seriam muito mais os fundadores e oriundos de regiões diversas, esperando-se encontrar nos Angolares muito maior dispersão geográfica quanto à origem das linhagens e, teoricamente, menor relacionamento molecular entre elas. Quanto aos locais específicos de origem das linhagens de mtDNA dos Angolares, a informação de que dispomos é pouco conclusiva face à ausência, quanto a mtDNA, de uma caracterização pormenorizada nas áreas que potencialmente constituíram centros importantes de proveniência dos escravos levados para São Tomé e Príncipe. Porém, e não obstante a redução de diversidade nos Angolares comparativamente a Forros e Tongas, o reportório de linhagens de mtDNA Angolares é bastante variado, o que se traduz, como já salientámos, numa média muito elevada quanto ao número de diferenças entre pares de haplótipos, resultado que parece mais compatível com um cenário envolvendo a entrada sucessiva de linhagens múltiplas e heterogéneas, ou seja, o previsto assumindo a segunda hipótese sobre a origem dos Angolares, que considera serem os descendentes dos escravos fugitivos das plantações, que ao longo do tempo foram consolidando uma comunidade relativamente isolada de outros habitantes de São Tomé e Príncipe. Como já se referiu no ponto 1.2.4 a propósito da questão da origem dos Angolares, também as evidências linguistas

124 III-Resultados e Discussão favorecem este cenário. Pela análise lexical e fonética pôde deduzir-se que o Angolar, o crioulo falado pelos Angolares, se autonomizou mais recentemente que os outros crioulos existentes no arquipélago, e parece ter surgido, basicamente, de uma relexificação de vocábulos utilizados nas fazendas pelos escravos e seus descendentes (Seibert, 1998). Trata-se de um crioulo de origem heterogénea, o que faz supor que os que o utilizam fossem também descendentes de um núcleo de fundadores igualmente diversificado. Com base na análise linguística, Hagemeijer (1999) recusa para os Angolares a tese do naufrágio, considerando que o grupo se formou à custa dos escravos fugidos das roças, tendo por isso assimilado já o crioulo que aí se falava. O mesmo autor considera que, originalmente, haveria apenas um único crioulo que nos Angolares se foi diferenciando devido ao isolamento do grupo.

3.3.7.3 - Afinidades genéticas entre Angolares, Forros e Tongas

Como diversos índices indicam, nomeadamente proporção de haplótipos diferentes, diversidade génica, Tajima´s D ou Fu´s Fs, os Angolares distinguem-se de Forros e Tongas pela patente redução de diversidade ao nível do mtDNA. A redução de diversidade no pool de linhagens maternas neste grupo constitui mais uma marca de efeitos de deriva genética no seu seio consequentes à circunstância de que, até bastante recentemente, os Angolares se constituírem como grupo relativamente fechado mantendo escassos contactos com os outros habitantes de São Tomé e Príncipe. Em conformidade, os Angolares apresentam indícios de moderada diferenciação genética, mas já estatisticamente significativa, quando confrontados com os dois outros grupos populacionais sãotomenses. Pelo contrário, Forros e Tongas compartilham um padrão de diversidade muito semelhante e não manifestam sinais de heterogeneidade genética quanto aos perfis de mtDNA. Assim, os resultados obtidos com mtDNA corroboram e reforçam os obtidos com STRs do cromossoma Y no que respeita às relações de afinidade genética entre os três grupos populacionais de São Tomé e Príncipe. No conjunto, os dados obtidos apontam para uma ligeira diferenciação genética dos Angolares relativamente a Tongas ou Forros, enquanto que os dois últimos grupos constituem entidades geneticamente homogéneas. Para um arquipélago pequeno como São Tomé e Príncipe e com uma história populacional tão recente, este resultado é digno de reparo. As populações são

125 III-Resultados e Discussão entidades complexas que desenvolvem intricadas interacções sociais. Os actuais perfis genéticos podem fornecer uma aproximação sobre o seu passado evolutivo, mas este nunca pode ser completamente recuperado. Em São Tomé e Príncipe, uma rede complexa de forças sociais, históricas e económicas inter-actuaram para que uma comunidade que se auto-intitula como angolar ainda hoje preserve sinais de uma certa especificidade genética, apesar de compartilhar um território tão exíguo com outros habitantes do arquipélago.

3.3.7.4 - Fluxo génico mediado pelo sexo feminino entre grupos sãotomenses

Finalmente, comentaremos os resultados obtidos com AMOVA. Embora quando considerámos Angolares, Forros e Tongas como um único grupo, o FST global produzido por AMOVA fosse estatisticamente significativo

(FST=0.026, P=0.02), quando a análise foi executada hierarquicamente discriminando de cada vez um dos grupos populacionais dos restantes dois, não registámos diferenças significativas entre os agrupamentos considerados. Estes resultados parecem indicar que entre os grupos populacionais sãotomenses não se verificaram restrições muito marcadas quanto ao fluxo génico mediado pelo sexo feminino, e para tal a explicação poderá residir na conjugação de dois factores. Por um lado, a tendência para sistemas de acasalamento poligâmicos que cedo se generalizou em São Tomé e Príncipe. No arquipélago, a poligamia é uma prática tradicional e corresponde à retenção de traços comuns em populações africanas que contribuíram para o povoamento das ilhas (Caldeira, 1999). A poligamia tem como consequência um aumento do tamanho efectivo da população feminina, o que pode ter concorrido para impedir que se estabelecesse um grau de subestruturação bem definido no pool de linhagens de mtDNA sãotomenses. Por outro lado, e paralelamente ao aspecto anterior mas respeitante apenas aos Angolares, a prática inicial de procurarem mulheres fora da comunidade. Muito provavelmente, seria do sexo masculino a maioria dos escravos fugitivos das plantações. A partir das áreas de refúgio e uma vez organizados, os Angolares desencadeavam ataques às plantações, sendo usual raptarem mulheres negras. Há registos dessa prática até finais do século XVIII, o que indica que o défice feminino era um problema estrutural sério entre a comunidade angolar (Caldeira, 1999). Défice que foi difícil equilibrar em parte porque muitas das mulheres que eram

126 III-Resultados e Discussão levadas para os quilombos regressavam voluntariamente às plantações (Caldeira, 1999). Assim, durante os séculos em que o grupo se consolidou, procurou-se compensar o reduzido número de mulheres entre os Angolares com a renovação de forma continuada de elementos do sexo feminino. Este influxo sistemático de linhagens femininas poderá ter contribuído para evitar limitações de relevo quanto ao fluxo génico feminino entre grupos sãotomenses, e daí ser parcialmente responsável por não se ter gerado subestruturação significativa no pool de linhagens maternas do arquipélago. Retomando os resultados obtidos com STRs do cromossoma Y, é de recapitular que, quando aplicámos AMOVA, detectámos uma fracção significativa de diversidade atribuível a diferenças entre grupos na hierarquia em que Angolares eram confrontados com Tongas e Forros. Por conseguinte, a informação combinada extraída com base em linhagens maternas e paternas definidas por STRs, sugere que o fluxo génico entre Angolares e os outros habitantes de São Tomé e Príncipe foi sexualmente desequilibrado, tendo aparentemente ocorrido uma taxa de migração mais baixa mediada por indivíduos de sexo masculino.

127

IV - CONCLUSÕES

Integrando os resultados obtidos com a análise de STRs ou marcadores bialélicos do cromossoma Y e de sequências de mtDNA, são as seguintes as principais conclusões a que conduziu este trabalho:

1. Sobre o arquipélago de São Tomé e Príncipe

- Os níveis de diversidade registados no arquipélago são elevados e enquadram-se na gama de valores que caracteriza a maioria das populações continentais de África. Apesar do relativo isolamento, não se encontram em São Tomé e Príncipe sinais globais de erosão de diversidade que são comuns em grupos populacionais fechados ou com longo percurso de insularidade. A recente história demográfica do arquipélago e a origem diversificada dos indivíduos que ao longo dos séculos foram consolidando o seu povoamento, permitem compreender esta característica da moldura genética de São Tomé e Príncipe.

- O seu fundo genético é preponderantemente de origem africana, o que atesta o forte impacto da contribuição de escravos no povoamento do arquipélago. Sobre a sua proveniência, as linhagens de mtDNA apontam para uma contribuição significativa do Centro/Ocidente de África, em conformidade com o que se sabe sobre as zonas de recrutamento dos escravos levados para São Tomé e Príncipe, mas o estado de incipiente caracterização filogeográfica de toda essa região, impossibilita que, de momento, se façam inferências mais pormenorizadas.

131

IV- Conclusões

- Para além dos vestígios destes povoadores, que desempenharam um papel fundamental nos séculos que se seguiram à descoberta do arquipélago, outros sinais no padrão de sequências de mtDNA parecem ser consequentes de um fluxo imigratório mais recente. A observação de que uma percentagem elevada de linhagens femininas sãotomenses é compartilhada por caboverdianos, quando não há indicações que estes tenham tido algum papel de relevo no desenvolvimento inicial da população de São Tomé e Príncipe, parece justificar- se porque a partir do século XIX entraram no arquipélago milhares de caboverdianos como contratados para os trabalhos nas roças do cacau e do café, e nessa vaga, ao contrário dos serviçais moçambicanos ou angolanos que eram esmagadoramente do sexo masculino, a quota de mulheres era muito semelhante à de homens.

- O contributo europeu na formação da população de São Tomé e Príncipe está bem presente no seu perfil genético actual que retém marcas claras sobre o grau e padrão de miscigenação ocorridos. Com base em marcadores bialélicos do Y, avaliou-se em 20.4% a proporção de linhagens masculinas de origem europeia, o que representa uma fracção surpreendentemente elevada se se atender ao sempre reduzido peso demográfico dos europeus comparativamente ao dos africanos em São Tomé e Príncipe, passadas as décadas iniciais do processo de povoamento. O considerável desfasamento entre a proporção de europeus e a proporção de linhagens que introduziram no arquipélago reflecte bem a grande variância no sucesso reprodutivo dos indivíduos que contribuíram para formação da população de São Tomé e Príncipe.

- Em oposição, nas sequências de mtDNA sãotomenses, não existem quaisquer linhagens de presumível origem europeia, o que significa que foi virtualmente nulo o impacto demográfico do cruzamento entre mulheres europeias e homens africanos. Tal entende-se por ter sido insignificante o número de mulheres europeias que foi para São Tomé e Príncipe e porque, face ao contexto social da altura, foram raras as ligações entre mulheres europeias e homens africanos.

132 IV- Conclusões

2. Sobre Angolares, Forros e Tongas

- Não se encontraram indícios de diferenciação genética entre Forros e Tongas. Os dois grupos compartilham basicamente o mesmo padrão de variação para todos os marcadores analisados e podem, portanto, considerar-se uma entidade genética homogénea. Forros, são os sãotomenses cujos antepassados têm raízes remotas no arquipélago e incluem os descendentes dos escravos provenientes da faixa Ocidental Atlântica que, após a descoberta de São Tomé e Príncipe, foram sendo recrutados para o seu povoamento. Tongas são os descendentes dos imigrantes forçados originários de Angola, Cabo Verde e Moçambique que, entre o século XIX e meados do XX, entraram em massa no arquipélago para trabalhar nas roças do cacau e do café. De uma certa forma e comparativamente aos Forros, os Tongas representam uma sub-amostragem do continente africano mais recente e geograficamente mais abrangente, mas percebe-se a ausência de diferenciação entre os dois grupos dada a forma como os últimos se integraram na sociedade sãotomense que, ao contrário de potenciar eventuais diferenças, sempre funcionou no sentido de as esbater. Os Tongas descendem dos serviçais que, por terem ficado com contratos de repatriação por cumprir, se viram obrigados a estabelecer no arquipélago. Nunca formaram uma comunidade isolada de outros habitantes, até porque o défice global de mulheres entre os serviçais proporcionava as ligações com naturais do arquipélago. Assim, a idealização de Tongas é uma construção social que não tem paralelo do ponto de vista genético.

- Os Angolares apresentam sinais de alguma diferenciação relativamente a Tongas ou Forros, embora seja uma diferenciação de nível moderado pois se atinge significância estatística quando averiguada com STRs do Y ou mtDNA, o mesmo não se verifica com marcadores bialélicos do Y. A especificidade angolar, reside essencialmente numa redução de diversidade genética que se nota na maioria dos parâmetros de avaliação e que se poderá explicar por efeitos de deriva génica dado que este pequeno grupo populacional se manteve, até há pouco tempo, bastante isolado e com escassos contactos com outros habitantes de São Tomé.

133 IV- Conclusões

- O grau de subestruturação detectado em São Tomé e Príncipe é, no entanto, mais acentuado nas linhagens definidas por STRs do Y que nas de mtDNA, indicando que entre os Angolares e outros sãotomenses, foram menores as restrições ao fluxo génico mediado pelo sexo feminino que ao fluxo mediado pelo sexo masculino. Para tal poderá ter concorrido, por um lado, uma certa generalização em São Tomé e Príncipe de sistemas de acasalamento poligâmicos, com consequente diminuição relativa do tamanho efectivo da população masculina e, por outro, uma prática inicial entre os Angolares, e persistente durante séculos, de procurarem mulheres fora da comunidade.

- Sobre a questão da origem dos Angolares, os resultados obtidos com mtDNA indicam que apesar da relativa redução de diversidade das linhagens angolares, elas incluem sequências molecularmente bastante divergentes, o que parece favorecer um cenário evolutivo do grupo envolvendo a entrada sucessiva de linhagens múltiplas e heterogéneas, ou seja, o previsto assumindo a hipótese de os Angolares serem os descendentes dos escravos fugitivos das plantações que ao longo do tempo foram reforçando um núcleo populacional que se manteve bastante isolado de outros habitantes de São Tomé e Príncipe. É a hipótese que os dados linguísticos também favorecem.

- No futuro, o previsível refinamento da caracterização filogeográfica de haplótipos de mtDNA ou do cromossoma Y em toda a faixa Centro/Ocidental atlântica do continente africano, permitirá um melhor enquadramento dos resultados agora obtidos e afigura-se da maior importância para se poder inferir quais os principais locais de origem dos africanos que contribuíram para o povoamento geral de São Tomé e Príncipe e, em particular, para a formação do grupo angolar. Quanto ao último ponto, a observação de que apenas entre os Angolares estão presentes linhagens quer do haplogrupo do Y B*(xB2a,b), um haplogrupo muito raro em África, quer de sequências mitocondriais de tipo L1c1 ou L1c1a, tipo de linhagens que, até agora, só se encontrou bem representado entre um grupo de Pigmeus da Républica Centro-Africana, afigura-se ser uma pista a valorizar no esclarecimento da questão relativa à origem dos Angolares.

134 IV- Conclusões

3. Sobre a caracterização fina da diversidade genética em África

- Os dados obtidos neste trabalho contribuiram para aumentar o estado de caracterização dos padrões de diversidade genética em África e a sua disponibilização perante a comunidade científica permitirá integrá-los em contextos de investigação diversificados, nomeadamente na reconstituição pormenorizada da história genética do continente africano.

135

V - BIBLIOGRAFIA ______

Albarrán, C., Garcia, O., Alonso, A., Deka, R., Martin, P., Trovoada, M.J., Amorim, A., Sancho, M. (1998) Patterns of haplotype variation at the D1S80 locus and a flanking sequence polymorphism in African and non - African populations. Prog. Forensic Genet. 7: 401-403.

Almeida, A. (1966) Das etnonimias da Guiné Portuguesa, do arquipélago de Cabo Verde e das ilhas de São Tomé e Príncipe. Instituto Superior de Ciências Sociais e Política Ultramarina.

Alves-Silva, J., Santos, M.S., Guimarães, P.E., Ferreira, A.C., Bandelt, H.J., Pena, S.D., Prado, V.F. (2000) The ancestry of Brazilian mtDNA lineages. Am. J. Hum. Genet. 67 (2): 444-461.

Ambrósio, A. (1984) Subsídios para a História de São Tomé e Príncipe. Livros do Horizonte.

Anderson, S., Bankier, A.T., Barrell, B.G., De Bruijn, M.H.L., Coulson, A.R. (1981) Sequence and organization of the human mitochondrial genome. Nature 290: 457- 465.

Andrews, R.M., Kubacka, I., Chinnery, P.F., Lightowlers, R.N., Turnbull, D.M., Howell, N. (1999) Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA. Nat. Genet. 23 (2):147 .

139 V- Bibliografia

Ankel-Simons, F., Cummins, J.M. (1996) Misconceptions about mitochondria and mammalian fertilization: Implications for theories on human evolution. Proc. Natl. Acad. Sci. USA 93: 13859-13863.

Aquadro, C.F., Greenberg, B.D. (1983) Human mitochondrial DNA variation and evolution: analysis of nucleotide sequences from seven individuals. Genetics 103: 287-312.

Avise, J.C., Arnold, J., Ball, R.M., Bermingham, E, Lamb, T., Neigel, J.E, Reeb, C.A., Saunders, N.C. (1987) Intraspecific Phylogeography: The Mitochondrial DNA Bridge Between Population Genetics and Systematics. Annual Review of Ecology and Systematics 18: 489-522.

Awadalla, P. Eyre-Walker, A., Smith, J.M. (1999) Linkage Disequilibrium and Recombination in Hominid Mitochondrial DNA. Science 286: 2524-2525.

Awadalla, P. Eyre-Walker, A. Smith, J.M. (2000) Questioning evidence for recombination in human mitochondrial DNA. Science 288: 1931a.

Awadalla, P. (2003) The evolutionary genomics of pathogen recombination. Nat. Rev. Genet. 4 (1): 50-60.

Bandelt, H.J., Alves-Silva, J., Guimarães, P.E., Santos, M.S., Brehm, A., Pereira, L., Coppa, A., Larruga, J.M., Rengo, C., Scozzari, R., Torroni, A., Prata, M.J., Amorim, A., Prado, V.F., Pena, S.D. (2001) Phylogeography of the human mitochondrial haplogroup L3e: a snapshot of African prehistory and Atlantic slave trade. Ann. Hum. Genet. 65 (Pt 6): 549-563.

Bandelt, H.J., Quintana-Murci, L., Salas, A., Macaulay, V. (2002) The fingerprint of phantom mutations in mitochondrial DNA data. Am. J. Hum. Genet. 71 (5): 1150- 60.

140 V- Bibliografia

Bendall, K.E., Macaulay, V.A., Baker, J.R., Sykes B.C. (1996) Heteroplasmic point mutations in the human mtDNA control region. Am. J. Hum. Genet. 59 (6): 1276- 1287.

Boore, J.L. (1997) Transmission of mitochondrial DNA--playing favorites? Bioessays 19 (9): 751-753.

Bosch, E., Calafell, F., Santos, F. R., Perez-Lezaun, A., Comas, D., Benchemsi, N., Tyler-Smith, C., Bertranpetit, J. (1999) Variation in short tandem repeats is deeply structured by genetic background on the human Y chromosome. Am. J. Hum. Genet. 65, 1623-1638.

Bosch, E., Calafell, F., Comas, D., Oefner, P.J., Underhill, P.A., Bertranpetit, J. (2001) High-resolution analysis of human Y-chromosome variation shows a sharp discontinuity and limited gene flow between northwestern Africa and the . Am. J. Hum. Genet. 68 (4): 1019-1029.

Brehm, A., Pereira, L., Bandelt, H.J., Prata, M.J., Amorim, A. (2002) Mitochondrial portrait of the Cabo Verde archipelago: the Senegambian outpost of Atlantic slave trade. Ann. Hum. Genet. 66 (Pt 1): 49-60.

Brion, M., Salas, A., Gonzalez-Neira, A., Lareu, M.V., Carracedo, A. (2003) Insights into Iberian population origins through the construction of highly informative Y- chromosome haplotypes using biallelic markers, STRs, and the MSY1 minisatellite.Am. J. Phys. Anthropol. 122 (2): 147-61.

Brown, W.M. (1980) Polymorphism in mitochondrial DNA of humans as revealed by restriction endonuclease analysis. Proc. Natl. Acad. Sci. USA 77 (6): 3605-3609.

Brown W.M., Prager, E.M., Wang, A., Wilson, A.C. (1982) Mitochondrial DNA sequences of primates: tempo and mode of evolution. J. Mol. Evol. 18 (4): 225-239.

141 V- Bibliografia

Brown, D.T., Samuels, D.C., Michael, E.M., Turnbull, D.M., Chinnery, P.F. (2001) Random genetic drift determines the level of mutant mtDNA in human primary oocytes. Am. J. Hum. Genet. 68 (2): 533-536.

Budowle, B., Chakraborty, R., Giusti, A.M., Eisenberg, A.J., Allen, R.C. (1991) Analysis of the VNTR locus D1S80 by the PCR followed by high-resolution PAGE. Am. J. Hum. Genet. 48 (1):137-144.

Budowle, B., Allard, M.W., MR Wilson (2002) Critique of interpretation of high levels of heteroplasmy in the human mitochondrial DNA hypervariable region I from hair. Forensic Sci. Int. 126 (1): 30-33.

Caldeira, A.M. (1999). Mulheres, sexualidade e casamento em São Tomé e Príncipe (Séculos XV-XVIII). Lisboa. Edições Cosmos.

Cann, R.L., Wesley, M.B., Wilson, A.C. (1984). Polymorphic sites and the mechanism of evolution in human mitochondrial DNA. Genetics 106: 479-499.

Cann, R.L., Stoneking, M., Wilson, A.C. (1987). Mitochondrial DNA and human evolution. Nature 325 (6099): 31-36.

Carreira, A. (1982). The people of the Cape Verde islands. Exploitation and Emigration. C. Hurst & Company, London and Archon Books, Hamden, Connecticut.

Carvalho, M., Anjos, M.J., Andrade, L., Coxinho, C., Corte-Real, F., Gamero, J.J., Vieira, D.N., Vide, M.C. (2000) Y chromosome polymorphisms: a comparison between and continental Portuguese samples. Progress in Forensic Genetics 8, 302-304.

Cavalli-Sforza, L.L., Feldman, M.W. (2003) The application of molecular genetic approaches to the study of human evolution. Nat. Genet. 33 Suppl: 266-275.

142 V- Bibliografia

Cavelier, L., Johannisson, A., Gyllensten, U. (2000) Analysis of mtDNA copy number and composition of single mitochondrial particles using flow cytometry and PCR. Exp. Cell Res. 259 (1): 79-85.

Chen, Y.S., Olckers, A., Schurr, T.G., Kogelnik, A.M., Huoponen, K., Wallace, D.C. (2000) mtDNA variation in the South African Kung and Khwe-and their genetic relationships to other African populations. Am. J. Hum. Genet. 66 (4): 1362-1383.

Chinnery, P.F., Howell, N., Lightowlers, R.N., Turnbull, D.M. (1997) Molecular pathology of MELAS and MERRF. The relationship between mutation load and clinical phenotypes. Brain 120: 1713 - 1721.

Costa, F.F. (1982) A ilha de São Tomé. Um reino de escravos na linha do Equador. História 50, 66-78.

Cruciani, F., Santolamazza, P., Shen, P., Macaulay, V., Moral, P., Olckers, A., Modiano, D., Holmes, S., Destro-Bisol, G., Coia, V., Wallace, D.C., Oefner, P.J., Torroni, A., Cavalli-Sforza, L.L., Scozzari, R., Underhill, P.A. (2002) A back migration from Asia to sub-Saharan Africa is supported by high-resolution analysis of human Y-chromosome haplotypes. Am. J. Hum. Genet. 70 (5): 1197-1214.

Cruciani, F., La Fratta, R., Santolamazza, P., Sellitto, D., Pascone, R., Moral, P., Watson, E., Guida, V., Colomb, E.B., Zaharova, B., Lavinha, J., Vona, G., Aman, R., Cali, F., Akar, N., Richards, M., Torroni, A., Novelletto, A., Scozzari, R. (2004) Phylogeographic analysis of haplogroup e3b (e-m215) Y chromosomes reveals multiple migratory events within and out of Africa. Am. J. Hum. Genet. 74 (5): 1014-22.

Cruz, C.B. (1975) São Tomé e Príncipe: do colonialismo à independência. Actualidade portuguesa. Moraes editora. Lisboa.

Curtin, P. (1969) The Atlantic Slave Trade: A Census. Madison: University of Wisconsin Press.

143 V- Bibliografia

Davidson, B. (1988) As Ilhas Afortunadas. Lisboa. Editorial Caminho, SA.

D'Eustachio, P. (2002) High levels of mitochondrial DNA heteroplasmy in human hairs by Budowle et al. Forensic Sci. Int. 130 (1): 63 - 67.

Dupanloup, I, Pereira, L., Bertorelle, G., Calafell, F., Prata, M.J., Amorim, A., Barbujani, G. (2003) A recent shift from polygyny to monogamy in humans is suggested by the analysis of worldwide Y-chromosome diversity. J. Mol. Evol. 57 (1): 85-97.

Eisen, J.A., Hanawalt, P.C. (1999) A phylogenomic study of DNA repair genes, proteins, and processes. Mutat. Res. 435 (3): 171-213.

Eltis, D., Beherendt, S.D., Richardson, D., Klein, H.S. eds. (1999) The Trans-Atlantic Slave Trade: A Database on CD-Rom. Cambridge.

Eyre-Walker, A., Smith, N.H., Smith, J.M. (1999) How clonal are human mitochondria? Proc. R. Soc. Lond. B. Biol. Sci. 266 (1418): 477-483.

Eyre-Walker, A.C., Awadalla, P. (2001) Does human mtDNA recombine? J Mol Evol. 53 (4-5): 430-435.

Excoffier, L., Yang, Z. (1999) Substitution rate variation among sites in mitochondrial hypervariable region I of humans and chimpanzees. Mol. Biol. Evol. 16: 1357-1368.

Felsenstein, J. (1993) Phylip (Phylogeny inference package) version 3.5c. Distributed by the author. Department of Genetics. University of Washington. Seatle.

Ferlin, A., Moro, E., Rossi, A., Dallapiccola, B., Foresta, C. (2003). The human Y chromosome’s azoospermia factor b (AZFb) region: sequence, structure, and deletion analysis in infertile men. Med. Genet. 40: 18-24.

144 V- Bibliografia

Fisher, R.P., Lisowsky, T., Parisi, M.A., Clayton, D.A. (1992) DNA wrapping and bending by a mitochondrial high mobility group-like transcriptional activator protein. J. Biol. Chem. 267: 3358-3367.

Forster, P., Rohl, A., Lunnemann, P., Brinkmann, C., Zerjal, T., Tyler-Smith, C., Brinkmann, B. (2000) A short tandem repeat-based phylogeny for the human Y chromosome. Am. J. Hum. Genet. 67 (1): 182-196.

Galhano, M.H. (1962) Estudo comparativo dos Angolares e Mussurongos pelo método da análise discriminante. Trabalhos do centro de estudos de etnologia do Ultramar.

Giles, R.E., Blanc, H, Cann, H.M., Wallace, D.C. (1980). Maternal inheritance of human mitochondrial DNA. Proc. Natl. Acad. Sci. USA. 77 (11): 6715-6719.

Gill, P., Brenner, C., Brinkmann, B., Budowle, B., Carracedo, A., Jobling, M.A., de Knijff, P., Kayser, M ., Krawczak, M ., Mayr, W.R., Morling, N., Olaisen, B., V Pascali, V., Prinz, M., Roewer, L., Schneider, P.M., Sajantila, A., Tyler-Smith, C. (2001) DNA commission of the International Society of Forensic Genetics: recommendations on forensic analysis using Y-chromosome STRs. Int. J. Legal Med. 114 (6): 305-309.

Gonçalves, R., Rosa, A., Freitas, A., Fernandes, A., Kivisild, T., Villems, R., ·Brehm, A. (2003) Y-chromosome lineages in Cabo Verde Islands witness the diverse geographic origin of its first male settlers. Hum. Genet. 113: 467-472

Gonser, R., Donnelly, P., Nicholson, G., Di Rienzo, A. (2000). Microsatellite mutations and inferences about human demography. Genetics 154: 1793-1807.

González-Neira, A., Gusmão, L., Brión, M., Lareu, M. V., Amorim, A., Carracedo, A. (2000) Distribution of Y-chromosome STR defined haplotypes in Iberia. Forensic Sci. Int. 110: 117-126.

145 V- Bibliografia

Goodfellow, P., Darling, S., Wolfe, J. (1985) The human Y chromosome. J. Med. Genet. 22: 329 - 344.

Graven, L., Passarino, G., Semino, O., Boursot, P., Santachiara-Benerecetti, S., Langaney, A. & Excoffier, L. (1995) Evolutionary correlation between control region sequence and restriction polymorphisms in the mitochondrial genome of a large Senegalese Mandenka sample. Mol. Biol. Evol. 12, 334 - 345.

Graves, J.A.M. (2000) Human Y Chromosome, Sex Determination, and Spermatogenesis - A Feminist View. Biol. Reprod. 63: 667 - 676.

Graves, J.A.M. (2002). The rise and fall of SRY. Trends Genet. 18 (5): 259-264.

Grzybowski, T. (2000) Extremely high levels of human mitochondrial DNA heteroplasmy in single hair roots. Electrophoresis 21 (3): 548-553.

Gusmão, L., Gonzáles-Neira, A., Pestoni, C., Brión, M., Lareu, M. V., Carracedo, A. (1999) Robustness of the Y STRs DYS19, DYS389I/II, DYS390, DYS391, DYS392 and DYS393: optimization of a PCR pentaplex. Forensic Sci. Int. 106, 163-172.

Gusmão, L., Prata, M.J., Miranda, C., Trovoada, M.J., Amorim, A. (2001) STR data from S. Tomé e Príncipe (Gulf of Guinea, ). Forensic Sci. Int. 116 (1): 53-54.

Hagemeijer, T. (1999). As Ilhas de Babel: a crioulização no Golfo da Guiné in Revista Camões 6: 74-88.

Hammer, M.F., Horai, S (1995) Y chromosomal DNA variation and the peopling of Japan. Am. J. Hum. Genet 56 (4): 951-962.

146 V- Bibliografia

Hammer, M.F., Blackmer, F., Garrigan, D., Nachman, M.W., Wilder, J.A. (2003) Human Population Structure and Its Effects on Sampling Y Chromosome Sequence Variation. Genetics 164: 1495 - 1509.

Harpending, H.C., Batzer, M.A., Gurven, M., Jorde, L.B., Rogers, A.R., Sherry, S.T. (1998). Genetic traces of ancient demography. Proc. Natl. Acad. Sci. USA 95: 1961- 1967. Hasegawa, M., Di Rienzo, A., Kocher, T.D., Wilson, A.C. (1993) Toward a more accurate time scale for the human mitochondrial DNA tree. J. Mol. Evol. 37 (4): 347-354.

Henriques, I.C. (2000). São Tomé e Príncipe. A invenção de uma sociedade. Vega e Autor.

Hurles, M.E., Irven, C., Nicholson, J., Taylor, P.G., Santos, F.R., Loughlin, J., Jobling, M.A., Sykes, B.C. (1998) European Y-chromosomal lineages in Polynesians: a contrast to the population structure revealed by mtDNA. Am. J. Hum. Genet. 63 (6): 1793-1806.

Hurles, M., Veitia, R., Arroyo, E., Armenteros, M., Bertranpetit, J., Perez-Lezaun, A., Bosch, E., Shlumukova, M., Cambon-Thomsen, A., Singh, L., Pandya, A. Santos, F., Tyler-Smith, C., Jobling, M. (1999). Recent male-mediated gene flow over a linguistic barrier in Iberia, suggested by analysis of a Y-chromosomal DNA polymorphism. Am. J. Hum. Genet. 65: 1437-1448.

Iliffe, J. (1995) Os Africanos - história dum continente. Terramar, Lda.

Ingman, M., Kaessmann, H., Paabo, S., Gyllensten, U. (2000). Mitochondrial genome variation and the origin of modern humans. Nature. 408 (6813): 708-713.

Ingman, M. (2003) Mitochondria and Human Evolution. Acta Universitatis Upsaliensis. Comprehensive Sumamaries of Uppsala Dissertations from the Faculty of Medicine 1288. Uppsala.

147 V- Bibliografia

Jenuth, J.P., Peterson, A.C., Fu, K., Shoubridge, E.A. (1996). Random genetic drift in the female germline explains the rapid segregation of mammalian mitochondrial DNA. Nat. Genet. 14 (2): 146-151.

Jin, L., Macaubas, C., Hallmayer, J., Kimura, A., Mignot, E. (1996) Mutation rate varies among alleles at a microsatellite locus: Phylogenetic evidence. Proc. Natl. Acad. Sci. USA 93: 15285-15288.

Jobling, M.A., Heyer, E., Dieltjes, P., de Knijff, P. (1999). Y-chromosome-specific microsatellite mutation rates re-examined using a minisatellite, MSY1. Hum. Mol. Genet. 8: 2117-2120.

Jobling, M.A., Tyler-Smith, C. (2000). New uses for new haplotypes the human Y chromosome, disease and selection. Trends Genet. 16 (8): 356-362.

Jobling, M.A. (2001). Y-chromosomal SNP haplotype diversity in forensic analysis. Forensic Sci. Int. 118 (2-3): 158-162.

Jobling, M.A., Tyler-Smith, C. (2003) The human Y chromosome: an evolutionary marker comes of age. Nat Rev Genet. 4 (8): 598-612.

Johnson, A.A., Johnson, K.A. (2001). Exonuclease Proofreading by Human Mitochondrial DNA Polymerase. J. Biol. Chem. 276: 38097-38107.

Jorde, L.B., Bamshad, M.J., Watkins, W.S., Zenger, R., Fraley, A.E., Krakowiak, P.A., Carpenter, K.D., Soodyall, H., Jenkins, T., Rogers, A.R. (1995) Origins and affinities of modern humans: a comparison of mitochondrial and nuclear genetic data. Am. J. Hum. Genet. 57 (3): 523-38.

Jorde, L.B., Bamshad, M. (2000) Questioning evidence for recombination in human mitochondrial DNA. Science 288 (5473): 1931.

148 V- Bibliografia

Kaneda, H., Hayashi, J., Takahama, S., Taya, C., Lindahl, K.F., Yonekawa, H. (1995) Elimination of Paternal Mitochondrial DNA in Intraspecific Crosses During Early Mouse Embryogenesis. Proc. Natl. Acad. Sci. USA 92: 4542-4546.

Kayser, M., de Knijff, P., Dialtjes, P., Krawczak, M., Nagy, M., Zerjal, T., Pandya, A. (1997) Applications of microsatellite based Y chromosome haplotyping. Electrophoresis 18 1602-1607.

Kayser, M., Roewer, L., Hedman, M., Henke, L., Henke, J., Brauer, S., Kruger, C., Krawczak, M., Nagy, M., Dobosz, T., Szibor, R., de Knijff, P., Stoneking, M., Sajantila, A. (2000) Characteristics and frequency of germline mutations at microsatellite loci from the human Y chromosome, as revealed by direct observation in father/son pairs. Am. J. Hum. Genet. 66 (5): 1580-1588.

Kayser, M., Brauer S, Weiss G, Schiefenhovel W, Underhill P, Stoneking M (2001a) Independent histories of human Y chromosomes from Melanesia and Australia. Am. J. Hum. Genet. 68:173-190.

Kayser, M., Krawczak, M., Excoffier, L., Dieltjes, P., Corach, D., Pascali, V., Gehrig, C., Bernini, L.F., Jespersen, J., Bakker, E., Roewer, e de Knijff, P. (2001b) An extensive analysis of Y-chromosomal microsatellite haplotypes in globally dispersed human populations. Am. J. Hum. Genet. 68 (4): 990-1018.

Kayser, M., Brauer, S., Weiss, G., Schiefenhovel, W., Underhill, P., Shen, P., Oefner, P., Tommaseo-Ponzetta, M., Stoneking, M. (2003) Reduced Y-chromosome, but not mitochondrial DNA, diversity in human populations from West New Guinea. Am. J. Hum. Genet. 72:281-302.

Kimmel, M., Chakraborty, R., King, J. P., Bamshad, M., Watkins, W. S., Jorde, L. B. (1998) Signatures of population expansion in microsatellite repeat data. Genetics 148, 1921-1930.

149 V- Bibliografia

Kivisild, T., Villems, R., Jorde, L.B., Bamshad, M., Kumar, S., Hedrick, P., Dowling, T., Stoneking, M., Parsons, T.J., Irwin, J.A., Awadalla, P., Eyre-Walker, A., Maynard, S.J. (2000) Questioning evidence for recombination in human mitochondrial DNA. Science 288: 1931.

Klein, H.S. (1999) O Comércio Atlântico de Escravos. Quatro séculos de comércio esclavagista. Lisboa. Editora Replicação, Lda.

Knight, A., Underhill, P.A., Mortensen, H.M., Zhivotovsky, L.A., Lin, A.A., Henn, B.M., Louis. D., Ruhlen, M., Mountain, J.L. (2003) African Y chromosome and mtDNA divergence provides insight into the history of click languages. Curr. Biol. 13 (6): 464-473. de Knijff, P., Kayser, M., Caglia, A., Corach, D., Fretwell, N., Gehrig, C., Graziosi, G., Heidorn, F., Herrmann, S., Herzog, B., Hidding, M., Honda, K., Jobling, M., Krawczak, M., Leim, K., Meuser, S., Meyer, E., Oesterreich, W., Pandya, A., Parson, W., Penacino, G., Perez-Lezaun, A., Piccinini, A., Prinz, M., Roewer, L (1997) Chromosome Y microsatellites: population genetic and evolutionary aspects. Int J. Legal. Med. 110 (3): 134-49.

Krausz, C., Quintana-Murci, L., Rajpert-De Meyts, E., Jørgensen, N., Jobling, M.A., Rosser, Z.H., Skakkebaek, N.E., e McElreavey, K., (2001) Identification of a Y chromosome haplogroup associated with reduced sperm counts. Hum. Mol. Genet. 10: 1873-1877.

Krings, M., Salem, A. E., Bauer, K., Geisert, H., Malek, A. K., Chaix, L., Simon, C., Welsby, D., Di Rienzo, A., Utermann, G., Sajantila, A., Pääbo, S. & Stoneking, M. (1999) mtDNA analysis of Nile River Valley populations: A genetic corridor or a barrier to migration? Am. J. Hum. Genet. 64, 1166-76.

Kumar, S., Hedrick, P., Dowling, T., Stoneking, M (2000) Questioning evidence for recombination in human mitochondrial DNA. Science 288 (5473): 1931.

150 V- Bibliografia

Lansman, R.A., Clayton, D.A. (1975). Mitochondrial protein synthesis in mouse L- cells: effect of selective nicking of mitochondrial DNA. J. Mol. Biol. 99 (4): 777- 793.

Lareu, M. V., Phillips, C. P., Carracedo, A., Lincoln, P. J., Syndercombe Court, D. & Thomson, J. A. (1994) Investigation of the STR locus HUMTH01 using PCR and two electrophoresis formats: UK and Galician Caucasian population surveys and usefulness in paternity investigations. Forensic Sci. Int. 66, 41-52.

Larsson, N.G., Clayton, D.A. (1995) Molecular genetic aspects of human mitochondrial disorders.Annu Rev Genet. 29: 151-178.

Lightowlers, RN, PF Chinnery, DM Turnbull, and N Howell (1997) Mammalian mitochondrial genetics: heredity, heteroplasmy and disease. Trends Genet. 13 (11): 450-455.

Lorenzino, G.A. (1998). The Angolar Creole Portuguese of São Tomé: Its Grammar and Sociolinguistic History. A dissertation submitted to the Graduate Faculty in Linguistics in partial fulfillment of the requirements for the degree of Doctor of Philisophy, The City University of New York.

Luís, J.R., Caeiro, B.A. (1995) Application of two STRs (VWF and hTPO) to human population profiling. A survey in . Hum. Biol. 67 (5): 789-795.

Macaulay, V., Richards, M., Hickey, E., Vega, E., Cruciani, F., Guida, V., Scozzari, R., Bonné-Tamir, B., Sykes, B., Torroni, A. (1999) The emerging tree of West Eurasian mtDNAs: a synthesis of control-region sequences and RFLPs. Am. J. Hum. Genet. 64, 232-49.

Manco, L., Trovoada, M.J., Abade, A., Amorim, A. (1999) Distribution of AMY2 polymorphism in S.Tomé and Príncipe (West Africa). Int. J. Anthr. 14 (4): 255-258.

151 V- Bibliografia

Marchington, D.R., Hartshorne, G.M., Barlow, D., Poulton, J. (1997) Homopolymeric tract heteroplasmy in mtDNA from tissues and single oocytes: support for a genetic bottleneck. Am. J. Hum. Genet.; 60 (2): 408-416.

Mateu, E., Comas, D., Calafell, F., Perez-Lezaun, A., Abade, A., Bertranpetit, J. (1997) A tale of two islands: population history and mitochondrial DNA sequence variation of Bioko and São Tomé, Gulf of Guinea. Ann. Hum. Genet. 61, 507-518.

Nachman, M.W., Crowell, S.L. (2000) Estimate of the Mutation Rate per Nucleotide in Humans. Genetics. 156: 297-304.

Nascimento, A. (2002) Desterro e Contrato: Moçambicanos a caminho de S. Tomé e Príncipe (Anos 1940 a 1960). Arquivo Histórico de Moçambique. Colecção Estudos, 19. 195 pgs. Maputo.

Neves, C.A. (1989) São Tomé e Príncipe na segunda metade do SéculoXVIII. Faculdade de Ciências Sociais e Humanas. Universidade Nova de Lisboa. Instituto de História de Além-Mar.

Oliveira, P.M.M. (2001) Caracterização genética de populações Açorianas com base no estudo de polimorfismos do cromossoma Y. Dissertação de Mestrado em Evolução Humana. Faculdade de Ciências da Universidade de Coimbra.

Oota, H., Settheetham-Ishida, W., Tiwawech, D., Ishida, T., Stoneking, M. (2001) Human mtDNA and Y-chromosome variation is correlated with matrilocal versus patrilocal residence. Nat. Genet. 29 (1): 20-21.

Page, R.D.M. (1996). Treeview: An application to display phylogenetic trees on personal computers. Computer Applications in the Biosciences. 12: 357-358.

Parsons, T.J., Muniec, D.S., Sullivan, K., Woodyatt, N., Alliston-Greiner, R. Wilson, M.R., Berry, D.L., Holland, K.A., Weedn, V.W., Gill, P., Holland, M.M. (1997). A

152 V- Bibliografia

high observed substitution rate in the human mitochondrial DNA control region. Nat. Genet. 15 (4): 363-368.

Pereira, L., Gusmão, L., Prata, M.J., Mota, P., Trovoada, M.J., Amorim, A. (2000a) Variation in STR loci of the human myelin basic protein gene: north Portugal and São Tomé e Príncipe. Hum Biol 72 (3): 481-7.

Pereira, L., Prata, M.J., Amorim, A. (2000b) Diversity of mtDNA lineages in Portugal: not a genetic edge of European variation. Ann Hum Genet. 64 (Pt 6): 491-506.

Pereira, L., Prata, M.J., Jobling, M.A., Amorim, A, (2000c). Analysis of the Y- chromosome and mitochondrial DNA pools in Portugal. In Renfrew C, Boyle K (2000) Archaeogenetics: DNA and the population prehistory of Europe. McDonald Institute for Archaeological Research, University of Cambridge. Cambridge.

Pereira, L., Macaulay, V., Torroni, A., Scozzari, R., Prata, M.J., Amorim, A. (2001) Prehistoric and historic traces in the mtDNA of Mozambique: insights into the Bantu expansions and the slave trade. Ann Hum Genet. 65 (Pt 5): 439-58.

Pereira, L., Gusmão, L., Alves, C., Amorim, A., Prata, M.J. (2002). Bantu and European Y-lineages in Sub-Saharan Africa. Ann. Hum. Genet. 66 (Pt 5-6): 369-378.

Perez-Lezaun, A., Calafell, F., Seielstad, M., Mateu, E., Comas, D., Bosch, E., Bertranpetit, J. (1997) Population genetics of Y-chromosome short tandem repeats in humans. J. Mol. Evol. 45, 265-270.

Perez-Lezaun, A., Calafell, F., Comas, D., Mateu, E., Bosch, E., Martinez-Arias, R., Clarimon, J., Fiori, G., Luiselli, D., Facchini, F., Pettener, D., Bertranpetit, J. (1999) Sex-specific migration patterns in Central Asian populations, revealed by analysis of Y-chromosome short tandem repeats and mtDNA. Am. J. Hum. Genet. 65 (1): 208- 219.

153 V- Bibliografia

Pinto, F.L.V., Carreira, A. (1979) Portuguese participation in the slave trade: opposing forces, trends of opinion within Portuguese society: effects on Portugal's socio- economic development. In: The African slave trade from the fifteenth to the nineteenth century. The general history of Africa. Studies and documents 2. pp. 119– 147. Unesco.

Poulton, J., Macaulay, V, Marchington, D.R. (1998) Mitochondrial genetics '98 is the bottleneck cracked? Am. J. Hum. Genet. 62 (4): 752-7.

Prata, M.J., Gusmão, L., Silva, F., Amorim, A., Trovoada, M.J., Santos, M.T. (1997) Population Genetics of the STRs CD4, MBP (locus B), THO1, TP53, TPO and VWA31/A in S.Tomé e Príncipe. Proceedings of ISFH Symposium on DNA polymorphisms, 1996, Japan: 420-423. Pritchard, J.K., Seielstad, M.T., Perez-Lezaun, A., Feldman, M.W. (1999) Population growth of human Y chromosomes: a study of Y chromosome microsatellites. Mol. Biol. Evol. 16: 1791-1798.

Pritchard, J.K, Stephens, M., Donnelly, P. (2000) Inference of Population Structure Using Multilocus Genotype Data. Genetics. 155: 945 - 959.

Quintana-Murci, L., Fellous, M. (2001) The Human Y Chromosome: The Biological Role of a "Functional Wasteland". J. Biomed. Biotechnol. 1 (1): 18-24.

Rando, J.C., Pinto, F., Gonzalez, A.M., Hernandez, M., Larruga, J.M., Cabrera, V.M., Bandelt, H.J. (1998) Mitochondrial DNA analysis of northwest African populations reveals genetic exchanges with European, near-eastern, and sub-Saharan populations. Ann Hum Genet 62 (Pt 6): 531-550.

Relethford, J.H. (1998) Mitochondrial DNA and ancient population growth. Am. J. Phys. Anthropol. 105 (1): 1-7.

Richards, M., Macaulay, V., Hickey, E., Vega, E., Sykes, B., Guida, V., Rengo, C., Sellitto, D., Cruciani, F., Kivisild, T., Villems, R., Thomas, M., Rychkov, S.,

154 V- Bibliografia

Rychkov, O., Rychkov, Y., Golge, M., Dimitrov, D., Hill, E., Bradley, D., Romano, V., Cali, F., Vona, G., Demaine, A., Papiha, S., Triantaphyllidis, C., Stefanescu, G., Hatina, J., Belledi, M., Di Rienzo, A., Novelletto, A., Oppenheim, A., Norby, S., Al- Zaheri, N., Santachiara-Benerecetti, S., Scozari, R., Torroni, A., Bandelt, H.J. (2000) Tracing European founder lineages in the Near Eastern mtDNA pool. Am. J. Hum. Genet. 67 (5): 1251-1276.

Richards, M., Rengo, C., Cruciani, F., Gratrix, F., Wilson, J.F., Scozzari, R., Macaulay, V. Torroni, A. (2003) Extensive female-mediated gene flow from sub-Saharan Africa into near eastern Arab populations. Am. J. Hum. Genet. 72 (4): 1058-1064.

Rosser, Z.H., Zerjal, T., Hurles, M.E., Adojaan, M., Alavantic, D., Amorim, A., Amos, W., Armenteros, M., Arroyo, E., Barbujani, G., Beckman, G., Beckman, L., Bertranpetit, J., Bosch, E., Bradley, D.G., Brede, G., Cooper, G., Corte-Real, H.B., de Knijff, P., Decorte, R., Dubrova, Y.E., Evgrafov, O., Gilissen, A., Glisic, S., Golge, M., Hill, E.W., Jeziorowska, A., Kalaydjieva, L., Kayser, M., Kivisild, T., Kravchenko, S.A., Krumina, A., Kucinskas, V., Lavinha, J., Livshits, L.A., Malaspina, P., Maria, S., McElreavey, K., Meitinger, T.A., Mikelsaar, A.V., Mitchell, R.J., Nafa, K., Nicholson, J., Norby, S., Pandya, A., Parik, J., Patsalis, P.C., Pereira, L., Peterlin, B., Pielberg, G., Prata, M.J., Previdere, C., Roewer, L., Rootsi, S., Rubinsztein, D.C., Saillard, J., Santos, F.R., Stefanescu, G., Sykes, B.C., Tolun, A., Villems, R., Tyler-Smith, C., Jobling, M.A. (2000) Y-chromosomal diversity in Europe is clinal and influenced primarily by geography, rather than by language. Am. J. Hum. Genet. 67 (6): 1526-1543.

Rozen, S, Skaletsky, H, Marszalek, JD, Minx, PJ, Cordum, HS, Waterston, RH, Wilson, R.K., e Page, D.C. (2003) Abundant gene conversion between arms of palindromes in human and ape Y chromosomes. Nature 423 (6942): 873-876.

Saitou, N., Nei, M. (1987) The neighbour-Joining method: a new method for reconstructing phylogenetic tree. Mol. Biol. Evol. 4: 406.

155 V- Bibliografia

Salas, A., Richards, M., De la Fe, T., Lareu, M.V., Sobrino, B., Sanchez-Diz, P., Macaulay, V., Carracedo, A. (2002) The making of the African mtDNA landscape. Am. J. Hum. Genet. 71 (5): 1082-1111.

Sánchez-Diz, P. (2003) Polimorfismos de cromosoma Y: aspectos genético- poblacionales y evolutivos y aplicaciones forenses. Tesis doctoral. Universidade de Santiago de Compostela.

Santibáñez-Koref, M.F., Rathithevy Gangeswaran, and John M. Hancock (2001) A Relationship Between Lengths of Microsatellites and Nearby Substitution Rates in Mammalian Genomes. Mol. Biol. Evol. 18: 2119-2123.

Santos, M.F., Amorim, A., Manco. L., Trovoada, M.J. (1996) Plasma protein markers in São Tomé e Príncipe. Adv Forens Haemogenet 6: 444-445.

Santos, C., Lima, M., Montiel, R., Angles, N., Pires, L., Abade, A., Aluja, M.P. (2003) Genetic structure and origin of peopling in the Azores islands (Portugal): the view from mtDNA. Ann. Hum. Genet. 67(Pt 5): 433-456.

Schneider, S., Excoffier, L. (1999) Estimation of past demographic parameters from the distribution of pairwise differences when themutation rates vary among sites: application to human mitochondrial DNA. Genetics. 152 (3),1079 -1089.

Schneider, S; Roessli, D., Excoffier, L. (2000) ARLEQUIN: A software for population genetics data analysis. Ver 2.000. Genetics and Biometry . Lab, Dept. of Anthropology, University of Geneva.

Schwartz, M., Vissing, J. (2003) New patterns of inheritance in mitochondrial disease. Biochem. Biophys. Res. Commun. 310 (2): 247-251.

Scozzari, R., Cruciani, F., Santolamazza, P., Malaspina, P., Torroni, A., Sellitto, D., Arredi, B., Destro-Bisol, G., De Stefano, G., Rickards, O., Martinez-Labarga, Modiano, D., Biondi, G., Moral, P., Olckers, A., Wallace, D.C., Novelletto. (1999)

156 V- Bibliografia

A. Combined use of biallelic and microsatellite Y-chromosome polymorphisms to infer affinities among African populations. Am. J. Hum. Genet.. 65 (3): 829-846.

Scozzari, R., Cruciani, F., Pangrazio, A., Santolamazza, P., Vona, G., Moral, P., Latini, V., Varesi, L., Memmi, M.M., Romano, V., De Leo, G., Gennarelli, M., Jaruzelska, J., Villems, R., Parik, J., Macaulay, V., Torroni, A. (2001) Human Y-chromosome variation in the western Mediterranean area: implications for the peopling of the region. Hum. Immunol. 62 (9): 871-84.

Seibert, G. (1998) A Questão da Origem dos Angolares de São Tomé. Brief Papers nº5/98, CEsA, Lisboa.

Seielstad, M.T., Hebert, J.M., Lin, A.A., Underhill, P.A., Ibrahim, M., Vollrath, D., Cavalli- Sforza, L.L. (1994) Construction of human Y-chromosomal haplotypes using a new polymorphic A to G transition. Hum. Mol. Genet. 3: 2159 - 2161.

Seielstad, M.T., Minch, E., Cavalli-Sforza, L.L. (1998). Genetic evidence for a higher female migration rate in humans. Nat. Genet. 20 (3): 278-280.

Seixas, S., Trovoada, M.J., Rocha, J. (1999) Haplotype analysis of the apolipoprotein E and apolipoprotein C1 loci in Portugal and São Tomé e Príncipe (Gulf of Guinea): linkage disequilibrium evidence that APOE*4 is the ancestral APOE allele. Hum. Biol. 71 (6): 1001-1008.

Semino, O., Passarino, G., Brega, A., Fellous, M., Santachiara-Benerecetti, A.S. (1996) A view of the demic diffusion in Europe through two Y chromosome- specific markers. Am. J. Hum. Genet. 59 (4): 964-968.

Semino, O., Santachiara-Benerecetti, A.S., Falaschi, F., Cavalli-Sforza, L.L., Underhill, P.A.( 2002) Ethiopians and Khoisan share the deepest clades of the human Y- chromosome phylogeny. Am. J. Hum. Genet. 70 (1): 265-268.

157 V- Bibliografia

Shadel, G.S., Clayton, D.A. (1997) Mitochondrial DNA maintenance in vertebrates. Annu. Rev. Biochem. 66: 409-435.

Shields, G.F., Schmiechen, A.M., Frazier, B.L., Redd, A., Voevoda, M.I., Reed, J.K., Ward, R.H. (1993) mtDNA sequences suggest a recent evolutionary divergence for Beringian and northern North American populations. Am. J. Hum. Genet. 53 (3): 549-562

Sigurðardóttir, S., Helgason, A., Gulcher, J.R., Stefansson, K., Donnelly, P. (2000) The mutation rate in the human mtDNA control region. Am J Hum Genet 66 :1599–1609

Skaletsky, H., Kuroda-Kawaguchi, T., Minx, P.J., Cordum, H.S., Hillier, L., Brown, L.G., Repping, S., Pyntikova, T., Ali, J., Bieri, T., Chinwalla, A., Delehaunty, A., Delehaunty, K., Du, H., Fewell, G., Fulton, L., Fulton, R., Graves, T., Hou, S.F., Latrielle, P., Leonard, S., Mardis, E., Maupin, R., McPherson, J., Miner, T., Nash, W., Nguyen, C., Ozersky, P., Pepin, K., Rock, S., Rohlfing, T., Scott, K., Schultz, B., Strong, C., Tin-Wollam, A., Yang, S.P., Waterston, R.H., Wilson, R.K., Rozen, S., Page, D.C. (2003) The male-specific region of the human Y chromosome is a mosaic of discrete sequence classes. Nature. 423 (6942): 825-837.

Smith, G.P. (1976) Evolution of repeated DNA sequences by unequal crossover. Science 191 (4227): 528-535.

Soodyall, H., Vigilant, L., Hill, A.V., Stoneking, M., Jenkins, T. (1996) mtDNA control-region sequence variation suggests multiple independent origins of an "Asian-specific" 9-bp deletion in sub-Saharan Africans. Am. J. Hum. Genet. 58:595- 608.

Sphuhler, J.N. (1988) Evolution of mitochondrial DNA in monkeys, apes, and humans. Y. Phys. Anthropol. 31: 15-48.

Stephan, W. (1989) Tandem-repetitive noncoding DNA: forms and forces. Mol. Biol. Evol. 6: 198-212.

158 V- Bibliografia

Sutovsky, P., Moreno, R.D., Ramalho-Santos, J., Dominko, T., Simerly, C., Schatten, G. (2000) Ubiquitinated Sperm Mitochondria, Selective Proteolysis, and the Regulation of Mitochondrial Inheritance in Mammalian Embryos. Biol. Reprod. 63: 582-590.

Sykes, B., Irven, C. (2000) Surnames and the Y chromosome. Am. J. Hum. Genet. 66 (4): 1417-1419.

Tang, H., Siegmund, D.O., Shen, P., Oefner, P.J., Feldman, M.W. (2002) Frequentist Estimation of Coalescence Times From Nucleotide Sequence Data Using a Tree- Based Partition. Genetics 161: 447-459.

Tautz, D., Schlötterer (1994) Simple sequences. Curr. Opin. Genet. 4 (6): 832-837.

Tenreiro, F. (1961) A ilha de São Tomé. Memórias da Junta de Investigações do Ultramar. Lisboa.

Thomas, M,G., Parfitt, T., Weiss, D.A., Skorecki, K., Wilson, J.F., le Roux, M., Bradman, N., Goldstein, D.B. (2000) Y chromosomes traveling south: the cohen modal haplotype and the origins of the Lemba--the "Black Jews of Southern Africa". Am. J. Hum. Genet. 66 (2): 674 - 686.

Tilford, C.A., Kuroda-Kawaguchi, T., Skaletsky, H., Rozen, S., Brown, L.G., Rosenberg, M., McPherson, J.D., Wylie, K., Sekhon, M., Kucaba, T.A., Waterston, R.H., Page, D.C. (2001). A physical map of the human Y chromosome. Nature 409 (6822): 943-945.

Tishkoff, S.A., Williams, S.M. (2002). Genetic analysis of African populations: human evolution and complex disease. Nat. Rev. Genet. 3 (8): 611-621.

Tomás, G., Seco, L., Seixas, S., Faustino, P., Lavinha, J., Rocha, J. (2002) The peopling of São Tomé (Gulf of Guinea): origins of slave settlers and admixture with the Portuguese. Hum. Biol. 74 (3): 397-411.

159 V- Bibliografia

Thomson, R., Pritchard, J.K., Shen, P., Oefner, P.J., Feldman M.W. (2000). Recent common ancestry of human Y chromosomes: Evidence from DNA sequence data Proc. Natl. Acad. Sci. USA 97: 7360 - 7365.

Torroni, A., D'Urbano, L., Rengo, C., Scozzari, R., Sbracia, M., Manna, C., Cavazzini, C. e Sellitto, D. (1998) Intracytoplasmic injection of spermatozoa does not appear to alter the mode of mitochondrial DNA inheritance. Hum. Reprod. 13: 1747-1749.

Trovoada, M.J., Manco, L., Amorim, A., Abade, A., Prata, M.J., Santos, M.T. (2001) Polimorfismos Genéticos de ESD, GLO1, GPT e PGM1 em São Tomé e Príncipe. Antropologia Portuguesa 18: 143-150.

Underhill, P.A., Shen, P., Lin, A.A., Jin, L., Passarino, G., Yang, W.H., Kauffman, E., Bonne-Tamir, B., Bertranpetit, J., Francalacci, P., Ibrahim, M., Jenkins, T., Kidd, J.R., Mehdi, S.Q., Seielstad, M.T., Wells, R.S., Piazza, A., Davis, R.W., Feldman, M.W., Cavalli-Sforza, L.L., e Oefner, P.J. (2000) Y chromosome sequence variation and the history of human populations. Nat. Genet. 26 (3): 358-361.

Underhill, P.A., Passarino, G., Lin, A.A., Shen, P., Lahr, M.M., Foley, R.A., Oefner, P.J. e Cavalli-Sforza, L.L. (2001) The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations. Ann. Hum. Genet. 65 (Pt 1): 43-62.

Valdes, AM, Slatkin, M, Freimer, NB (1993) Allele Frequencies at Microsatellite Loci: The Stepwise Mutation Model Revisited. Genetics. 133: 737-749.

Veitia, R., Ion, A., Barbaux, S., Jobling, MA., Souleyreau, N., Ennis, K., Ostrer, H., Tosi, M., Meo, T., Chibani, J., Fellous, M., McElreavey K. (1997) Mutations and sequence variants in the testis-determining region of the Y chromosome in individuals with a 46,XY female phenotype. Hum. Genet. 99 (5): 648-52.

160 V- Bibliografia

Vigilant, L., Pennington, R., Harpending, H., Kocher, T.D., Wilson, A.C. (1989) Mitochondrial DNA sequences in single hairs from a southern African population. Proc. Natl. Acad. Sci. USA. 86 (23): 9350-9354.

Vigilant, L., Stoneking, M., Harpending, H., Hawkes, K., Wilson, A.C. (1991) African populations and the evolution of human mitochondrial DNA. Science 253 (5027): 1503-1507.

Wakeley, J. (1993) Substitution rate variation among sites in hypervariable region 1 of human mitochondrial DNA. J. Mol. Evol. 37 (6): 613-23.

Wallace, D.C. (1994) Mitochondrial DNA sequence variation in human evolution and disease. Proc. Nat. Acad. Sci. USA. 91: 8739-8746.

Watson, E., Bauer, K., Aman, R., Weiss, G., von Haeseler, A., Paabo, S. (1996) mtDNA sequence diversity in Africa. Am. J. Hum. Genet. 59 (2): 437-44.

Watson, E., Forster, P., Richards, M., Bandelt, H.J. (1997) Mitochondrial footprints of human expansions in Africa. Am. J. Hum. Genet. 61 (3): 691-704.

Zerjal, T., Dashnyam, B., Pandya, A., Kayser, M., Roewer, L., Santos, F.R., Schiefenhovel, W., Fretwell, N., Jobling, M.A., Harihara, S., Shimizu, K., Semjidmaa, D., Sajantila, A., Salo, P., Crawford, M.H., Ginter, E.K., Evgrafov, O.V., Tyler-Smith, C. (1997) Genetic relationships of Asians and Northern Europeans, revealed by Y-chromosomal DNA analysis. Am. J. Hum. Genet. (60 (5): 1174-83.

161

VI – APÊNDICES ______

VI-Apêndices

Apêndice 1 - Frequências de haplogrupos definidos por marcadores bialélicos utilizadas na análise de componentes principais

Haplogrupo

População K J P CR*(xDE,J,K) E*(xE3a) E3a B2a B2b B*(xB2a,b) A Angolares(1) 0.089 0.036 0.036 0.786 0.054 Forros(1) 0.179 0.051 0.103 0.667 Tongas(1) 0.091 0.091 0.091 0.591 0.023 0.091 0.023 Árabes(2) 0.200 0.020 0.020 0.760 Berberes(2) 0.060 0.050 0.820 0.050 0.030 Biaka(3) 0.650 0.050 0.300 Cabo Verde(4) 0.100 0.109 0.229 0.095 0.284 0.159 0.025 Galiza(5) 0.076 0.151 0.566 0.094 0.113 0.000 Guiné(4) 0.227 0.713 0.060 Maghrebis(5) 0.050 0.250 0.050 0.600 0.050 Moçambique(6) 0.017 0.086 0.749 0.096 0.046 0.003 0.003 Portugal(7) 0.050 0.090 0.590 0.190 0.080 Senegal(8) 0.014 0.172 0.813 Ju, Ju|´hoansi (3) 0.004 0.103 0.179 0.282 0.436 Khwe(9) 0.350 0.540 0.120 (1)- Este trabalho; (2)- Scozzari et al., 2001; (3)- Underhill et al., 2000; (4)- Gonçalves et al., 2003; (5)- Brion et al., 2003; (6) Sánchez-Diz, 2003; (7)- Sandra Beleza, comunicação pessoal; (8)- Semino et al., 2002; (9)- Cruciani et al., 2002.

165

VI-Apêndices

Apêndice 2 - Haplótipos de STRs dentro de haplogrupos definidos por marcadores bialélicos do Y em amostras de Angolares, Forros e Tongas.

Haplogrupo DYS19 DYS389I DYS389II DYS390 DYS391 DYS392 DYS393 An Fo To

E3a 12 10 18 21 11 11 13 1 13 10 18 21 10 11 13 1 15 9 17 21 10 11 14 1 15 10 16 21 10 11 14 1 15 10 17 21 10 10 13 1 15 10 17 21 10 11 12 1 15 10 17 21 10 11 13 1 15 10 17 21 10 11 14 1 2 15 10 17 21 10 11 15 2 2 15 10 17 21 11 11 13 2 15 10 17 21 12 11 13 1 15 10 17 22 10 11 15 2 15 10 18 21 10 11 13 1 1 2 15 10 19 21 10 11 13 1 1 15 10 18 21 10 11 14 1 15 10 18 21 11 11 13 4 4 4 15 11 17 21 10 11 13 1 1 15 11 17 21 10 11 14 1 15 11 17 21 10 11 15 1 15 11 17 22 10 11 13 1 16 9 17 21 10 11 14 1 16 9 18 22 11 11 13 1 16 10 16 21 10 11 15 1 16 10 16 21 11 11 12 1 16 10 17 21 10 11 13 1 16 10 17 21 10 11 14 2 16 10 17 21 10 11 15 1 16 10 18 21 11 11 13 1 16 11 18 21 10 11 13 1 17 10 17 21 10 11 14 2 2 17 10 17 21 10 11 17 1 17 11 17 21 10 11 14 2 17 11 17 21 10 11 15 1 18 11 17 21 10 11 14 1 B*(xB2a,b) 14 9 17 22 11 11 14 1 16 10 18 20 11 12 13 1 B2a1 15 11 18 25 10 11 13 1

167 V- Apêndices

Apêndice 2 (continuação)

B2b 15 8 15 23 10 12 13 2 E*(xE3a) 13 9 17 24 10 11 13 1 13 10 17 24 10 11 13 1 13 10 17 24 11 11 13 1 13 10 18 24 10 11 12 1 14 10 18 24 10 11 13 1 14 11 17 23 9 11 13 1 15 9 18 23 12 11 14 1 16 10 16 24 10 11 13 1 P*(xR1a,R1b3f) 14 10 16 24 10 13 13 1 14 10 16 24 10 13 14 1 14 10 16 24 11 13 13 1 14 10 16 26 11 13 13 1 14 11 17 24 11 13 13 1 15 9 15 24 11 13 13 1 15 10 16 24 10 13 13 1 16 10 18 25 11 11 14 1 CR*(xDE,J,K) 14 9 16 24 11 13 13 1 14 11 17 23 10 11 12 2 15 9 16 22 10 11 13 1 17 10 18 23 10 14 13 1 16 32 40

168

Apêndice 3 - Frequência de haplogrupos definidos por mtDNA em amostras de Angolares, Forros e Tongas.

HVS-I HVS-II Haplogrupo Haplogrupo Angolares Forros Tongas 1 148 172 187 188C/G 189 223 230 311 320 93 152 189 204 207 236 247 263 315.1 L1a 1 129 148 168 172 187 188C/G 189 209 213 223 230* 93 185 189 236 247 263 309.1 315.1 L1a1 1 93 129 148 168 172 187 188C/G 189 223 230 278 293 311 320 93 95A/C 185 189 236 247 263 315.1 L1a1a 2 129 148 168 172 187 188C/G 189 223 230 278 293 311 320 93 95A/C 185 189 236 247 263 309.1 315.1 320 L1a1a 1 1 129 148 168 172 187 188C/G 189 223 230 311 320 93 185 189 236 247 263 315.1 L1a1a 2 1 126 187 189 223 264 270 278 311 73 152 182 185G/T 195 247 263 315.1 357 L1b 3 1 111 126 187 189 223 239 270 278 293 311 73 146 152 182 185G/T 189 247 263 315.1 357 L1b1 1 111 187 189 223 239 270 278 293 311 73 146 152 182 185G/T 189 247 263 315.1 357 L1b1 1 114C/A 126 189 223 264 270 274 278 293 311 73 152 182 185G/T 195 247 263 309.1 315.1 357 L1b1 1 114C/G 126 187 189 223 264 270 278 293 311 73 152 182 185G/T 195 247 263 315.1 357 L1b1 1 126 187 189 223 264 270 278 293 311 73 152 182 185G/T 189 195 247 263 309.1 315.1 357 L1b1 2 126 187 189 223 264 270 278 293 311 73 152 182 185G/T 189 195 247DelG 263 309.1 315.1 357 L1b1 1 129 163 187 189 209 223 278 293 294 298 311 360 73 152 182 186C/A 189A/C 194 198 247DelG 263 309.1 315.1 316 L1c1 1 129 163 187 189 223 278 293 294 304 311 360 73 151 152 182 186C/A 189A/C 195 247 263 315.1 316 L1c1 1 129 163 187 189 223 278 293 294 304 311 360 73 151 152 182 186C/A 189A/C 195 198 247 263 315.1 316 L1c1 1 129 187 189 223 278 293 294 311 360 73 152 186C/A 189 195 247 250T/G* L1c1 1 93 129 187 189 223 263 278 293 294 311 360 368 73 151 152 182 186C/A 189A/C 195 247 263 297 315.1 316 L1c1 1 93 129 187 189 223 263 278 293 294 311 360 368 73 182 186C/A 189A/C 195 247 263 297 315.1 316 L1c1 2 129 187 189 223 274 278 293 294 311 360 73 93 95A/C 152 182 186C/A 189A/C 195 236 247 263 297 315.1 316 L1c1a 1 129 187 189 223 274 278 293 294 311 360 73 95A/C 152 182 186C/A 189A/C 195 236 247 263 297 315.1 316 L1c1a 1 129 187 189 214 234 249 258 274 278 293 294 311 73 151 152 186C/A 189A/C 195 247 263 297 315.1 316 L1c1a1 1 51 129 187 189 214 234 249 258 274 278 293 294 311 73 186C/A 189A/C 195 247 263 297 315.1 316 L1c1a1 1 129 163 187 189 265A/C 278 286C/G 294 311 320 360 73 151 152 186C/A 189A/C 195 198 247 263 297 315.1 316 L1c2 1 129 187 189 214 223 265A/C 278 286C/A 291 294 311 360 73 151 152 182 186C/A 189A/C 195 198 247 263 297 315.1 316 L1c2 2 129 187 189 223 265A/C 278 286C/G 294 311 343A/T 360 73 151 152 182 186C/A 189A/C 195 198 247 263 297 315.1 316 L1c2 3 129 187 189 223 265A/C 286C/A 292 294 311 360 73 152 182 186C/A 189A/C 195 198 247 263 297 309.1 315.1 316 L1c2 1 172 187 189 223 265A/C 278 286C/G 294 311 360 73 151 152 182 186C/A 189A/C 195 198 247 263 297 309.1 315.1 316 L1c2 2 129 183A/C 189 215 223 278 294 311 360 73 152 182 186C/A 189A/C 247 263 309.1 315.1 316 L1c3

Apêndice 3 (continuação)

1 (42) 129 166 187 189 223 254 278 311 73 146 152 182 195 198 247 263 315.1 L1e 1 111 223 278 294 309 311 390 73 152 195 315.1 L2a1 1 129 223 278 294 309 390 73 143 146 152 195 263 315.1 L2a1 1 189 192 223 239C/A 278 279C/A 294 309* 73 195 263 315.1 L2a1 1 189 192 223 278 294 309 390 73 143 146 152 195 263 309.1 315.1 L2a1 2 189 192 223 278 294 309 390 73 146 152 195 263 309.1 315.1 L2a1 1 193 213 223 239 278 294 309 390 73 146 152 195 263 309 309.1 315.1 L2a1 1 223 278 294 309 390 73 143 146 152 195 198 263 309.1 315.1 L2a1 2 223 278 294 309 390 73 146 152 195 263 309.1 315.1 L2a1 2 223 278 286 294 309 390 73 146 152 195 263 309.1 315.1 L2a1a 2 114C/A 129 213 223 278 355 362 390 73 150 152 182 195 198 204 249DelA 263 309.1 315.1 L2b1 1 114C/A 213 223 278 362 390 73 150 152 182 195 198 204 263 315.1 L2b1 2 81 93 175 223 278 320 390 73 146 150 182 195 198 263 309.1 315.1 325 L2c 1 81 93 175 223 278 320 390 73 93 146 150 182 195 198 263 309.1 315.1 325 L2c 1 114 223 278 318 390 73 93 146 150 152 182 195 198 263 309.1 315.1 325 L2c1 1 223 264 278 390 73 146 150 152 182 195 198 263 309.1 315.1 325 L2c2 1 84 93 220 223 264 278 311 390 73 93 146 150 152 182 195 198 263 315.1 325 L2c2 1 93 223 264 278 390 73 93 146 150 152 182 195 198 263 309.1 315.1 325 L2c2 1 111C/A 145 184 223 239 278 292 355 390 73 146 150 152 182 263 315.1 L2d2 1 1 223 290 355 73 150 152 235 263 309.1 315.1 L3* 1 223 278 362 73 263 315.1 L3b 1 124 183A/C 189 214 223 278 73 263 309.1 315.1 L3b1 2 124 223 278 362 73 263 315.1 L3b1 1 124 223 278 311 362 73 257 263 309.1 315.1 L3b2 1 124 223 311 73 101G/C 150 152 263 309.1 315.1 L3d 3 124 223 311 73 152 200 263 309.1 315.1 L3d 1 124 209 223 319 362 73 152 263 315.1 (385) L3d1 1 124 223 300 319 73 152 263 315.1 L3d1 1 104 129 183A/C 189 223 260 327 73 150 263 309.1 315.1 L3e1* 8 172 223 327 (399) 73 150 189 200 207 263 309.1 315.1 L3e1* 1 207 223 327 73 150 183 189 200 263 309.1 315.1 L3e1* 1 223 325DelT 327 73 150 185 189 209 263 309.1 315.1 L3e1* 1 185 209 223 327 73 150 152 189 195 200 263 309.1 315.1 L3e1a 1 223 258A/T 320 73 150 189 195 315.1 L3e2a

Apêndice 3 (continuação)

1 223 320 73 150 195 198 263 309.1 315.1 L3e2a 1 2 223 320 73 150 195 198 263 315.1 L3e2a 1 126 172 182A/C 183A/C 189 223 320 73 150 195 263 315.1 L3e2b 1 1 223 265A/T 73 150 195 263 315.1 L3e3 1 51 223 264 73 150 263 309.1 315.1 L3e4 1 51 223 264 299 73 150 263 309.1 315.1 L3e4 1 129 209 223 311 73 189 200 263 315.1 L3f 1 209 223 311 73 150 189 200 263 309.1 315.1 L3f 1 209 215 223 256 292 311 73 185 189 195 263 309.1 315.1 L3f1

ARTIGO 1

ARTIGO 2

ARTIGO 3