El impacto de la migración en la constitución genética de las poblaciones latinoamericanas (en portugués), Universidad de Brasilia.
1. UNIVERSIDADE DE BRASÍLIA - UnB
INSTITUTO DE CIÊNCIAS BIOLÓGICAS
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOLOGIA ANIMAL
O IMPACTO DAS MIGRAÇÕES NA CONSTITUIÇÃO
GENÉTICA DE POPULAÇÕES LATINO-AMERICANAS
Neide Maria de Oliveira Godinho
Brasília
2008
2. UNIVERSIDADE DE BRASÍLIA - UnB
INSTITUTO DE CIÊNCIAS BIOLÓGICAS
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOLOGIA ANIMAL
O IMPACTO DAS MIGRAÇÕES NA CONSTITUIÇÃO
GENÉTICA DE POPULAÇÕES LATINO-AMERICANAS
Tese apresentada ao Instituto de Ciências
Biológicas da Universidade de Brasília
como requisito parcial para a obtenção do
título de Doutor em Ciências Biológicas,
área de concentração: Genética
Neide Maria de Oliveira Godinho
Orientadora: Profa
. Dra
. Silviene Fabiana de Oliveira
Brasília
2008
3. Dedico a todas as pessoas
de minha família.
De modo especial:
Meu pai e minha mãe
Meu esposo e
minha querida filha SOPHIA,
que renovou e transformou
minha vida para melhor.
4. Agradecimentos
Agradeço a Deus pela oportunidade de ter convivido com pessoas maravilhosas
e muito melhores que eu, sem as quais eu não teria a oportunidade de crescer como
pessoa, de aprender. A cada um que fez e faz parte da minha história, que unidas
contribuíram para minha formação pessoal e profissional.
Agradeço a minha orientadora, Professora Silviene Fabiana de Oliveira, que
indiscutivelmente me ajudou a ser uma pessoa melhor. Obrigada pela confiança e pelo
vínculo de amizade que se formou nesses últimos anos.
À Polícia Técnico-Científica da Secretaria de Segurança Pública do Estado de
Goiás pelo investimento em formação de servidor de seu quadro.
Agradeço aos professores do Instituto de Ciências Biológicas pela contribuição
no meu aprendizado.
Agradeço ao Prof. Aguinaldo Luiz Simões e Marcelo R. Luizon pelo suporte
financeiro, intelectual e estímulo.
Às instituições de fomento que permitiram a realização deste trabalho
(FINATEC, FUNPE, CAPES, CNPQ).
Aos meus amigos do laboratório de Genética da UnB, que pacientemente me
auxiliaram nos trabalhos de bancada e na compreensão da parte teórica, em especial
Carol, Mila, Gabriel, Dudu, Diogo, Guilherme, Rejane.
Aos meus amigos do laboratório químico e de biologia do Instituto de
Criminalística de Goiás, pelo incentivo e companheirismo.
À Prodimol pela doação de material para a pesquisa de bancada.
À Polícia Federal pelo apoio técnico na análise de parte dos dados obtidos.
Agradeço à SENASP pelo apoio acadêmico, científico e financeiro.
Ao laboratório Biologia Molecular da Universidade de Brasília pela
contribuição na realização de algumas análises laboratoriais.
Agradeço à Associação dos Peritos em Criminalística de Goiás, pelo apoio
financeiro e incentivo.
5. Aos doadores das amostras de sangue, sem o qual não seria possível realizar
essa pesquisa.
Agradeço toda minha família, parentes, amigos e colegas.
De modo especial, agradeço a todas as pessoas que cuidaram da minha filha
durante minha ausência: minhas queridas irmãs Norma e Meirilucy, que se doaram
incondicionalmente para cuidar do meu bem mais precioso; minha amada mãe Maria
Salomé pela vigilância constante; meu sogro e pai Altamiro; minha amiga Ana, a
segunda mãe de minha filha; minhas queridas cunhadas Sabrina e Eliana. Meu irmão
Hermano pelo apoio. Agradeço ainda minha sogra e tia por me apoiar em todas as
minhas decisões e fornecer subsídios para o término do meu doutorado
Aos meus queridos sobrinhos e sobrinha, às minhas cunhadas.
Ao meu esposo Aguinaldo e minha querida filha Sophia, por me amarem, serem
compreensivos e me apoiarem.
6. RESUMO
A América Latina tem sido palco de grandes transformações populacionais, sendo hoje
caracterizada por ter uma constituição multiétnica, porém com maior influência de três
populações parentais - européia, africana e ameríndia. Apesar das similaridades, cada
país latino-americano apresentou uma história de povoamento singular, já que
ocorreram variações na distribuição das populações parentais e na quantidade de fluxo
gênico entre elas. Esse trabalho teve por objetivo avaliar a constituição genética de
populações miscigenadas da América Latina e Caribe e a estruturação genética entre
elas. Para tanto, foram considerados quatro conjuntos populacionais e dois conjuntos de
marcadores. Primeiro, foram analisados treze países da América Latina e Caribe
(Argentina, Bahamas, Brasil, Chile, Colômbia, Costa Rica, El Salvador, Equador,
Jamaica, México, Peru, Porto Rico e Venezuela), utilizando marcadores do tipo STRs
(CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51,
D21S11, FGA, TH01, TPOX e vWA). Em um segundo momento, foram avaliadas as
diferenças entre as regiões geográficas de três países da América do Sul (Argentina,
Brasil e Colômbia) utilizando os mesmos marcadores. Para uma análise mais regional,
populações urbanas da região centro-oeste brasileira foram analisadas utilizando os
mesmo marcadores anteriores adicionados do Penta E. O povoamento da região centro-
oeste foi também avaliado pela comparação de duas populações da região – Goiás e
Distrito Federal – utilizando marcadores AIMs autossômicos - APO, AT3, D1, DRD2-
A, ECA, FXIIIB, FyNull, GC, LPL, OCA2, PV92, Rb2300, Sb19.3 e TPA25. As
análises de distância genética entre as populações latino-americanas e entre as regiões
dos três países mostraram um quadro bastante heterogêneo quanto à distribuição das
freqüências alélicas dos marcadores utilizados. A análise de mistura corroborou os
dados de distância, sendo que a contribuição parental ameríndia variou de 5% a 73%, a
africana de 4% a 90% e a européia de 4% a 66%. Com relação à análise das populações
da região centro-oeste do Brasil, não foi observado diferenciação entre a distribuição
gênica e genotípica, provavelmente devido ao intenso fluxo gênico entre elas. A mistura
gênica estimada, considerando os marcadores microssatélites, foi de 11% para a
parental ameríndia, 21% para a parental africana e de 68% para a parental européia. Os
resultados obtidos com os marcadores AIMs foi de 15%, 21% e 63%, respectivamente.
A maioria das populações analisadas apresentou modelo tri-híbrido de mistura. Esses
resultados são concordantes com dados históricos e demográficos das populações
latino-americanas.
7. ABSTRACT
The Latin American population has been under great transformations and today
it can be characterized as having a multiethnic constitution, however with three main
parental populations influence - European, African and Amerindian. Despite their
similarities, each country has a unique history of settlement, since there have been
variations in the distribution of the parental populations and in the amount of gene flow
between them. This study aimed to evaluate the genetic constitution in Latin American
and Caribbean populations and the genetic structure between them. For that matter, four
groups of populations and two sets of markers were employed. First, thirteen countries
of Latin America and Caribbean (Argentina, Bahamas, Brazil, Chile, Colombia, Costa
Rica, El Salvador, Ecuador, Jamaica, Mexico, Peru, Puerto Rico and Venezuela), were
analyzed with STR markers (CSF1PO, D3S1358, D5S818, D7S820, D8S1179,
D13S317, D16S539, D18S51, D21S11, FGA, TH01, TPOX and vWA). In a second
moment, the differences between the geographic regions of three South-American
countries were evaluated (Argentina, Brazil and Colombia) using the same markers.
Next, for a more regional analysis, urban populations from Brazilian Middle-Western
region were studied using the same markers listed above and Penta E. The settlement of
the Brazilian Middle-Western region was also evaluated regarding the comparison of
two populations of this region - Goiás and Federal District - using autosomic AIMs -
APO, AT3, D1, DRD2-A, ECA, FXIIIB, FyNull, GC, LPL, OCA2, PV92, Rb2300,
SB19.3 and TPA25. The analyses of the genetic distance between the Latin American
populations and between the regions of the three countries had shown a heterogeneous
picture of the distribution of the allelic frequencies. The admixture analysis
corroborated the genetic distance data, with the Amerindian parental contribution
presenting variations ranging from 5 to 73%, the African from 4 to 90% and the
European from 4 to 66%. Regarding the analysis of the populations of the Brazilian
Middle-Western region, differentiation between the genetic and genotypic distribution
was not observed, probably due the intense gene flow between them. The genetic
admixture estimate, considering the STRs markers, was 11% for the Amerindian
parental, 21% for the African parental and 68% for the European parental. The results
generated with the AIMs were 15%, 21% and 63%, respectively. The majority of the
analyzed populations are tri-hybrid, having been formed by three parental groups. These
results agree with historical and demographic data of the Latin American populations.
8. ABREVIATURAS
APS Persulfato de amônia
CEP Conselho de Ética em Pesquisa
CODEPLAN Companhia de Planejamento do Distrito Federal
CONEP Comissão Nacional de Ética em Pesquisa
DNA Ácido desoxirribonucléico
dNTP Dideoxi-nucleotídeo
EDTA Ácido etilenodiamino tetra-acético
FUNAI Fundação Nacional do Índio
IBGE Instituto Brasileiro de Geografia e Estatística
NaCl Cloreto de sódio
PCR Reação em cadeia da polymerase
RFLP Polimorfismo de comprimento de fragmento de restrição
TBE Tampão tris-borato
TE Tampão tris-EDTA
STR Repetições curtas em tandem
UnB Universidade de Brasília
9. LISTA DE TABELAS
Tabela 1.1 Análise de variância molecular (AMOVA) para 13 populações latino-
americanas - Argentina, Bahamas, Brasil, Chile, Costa Rica,
Colômbia, El Salvador, Equador, Jamaica, México, Peru, Porto Rico e
Venezuela – utilizando 13 marcadores genéticos do tipo STR do
CODIS .................................................................................................... 15
Tabela 1.2 Porcentagem de loci STR cujas freqüências gênicas apresentaram
valores de p para Fst na análise de variância molecular (p<0,05) entre
os pares de populações ............................................................................ 16
Tabela 1.3 Estimativas de contribuição dos três principais grupos parentais na
composição genética atual de treze países da América latina utilizando
13 marcadores microssatélites do sistema CODIS ................................. 17
Tabela 2.1 Estimativas de contribuição das populações parentais sul-americanas –
europeu, africano e ameríndio – na constituição atual das regiões
geográficas de Brasil, Colômbia e Argentina, utilizando 13 marcadores
microssatélites do sistema CODIS .......................................................... 36
Tabela 3.1 Tribos indígenas localizadas nos Estados da região centro-oeste
(Goiás, Mato Grosso e Mato Grosso do Sul) e número total de
individuos por estado .............................................................................. 51
Tabela 3.2. Discriminação das mesorregiões, microrregiões, do número de
habitantes de cada microrregião à época da coleta das amostras de
sangue e do número de indivíduos coletados em cada região do Estado
de Goiás .................................................................................................. 53
Tabela 3.3 Freqüências alélicas e parâmetros estatísticos estimados para a
população do estado de Goiás, correspondente aos 15 marcadores
STRs do sistema PowerPlex 16 .............................................................. 58
Tabela 3.4 Pares de populações da população brasileira que apresentaram
diferenças estatisticamente significativas por marcador STR
considerando 14 marcadores e 13 bancos de dados ................................ 61
Tabela 3.5 Teste de significância das análises de Fst considerando bancos de
dados da população brasileira (α=5%) referente à freqüência para 14
marcadores STRs..................................................................................... 63
10. Tabela 3.6 Estimativas de contribuição dos três principais grupos parentais na
composição genética atual de dois estados brasileiros da região
Centro-oeste – Goiás e Mato Grosso do Sul – e do Distrito Federal,
utilizando 14 marcadores microssatélites ...............................................
64
Tabela 4.1. Distribuição dos indivíduos componentes da amostra do Distrito
Federal com relação à região administrativa da residência dos pais à
época do nascimento ............................................................................... 75
Tabela 4.2 Caracterização das mesorregiões, microrregiões quanto ao número de
habitantes de cada microrregião a época da coleta das amostras de
sangue e do número de indivíduos coletados em cada microrregião do
Estado de Goiás ...................................................................................... 76
Tabela 4.3 Diferenças nas freqüências alélicas (δ) entre os grupos parentais
(africano, europeu e ameríndio), dos 14 marcadores autossômicos
analisados ................................................................................................ 78
Tabela 4.4 Características dos marcadores genéticos do tipo AIMs analisados:
tipo de marcador, modo de identificação, localização cromossômica,
seqüência dos iniciadores, temperatura de pareamento na PCR e
referência ................................................................................................
80
Tabela 4.5 Freqüências alélicas, valores de heterozigose observada e esperada,
valores de p do teste de aderência ao Equilíbrio de Hardy-Weinberg e
respectivos desvios padrões com relação aos 14 marcadores AIMs
autossômicos analisados para as populações de Goiás e Distrito
Federal e nas três populações parentais .................................................. 88
Tabela 4.6 Pares de loci que apresentaram desequilíbrio de ligação (p < 0,05) nas
populações do Distrito Federal e do estado de Goiás ............................. 90
Tabela 4.7 Estatística F (f, F e Theta-P) e componentes da variância (Sigma-P,
Sigma-I e Sigma-G) para os 14 loci autossômicos analisados nas
populações do Distrito Federal e do estado de Goiás ............................. 90
Tabela 4.8 Diferenciação gênica e genotípica entre as populações do Distrito
Federal e Goiás considerando 14 marcadores genéticos do tipo AIMs 91
Tabela 4.9 Estimativas de contribuições das parentais africana, ameríndia e
européia na constituição genética atual das populações do Distrito
Federal e de Goiás, utilizando 14 marcadores de DNA autossômicos ... 91
11. Tabela 4.10 Dados da análise de estatística descritiva para os valores IAAs
determinados nos indivíduos amostrados na população do Distrito
Federal e Goiás ....................................................................................... 94
12. LISTA DE FIGURAS
Figura 1.1 Mapa da América Latina e Caribe mostrando as variações
étnicas entre os países conforme as estimativas de contribuição
parental africana, ameríndia e européia ....................................... 18
Figura 1.2 Matriz de distância genética (Reynolds et al, 1983), entre treze
populações miscigenadas latino-americanas e as três parentais
com referência aos 13 marcadores STRs do CODIS ................... 20
Figura 1.3 Diagrama das duas primeiras coordenadas principais, relativo à
distância genética entre os 13 países latino-americanos e
caribenhos e suas populações parentais, baseado na análise de
13 marcadores STRs autossômicos .............................................. 21
Figura 2.1 Mapa da Argentina, Brasil e Colômbia e suas respectivas
regiões geográficas adotadas para as análises desenvolvidas
neste trabalho ............................................................................... 33
Figura 2.2 Matriz de distância genética de Reynolds et al. (1983)
mostrando as distâncias genéticas entre as regiões geográficas
da Argentina, Brasil, Colômbia e as populações
parentais....................................................................................... 39
Figura 2.3 Primeira e segunda coordenadas principais obtidas a partir da
análise de 13 marcadores STRs mostrando o relacionamento
entre a distribuição das freqüências alélicas nas regiões de
Argentina, Brasil e Colômbia e as populações parentais ............. 40
Figura 3.1 Mapa do estado de Goiás destacando as dezoito microrregiões,
de acordo com classificação do sistema de cartografia do IBGE
(2000) ........................................................................................... 52
Figura 3.2 Matriz de distância genética de Reynolds et al. (1983) para as
populações do Distrito Federal, Goiás, Mato Grosso do Sul, da
região centro-oeste como um todo, bem como das populações
parentais utilizando 14 marcadores genéticos do tipo
STRs.............................................................................................. 64
13. Figura 4.1 Regiões Administrativas que compunham o Distrito Federal em
2002 (Fonte: Codeplan, 1997), época da coleta de material
biológico ...................................................................................... 75
Figura 4.2 Histograma da distribuição dos valores de índice de
ancestralidade africana nas populações do Distrito Federal e do
Estado de Goiás ............................................................................ 93
14. SUMÁRIO
INTRODUÇÃO............................................................................................................................. 1
Migração e evolução......................................................................................................... 1
Migração na América Latina............................................................................................ 4
OBJETIVOS.................................................................................................................................. 6
CAPÍTULO 1................................................................................................................................ 8
Panorama étnico da América Latina pela análise de marcadores microssatélites autossômicos
1.1. INTRODUÇÃO...................................................................................................................... 9
1.2 MATERIAL E MÉTODOS................................................................................................... 11
Dados de freqüências gênicas......................................................................................... 11
Análise estatística........................................................................................................... 12
1.3. RESULTADOS.................................................................................................................... 13
1.4. DISCUSSÃO........................................................................................................................ 22
Diferenciação populacional na América latina............................................................... 22
Mistura genética............................................................................................................. 23
CAPÍTULO 2.............................................................................................................................. 27
Padrões regionais de mistura genética na américa do sul
2.1. INTRODUÇÃO.................................................................................................................... 28
2.2. MATERIAL E MÉTODOS.................................................................................................. 32
Fonte de Dados ............................................................................................................... 32
Análises populacionais................................................................................................... 34
2.3. RESULTADOS.................................................................................................................... 35
2.4. DISCUSSÃO........................................................................................................................ 41
A presença européia........................................................................................................ 41
O africano e o ameríndio................................................................................................ 43
CAPÍTULO 3.............................................................................................................................. 47
Mistura gênica na região centro-oeste brasileira estimada utilizando dados de marcadores
microssatélites autossômicos
3.1. INTRODUÇÃO.................................................................................................................... 48
3.2. MATERIAL E MÉTODOS.................................................................................................. 52
Amostras populacionais.................................................................................................. 52
Levantamento de dados para realização das análises estatísticas................................... 54
Análise estatística........................................................................................................... 55
Dos dados gerados para a população de Goiás............................................................... 55
Análises interpopulacionais............................................................................................ 56
3.3. RESULTADOS.................................................................................................................... 57
Análise intrapopulacional............................................................................................... 57
15. Análise interpopulacional............................................................................................... 57
3.4. DISCUSSÃO........................................................................................................................ 65
CAPÍTULO 4.............................................................................................................................. 69
Constituição genética de Goiás e Distrito Federal, duas populações da região Centro-Oeste
Brasileira, com relação a marcadores do tipo AIMs autossômicos
4. 1. INTRODUÇÃO................................................................................................................... 70
4. 2 MATERIAL E MÉTODOS.................................................................................................. 73
Caracterização da população e coleta das amostras....................................................... 73
Distrito Federal................................................................................................................73
Goiás.............................................................................................................................76
Procedimentos metodológicos........................................................................................ 77
Seleção dos marcadores genéticos ....................................................................................... 77
Extração de DNA e verificação em gel de agarose ................................................................... 77
Reação em Cadeia da Polimerase (PCR) e visualização dos produtos de amplificação .................... 78
Reação de restrição ........................................................................................................... 79
Eletroforese e avaliação fenotípica ....................................................................................... 82
Análise estatística........................................................................................................... 82
4. 3. RESULTADOS................................................................................................................... 86
4. 4. DISCUSSÃO....................................................................................................................... 94
Mistura............................................................................................................................ 98
Contextualização dos dados apresentados.................................................................... 102
CONSIDERAÇÕES FINAIS.................................................................................................... 104
REFERÊNCIA BIBLIOGRÁFICA........................................................................................... 106
Sítios da internet........................................................................................................... 121
ANEXO 1: TABELAS SUPLEMENTARES........................................................................... 122
ANEXO 2. PROTOCOLOS DOS PROCEDIMENTOS LABORATORIAIS......................... 133
ANEXO 3. TERMOS DE CONSENTIMENTO LIVRE E ESCLARECIDOS........................ 141
17. 1
Introdução
INTRODUÇÃO
Uma questão que intriga os estudiosos em populações humanas é porque as pessoas
migram, visto que a maioria dos migrantes não gostaria, de fato, abandonar suas casas,
terras, seus locais de origem. Fatores de expulsão e de atração são os mais importantes
fatores que levam à migração. Exemplos de fatores de expulsão são escassez de alimentos
e perseguições politico-religiosas. Os principais fatores de atração são os relacionados à
carência de mão-de-obra, facilidades na obtenção de terra, migração subsidiada, maiores
salários na área para onde os migrantes se encaminham, dentre outros (Klein, 2000).
As formas de migração estão relacionadas com o destino dos indivíduos migrantes,
isso é, podem ocorrer dentro de um território, sendo assim chamadas migrações internas,
ou para outro território ou país, sendo chamadas de migrações externas. A mobilidade
dentro do território geralmente não sofre restrições, mas as migrações externas, atualmente,
dependem de normas estabelecidas pelos chefes do Estado receptor.
Restrições à migração são práticas mais recentes. O povoamento das Américas é
um exemplo marcante de migração em massa com enorme modificação na constituição
populacional humana da população receptora. Logicamente que restrições às migrações
não se aplicaram nesse caso. Muito pelo contrário, houve incentivos à migração européia
(migração subsidiada), assim como a migração forçada de povos africanos à época das
grandes navegações em virtude do tráfico de indivíduos africanos para as Américas. O
contexto da migração européia para a América pode ser melhor compreendido à luz do
conhecimento de que os europeus viviam um momento de recessão, onde a dificuldade de
acesso à terra e ao alimento era um fator de repulsão. Por outro lado, o descobrimento de
um novo território, o americano, atraía e apresentava-se naquele momento histórico como
solução. Assim, a possibilidade de acesso à terra, associado ao incentivo dado pelos
governantes para a contratação de mão-de-obra de modo a suprir a economia do novo
mercado de trabalho, além dos subsídios fornecidos para estimular a migração, foram os
principais fatores de atração que contribuíram para a migração européia.
Migração e evolução
A migração é um fator evolutivo que pode levar populações à homogeneização
(Wang & Caballero, 1999). Pode ser definida como o deslocamento físico de um indivíduo
ou grupos de indivíduos de uma sociedade ou área geográfica para outra. Porém, o
deslocamento de indivíduos de uma população para outra só faz sentido em termos de
18. 2
Introdução
evolução se tais indivíduos estiverem na idade reprodutiva. Isso torna possível a introdução
de genes da população migrante para a população receptora.
Caso exista diferença na constituição genética entre a população receptora e a
doadora, haverá a possibilidade de introdução de novos alelos na receptora, o que a tornará
mais semelhante à população de origem dos migrantes. Portanto, necessário se torna
também que os indivíduos migrantes tenham sucesso reprodutivo, pois somente assim
haverá a modificação efetiva na constituição genética da população. Esse evento
decorrente da migração é denominado fluxo gênico (Barbujani, 2005).
Geralmente a troca de material genético entre populações se dá entre aquelas que se
encontram à uma menor distância geográfica. Portanto, o fluxo gênico entre grupos
populacionais é inversamente proporcional à distância geográfica entre eles (Handley et
al., 2007; Serre & Pääbo, 2004). Um fator decorrente do fluxo gênico é que as
modificações genéticas não se darão apenas com relação a um determinado gene, mas as
alterações ocorrerão no genoma como um todo, já que cada indivíduo de um par de
acasalamento doará 23 cromossomos.
Sabe-se que pessoas de diferentes lugares, em especial continentes, podem
apresentar diferenças fenotípicas, e que parte dessas diferenças é decorrente das diferenças
entre as freqüências alélicas em determinados genes. Desse modo, freqüências alélicas
podem ser comparadas com o intuito de definir o quanto uma população difere da outra.
Observa-se que há uma maior similaridade genética entre populações próximas
geograficamente, isso é, as diferenças entre os agrupamentos populacionais tendem a
seguir a distância geográfica que uma tem em relação às demais (Manica et al., 2005;
Jorde & Wooding, 2004). Dessa forma, populações mais distantes geograficamente têm
menor probabilidade de trocarem migrantes. Conseqüentemente, as variações genéticas
entre as populações tendem a ser geograficamente estruturadas, pois os indivíduos de uma
região geográfica são mais similares entre si do que de indivíduos de uma região mais
distante. Como a migração geralmente é constante entre as populações humanas, e tende a
ocorrer para regiões vizinhas, as variações genéticas observadas se distribuem em um
padrão contínuo, e raramente tem descontinuidades geográficas marcantes (Behar et al.,
2008).
Embora a migração ocorra na maioria das populações humanas, determinados
grupos populacionais se diferenciaram, devido a mutações em alguns genes, deriva
genética e seleção. Entre os fatores evolutivos que levam à diferenciação populacional, a
deriva genética é a que promove as alterações entre as populações em um tempo menor e
19. 3
Introdução
de modo mais intenso, pois ela produz alteração em todo o genoma do indivíduo e não
apenas em um dado gene (Jorde & Wooding, 2004; Destro-Bisol et al., 2000). Por
exemplo, a migração de um grupo de indivíduos para uma outra região inicialmente
desabitada pode originar uma população distinta da população original, pois é provável que
nesse grupo não estejam representados todos os alelos de um determinado gene da
população original. Esse efeito é conhecido como efeito fundador, o que promove,
conseqüentemente, a diferenciação entre as populações em virtude da perda de alelos e da
fixação de outros. Exemplo disso são os ameríndios que ao migrarem para a América
trouxeram consigo apenas parte dos alelos que existiam na população original. O grupo
sangüíneo ABO mostra de modo muito claro este efeito. Os ameríndios atuais praticamente
não apresentam os alelos A e B, sendo que a maior parte das populações apresenta
monomorfismo do alelo O (Ollson, 2002). A teoria mais aceita para esse fenômeno é que o
efeito do fundador de um pequeno número de migrantes que deu origem ao povoamento da
América seja responsável por isso, embora exista a hipótese de que tenha ocorrido seleção
natural em favor dos indivíduos do tipo O (Cavalli-Sforza et al., 1996).
Pode ocorrer, entretanto, que as diferenças genéticas não sejam proporcionais às
distâncias geográficas, mas decorrente de um fator que impede a reprodução entre esses
grupos, como, por exemplo, um acidente geográfico ou uma barreira cultural (Comas et al.,
2000). O cruzamento preferencial é outro fator que pode promover ao longo do tempo
pequenas variações entre as populações. É o que ocorreu, por exemplo, com populações
latino-americanas. De acordo com dados genéticos e históricos, no início da colonização
americana houve cruzamento preferencial entre homens europeus e mulheres ameríndias e
africanas (Lind et al., 2007; Martinez et al., 2007; Bedoya et al., 2006; Abe-Sandes et al.,
2004; Martinez-Marignac et al., 2004). Tais estudos mostram que, nessas populações, as
linhagens ameríndias e africanas foram passadas para as próximas gerações pela linhagem
matrilinear, enquanto que o componente genético europeu predominou nas linhagens
patrilineares. O cruzamento preferencial ocorreu em decorrência do predomínio de
indivíduos do sexo masculino entre os migrantes europeus nos primeiros séculos de
colonização.
De fato, o movimento migratório em massa mais marcante nos últimos séculos foi
o de colonização da América, que resultou na formação de populações hibrídas, como
mostram vários estudos de estimativas de mistura em populações da América (Martinez et
al., 2007; Tang et al., 2007; Bedoya et al., 2006; Choudhry et al., 2006; Gadelha et al.,
2005; Bonilla et al., 2004). Para tais análises, freqüentemente tem-se usado marcadores
20. 4
Introdução
que apresentam diferenças nas freqüências alélicas entre os grupos parentais que
originaram a população miscigenada. Determinar um conjunto de marcadores que possam
discriminar grupos étnicos é difícil, porque as maiores diferenças acontecem entre
indivíduos dentro de uma população do que entre populações. A variabilidade entre grupos
populacionais ou étnicos é pequena, justamente porque as diferenças entre as freqüências
alélicas dos genes/marcadores genéticos são pequenas na maioria dos casos (Barbujani,
2005). Entretanto, essas diferenças são suficientes para separar grupos geográficos nas
análises filogenéticas (Luizon et al., 2008; Rowold e Herrera, 2003; Comas et al., 2000;
Batzer et al., 1996).
Um dos efeitos provocados pelo fluxo gênico é que poderão ocorrer associações
alélicas entre dois loci que não estejam ligados. Chakraborty e Weiss (1988) denominaram
tais associações como desequilíbrio de mistura para distinguir das associações que ocorrem
entre loci ligados. Essas associações decaem com o tempo e depende da distância genética
entre os grupos parentais, mas o desequilíbrio de ligação pode permanecer por longos
períodos, caso a história de mistura não seja muito antiga. Portanto, o desequilíbrio de
ligação entre dois loci em uma população híbrida pode ser decorrente apenas do processo
de mistura, não significando necessariamente relação de ligação física entre eles. O
desequilíbrio de ligação tende a diminuir com o tempo devido à recombinação recorrente
em várias gerações de cruzamento. Compreender esse processo e discernir em uma
população a origem do desequilíbrio entre loci tem ajudado no mapeamento de genes
relacionados a doenças (Nalls et al., 2008; Martinez-Marignac et al., 2007; Bonilla et al.,
2004; Shriver et al., 2003; Kidd et al., 1998).
Migração na América Latina
O descobrimento da América pelos europeus, no século XV, promoveu uma onda
migratória intensa envolvendo pelo menos dois continentes doadores, isto é, a Europa e a
África, e a América como receptora de tais etnias. Estima-se que cerca de 15 milhões de
europeus tenham cruzado o Atlântico até 1880 e que entre 1881 a 1915 o número de
migrantes alcançou seu apogeu, chegando à pelo menos 31 milhões de indivíduos (Klein,
2000). A maioria dos migrantes era de jovens adultos do sexo masculino em busca de
emprego, temporário ou permanente, em território americano, sendo que metade desses
imigrantes permaneceu na América. Outro grupo étnico que veio para a América em massa
foi o africano que foi trazido pela força, para trabalhar como escravo na agricultura e na
21. 5
Introdução
extração de metais preciosos. Estima-se que até 1880 tenham sido trazidos para o
continente americano pelo menos 10 milhões de africanos. A migração em massa de
europeus e de africanos, promoveu alterações genéticas tanto nas populações locais, quanto
nas populações migrantes em decorrência da miscigenação, havendo o estabelecimento de
populações com vários tipos e graus de mistura em toda América. Além disso, a migração
em massa promoveu também mudanças demográficas, havendo redução da população
nativa em aproximadamente 90% do que existia à época do início da colonização (Bedoya
et al., 2006).
Quanto à origem do grupo parental ameríndio existem controvérsias quanto a sua
chegada à América, mas é consenso que todos ou a maioria vieram da Ásia via Estreito de
Bering (Cavalli-Sforza et al., 1996). Estudos utilizando marcadores do DNA mitocondrial,
do cromossomo Y e de autossômicos buscam compreender a origem do homem ameríndio
e como ele chegou à América (Fagundes et al., 2008; Wang et al., 2007; Bandelt et al.,
2003; Underhill et al., 2003; Silva et al., 2002).
Devido a essas diferenças históricas e ao padrão de colonização e migração na
América, pode-se observar atualmente uma variação quanto às contribuições entre esses
três grupos geográficos parentais na formação das populações urbanas e rurais da América
Latina (Sans, 2000). O encontro desses três grupos parentais possibilitou o aparecimento
de novos grupos étnicos ou novas populações, como a de indivíduos que se
autodenominam pardos, que são produto de cruzamento por várias gerações de
colonizadores (europeus e africanos) e seus descendentes, com populações locais. Outro
fator que contribui para esse quadro complexo de mistura na América é a ocorrência de
migrações internas motivadas por distintos fatores, dentre eles os políticos ou devido à
emergência de novas oportunidades econômicas, como por exemplo, o que ocorreu na
Venezuela na década de 70 do século passado. Associado à instabilidade política na
América do Sul e à prosperidade experimentada pela Venezuela por causa da existência de
petróleo, muitos indivíduos de vários países da América do Sul e do Caribe migraram para
esse país, colaborando ainda mais para o processo de amalgamento experimentado na
região (Martinez et al., 2007). De um modo geral, não apenas nas populações latino-
americanas, como da Venezuela, exemplo citado acima, a mistura étnica é um processo
contínuo que ocorre ao longo de várias gerações.
22. 6
Objetivos
OBJETIVOS
O objetivo do presente trabalho foi avaliar o impacto das migrações na constituição
atual de populações latino-americanas utilizando marcadores genéticos moleculares do tipo
microssatélites, inserções Alu, inserções/deleções e SNPs. A hipótese inicial é saber se as
migrações contribuíram para homogeneizar as populações. Para tanto, foram analisados
distintos níveis populacionais: 1. da América Latina; 2. de regiões geográficas da
Argentina, Brasil e Colômbia; 3. região centro-oeste brasileira.
Visando atingir esse objetivo geral, foram buscados:
Capítulo 1 – Avaliar o impacto das migrações considerando países da América Latina e
Caribe, utilizando dados de marcadores do tipo microssatélites (CSF1PO, D3S1358,
D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, FGA, TH01, TPOX e
vWA). Para tanto buscou-se:
a) Estimar a diversidade gênica intrapopulacional hsk para cada locus;
b) Avaliar a diferenciação populacional e estruturação populacional pela análise de
variância molecular (AMOVA);
c) Estimar mistura genética na constituição atual de 13 países;
d) Estimar distâncias genéticas de Reynolds et al. (1983) entre as populações
utilizando matriz de distância e análise do componente principal.
Capítulo 2 – Buscar compreender o impacto das migrações decorrentes da colonização em
três países da América do Sul - Argentina, Brasil e Colômbia, utilizando os mesmos
marcadores microssatélites do capítulo 1 baseado em:
a) Estimativa de mistura étnica para cada país e suas respectivas regiões
geográficas;
b) Avaliação das distâncias genéticas de Reynolds et al. (1983) entre os pares de
populações com base na matriz gerada e na análise do componente principal.
Capítulo 3 - Avaliar a região centro-oeste brasileira quanto ao seu processo de formação
genética e estruturação populacional, com base em dois estados, Goiás e Mato Grosso do
Sul, e o Distrito Federal utilizando marcadores do tipo microssatélites. Para alcançar esse
objetivo, as estratégias utilizadas foram:
a) Estimar as freqüências alélicas de 15 marcadores STRs (CSF1PO, D3S1358,
D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, FGA,
Penta D, Penta E, TH01, TPOX e vWA) para a população do estado de Goiás;
23. 7
Objetivos
b) Estimar heterozigose observada e esperada e o conteúdo informativo de
polimorfismo (PIC) para cada marcador;
c) Comparar as freqüências genotípicas observadas com as esperadas de acordo
com a Lei de Hardy-Weinberg;
d) Avaliar a ocorrência de desequilíbrio de ligação entre os 15 loci STRs
analisados;
e) Utilizar os dados levantados para as populações da região centro-oeste brasileira
para realizar uma série de comparações e estimativas:
I. AMOVA, índice de estruturação populacional (Fst) e o teste de
significância do mesmo para comparar os estados de Goiás e Mato Grosso
do Sul e o Distrito Federal;
II. Diversidade gênica intrapopulacional hsk (Nei, 1987), para cada locus para
as populações da região centro-oeste (Distrito Federal, Goiás e Mato
Grosso do Sul);
III. AMOVA, índice de estruturação populacional (Fst) e o teste de
significância do mesmo para comparar as populações da região centro-
oeste com outras populações brasileiras;
IV. Índices de mistura genética para as três populações do centro-oeste.
Capítulo 4 - Avaliar a constituição e estruturação populacional do estado de Goiás e do
Distrito Federal pela análise de 14 marcadores autossômicos informativos de
ancestralidade - AIMs (APO, AT3, D1, DRD2-A, ECA, FXIIIB, FyNull, GC, LPL, OCA2,
PV92, Rb2300, Sb19.3, TPA25). Para atingir este objetivo definiu-se:
a) Determinar a freqüência alélica dos marcadores autossômicos AIMs,
heterozigose observada e esperada para cada locus e avaliar se esses marcadores
encontram-se em equilíbrio segundo o proposto por Hardy-Weinberg;
b) Estimar o desequilíbrio de ligação entre todos os loci e entre os pares de loci;
c) Comparar as populações do estado de Goiás e do Distrito Federal pelo teste
exato de diferenciação populacional e da estatística F;
d) Estimar mistura genética nas duas populações (Distrito Federal e Goiás),
utilizando os 14 marcadores AIMs;
e) Estimar o índice de ancestralidade individual nas duas populações e a
distribuição em uma curva normal.
24. CAPÍTULO 1
Panorama étnico da América Latina e Caribe pela análise de
marcadores microssatélites autossômicos
25. 9
Capítulo 1
1.1. INTRODUÇÃO
A expansão de vários impérios europeus em decorrência das grandes navegações, a
partir do século XV, promoveu transformações econômicas, culturais e genéticas nas
populações dos vários continentes e em especial na América. Antes da chegada de
Cristóvão Colombo à América, em 1492, a população local era constituída por ameríndios,
uma população bastante heterogênea, tendo em vista não só a cultura praticada, mas
também devido à existência de uma infinidade de grupos lingüísticos.
A migração européia para a América Latina foi marcada por um fluxo intenso de
indivíduos de vários países, principalmente povos da península Ibérica (Portugal e
Espanha), e, em um segundo momento, italianos e alemães. Além da migração européia
acentuada até o início do século XX, outro fator contribuiu para alterar o perfil genético
populacional da América: a migração forçada de povos africanos (Klein, 2000). Esses
povos foram advindos da África subsaariana, especialmente dos atuais países de Congo e
Angola e da antiga Costa do Ouro (atual Gana), e pertenciam a diferentes grupos étnicos e
muitas vezes lingüísticos, favorecendo ainda mais uma formação complexa da nova
população americana (Wang et al., 2008).
A distribuição do contingente populacional africano não foi homogênea ao longo
do território latino-americano, o que reflete a composição genética atual das populações.
Observa-se uma forte influência africana, em especial cultural, em países do Caribe e no
Brasil enquanto que em outros países latino-americanos, como aqueles localizados nas
regiões andinas, essa influência é pequena (Wang et al., 2008).
Uma estratégia para melhor compreender a história da constituição genética da
população da América Latina é estimar a contribuição das populações parentais baseada na
distribuição das freqüências alélicas de marcadores genéticos. Dentre os marcadores, estão
os STRs (Short Tandem Repeats – repetições curtas em tandem) com um grande volume de
dados na literatura, em especial com relação aos utilizados pelo sistema CODIS (Combined
DNA Index Systems). Cada locus STR constitui um locus genético altamente variável,
multialélico, com expressão codominante, havendo assim a possibilidade de seus alelos
poderem ser detectados e discriminados na população (Schröer et al., 2000). O
polimorfismo nos loci STRs resulta da variação do número de unidades de repetições
(Drobnic & Budowle, 2000).
Essas variações, possivelmente decorrentes de mutações que favorecem pequenas
mudanças, geralmente de uma unidade de repetição (Martinovic et al., 1999), envolvem
diferenças no comprimento do microssatélite em decorrência de erros da enzima
26. 10
Capítulo 1
polimerase. Durante a replicação de uma região repetitiva, as cadeias de DNA podem
dissociar-se e então se associarem incorretamente, levando a inserção ou deleção de
unidades repetidas, alterando, assim, o comprimento do alelo (Ellegren, 2000; Hancock,
1996; Kruglyak et al., 1998).
Sua abundância no genoma e sua alta taxa de mutação, comparado com outros tipos
de polimorfismos, tornam-os úteis em estudos microevolutivos. Dentro de um curto
período evolutivo, um número suficiente de eventos mutacionais acumulados pode ser
observado em populações divergentes (Wang et al., 2008; Agrawal & Khan, 2005; Rowold
& Herrera, 2003). Por isso, recentemente está sendo dada atenção para a sua utilidade em
estudos mais detalhados de grupos populacionais humanos, com objetivo de inferir alguns
aspectos históricos demográficos e avaliar mistura étnica em populações miscigenadas.
A avaliação do processo das expansões humanas utilizando marcadores
microssatélites é um dos trabalhos que demonstrou essa questão (Bowcock et al., 1994).
Quando árvores filogenéticas de distâncias foram construídas, foi observado que os
indivíduos agrupavam-se de acordo com sua origem geográfica. A grande maioria dos
indivíduos examinados foi agrupada em grupos discretos que coincidem com o continente
de origem da amostra. Além disso, apresentou uma tendência para formar subgrupos
dentro dos continentes que correspondiam à população de origem da amostra.
A dinâmica de mistura entre populações pode produzir desequilíbrio de ligação
entre os loci STRs analisados mesmo quando são sintênicos mas não ligados e ainda
quando os loci não se encontram em um mesmo cromossomo. O desequilíbrio produzido
pela miscigenação será numericamente proporcional ao produto das diferenças das
freqüências alélicas entre as populações que sofreram miscigenação, significando que o
desequilíbrio poderá ser maior do que aquele produzido puramente por mutação e deriva
em loci ligados, a menos que os loci sejam muito ligados (Pfaff et al., 2001).
A possibilidade de avaliar as relações genéticas de indivíduos amostrados de uma
população com base em genótipos multilocos abre novas perspectivas em análises
genéticas populacionais. Este tipo de dados elimina a necessidade de definir população a
priori, o que pode ajudar em estudos de movimentos populacionais recentes, bem como
facilita a estimativa de mistura individual (Martinez et al., 2007; Ferreira et al., 2006;
Callegari-Jaques et al., 2003; Cerda-Flores et al., 2002; Cavalli-Sforza, 1997). Dessa
forma, os microssatélites têm sido considerados como marcadores genéticos ideais na
identificação de indivíduos e também na descrição de processos históricos de migração e
outros eventos evolutivos mais recentes, como o processo de formação étnica e
27. 11
Capítulo 1
miscigenação, incluindo a que ocorreu na América Latina (Wang et al., 2008; González-
Andrade et al., 2007; Martínez et al., 2007; Toscanini et al., 2007; Ferreira et al., 2006;
Ferreira et al., 2005; Callegari-Jacques et al., 2003; Cerda-Flores et al., 2002).
Este capítulo teve por objetivo traçar um panorama da composição genética da
América Latina com relação à porcentagem de contribuição das três principais populações
parentais – europeus, africanos subsaarianos e ameríndios – e as similaridades e diferenças
genéticas entre as populações de 13 países da América Latina. Para a realização das
análises, que incluíram também estimativas de distância genética, foram utilizados dados
de freqüências alélicas de 13 marcadores genéticos do tipo STR do sistema CODIS.
1.2 MATERIAL E MÉTODOS
Dados de freqüências gênicas
Os países considerados neste trabalho foram: da América do Sul - Argentina,
Brasil, Chile, Colômbia, Equador, Peru e Venezuela; da América Central - Costa Rica, El
Salvador, Bahamas, Jamaica e Porto Rico, estes três últimos localizados no Mar do Caribe,
e da América do Norte - México. Para a realização das análises foi estruturado um banco
de dados das freqüências alélicas para 13 marcadores STRs adotado pelo CODIS –
CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11,
FGA, TH01, TPOX e vWA – a partir de dados obtidos da literatura. O critério utilizado
para a seleção dessas populações se baseou na disponibilidade dos dados publicados na
literatura. O número de indivíduos analisados variou entre os países e entre os locus,
podendo ser conferido na Tabela 1 do Anexo 1. As freqüências gênicas para cada locus
para cada país foram obtidas utilizando a média ponderada, quando dados de mais do que
uma população do mesmo país estava disponível. Nos casos de Porto Rico, Bahamas,
Jamaica, Equador e Peru havia disponibilidade de apenas um banco de dados.
A escolha das populações parentais baseou-se no histórico de povoamento da
América Latina e Caribe, considerando como maiores contribuintes povos europeus,
ameríndios e africanos subsaarianos. Com relação às populações parentais européias, foi
considerado que o maior fluxo gênico para a América Latina veio da Península Ibérica.
Para o cálculo das freqüências gênicas da população parental européia, foi efetuada a
média ponderada de freqüências gênicas disponíveis para as populações de Portugal e da
Espanha obtidos no banco de dados da Universidade de Düsseldorf (http:/www.uni-
28. 12
Capítulo 1
duesselforf.de/WWW/MedFak/Serology/Database.html, acessado dia 03/05/2008), em
Paredes et al., 2003a e em Fernandes e Brehm (2002).
Com relação ao grupo parental ameríndio, foram consideradas diferentes
populações a depender do país em questão. Para os países da América do Sul foram
utilizadas populações deste subcontinente: Kichwas, Cubeo, Desano, Puinave, Tehuelche,
Tucano, Wichi e Curripaco (González-Andrade et al., 2006; ALFRED – Allelic Frequency
Database http://alfred.med.yale.edu – acessado em 03/05/2008). Excepcionalmente para a
população do Equador foram utilizados apenas dados de Kichwas por ser essa a população
nativa daquele país e apresentar o conjunto completo de dados de freqüência quanto aos
marcadores analisados. Para as populações da América Central foi utilizada a média
ponderada de freqüências de populações ameríndias de El Salvador - Conchagua, San
Alejo, Panchimalco e Izalco (Lovo-Gómez et al., 2007). Para o México foram realizadas
duas análises: uma considerando os dados de Navajo e Apache (sítio ALFRED) e outra
com as populações de El Salvador supracitadas utilizadas para a América Central.
Para o grupo parental africano, a maioria utilizada foi de populações do oeste da
África subsaariana. Os dados foram obtidos no banco de dados da Universidade de
Düsseldorf - populações de Nigéria, Zimbábue, Benin, Bamileke e Ewondo de Camarões,
Ovambo da Namíbia e uma amostra de Angola e Guiné Bissau - e em artigos científicos -
Angola (Alves et al., 2004), Guiné Bissau (Gonçalves et al., 2002), Gabão (Steinlechner et
al., 2002), Guiné Equatorial (Alves et al., 2005; Gene et al., 2001) e Ruanda (Tofanelli et
al., 2003).
Análise estatística
As proporções de contribuição das populações parentais na constituição da
população atual dos países da América Latina (estimativa de mistura genética) foram
estimadas usando o método de Chakraborty (1985), que considera as probabilidades de
identidade gênica. Essa análise foi realizada utilizando o programa ADMIX 3. Pelo fato de
Argentina e Brasil possuírem dados disponíveis para a maioria de suas regiões geográficas,
após a análise de mistura para cada região (será discutido no capítulo seguinte) foi feita
análise de mistura total para cada país levando-se em consideração o número de habitantes
de cada região geográfica. Esta última análise foi realizada devido às diferenças de
densidade demográfica de cada região, bem como das diferenças na composição étnica
entre as regiões.
29. 13
Capítulo 1
As distâncias genéticas entre as populações foram estimadas utilizando a
metodologia proposta por Reynolds (1983), a qual assume que as mudanças nas
freqüências são decorrentes apenas dos efeitos de deriva genética. Esta análise foi realizada
com o uso do software PHYLIP versão 3.65 (Felsenstein, 1989). Para Análise de
Coordenada Principal (PCA), gerada pelo programa NTSYS-pc versão 1.70 (Rohlf, 1992),
foi utilizada essa matriz de distância genética.
A diversidade gênica intrapopulacional hsk (Nei, 1987) foi estimada para cada locus
para todas as populações. A análise de variância molecular (AMOVA) foi utilizada para
avaliar a diferenciação populacional estimando a partição da variância que é decorrente da
diferenciação intrapopulacional e a interpopulacional (Excoffier et al., 1992). Foi estimado
também o índice de estruturação populacional Fst (Weir e Cockerham, 1984) assim como
realizado o teste de significância do mesmo, de acordo com o descrito por Excoffier et al.
(1992). Para todas essas análises foi utilizado o programa Arlequin versão 2000
(Schneider, 2000). Dos resultados obtidos foram verificados quais valores de Fst
apresentaram diferenças estatisticamente significativas e calculado o percentual dessas
diferenças para cada par de populações. Para a estimativa da diversidade gênica média para
os diferentes marcadores e de cada marcador para as diferentes populações foi realizada
uma média ponderada.
1.3. RESULTADOS
A análise de variância molecular (AMOVA) indicou subestruturação populacional
entre os 13 países analisados. O valor de Fst variou de 0,002, para o marcador CSF1PO, a
0,013 para o marcador THO1 (Tabela 1.1). O marcador com maior poder de discriminação
foi o TH01, que mostrou diferenças para 82% dos 78 pares de populações possíveis, e o
com menor poder de discriminação foi o CSF1PO, 35%. Apesar dos valores de Fst
estimados serem baixos, o teste de significância mostrou um valor de p<0,00001 para
todos os marcadores STRs analisados individualmente. A maior causa das variações foram
decorrentes das variações dentro das populações (Vb).
Análise ao nível intrapopulacional foi realizada com objetivo de observar as
variações genéticas em cada população. Para isso, a média dos índices obtidos para
diversidade em cada país foi estimada considerando todos os marcadores analisados. Os
valores de diversidade gênica obtidos para os 13 marcadores (Tabela 1.1) variaram de 0,69
a 0,88. Com relação à diversidade gênica média estimada para cada país, os valores foram
30. 14
Capítulo 1
altos e muito similares, variando de 0,76 para o Peru a 0,80 para Bahamas, Brasil, Porto
Rico e Venezuela (Tabela 1 - Anexo 1).
A tabela 1.2 mostra a porcentagem de marcadores que apresentaram diferenças nas
freqüências alélicas considerando os pares de populações (Fst com p<0,05). Jamaica e
Bahamas não apresentaram diferenças. Peru apresentou apenas uma diferença (marcador
TH01) com relação à El Salvador e Equador. Chile e Argentina apresentaram diferença
quanto ao marcador D18S51. Diferença para 100% dos marcadores foi observada entre
Jamaica e três países (El Salvador, Costa Rica e Colômbia), Brasil e dois países (Costa
Rica e Colômbia) e Bahamas com El Salvador. Considerando os 78 pares de combinações
possíveis entre as populações, verificou-se que em 64% deles houve diferença em pelo
menos seis dos marcadores utilizados.
A tabela 1.3 mostra as estimativas de contribuição dos três grupos parentais
principais na composição genética atual de 11 países latino-americanos e dois caribenhos
com base nos 13 STRs e os erros padrões associados às mesmas. A figura 1.1 mostra o
mapa da América Latina e Caribe com a distribuição das variações de mistura entre os
países analisados segundo as estimativas de contribuição africana, ameríndia e européia.
As cores mais escuras indicam maior contribuição e as mais claras, menor contribuição da
parental em questão.
Para a população do México foi realizada ainda a estimativa de mistura
considerando como parentais o europeu, o africano e duas populações nativas da América
do Norte (Apache e Navajo – dois grupos Na-Dené), devido à localização geográfica do
mesmo e à proximidade com essas duas populações. O resultado obtido foi de 50% ± 0,02
para a parental européia, 12,4% ± 0,01 para a parental africana e 37,6% ± 0,02 para a
parental Na-Dené.
A tabela de mistura e o mapa da América Latina e Caribe com as variações quanto
à contribuição das parentais mostram que a maior contribuição africana foi observada nos
países situados na região do Caribe: Jamaica e Bahamas. El Salvador, Peru, Equador e
México foram os países com maior contribuição ameríndia. Com relação à contribuição
européia, os maiores valores foram observados no Brasil, Porto Rico, Venezuela,
Argentina e Chile.
32. 16
Capítulo 1
Tabela 1.2. Porcentagem de loci STR cujas freqüências gênicas apresentaram valores de p significativos para Fst na análise de
variância molecular (p<0,05) entre os pares de populações.
Argentina Bahamas Brasil Chile Colômbia Costa Rica El Salvador Equador Jamaica México Peru Porto Rico
Argentina -
Bahamas 0,923 -
Brasil 0,923 0,615 -
Chile 0,077 0,538 0,538 -
Colômbia 0,846 0,846 1,000 0,231 -
Costa Rica 0,538 0,846 1,000 0,231 0,538 -
El Salvador 0,615 1,000 0,846 0,308 0,462 0,538 -
Equador 0,615 0,923 0,923 0,231 0,692 0,692 0,231 -
Jamaica 0,923 0,000 0,846 0,692 1,000 1,000 1,000 0,923 -
México 0,308 0,846 0,846 0,231 0,308 0,385 0,231 0,385 0,846 -
Peru 0,385 0,846 0,769 0,231 0,385 0,462 0,077 0,077 0,846 0,231 -
Porto Rico 0,538 0,538 0,154 0,846 0,538 0,692 0,769 0,769 0,769 0,462 0,692 -
Venezuela 0,385 0,692 0,385 0,385 0,462 0,538 0,692 0,769 0,769 0,308 0,615 0,154
33. 17
Capítulo 1
Tabela 1.3. Estimativas de contribuição dos três principais grupos parentais na composição
genética atual de treze países da América Latina e Caribe utilizando 13
marcadores microssatélites do sistema CODIS.
Localização geográfica
Países
Populações parentais
Africana Ameríndia Européia
América do Sul
Argentina 0,090 ± 0,028 0,308 ± 0,051 0,601 ± 0,179
Brasil 0,248 ± 0,050 0,093 ± 0,010 0,659 ± 0,089
Chile 0,063 ± 0,017 0,421 ± 0,017 0,516 ± 0,027
Colômbia 0,203 ± 0,063 0,338 ± 0,057 0,459 ± 0,081
Equador 0,044 ± 0,005 0,646 ± 0,006 0,310 ± 0,007
Peru 0,119 ± 0,012 0,730 ± 0,006 0,151 ± 0,015
Venezuela 0,163 ± 0,031 0,230 ± 0,015 0,606 ± 0,040
América Central
Bahamas 0,852 ± 0,023 0,080 ± 0,021 0,068 ± 0,039
Costa Rica 0,122 ± 0,012 0,497 ± 0,038 0,381 ± 0,039
El Salvador 0,097 ± 0,019 0,752 ± 0,018 0,151 ± 0,032
Jamaica 0,903 ± 0,010 0,057 ± 0,011 0,041 ± 0,001
Porto Rico 0,264 ± 0,010 0,132 ± 0,028 0,603 ± 0,026
América do Norte
México 0,101 ± 0,027 0,601 ± 0,021 0,296 ± 0,023
34. 18
Capítulo 1
Figura 1.1. Mapa da América Latina e Caribe mostrando as variações étnicas entre os países conforme as estimativas de
contribuição parental africana (vermelho), ameríndia (verde) e européia (azul). As legendas indicam a proporção de
mistura variando de 1 a 10, sendo que até 1 indica que a população possui até dez por cento de contribuição da
respectiva parental e assim sucessivamente.
35. 19
Capítulo 1
A matriz de distância genética de Reynolds et al. (1983), entre as 13 populações
latino-americanas e caribenhas miscigenadas e as populações três parentais, está
apresentada na Figura 1.2. Como esperado, as distâncias genéticas entre as populações
parentais foi maior do que os valores de distância entre as populações miscigenadas.
Exceções foram observadas nos casos em que as populações miscigenadas apresentavam
grande diferencial no percetual de contribuição para as populações parentais, como é o
caso de Jamaica, com alta contribuição africana, com relação às populações de Peru
(0,044) e Equador (0,039), que apresentaram alta contribuição ameríndia.
Quando se comparam as populações miscigenadas com as parentais, observou-se
uma maior distância genética entre estas e as parentais que menos contribuíram para a
formação das mesmas e menor distância com as que mais contribuiriam. Por exemplo,
verificou-se uma maior distância entre as populações caribenhas (Bahamas e Jamaica) e a
parental ameríndia. Entretanto, essas duas populações miscigenadas apresentaram
distâncias menores quando se compara com a parental africana. As populações de Chile,
Peru, Equador, Colômbia, Argentina, México e El Salvador apresentaram as menores
distâncias em relação à parental ameríndia, enquanto que o Brasil, Venezuela e Porto Rico
apresentaram as menores distâncias com relação à parental européia. De um modo geral,
na comparação entre os grupos parentais e as populações miscigenadas, as menores
distâncias observadas ocorreram com a parental européia. Quando se comparam apenas as
populações miscigenadas entre si, as menores distâncias observadas foram com o Brasil e a
Venezuela e com a Colômbia e a Argentina e Costa Rica.
A Figura 1.3 mostra o diagrama da primeira e segunda coordenadas principais, que
responderam por cerca de 83% da variação, sendo que a primeira coordenada representou
64% e a segunda 18% do total da variabilidade entre as populações. O eixo X mostrou a
separação entre ameríndio e as outras parentais. A segunda coordenada principal separou o
agrupamento europeu da parental africana, ficando assim localizado no quadrante superior
à direita. Os dados mostrados na matriz de distância genética e no diagrama acima
corroboraram os resultados gerados na análise de mistura. Todas as populações
miscigenadas apresentaram valores de distância genética intermediários às três parentais.
As populações com alto percentual africano (Jamaica e Bahamas) ficaram próximos da
parental africana, localizados no quadrande inferior à direita. As com maior contribuição
ameríndia apresentaram menor distância em relação a essa parental, ou seja, todas se
localizaram nos dois quadrantes da esquerda. As populações mais proximas da parental
européia foram Porto Rico, Brasil e Venezuela.
36. 20
Capítulo 1
EUR AFR AMC AMS VEZ PER CHI EQU BAH JAM COL BRA ARG MEX COS SAL PUE
EUR -
AFR 0,0255 -
AMC 0,0503 0,0674 -
AMS 0,0276 0,0503 0,0144 -
VEZ 0,0047 0,0211 0,0299 0,0144 -
PER 0,0327 0,0460 0,0097 0,0122 0,0171 -
CHI 0,0188 0,0388 0,0276 0,0151 0,0111 0,0184 -
EQU 0,0204 0,0415 0,0125 0,0078 0,0097 0,0068 0,0132 -
BAH 0,0196 0,0023 0,0563 0,0398 0,0148 0,0367 0,0305 0,0324 -
JAM 0,0239 0,0025 0,0671 0,0473 0,0199 0,0444 0,0372 0,0395 0,0032 -
COL 0,0097 0,0250 0,0220 0,0087 0,0021 0,0120 0,0098 0,0057 0,0179 0,0234 -
BRA 0,0028 0,0157 0,0392 0,0215 0,0017 0,0229 0,0149 0,0147 0,0106 0,0150 0,0049 -
ARG 0,0086 0,0299 0,0202 0,0096 0,0023 0,0110 0,0086 0,0053 0,0216 0,0289 0,0020 0,0052 -
MEX 0,0133 0,0313 0,0195 0,0100 0,0050 0,0097 0,0113 0,0064 0,0238 0,0304 0,0034 0,0085 0,0035 -
COS 0,0092 0,0286 0,0240 0,0102 0,0029 0,0156 0,0091 0,0078 0,0213 0,0271 0,0019 0,0056 0,0028 0,0051 -
SAL 0,0183 0,0376 0,0150 0,0036 0,0078 0,0094 0,0111 0,0041 0,0283 0,0350 0,0032 0,0126 0,0046 0,0047 0,0048 -
PUE 0,0058 0,0182 0,0419 0,0261 0,0049 0,0270 0,0206 0,0193 0,0134 0,0180 0,0085 0,0034 0,0082 0,0121 0,0084 0,0161 -
Figura 1.2. Matriz de distância genética (Reynolds et al, 1983), entre treze populações miscigenadas latino-americanas e as três parentais com
referência aos 13 marcadores STRs do CODIS. Legenda: EUR (europeu), AFR (africano), AMC (ameríndio da América Central), AMS (ameríndio
da América do Sul), VEZ (Venezuela), PER (Peru), CHI (Chile), EQU (Equador), BAH (Bahamas), JAM (Jamaica), COL (Colômbia), BRA (Brasil), ARG
(Argentina), MEX (México), COS (Costa Rica), SAL (El Salvador), PUE (Porto Rico).
37. 21
Capítulo 1
Figura 1.3. Diagrama das duas primeiras coordenadas principais, relativo à distância
genética entre os 13 países latino-americanos e caribenhos e suas populações
parentais (europeu, africano e ameríndio), baseado na análise de 13
marcadores STRs autossômicos. AFR (africano), AMEC (ameríndio da América
Central), AMES (ameríndio da América do Sul), ARG (Argentina), BAH (Bahamas), BRA
(Brasil), CHI (Chile), COL (Colômbia), COS (Costa Rica), EQU (Equador), EUR (europeu),
JAM (Jamaica), MEX (México), PER (Peru), PUE (Porto Rico), SAL (El Salvador), VEN
(Venezuela).
38. 22
Capítulo 1
1.4. DISCUSSÃO
Diferenciação populacional na América Latina
Há uma grande semelhança na história geral dos países latino-americanos, em
especial com relação à colonização, a escravidão e a origem geográfica dos colonizadores e
escravos (Sans, 2000). Por outro lado, em decorrência de diversos fatores, dentre os quais o
posicionamento geográfico e econômico dentro do continente americano, há uma
heterogeneidade entre as regiões do continente (Wang et al., 2008; Choudhry et al., 2006;
Salzano, 2004). No presente trabalho foi observado que há diferenças entre os países da
América latina quando são considerados 13 marcadores STR do CODIS.
As diferenças entre os países não são reflexo da diversidade gênica dos marcadores
analisados, pois esta foi alta em todos os países para todos os marcadores. A diversidade
gênica alta foi decorrente do alto número de alelos que é uma característica do tipo de
marcador empregado. Essa característica é um dos parâmetros que levou o CODIS a
utilizar tais marcadores para análises forenses, ou seja, o alto polimorfismo principalmente
em populações européias (Oliveira et al., 2006; Dixon et al., 2005; Destro-Bisol et al.,
2000). A diversidade gênica avalia a heterozigose que é dependente do número de alelos e
sua freqüência nas populações (Nei, 1987). Como o número de alelos variou pouco entre as
populações, a única fonte de variação ficou restrita à freqüência dos alelos.
A subestruturação populacional entre os países da América Latina e Caribe foi
confirmada pela análise de variância molecular – AMOVA – que indicou que os valores de
Fst estimados para os pares de populações foram estatisticamente significativos em várias
combinações de populações. Como em outras análises envolvendo a espécie humana
(Manica et al., 2005; Jorde & Wooding, 2004; Comas et al., 2000; Destro-Bisol et al.,
2000), o resultado mostrou que a diferença entre as populações pode ser melhor explicado
pelas diferenças intrapopulacionais do que interpopulacionais. No presente trabalho a
variação intrapopulacional estimada variou de 99,83% a 98,68. A maior variação
intrapopulacional é um dos parâmetros utilizados na sustentação da inexistência de raças
humanas (Barbujani, 2005; Bamshad et al., 2004; Oliveira & Ferreira, 2004).
A subestruturação populacional foi também confirmada pela análise de distância
genética. Observou-se que as três populações parentais ficaram perfeitamente bem
diferenciadas, enquanto que as populações latino-americanas e do Caribe apresentaram
uma posição no diagrama, diretamente relacionada à população parental que participou
com a maior contribuição na sua constituição genética atual. De um modo geral, a análise
39. 23
Capítulo 1
de coordenada principal foi concordante com dados antropológicos e históricos, assim
como com as estimativas de mistura, isto é, o posicionamento das populações no diagrama
apresentou-se relacionado à porcentagem de contribuição das populações parentais.
Mistura genética
A América Latina tem sido palco de grandes transformações populacionais, sendo
hoje caracterizada por ter uma constituição multiétnica em decorrência da influência dos
mais distintos povos ao longo da história. Por outro lado, a maior contribuição genética
adveio de três populações parentais principais - europeu, africano e ameríndio.
A população americana pré-colombiana sofreu mudanças significativas na sua
composição inicial. Paralelamente à diminuição numérica expressiva, relacionada
principalmente ao processo da conquista, houve também à diminuição numérica
importante relativa à perda da identidade étnica em decorrência da absorção destes por
parte dos colonizadores. Entretanto, em algumas regiões a população nativa subsistiu e tem
forte influência na formação da população. Isto pode ser observado em especial nas regiões
onde o acesso foi mais difícil e/ou eram regiões inóspitas a época da colonização. Países
como El Salvador, Chile, Costa Rica, Colômbia, Equador e Peru, que apresentavam
florestas fechadas e/ou regiões montanhosas, apresentaram estimativas expressivas de
contribuição ameríndia. Por outro lado, no Brasil, em algumas regiões da Argentina e da
Colômbia, na Venezuela e em Porto Rico, a contribuição parental ameríndia é menor, em
decorrência da extensiva migração européia que houve para esses países.
Pode-se dizer que, em termos de contribuição populacional, a colonização européia
na América Latina obteve êxito no sentido de que as estimativas aqui obtidas revelam que
sua presença é marcante em quase todos os territórios. Em determinados países a
contribuição se sobrepôs às demais, com foi o caso do Brasil, Venezuela, Porto Rico e
Argentina (65,9%, 61,5%, 61,3% e 60,1%, respectivamente). Essa sobreposição numérica
tem relação com o número efetivo de migrantes e com o fato de que os homens europeus
se reproduziram com mulheres de todas as etnias, como já demonstrado em outros estudos
(Martínez et al., 2007; González-Andrade et al. 2007; Bedoya et al., 2006; Campos-
Sánchez et al., 2006; Alves-Silva et al., 2000), o que teve como conseqüência a geração de
um maior número de descendentes.
A contribuição africana é maior em regiões onde houve maior exploração
econômica por parte dos europeus, sendo, portanto lugares de mais fácil acesso, isto é, pela
40. 24
Capítulo 1
costa do Atlântico já que a rota de navegação naquela época entre a Europa e África com a
América se ocorria no Oceano Atlântico. As maiores contribuições dessa parental foram
encontradas nos países do Caribe, Jamaica (com mais de 90%) e Bahamas (quase 85%). Na
América do Sul, países com acesso mais fácil à costa do Oceano Atlântico apresentaram
estimativas maiores de contribuição africana na composição genética atual, como Brasil e
Venezuela. Exceção foi a Argentina que, apesar de ser um país da costa Atlântica,
apresenta apenas 9% de contribuição africana. Por outro lado, países em que o acesso se dá
pela costa do pacífico, como Chile, Equador e Peru, apresentaram baixa contribuição
africana. Estimativas de contribuição dessa parental para a população do Equador foram
também obtidas por González-Andrade et al. (2007), os quais obteveram resultado similar
ao aqui apresentado. Essa observação reflete o fato histórico de que durante o tráfico de
escravos, em especial no século XVI, os escravos africanos com destino à costa Pacífica
vinham da costa Atlântica, passando pelo atual território colombiano e depois eram
levados para o Peru de onde eram distribuídos para as regiões vizinhas, (Klein, 1986).
Estimativas de mistura genética calculadas anteriormente para a Argentina
mostraram resultados similares aos encontrados neste trabalho. A contribuição africana foi
estimada em 7% e ameríndia em torno de 30% na constituição da população de La Plata,
região próxima a capital Buenos Aires, utilizando dados de marcadores genéticos
autossômicos clássicos (Lopes-Camelo et al., 1996). A avaliação dessa mesma população
utilizando cinco marcadores do tipo AIMs confirmaram a baixa contribuição africana
(6,5%), alta européia (67,5%) e ameríndia intermediária (30%) (Martínez-Marignac et al.,
2004).
No Brasil, o processo de mistura foi complexo devido à sua extensão territorial e,
ao contrário da Argentina, a contribuição parental africana foi significativa. A contribuição
européia aqui estimada foi concordante com a descrita em outros trabalhos (Ferreira et al.,
2006; Callegari-Jacques et al., 2003) e é marcante em todas as regiões do Brasil,
especialmente na região sul, sendo a contribuição ameríndia e africana variável.
Na Colômbia, há uma diversidade na constituição genética entre as regiões. Na
Costa Colombiana, por exemplo, predomina a contribuição européia e africana (capítulo
2), mas nos Andes a presença ameríndia é marcante. Na Antioquia, a contribuição européia
é elevada, acima de 69% (Bedoya et al., 2006) quando se considera marcadores do
cromossomo X, ao passo que na região de Chocó a contribuição européia é baixa. Se
considerarmos todas as regiões simultaneamente o que se verifica são valores
intermediários para as três parentais.
41. 25
Capítulo 1
Já na Venezuela, estudos mostram que a heterogeneidade genética é verificada com
relação às diferentes regiões geográficas (Simmons et al., 2007; Loyo et al., 2004), e
também entre diferentes grupos sociais (Martínez et al., 2007), sendo as contribuições
ameríndias e africanas maiores nas classes mais baixas do que nas classes mais ricas. Os
dados do presente estudo foram similares aos estudos já realizados, mostrando contribuição
européia mais alta do que as outras parentais. Com relação ao Chile, os resultados
encontrados no presente trabalho foram similares ao observado em trabalho utilizando
marcadores genéticos clássicos (grupos sangüíneos, enzimas eritrocitárias, proteínas do
plasma e marcadores do sistema HLA), onde foi estimada uma contribuição ameríndia que
variou de 47 a 59% e uma africana baixa (Acuña et al., 2000).
A escolha das parentais, como dito anteriormente, tem um reflexo direto nos
resultados. Isso pode ser exemplificado com os resultados obtidos por Zúñiga et al. (2006)
para Porto Rico, que mostraram diferenças para os resultados aqui relatados, apesar de
tratar-se fundamentalmente do mesmo banco de dados, isto é, eles utilizaram 15
marcadores STRs, incluindo os 13 marcadores analisados neste estudo. A maior diferença,
de fato, concentrou-se na escolha das parentais. Zúñiga et al. (2006) selecionaram como
parental européia um banco de dados de Andaluzia (Sul da Espanha), como africana um
banco do oeste da África subsaariana (Guiné-Bissau) e como ameríndia dados de
ameríndios do México (Estado de Hidalgo). Os resultados indicaram contribuição européia
alta (superior a 76%), africana intermediária (em torno de 17%) e ameríndia baixa (cerca
de 6%). No presente estudo foi também observada contribuição européia é alta, porém com
valores bem inferiores (61%), enquanto que a contribuição estimada da parental ameríndia
foi o dobro do obtido por Zúñiga et al. (2006). Essa discrepância sugere que a população
ameríndia que foi utilizada provavelmente apresenta miscigenação com europeu, o que
pode ter superestimado a contribuição européia obtida por aqueles autores.
Com relação à população mexicana, as estimativas para a região noroeste do
México mostraram contribuição significativa da parental européia e da parental ameríndia,
com baixa contribuição africana (Cerda-Flores et al., 2002). No presente estudo observou-
se uma contribuição parental ameríndia maior que a européia. Entretanto, nas análises de
mistura do presente estudo foram incluídos dados de freqüências alélicas de outras regiões
mexicanas, isto é, da região central (Hernández-Gutiérrez et al., 2005) e cidade do México
(Luna-Vasquez et al., 2003). Pode-se sugerir que exista heterogeneidade genética nas
diferentes regiões do México, assim como que tais diferenças possam ser decorrentes da
escolha das populações parentais.
42. 26
Capítulo 1
Similarmente, trabalho anterior com a população da Costa Rica também apresentou
resultados diferentes aos encontrados nesse estudo. Os resultados de análises de mistura
utilizando 11 marcadores genéticos clássicos (ABO, RH, MNS, KEL, FY, jK, P, LE, SE,
DI e HP) mostraram contribuição européia de mais de 60% na constituição étnica da
população (Morera et al., 2003), enquanto que os dados aqui obtidos indicaram que a
parental ameríndia apresenta a maior contribuição.
Os resultados de estimativa de mistura obtidos para a região caribenha com os 13
marcadores STRs foi similar ao encontrado por Benn-Torres et al. (2007) com a utilização
de 28 marcadores AIMs. Há uma concordância de que a contribuição africana é muito alta
e as ameríndia e européia muito baixas.
É possível sugerir que os aspectos geográficos e climáticos influenciaram na
europeização da América. Extensas barreiras naturais, como as regiões semi-áridas e os
desertos do México, do noroeste da Argentina e o Atacama no Chile, a Cordilheira dos
Andes e a floresta Amazônica aparentemente formaram barreiras que podem ter desviado o
curso das migrações. Essas regiões são bastante inóspitas o que tornou as regiões
interioranas de difícil acesso. Ainda assim, a América Latina sofreu forte transformação
étnica, com grau de amalgamação intenso e ininterrupto que reflete na formação da
população, possibilitando a existência de diversas combinações. Assim, os afro-americanos
estão mais presentes no Caribe e ao longo da costa atlântica até o Brasil. Os ameríndios são
mais numerosos na região da Cordilheira, e os europeus nas regiões de clima mais ameno
ou menos inóspito como Argentina, sul do Brasil, Chile, Venezuela e Porto Rico.
Quando se analisa grandes regiões geográficas pode-se entender melhor todo o
processo de transformação que as populações sofreram devido ao intenso fluxo gênico
contínuo, como ocorreu na América nestes últimos 500 anos. Entretanto, as mudanças
microrregionais são importantes para se compreender o todo, já que existem variações
étnicas ao longo do continente. Estudando o processo de construção histórica regional
pode-se fazer inferências de como ocorreu o processo de assimilação entre os diferentes
grupos étnicos. Nos próximos capítulos serão discutidos dois modelos distintos de
colonização: primeiro, o processo de mistura étnica em três países considerando-se as
diferenças regionais dos mesmos e, segundo, será discutido um modelo regional de
colonização, em que populações da região centro-oeste brasileira serão o objeto de estudo.
O objetivo é mostrar que, assim como ocorreu com toda a América Latina, a região centro-
oeste foi palco de profundas transformações étnicas.
44. 28
Capítulo 2
2.1. INTRODUÇÃO
As sucessivas migrações ocorridas para a América do Sul levaram à formação de
grupos miscigenados e a um quadro populacional diversificado. É notável a
heterogeneidade populacional decorrente dessas migrações e do processo de amalgamento
que se deu em virtude dos contatos entre os diferentes grupos étnicos a partir do início da
colonização da América pelos europeus. Embora o início da colonização tenha sido
similar, posteriormente o povoamento se desenvolveu por diferentes caminhos nas
diferentes regiões da América, incluindo diferenças regionais dentro de um mesmo país
(Salzano, 2004). Exemplo disso foi o que ocorreu na Argentina, Brasil e Colômbia, países
localizados na América do Sul.
Antes da ocupação pelos europeus, a partir do século XV, a América do Sul era
ocupada exclusivamente pelos ameríndios, porém de diferentes grupos lingüísticos.
Quando os espanhóis chegaram ao atual território colombiano eles se depararam com
populações ameríndias divididas em diversos grupos lingüísticos, sendo que a maioria
pertencia aos grupos Chibchan e Caribe (Melo, 1996). Os povos indígenas dessa região já
conheciam a agricultura, sendo que os que habitavam as regiões litorâneas praticavam uma
agricultura mais rudimentar, enquanto que aqueles que viviam nas regiões mais altas
(Chibchan) praticavam a agricultura utilizando técnicas mais avançadas e intensivas,
cultivando milho, batata e algodão.
Na Argentina, os espanhóis encontraram populações ameríndias agricultoras, na
região noroeste, nas serras centrais e nas margens dos rios, e nômades, que viviam da caça
e da coleta, localizadas principalmente nas regiões de pampa, nos chacos e na patagônia. A
maioria pertencia ao grupo lingüístico Tupi-guarani e outros pequenos grupos como os
Tehuelche (Salzano & Callegari-Jacques, 1988).
No Brasil, diferentemente dos demais países latino-americanos, o principal
colonizador foi o português. Quando os colonizadores chegaram ao território, encontraram
na costa atlântica grupos ameríndios que pertenciam a diversos grupos lingüísticos
especialmente Tupi-guarani. Ao adentrarem o país encontraram diversos grupos indígenas,
dentre os quais os do grupo Jê, habitantes da região mais central do Brasil. A maior parte
dos indígenas brasileiros vivia da caça, coleta e da pesca, sendo que vários conheciam a
agricultura, cultivando hortaliças e tubérculos como a mandioca (Vainfas, 2000; Salzano &
Callegari-Jacques, 1988).
45. 29
Capítulo 2
Paralelamente a essa diferença inicial entre os três países em decorrência dos
diferentes grupos lingüísticos que habitavam a região antes do inicio da colonização, dois
outros fatores contribuíram de maneira fundamental na definição da constituição genética
populacional desses países. Primeiro foi a forma com que se deu a conquista desses
territórios pelos europeus e segundo foi o tráfico de escravos e a distribuição dos africanos
nos mesmos.
Quanto à colonização pelos europeus, a elaboração de um tratado em 1494
estabelecendo a divisão das terras até então descobertas e aquelas por descobrir entre
Portugal e Espanha, o Tratado de Tordesilhas, definiu que Portugal teria direito de ocupar
as terras localizadas a leste da linha de 370 léguas traçada a partir de Açores e Cabo Verde,
enquanto que a Espanha ocuparia todas as terras que ficassem do lado ocidental dessa
linha. Por isso, Brasil foi colonizado pelos portugueses, enquanto que o restante da
América seria de direito da Espanha (Herman, 2000).
A Colômbia foi o primeiro país da América do Sul a ser dominado pela Espanha.
Quando Cristóvão Colombo chegou à América em 1492, os espanhóis se fixaram primeiro
nas ilhas do mar do Caribe. Somente em 1498, em sua terceira viagem à América,
Colombo alcançou a atual costa venezuelana. Entre 1501 e 1535 vários contatos já haviam
sido estabelecidos com os ameríndios da costa atlântica da Colômbia e das savanas
adjacentes. A ocupação espanhola se estendeu para o interior do território entre 1535 a
1560, especialmente nos Vales del Cauca e Madalena e dos altiplanos ao sul e oriente. O
estabelecimento dos espanhóis no território foi rápido, sendo que nas primeiras décadas de
colonizção houve a fundação de várias cidades como Santa Marta (1526), Cartagena
(1533) e Santa Fé de Bogotá (1539), atual capital Bogotá. A Colômbia ocupava uma
posição estratégica, pois era a porta de acesso para as demais regiões a oeste e ao sul da
América do Sul, onde se localizavam os impérios ameríndios mais desenvolvidos, Astecas
e Incas (Melo, 1996).
A chegada dos portugueses à costa atlântica do Brasil se deu em 1500. Como o
território e a costa marítima eram vastos, a coroa portuguesa criou o regime de capitanias
hereditárias em 1532 com o objetivo de explorar e ocupar o território, propiciando, assim,
a criação dos primeiros núcleos de colonização portuguesa no Brasil. Diferente do que
ocorreu com as colônias espanholas, não houve planejamento de cidades e a ocupação
ocorreu apenas na costa atlântica nas primeiras décadas. A união entre Espanha e Portugal
entre 1580 e 1640 permitiu a expansão do território brasileiro além dos limites fixados pelo
Tratado de Tordesilhas, época em que ocorreram expedições, conhecidas como Entradas e
46. 30
Capítulo 2
Bandeiras, que promoveram a ocupação das terras a oeste, além das terras localizadas ao
norte do país e ao sul, na região platina. No século XVIII muitas cidades já haviam sido
estabelecidas, tanto na costa marítima (Fortaleza, São Luiz, Natal, Recife, Olinda, Ilhéus,
Vitória, Rio de Janeiro entre outras) quanto no interior do território (Mariana, Vila Rica,
Goiás, Cuiabá, entre outras) (Bertran, 2000; Herman, 2000; Palacín & Moraes, 1994).
Os portugueses foram os europeus que mais contribuíram para a colonização do
Brasil. Estima-se que em um primeiro momento aproximadamente 700 mil portugueses
tenham migrado para o Brasil. A partir de 1700 o fluxo migratório se tornou mais intenso
em virtude da descoberta do ouro, sendo que entre os períodos de 1880 a 1960 houve
migração em massa, com um número de imigrantes estimado em mais de 1,5 milhão de
indivíduos. Contribuíram ainda para povoar o Brasil, principalmente a partir de 1890, os
italianos, que formaram o segundo maior contingente de migrantes europeus, seguido pelos
espanhóis, que iniciaram a migração para o Brasil em épocas mais remotas desde o século
XVI (Venâncio, 2000) e os japoneses que migraram principalmente para a região sudeste.
O processo de colonização da Argentina ocorreu a partir do século XVI. Pelo fato
de haver poucos grupos camponeses indígenas estabelecidos e, inicialmente, poucos
recursos minerais disponíveis ao sul do rio da Prata, até 1520 a coroa espanhola estava
mais voltada para a conquista do rico império inca localizado na região da Cordilheira dos
Andes, na América do Sul. Somente em 1527 se deu a construção do primeiro povoado da
Argentina, chamado forte de Sancti Spiritus. O povoamento do território se deu graças às
concessões para explorar a região fornecida pela coroa espanhola a particulares (Rock,
1985).
O atual território argentino fazia parte da vasta região de colonização da Espanha
que abrangia também, por direito concedido pelo tratado de Tordesilhas, a Bolívia,
Paraguai, Uruguai, Chile e parte do Brasil. Assim, até o início do século XVII os espanhóis
fundaram alguns assentamentos que acabaram por originar as principais cidades
argentinas, como Buenos Aires (1536), Santa Fé e Córdoba (1573), Catamarca (1603),
entre outras. A imigração européia para a Argentina foi contínua, o que contribuiu com a
política de “embranquecimento” da população, sendo que os migrantes eram originários
principalmente da Espanha e da Itália. A colonização pelos europeus foi intensa até o
início do século XX, época da segunda guerra mundial (Rock, 1985).
Quanto à contribuição africana, a vinda para a Argentina, Brasil e Colômbia se deu
em diferentes épocas e proporções. Todos esses três países apresentam costa marítima
atlântica, o que facilitou a entrada de africanos, decorrente do tráfico de escravos pelos
47. 31
Capítulo 2
europeus, a partir do século XVI. A origem dos africanos foi semelhante, isto é, eram de
povos que viviam na África subsaariana, principalmente do Congo e Angola e, em menor
número, da Guiné, Gana, Nigéria, Serra Leoa e Moçambique. Pertenciam a diferentes
grupos lingüísticos, como bantus e sudaneses. O Brasil foi a colônia que mais utilizou a
mão-de-obra escrava. Dados estatísticos mostram que cerca de 40% de todos os africanos
trazidos para a América vieram para o Brasil (Klein, 1986). Enquanto que mais de quatro
milhões de escravos entraram no Brasil entre 1451 e 1870, nesse mesmo período a
América espanhola recebeu menos da metade deste contingente. Isso foi teoricamente
decorrente do menor êxito português na utilização de mão-de-obra indígena quando
comparado com os espanhóis (Klein, 2000).
A Colômbia foi uma rota importante para a entrada de escravos africanos na
América do Sul. Antes da chegada dos escravos até o Peru e sua distribuição a outras
regiões da colônia espanhola, o porto de Cartagena na costa caribenha era o primeiro local
de desembarque dos escravos. Os escravos que ficavam na Colômbia eram utilizados
principalmente na costa caribenha e, posteriormente, na região oeste ao norte do pacífico,
que compreende o atual estado de Chocó. A descoberta de ouro no século XVIII nesta
região incrementou o fluxo de escravos. Embora o local fosse de difícil acesso, Chocó se
tornou o principal centro de extração de ouro nessa época e a população afro-descendente
nesse local cresceu rapidamente: de dois mil escravos mineiros em 1720 a mais de sete mil
em 1782. Esse número respondia por mais de 13% da população escrava total de todo o
vice-reinado de Nova Granada, onde hoje se localiza as terras baixas da costa nordeste da
Colômbia (Klein, 1986). Portanto, nessa época a população escrava total na Colômbia era
em torno de 54 mil indivíduos.
Na Argentina houve inicialmente pouco interesse na mão-de-obra escrava, pois esta
era uma região pouco explorada devido à falta de metais preciosos exportáveis disponíveis
de imediato. A demanda se deu quando da implantação de estâncias de gado no Rio da
Prata e da descoberta de prata no alto Peru em 1545. O porto de entrada dos escravos foi a
cidade de Buenos Aires, sendo que a maioria deles era proveniente de Angola. Porém os
números são imprecisos em decorrência de uma ampla perda de documentos. Estima-se
que entre 1600 até 1806 tenham entrado na Argentina pouco mais de 52 mil escravos
(Rock, 1985).
O avanço de povos europeus na América do Sul provocou mudanças significativas
nas populações locais. À medida que os europeus avançaram no processo de conquista,
trazendo junto consigo escravos africanos, os povos ameríndios que se encontravam na
48. 32
Capítulo 2
costa atlântica foram sendo forçados a migrar para o interior do continente, isto quando
conseguiam escapar da morte provocada pelas guerras ou pelas doenças trazidas pelos
europeus (Alencastro, 2000). Isso provocou a diminuição do número de ameríndios onde a
presença européia ocorria. Uma questão então pode ser levantada: quais foram as
conseqüências em termos de constituição genética populacional do predomínio europeu em
determinadas regiões? Assim, buscou-se responder às seguintes indagações: Argentina,
Brasil e Colômbia, devido à similaridade nas suas histórias, apresentam hoje o mesmo
padrão populacional? A participação dos grupos parentais presentes durante a colonização
da América Latina ocorreu de forma homogênea nos três países analisados?
Este capítulo teve por objetivo mostrar que o processo de colonização e mistura em
três países da América do Sul – Argentina, Brasil e Colômbia - ocorreu de forma
heterogênea. Os instrumentos para tal estudo foram marcadores genéticos do tipo
microssatélites, pois seu alto grau de polimorfismo permite observar as variações entre
indivíduos numa dada população e entre as populações.
2.2. MATERIAL E MÉTODOS
Fonte de Dados
Argentina, Brasil e Colômbia são três países da América do Sul que apresentaram
semelhanças quanto ao seu povoamento. O Brasil é dividido em cinco regiões geográficas:
norte, nordeste, centro-oeste, sudeste e sul. A Argentina pode ser dividida em seis regiões
geográficas: Pampa (região centro-oriental), Mesopotâmia (na bacia hidrográfica formada
pelos rios Uruguai e Paraná), Gran Chaco (terras do Chaco argentino), Noroeste (região
montanhosa localizada a noroeste, próximo às divisas com Chile e Bolívia), Cuyo (região
andina) e Patagônia (sul do país). A Colômbia é divida em 32 estados, mas não apresenta
divisão administrativa ou geográfica em macrorregiões como é o caso da Argentina e do
Brasil. No presente trabalho foi adotado a divisão populacional em quatro principais
regiões colombianas sugerida por Paredes et al. (2003) que são: Costa do Caribe, Costa do
Pacífico Norte (afro-descendentes do Estado de Chocó) e Ilha Caribenha de San André,
região a sudoeste dos Andes e região dos Andes, Amazônica e do Orinoco, as quais foram
denominadas A, B, C e D, respectivamente, no presente trabalho. As divisões acima
citadas foram utilizadas para as análises descritas a seguir e estão apresentadas na Figura
2.1.
49. 33
Capítulo 2
Figura 2.1. Mapa da Argentina, Brasil e Colômbia e suas respectivas regiões geográficas adotadas para as análises desenvolvidas neste trabalho.
A divisão adotada para a Argentina é referente às regiões geográficas do mesmo, para o Brasil é a divisão político-administrativa
adotada pelo governo federal do país, enquanto que a Colômbia foi dividida de acordo com o proposto por Paredes et al. (2003).
Costa Caribe
Chocó
Sudoeste Andes
Andes, Amazônia e
Orinoco
Norte
Centro-Oeste
Nordeste
Sudeste
Sul
Noroeste
Pampa
Patagônia
Gran Chaco
Mesopotâmia
Costa Caribe
Chocó
Sudoeste Andes
Andes, Amazônia e
Orinoco
Costa Caribe
Chocó
Sudoeste Andes
Andes, Amazônia e
Orinoco
Norte
Centro-Oeste
Nordeste
Sudeste
Sul
Norte
Centro-Oeste
Nordeste
Sudeste
Sul
Noroeste
Pampa
Patagônia
Gran Chaco
Mesopotâmia
Noroeste
Pampa
Patagônia
Gran Chaco
Mesopotâmia
50. 34
Capítulo 2
Para as análises populacionais relativas às regiões dos três países, foram realizados
levantamentos da literatura referentes às freqüências gênicas de treze marcadores STRs do
sistema CODIS (Combined DNA Index System) - CSF1PO, D3S1358, D5S818, D7S820,
D8S1179, D13S317, D16S539, D18S51, D21S11, FGA, TH01, TPOX e vWA (Tabela 1,
Anexo 1). Os dados foram compilados de acordo com as regiões geográficas de cada país e
as freqüências gênicas foram estimadas pelas médias ponderadas dos dados obtidos para
cada região. A região de Cuyo (Argentina) não foi considerada devido à ausência de dados
na literatura com relação aos marcadores analisados.
Análises populacionais
A mistura gênica foi estudada com base nas diferenças e similaridades das
freqüências gênicas dos marcadores genéticos entre as populações de interesse e suas
parentais (grupos étnicos parentais), que no caso aqui apresentado são europeus, africanos
e ameríndios. Para estimar as freqüências alélicas das parentais, foram calculadas as
médias ponderadas a partir de bancos de dados de Portugal e da Espanha, para a parental
européia, da África subsaariana, para a africana, e de povos ameríndios da América do Sul
para a ameríndia. Os dados de freqüência foram obtidos no banco de dados da
Universidade de Düsseldorf (http:/www.uni-duesselforf.de/WWW/MedFak/Serology/
Database.html, acessado dia 03/05/2008), em Paredes et al. (2003a) e em Fernandes e
Brehm (2002) para as populações de Portugal e da Espanha; no banco de dados ALFRED
(Allelic Frequency Database -http://alfred.med.yale.edu – acessado em 03/05/2008) e em
González-Andrade et al. (2006) para as populações ameríndias da América do Sul
(Kichwas, Cubeo, Desano, Puinave, Tehuelche, Tucano, Wichi e Curripaco). Para a
população parental africana, os dados foram obtidos no banco de dados da Universidade de
Düsseldorf para as populações de Nigéria, Zimbábue, Benin, Bamileke e Ewondo de
Camarões, Ovambo da Namíbia e uma amostra de Angola e Guiné Bissau - e em artigos
científicos - Angola (Alves et al., 2004), Guiné Bissau (Gonçalves et al., 2002), Gabão
(Steinlechner et al., 2002), Guiné Equatorial (Alves et al., 2005; Gene et al., 2001) e
Ruanda (Tofanelli et al., 2003).
A análise de mistura foi realizada utilizando o programa ADMIX 3, baseado no
método de Identidade Gênica (Chakraborty, 1985) entre as populações ancestrais e a
miscigenada. Esse programa gera duas estimativas, a viesada e a não viesada. É
considerada como melhor estimativa aquela que apresentar o maior R-square e nos casos
em que o R-square é igual escolheu-se a estimativa não viesada. As estimativas de mistura