terça-feira, 18 de junho de 2024

Translator

 

Primeiras dispersões humanas nas Américas

Ciência
8 de novembro de 2018
Vol 362 , Edição 6419
DOI: 10.1126/science.aav2621

Processos complexos na colonização das Américas

A expansão para as Américas pelos ancestrais dos atuais nativos americanos tem sido difícil de separar das análises das populações atuais. Para entender como os humanos divergiram e se espalharam pelas Américas do Norte e do Sul, Moreno-Mayar et al. sequenciou 15 genomas humanos antigos do Alasca à Patagônia. A análise dos genomas mais antigos sugere que houve uma divisão precoce nas populações beringianas, dando origem às linhagens do Norte e do Sul. Dado que a história da população não pode ser explicada por modelos ou padrões simples de dispersão, parece que as pessoas saíram da Beringia e atravessaram os continentes de uma forma complexa.
Ciência , esta edição p. eaav2621

Resumo Estruturado

INTRODUÇÃO

Os estudos genéticos do povoamento das Américas no Pleistoceno concentraram-se no momento e no número de migrações da Sibéria para a América do Norte. Eles mostram que os ancestrais nativos americanos (NAs) divergiram dos siberianos e dos asiáticos orientais há cerca de 23.000 anos (~ 23 ka) e que uma divisão dentro dessa linhagem ancestral entre os NAs posteriores e os antigos Beringianos (ABs) ocorreu há cerca de 21 ka. Posteriormente, os NAs divergiram nos ramos norte de NA (NNA) e sul de NA (SNA) há cerca de 15,5 ka, uma divisão que se infere ter ocorrido ao sul do leste de Beringia (atual Alasca e oeste do Território de Yukon).

RATIONALE

Claims of migrations into the Americas by people related to Australasians or by bearers of a distinctive cranial morphology (“Paleoamericans”) before the divergence of NAs from Siberians and East Asians have created controversy. Likewise, the speed by which the Americas were populated; the number of basal divergences; and the degrees of isolation, admixture, and continuity in different regions are poorly understood. To address these matters, we sequenced 15 ancient human genomes recovered from sites spanning from Alaska to Patagonia; six are ≥10 ka old (up to ~18× coverage).

RESULTS

All genomes are most closely related to NAs, including those of two morphologically distinct Paleoamericans and an AB individual. However, we also found that the previous model is just a rough outline of the peopling process: NA dispersal gave rise to more complex serial splitting and early population structure—including that of a population that diverged before the NNA-SNA split—as well as admixture with an earlier unsampled population, which is neither AB nor NNA or SNA. Once in the Americas, SNAs spread widely and rapidly, as evidenced by genetic similarity, despite differences in material cultural, between >10-ka-old genomes from North and South America. Soon after arrival in South America, groups diverged along multiple geographic paths, and before 10.4 ka ago, these groups admixed with a population that harbored Australasian ancestry, which may have been widespread among early South Americans. Later, Mesoamerican-related population(s) expanded north and south, possibly marking the movement of relatively small groups that did not necessarily swamp local populations genetically or culturally.

CONCLUSION

Os NAs irradiaram rapidamente e deram origem a múltiplos grupos, alguns visíveis no registo genético apenas como populações não amostradas. Em diferentes épocas estes grupos expandiram-se para diferentes porções do continente, embora não tão extensivamente como no povoamento inicial. O facto de a população inicial se ter espalhado ampla e rapidamente sugere que o seu acesso a grandes porções do hemisfério era essencialmente irrestrito, embora existam indícios genómicos e arqueológicos de uma presença humana anterior. Como esses primeiros grupos estão relacionados ou estruturados, especialmente aqueles com ascendência australásica, permanece desconhecido. A rápida expansão, agravada pelo efeito atenuante da distância e, em alguns lugares, pelas barreiras geográficas e sociais, deu origem a histórias populacionais complexas. Estes incluem uma forte estrutura populacional no noroeste do Pacífico; isolamento na Grande Bacia da América do Norte, seguido por continuidade genética de longo prazo e, finalmente, um episódio de mistura anterior a aproximadamente 0,7 ka atrás; e múltiplas migrações independentes e geograficamente desiguais para a América do Sul. Uma dessas migrações fornece pistas sobre a ancestralidade australásia do Pleistoceno Superior na América do Sul, enquanto outra representa uma expansão relacionada à Mesoamérica; ambos contribuíram para a atual ascendência sul-americana.
Dispersão e divergência de NA ao longo do tempo.
Representação esquemática dos pontos amostrais incluídos neste estudo (círculos) e nossas principais conclusões (apresentadas geográfica e temporalmente). ( A ) História populacional dos ramos basais AB, NNA e SNA na América do Norte. kya, mil anos atrás. ( B ) Dispersão precoce e rápida de SNAs em todo o continente (~14 ka atrás). ( C ) Expansão recente relacionada à Mesoamérica para norte e sul. As setas não correspondem a rotas de migração específicas.
Abrir no visualizador

Abstrato

Os estudos sobre o povoamento das Américas concentraram-se no momento e no número das migrações iniciais. Menos atenção tem sido dada à subsequente disseminação de pessoas nas Américas. Sequenciamos 15 genomas humanos antigos, abrangendo do Alasca à Patagônia; seis têm ≥10.000 anos (até ~18× cobertura). Todos estão mais intimamente relacionados com os nativos americanos, incluindo os de um indivíduo da Antiga Beringia e de dois “paleoamericanos” morfologicamente distintos. Encontrámos evidências de rápida dispersão e diversificação precoce que incluíam grupos até então desconhecidos à medida que as pessoas se deslocavam para sul. Isso resultou em múltiplas migrações independentes e geograficamente desiguais, incluindo uma que fornece pistas de um sinal genético da Australásia do Pleistoceno Superior, bem como uma expansão posterior relacionada à Mesoamérica. Isso levou a histórias populacionais complexas e dinâmicas da América do Norte à América do Sul.
Previous genomic studies have estimated that ancestral Native Americans (NAs) diverged from Siberian and East Asian populations ~25,000 ± 1100 years ago (25 ± 1.1 ka ago) (1, 2), with a subsequent split 22 to 18.1 ka ago within that ancestral lineage between later NAs and Ancient Beringians (ABs). NAs then diverged into two branches, northern NAs (NNAs) and southern NAs (SNAs), ~17.5 to 14.6 ka ago (24), a process inferred to have taken place south of eastern Beringia (present-day Alaska and western Yukon Territory). All contemporary and ancient NA individuals for whom genome-wide data have been generated before this study derive from either the NNA or SNA branch.
No entanto, existe desacordo sobre reivindicações de migrações anteriores para as Américas por pessoas possivelmente relacionadas com a Australásia ou por portadores de uma forma craniana distinta (“Paleoamericanos”) ( 5 , 6 ). Se ocorreram divisões adicionais nas Américas, quantos movimentos migratórios para o norte e para o sul ocorreram e a velocidade da dispersão humana em diferentes épocas e regiões também são controversos. Em contraste com modelos baseados em dados genéticos contemporâneos e da idade do Pleistoceno ( 3 , 4 ), estudos genômicos de restos humanos do Holoceno posterior indicam mistura pós-divergência entre grupos NA basais ( 7 ). No geral, o grau de isolamento, mistura ou continuidade populacional em diferentes regiões geográficas das Américas após a colonização inicial é mal compreendido ( 7 9 ).
Sequências do genoma do Pleistoceno Superior e do Holoceno Inferior são raras. Se quisermos resolver como ocorreu o processo de povoamento, são necessárias mais sequências além das três atualmente disponíveis: Anzick1 de Montana (~12,8 ka de idade) ( 3 ), Kennewick Man/Ancient One de Washington (~9 ka de idade) ( 10 ) e USR1 do Alasca (~ 11,5 ka de idade) ( 1 ).

Conjunto de dados e resumo do método

Envolvemo-nos e procuramos feedback de grupos indígenas ligados aos indivíduos ancestrais analisados ​​neste estudo, utilizando as recomendações para investigação genómica com comunidades indígenas ( 11 13 ). Obtivemos sequências genômicas de 15 restos humanos antigos ( Fig. 1A ). Estes incluem restos de Trail Creek Cave 2, Alasca (radiocarbono datado de ~9 ka atrás; ~0,4× profundidade genômica de cobertura); Big Bar Lake, Colúmbia Britânica (~5,6 ka de idade; ~1,2× cobertura); e Spirit Cave, Nevada (~10,7 ka de idade; ~18× cobertura); quatro indivíduos de Lovelock Cave, Nevada (com idade variando de ~1,95 a 0,6 ka; cobertura de ~0,5× a ~18,7×); cinco indivíduos de Lagoa Santa, Brasil (~10,4 a ~9,8 ka de idade; ~0,18× a ~15,5× cobertura); um indivíduo de cada local de Punta Santa Ana e Ayayema ​​na Patagônia Chile (~7,2 e ~5,1 ka de idade, com cobertura de ~1,5× e ~10,6×, respectivamente); e uma múmia inca de Mendoza, Argentina (estimada em cerca de 0,5 ka de idade; ~ 2,5 × cobertura) ( 14 ) [todos 14 As idades C estão em anos calibrados ( 13 , 15 )] ( Fig. 1, A e B ). Também sequenciamos um genoma de ~ 15,9 × de um ilhéu de Andaman do século XIX, usado como proxy para a ancestralidade da Australásia em modelos envolvendo mistura em NAs ( 2 , 6 , 13 , 16 ). Foi confirmado que todos os extratos de DNA continham fragmentos com padrões característicos de incorporação incorreta de DNA antigo e baixos níveis de contaminação (<3%) ( 13 ). Os genomas Spirit Cave, Lovelock 2 e Lovelock 3 foram gerados exclusivamente a partir de extratos tratados com reagente de excisão específico de uracila (USER), confirmados como contendo padrões característicos de incorporação incorreta de DNA antigo antes do tratamento ( 13 , 17 ).
Open in viewer
Para avaliar as relações genéticas entre estes e outros genomas humanos antigos e contemporâneos, compilamos um conjunto de dados comparativos do genoma completo de 378 indivíduos ( 13 ). Além disso, fundimos estes dados com um painel de polimorfismo de nucleotídeo único (SNP) de 167 populações mundiais genotipadas para 199.285 SNPs, enriquecidos em populações NA cujos componentes de ancestralidade europeia e africana foram identificados e mascarados ( 2 , 4 , 13 , 18 ) ( Figura 1A ). De particular interesse são os Mixe, um grupo de referência mesoamericano que representa um ramo interno inicial dentro dos SNAs, antes da divergência dos sul-americanos ( 4 ), que carece do sinal de ancestralidade da Australásia documentado entre alguns grupos amazônicos ( 2 , 6 , 16 ).
Exploramos inicialmente as amplas afinidades genéticas dos indivíduos antigos usando agrupamento baseado em modelo ( 19 ) e escalonamento multidimensional (MDS) ( Fig. 1, C a F ) ( 13 ). O MDS foi aplicado tanto à matriz de distância identidade por estado para todos os indivíduos ( 20 ) quanto à matriz de distância f 3 sobre as populações incluídas no conjunto de dados do array SNP ( 13 , 21 , 22 ). Em seguida, testamos hipóteses específicas calculando D estatísticas corrigidas por erros e baseadas em genótipos ( 13 , 21 , 23 ) e ajustando gráficos de mistura ( 4 , 13 , 21 , 24 ) ( Figs. 2 , 3 e 4 ). Além disso, inferimos parâmetros demográficos e temporais usando o espectro de frequência do local conjunto (SFS) ( 25 , 26 ) e informações de desequilíbrio de ligação ( 27 , 28 ) ( Fig. 5 ). Esses esforços nos permitiram explorar modelos complexos em escala mais refinada usando dados do genoma completo ( 13 ). A profundidade média de cobertura dos genomas apresentados neste estudo varia amplamente, o que significa que nem todos os genomas poderiam ser utilizados em todas as análises, conforme especificado ( 13 ).
Abrir no visualizador
Figura 3 Os testes baseados em estatísticas da mostram uma rápida dispersão na América do Sul, seguida por uma mistura relacionada à Mesoamérica.
( A ) Representação esquemática de um modelo para formação de SNA. Este modelo representa um ajuste razoável para a maioria das populações atuais ( 13 ). As linhas de mistura relacionadas à UPopA, Mixe e Australásia são codificadas por cores como nos painéis subsequentes. Meso., Mesoamericano. ( B ) Pontuação de ajuste do gráfico mostrado em (A) (excluindo sul-americanos) em função da “mistura não amostrada” no Mixe. O ponto indica a proporção de mistura não amostrada que produz a pontuação de melhor ajuste. ( C ) Estatísticas D com correção de erros mostrando que Lagoa Santa (LagoaS), Mixe e a maioria dos genomas de SNA não podem ser modelados usando uma árvore simples. (Topo) A hipótese nula testada, juntamente com a indicação do par de populações com excesso de compartilhamento de alelos, dependendo do sinal de D. As populações SNA são organizadas de acordo com seu local de amostragem (rótulos à direita). Os pontos representam estatísticas D e as barras de erro representam ~3,3 SEs (que corresponde a um P valor Z de ~0,001 em um teste ). Para cada teste, mostramos o escore z absoluto ao lado de seu correspondente D. Valor ( D e E ) Superfícies de pontuação de ajuste para o modelo SNA “misturado” com proporções fixas de mistura Mixe e Australásia. Para Ayayema ​​e Suruí, exploramos o ajuste do modelo mostrado em (A) em uma grade de valores para a proporção Mixe em SNAs {0,0,05,...,1} e a contribuição da Australásia para Lagoa Santa {0, 0,01,...0,1}. “X” indica a combinação de parâmetros que produz a melhor pontuação. As linhas de contorno foram desenhadas de modo que todas as combinações de parâmetros contidas em uma determinada linha produzissem uma pontuação de ajuste inferior à indicada pelo rótulo de contorno. ( F ) Uma representação unidimensional de (D) e (E) para todas as populações SNA. Neste caso, fixamos a contribuição da Australásia para Lagoa Santa em 3%. Cada linha é rotulada com o valor que produz a pontuação de melhor ajuste. Comparamos diferentes modelos com base em suas pontuações de ajuste, onde uma diferença de ~3 corresponde a um valor P de ~0,05 e uma diferença de ~4,6 corresponde a um valor P de ~0,01. Para (B), um conjunto de cinco indivíduos sequenciados representa a população de Lagoa Santa. Para (C) a (F), consideramos o conjunto de dados do genótipo chamado excluindo transições ( 13 ) e utilizou o indivíduo Sumidouro5 de alta profundidade como representante da população de Lagoa Santa.
Abrir no visualizador
Fig. 4 Testes de simetria de compartilhamento de alelos para pares de NAs, em relação aos atuais grupos eurasianos.
( A ) Calculamos estatísticas D da forma D (NA, NA; Eurasiático, Yoruba) para testar se um determinado grupo de NA carrega ancestralidade “não-NA” em excesso em comparação com outros NAs. Para cada estatística, obtivemos um escore z (losangos) com base em um procedimento jackknife de bloco ponderado em blocos de 5 Mb. As linhas verticais representam ~3,3 e ~-3,3 (que correspondem a um valor P de ~0,001). Neste caso, mostramos apenas resultados para as populações atuais da Eurásia ( 13 ). Roxo, Oceanianos; rosa, Sudeste Asiático; cinza, não-australásios. ( B corrigidas para contaminação ) Estatísticas f 4 da forma f 4 (Mixe, Lagoa Santa; Australásia, Yoruba). Para cada estatística, subtraímos o valor de f 4 (Mixe, francês; Australásio, iorubá), ponderado por uma fração de contaminação assumida c variando entre 0 e 10% ( y eixo ). Os pontos representam estatísticas f 4 e as barras de erro representam ~3,3 SEs. Observamos que o aparente compartilhamento de alelos entre Lagoa Santa e Australásios aumenta em função da correção. Como referência, mostramos os valores de f 4 (Mixe, Suruí; Australásio, Yoruba) como linhas verticais sólidas. Todos os testes são do conjunto de dados do genoma completo descrito em ( 13 ) e excluindo polimorfismos de transição. H3, D -termo estatístico (ver materiais suplementares); WCDesert, Ngaanyatjarra do deserto centro-oeste. ( C ) Locais de amostragem aproximados para grupos da Australásia destacados em (A).
Abrir no visualizador
Figura 5 História demográfica dos SNAs.
Uma representação esquemática do modelo mais provável relacionando os antigos genomas USR1, Anzick1, Spirit Cave e Lagoa Santa e os atuais Mixe ( n = 3 genomas) e Karitiana ( n = 5 genomas). Os parâmetros demográficos foram inferidos usando momi2 ( 13 ). Este modelo apresenta um rápido padrão de divisão norte-sul para SNAs durante um período inferior a 2 ka, com posterior mistura de um grupo externo (UPopA) no Mixe Mesoamericano. Além disso, encontramos evidências de fluxo gênico destes últimos para os atuais sul-americanos, representados neste caso pelos Karitiana. Os pulsos de mistura do USR1 nos ancestrais de outros NAs seguem a inferência em ( 1 ).
Abrir no visualizador
Nosso objetivo é compreender padrões amplos de dispersão, divergência e mistura de pessoas nas Américas. Dada a distribuição altamente desigual das amostras do genoma no tempo e no espaço, os nossos resultados são expressos - tanto quanto possível - cronologicamente, do mais antigo para o mais novo, e geograficamente, de norte a sul, para reflectir a forma como ocorreu o povoamento das Américas.

Insights sobre as primeiras populações da Beringia Oriental a partir de um genoma do Alasca

Embora as primeiras evidências arqueológicas da presença humana no leste da Beringia permaneçam contestadas, as pessoas estavam presentes no Alasca há pelo menos 14,4 ka ( 29 ). Os insights genômicos do genoma USR1 indicam que os ABs ( 1 ) permaneceram isolados no interior do Alasca até pelo menos o Pleistoceno terminal e eram um grupo externo para NNAs e SNAs. Inferiu-se que a divisão populacional NNA-SNA ocorreu fora do leste da Beringia ( 1 , 2 ). Por outro lado, descobertas recentes sugerem que a população ancestral de NNAs existia ao norte dos mantos de gelo continentais ( 9 ).
O genoma da Caverna Trail Creek vem de um dente de uma criança recuperada na Península de Seward, no Alasca ( 13 ). Este agrupamento individual é adjacente ao USR1 nas análises de MDS ( Fig. 1C ) ( 13 ) e carrega uma distribuição semelhante de componentes de ancestralidade ( Fig. 1F ) ( 13 ). O indivíduo Trail Creek e o USR2 (encontrado com um parente próximo do USR1) abrigam o mesmo haplogrupo de DNA mitocondrial (mtDNA), B2, mas não a variante B2 derivada encontrada em outras partes das Américas ( 1 , 13 ). baseadas em genótipo Estatísticas D da forma D (Aymara, NA; TrailCreek, Yoruba) e D (USR1, TrailCreek; NA, Yoruba) sugerem que Trail Creek forma um clado com USR1 que representa um grupo externo para outros NAs ( 13 ). Este posicionamento foi apoiado pelo ajuste de gráficos de mistura baseados em estatísticas ( 13 , 21 ).
O procedimento aqui descrito, que também foi utilizado para outras amostras, baseia-se em um “gráfico de sementes” que incorpora a formação do grupo ancestral NA e seus três ramos basais (ABs, NNAs e SNAs) ( 1 , 30 , 31 ). O gráfico de sementes inclui as seguintes folhas: Yoruba (representando africanos), Mal'ta (antigos eurasianos do norte), Andaman (australásios), Han (orientais asiáticos), USR1 (ABs), Athabascan (NNAs) e Spirit Cave (SNAs) (ver abaixo) ( 13 ). Enumeramos todas as extensões possíveis do gráfico de sementes onde um genoma individual, Trail Creek neste caso, foi adicionado como uma população não misturada ou misturada ( 32 ). Otimizamos os parâmetros para cada topologia usando qpGraph ( 21 ) e favorecemos o gráfico que produz a melhor verossimilhança e os menores resíduos entre as estatísticas f observadas e previstas . Dado que os modelos misturados produzem melhores pontuações de verossimilhança (devido aos parâmetros adicionais sendo otimizados), consideramos um modelo misturado como uma melhoria em comparação com sua contraparte não misturada apenas se a diferença absoluta entre as pontuações de ajuste (log probabilidades) fosse maior que ~ 4,6, correspondente a um Valor P de ~0,01 em um teste de razão de verossimilhança padrão ( 30 ). De acordo com as análises exploratórias, descobrimos que o modelo no qual os indivíduos Trail Creek e USR1 formam um clado é o mais provável ( Fig. 2A ) ( 13 ).
Estes resultados sugerem que os indivíduos USR1 e Trail Creek eram membros de uma metapopulação AB que ocupou o leste da Beringia e permaneceu isolada de outras populações de NA durante o Pleistoceno Superior e o Holoceno Inferior. Encontrar dois membros da população AB, de locais separados por aproximadamente 750 km, com tecnologias de artefatos semelhantes ( 13 ) apoia a inferência de que a divisão SNA-NNA ocorreu ao sul do leste da Beringia ( 1 , 9 ). A alternativa, que as NNAs e SNAs se dividam no Alasca, parece menos provável; seriam necessários vários milhares de anos de forte estrutura populacional antes de aproximadamente 16 ka atrás para diferenciar esses grupos uns dos outros e dos ABs, bem como uma presença separada de SNA, que ainda não foi encontrada ( 1 ). Esses dados indicam que os Athabascans e Inuit, que hoje habitam o Alasca e são NNAs, mas com ascendência adicional relacionada à Sibéria ( 1 , 4 , 18 , 33 ), presumivelmente se mudaram para o norte, para a região, algum tempo depois de cerca de 9 ka atrás, a idade do Indivíduo de Trail Creek ( 1 , 13 ).

Rápida dispersão da população SNA pelas Montanhas Rochosas e na América do Sul

Estima-se que a divisão NNA-SNA tenha ocorrido entre 17,5 e 14,6 ka atrás ( 1 , 2 ). Os membros do ramo SNA finalmente alcançaram o sul da América do Sul e, com base no mtDNA, no cromossomo Y e nas evidências de todo o genoma, isso provavelmente ocorreu rapidamente ( 2 , 7 , 8 , 34 , 35 ). Este movimento deu origem à divisão em série e à estrutura populacional inicial, sendo os mesoamericanos o grupo mais profundamente divergente, seguidos pelos sul-americanos a leste e a oeste dos Andes ( 4 , 36 ). No entanto, dados genômicos de Spirit Cave (10,7 ka de idade) e Lagoa Santa (10,4 ka de idade), os locais mais antigos deste estudo, mostram que o padrão de dispersão do SNA ao sul dos mantos de gelo continentais envolveu eventos complexos de mistura entre populações estabelecidas anteriormente.
MDS e ADMIXTURE, bem como uma árvore TreeMix focada em genomas SNA, revelam que os indivíduos Spirit Cave e Lagoa Santa eram membros do ramo SNA ( Fig. 1, C e F ) ( 13 ). Dentro desse ramo, Spirit Cave está mais próxima de Anzick1, enquanto Lagoa Santa está mais próxima de grupos SNA do sul. Dois dos indivíduos de Lagoa Santa carregam o mesmo haplogrupo de mtDNA (D4h3a) que Anzick1, mas três dos indivíduos de Lagoa Santa abrigam o mesmo haplogrupo do cromossomo Y que o genoma da Spirit Cave (Q-M848) ( 13 ). No entanto, as transformações MDS restritas aos SNAs ( Fig. 1, D e E ) ( 13 ), juntamente com gráficos TreeMix incluindo mistura ( 13 ), sugerem que esses antigos indivíduos da América do Norte e do Sul estão intimamente relacionados, independentemente da afinidade de Lagoa Santa com o presente -dia grupos sul-americanos.
Testamos formalmente esse cenário ajustando f gráficos de mistura baseados em estatísticas e descobrimos que, embora os indivíduos Anzick1, Spirit Cave e Lagoa Santa estejam separados por aproximadamente 2 ka e milhares de quilômetros, os genomas desses três indivíduos podem ser modelados como um clado com exclusão do Mixe Mesoamericano ( 13 ). Embora não tenhamos encontrado evidências rejeitando este clado usando as estatísticas TreeMix e D ( 13 ), a modelagem adicional baseada em SFS indica que o Mixe provavelmente carrega fluxo gênico de um grupo externo não amostrado e forma um clado com Lagoa Santa. A inclusão de mistura de grupo externo diferente de zero no Mixe ao ajustar um gráfico de mistura baseado em estatísticas f resultou em um ajuste significativamente melhor (teste de razão de verossimilhança; P <0,05) ( Fig. 3, A e B ) ( 13 ). Doravante, nos referimos a esse grupo externo como população A não amostrada (UPopA), que não é AB, NNA ou SNA e que inferimos ter sido separada de NAs há aproximadamente 24,7 ka, com uma faixa etária entre 30 e 22 ka atrás [95% intervalo de confiança (IC); esta grande variação é resultado do desafio analítico de estimar a divergência e os tempos de mistura na ausência de dados do genoma da UPopA]. Esta faixa etária se sobrepõe à divisão inferida de NAs de siberianos e asiáticos orientais de 26,1 a 23,9 ka atrás ( 1 ) e a divergência do USR1 de outros NAs (23,3 a 21,2 ka atrás). Esta sobreposição temporal, que não pode ser totalmente resolvida numa sequência relativa com os dados actuais, sugere que ocorreram múltiplas divisões na Beringia num curto espaço de tempo. Dependendo de quão próximas estas divisões se revelarem, elas poderiam implicar que existia uma estrutura moderada dentro de Beringia ( 1 , 37 ), possivelmente juntamente com o fluxo gênico indireto dos siberianos, talvez através de outras populações de NA. Sob um modelo com um fluxo gênico semelhante a um pulso, inferimos uma probabilidade de ~ 11% do fluxo gênico de UPopA para o Mixe ~ 8,7 ka atrás (IC de 95%, 0,4 a 13,9 ka atrás; o amplo intervalo reflete potencialmente a migração contínua não modelada) ( Fig. 5 ) ( 13 ). Assim, favorecemos um modelo onde o ancestral comum dos indivíduos Anzick1 e Spirit Cave divergiu do ancestral comum dos indivíduos Lagoa Santa e Mixe ~14,1 ka atrás (IC 95%, 13,2 a 14,9 ka atrás), talvez como Lagoa Santa –A população ancestral mista estava se movendo para o sul. Inferimos que a população de Lagoa Santa divergiu do Mixe logo depois disso, ~13,9 ka atrás (IC 95%, 12,8 a 14,8 ka atrás) ( Figura 5 ) ( 13 ). A proximidade destes tempos de divergência estimados sugere que o processo de dispersão foi muito rápido numa escala de tempo arqueológico, à medida que as populações se expandiram pela América do Norte talvez numa questão de séculos e depois para o leste da América do Sul dentro de um ou dois milénios.

Ancestralidade da Australásia no Holoceno Inferior da América do Sul e reivindicações dos Paleoamericanos

Tanto os indivíduos da Caverna do Espírito quanto os de Lagoa Santa foram identificados como Paleoamericanos ( 38 , 39 ), conotando uma morfologia craniana distinta daquela dos NAs modernos. As interpretações deste padrão vão desde o facto de ser o resultado de uma migração anterior separada para as Américas até ao facto de surgir da continuidade da população com diferenciação in situ devido a factores como o isolamento e a deriva , 40-42 ) ( 13 . Examinamos se essa morfologia poderia estar associada à antiga ancestralidade genética da Australásia encontrada nos atuais grupos amazônicos ( 2 , 6 ). No entanto, não estão disponíveis dados morfométricos para os povos actuais com este sinal genético ( 6 ), nem este sinal foi detectado em qualquer esqueleto antigo com esta morfologia ( 2 , 10 ).
To test for the Australasian genetic signal in NAs, we computed D statistics of the form D(NA, NA; Eurasian, Yoruba), where NA represents all newly sequenced and reference high-depth NA genomes (13). In agreement with previous results (6), we found that the Amazonian Suruí share a larger proportion of alleles with Australasian groups (represented by Papuans, Australians, and Andaman Islanders) than do the Mixe (13). Lagoa Santa yielded results similar to those obtained for the Suruí: The analyzed Lagoa Santa genome also shares a larger proportion of alleles with Australasian groups, but not with other Eurasians, than do Mesoamerican groups (the Mixe and Huichol) (Fig. 4) (13). However, the Australasian signal is not present in the Spirit Cave individual, and we include this distinction in the admixture graph modeling (Figs. 3A and 4A) (13). We inferred less than 3% European contamination in the Lagoa Santa genome (<3%) (13) and show that this finding is robust to potential European contamination by computing “contamination-corrected” f4 statistics (Fig. 4B) (13). The presence of the Australasian genomic signature in Brazil 10.4 ka ago and its absence in all genomes tested to date that are as old or older and located farther north present a challenge in accounting for its presence in Lagoa Santa.
Notably, all sequenced Paleoamericans (including Kennewick Man/Ancient One) (2, 10) are genetically closer to contemporary NAs than to any other ancient or contemporary group sequenced to date.

Multiple dispersals into South America

Genome-wide data from contemporary populations suggested a single expansion wave into South America with little gene flow between groups (4) [but see (36)]. By contrast, analysis of later Holocene genomes suggests that South Americans derived from one or more admixture events between two ancestral NA groups, possibly via multiple movements into South America (7).
To test these competing scenarios, we performed an exhaustive admixture graph search, as described above. We fitted a seed graph involving Yoruba, Mal’ta, Andaman, Han, Anzick1, Spirit Cave, Lagoa Santa, and Mixe (present-day Mesoamerican) genomes and tested all possible “nonadmixed” and “admixed” models for SNAs: the Mesoamerican Maya and Yukpa of Venezuela, groups east (the Suruí, Karitiana, Piapoco, and Chané) and west (the Aymara and Quechua) of the spine of the Andes, six ancient Patagonians [one from Ayayema, one from Punta Santa Ana, and four individuals from (43)], the ancient Taino (44), and the Aconcagua Incan mummy (14) (Fig. 1B) (13). This analysis indicates that most present-day South American populations do not form a clade with Lagoa Santa but instead derive from a mixture of Lagoa Santa– and Mesoamerican-related ancestries (Fig. 3A) (13). We confirmed these results by computing standard and error-corrected D statistics of the form D(LagoaSanta, SNA; Mixe, Yoruba) and D(Mixe, SNA; LagoaSanta, Yoruba) (Fig. 3B) (13). For most groups, these statistics are inconsistent with a simple tree and indicate multiple dispersals into South America.
O genoma de Ayayema ​​da Patagônia com aproximadamente 5,1 ka de idade é uma exceção; forma um clado com a população de Lagoa Santa. Isto sugere que a chegada da ancestralidade relacionada à Mesoamérica ocorreu após –5,1 ka atrás e/ou que não atingiu a região remota habitada pelos ancestrais do indivíduo Ayayema ​​( Fig. 3C ) ( 13 ). Este resultado é espelhado qualitativamente pelo indivíduo de Punta Santa Ana, com 7,2 ka de idade (ambos agrupam-se com os atuais Patagônios e formam um clado com Lagoa Santa). No entanto, a baixa cobertura de Punta Santa Ana pode reduzir nosso poder de detectar possível mistura relacionada à Mesoamérica ( Fig. 3C ) ( 13 ).
Exploramos ainda mais o ajuste do modelo ( Fig. 3A ) para cada grupo sul-americano, fixando a contribuição da Australásia em Lagoa Santa e a contribuição mesoamericana ( Fig. 3, D e E ) na população de teste do SNA em uma faixa de valores ( 13 ). Enquanto uma contribuição da Australásia inferior a 1% e superior a ~6% resulta numa diminuição significativa na probabilidade (teste da razão de verossimilhança; P <0,05), a contribuição mesoamericana tem uma gama mais ampla de valores plausíveis ( Fig. 3E ) ( 13 ) . No entanto, a modelagem de cada grupo SNA com pouca ou nenhuma mistura relacionada à Mesoamérica produz consistentemente pontuações de ajuste significativamente mais baixas ( P <0,05) ( 13 ), exceto para o indivíduo Ayayema ​​( Fig. 3D ) ( 13 ).
A contribuição da Australásia para Lagoa Santa foi consistentemente diferente de zero quando modelamos os sul-americanos, embora não tenhamos observado em todos os casos uma melhoria significativa ao modelar a mistura da Australásia em grupos SNA através de Lagoa Santa ( 13 ). Este resultado sugere que esta ancestralidade era difundida entre os primeiros sul-americanos. Embora não possamos estimar com confiança a proporção de mistura relacionada a Lagoa Santa para esses grupos, observamos uma tendência geral para as populações a leste dos Andes (por exemplo, os Suruí) de suportarem mais desta ancestralidade do que os grupos andinos (por exemplo, os Aymara). ) ( Fig. 3F ) ( 13 ). Uma possível explicação para esta diferença é que a maior mistura relacionada com a Mesoamérica ocorreu no lado ocidental dos Andes.
Por último, exploramos a história demográfica dos atuais sul-americanos usando SFS conjunta (momi2) ( 25 , 26 ) e informações de desequilíbrio de ligação [SMC++ ( 27 ) e diCal2 ( 28 )]. Procuramos compreender as relações destes grupos com Lagoa Santa – o que também fornece um meio indireto de avaliar os efeitos da mistura na assinatura da Australásia. Para a análise SFS, selecionamos Karitiana, a única população SNA para a qual um número suficiente de genomas não misturados está disponível publicamente ( n = 5); para a análise diCal, utilizamos Karitiana, Aymara ( n = 1 genoma) e Suruí ( n = 2 genomas) ( 13 ). A partir da análise SFS, inferimos que os ancestrais de Lagoa Santa e Karitiana divergiram entre si há cerca de 12,9 ka (IC 95%, 10,4 a 14,0 ka atrás). Posteriormente, este último recebeu fluxo gênico de uma população relacionada à Mesoamérica, que já carregava mistura do grupo externo UPopA ( Fig. 5 ) ( 13 ). Com a suposição de uma migração semelhante a um pulso, isso aponta para um fluxo gênico recente (~35%) do grupo relacionado à Mesoamérica para Karitiana ( Fig. 5 ), possivelmente sugerindo mistura contínua durante um período prolongado. Quando permitimos dois pulsos, inferimos um fluxo gênico substancial tanto no passado recente quanto no distante ( 13 ). Os resultados do diCal2 são consistentes para as populações Karitiana, Aymara e Suruí, mostrando que suas histórias demográficas envolveram uma mistura entre uma fonte relacionada a Lagoa Santa e uma fonte relacionada a Mixe ( 13 ).
No geral, as nossas descobertas sugerem que logo após a chegada, os sul-americanos divergiram ao longo de múltiplos caminhos geográficos ( 36 ). Esse processo foi ainda mais complicado pela chegada de uma segunda migração independente e fluxo gênico nos tempos do Holoceno Médio e Superior. A mistura posterior reduziu potencialmente a assinatura da Australásia que poderia ter sido transportada pelos habitantes anteriores.

Continuidade populacional de longo prazo na Grande Bacia Norte-Americana e na Expansão Numérica

Mesoamerican-related expansion possibly had a bearing on a later, unresolved pattern seen in North America. In the western Great Basin of North America, paleoenvironmental evidence indicates decreased effective precipitation and increased aridity during the Middle Holocene, which led to a human population decline (45, 46). By ~5 ka ago, regional populations were rebounding, but whether these were descendants of the previous inhabitants is unknown. Unclear also is the relationship between those later Holocene groups and the people present in the region at the time of European contact and today. Linguistic evidence suggests that ancestors of Numic speakers presently inhabiting the region today arrived recently, perhaps ~1 ka ago. There is also archaeological evidence of changes in material culture around that time, though how those relate to the linguistic turnover is uncertain. Nor is it known whether these changes are related to population admixture or replacement. Patterns and changes in language, material culture, and genetics need not be congruent or causally linked (47 ). Assim, a chamada hipótese da Expansão Numérica tem sido altamente debatida ( 46 , 48 ); abordamos o aspecto populacional comparando genomas de Spirit Cave e Lovelock Cave ( Fig. 1A ) ( 13 ).
MDS and ADMIXTURE analyses, as well as D statistics of the form D(SpiritCave, Lovelock2/3; NA, Yoruba), suggest that despite the ~9 ka separating the Spirit Cave and Lovelock individuals, they form a clade with respect to other NAs (Fig. 1, C to F) (13). We tested that topology through the same admixture graph search implemented for SNAs (13). We were not able to reject the model without Mesoamerican-related admixture for Lovelock 2 (~1.9 ka old). However, the ~0.7-ka-old Lovelock 3 individual received Mesoamerican admixture from a group that was likely not present in the region just ~1.2 ka earlier, at the time of Lovelock 2. Because we do not know the language(s) that may have been involved, we cannot securely attribute this admixture to arriving Numic speakers [the Mixe, whom we use as a proxy for Mesoamerican ancestry, fall in a separate language family from Numic (49)]. Notably, we also observe genetic continuity, suggesting that there was not a complete population replacement.
Present-day Pima from northern Mexico can also best be modeled as a Mesoamerican-related mixture. However, the Pima require admixture from a branch splitting above the Mixe–Spirit Cave divergence, likely an NNA population (13). We cannot specify a particular source population. These patterns indicate that complex population movements and mixture occurred after the initial settlements of the Great Basin and Southwest from both the north and south.

História populacional complexa de longo prazo no noroeste do Pacífico

Os grupos do Noroeste do Pacífico tinham uma história demográfica do Pleistoceno Superior considerada distinta daquela dos primeiros grupos SNA ( 1 , 2 , 9 , 18 , 33 ). Para explorar a história populacional e a relação das populações regionais com NNAs e SNAs, avaliamos as afinidades genéticas entre o indivíduo Big Bar Lake, de 5, 6 ka, do Planalto Fraser, no centro da Colúmbia Britânica, e outros NAs. Dada a sua relativa proximidade geográfica, incluímos os 939, 302 e 443 indivíduos da costa da Colúmbia Britânica ( 9 ) e o Kennewick Man/Ancient One ( 10 ). Como esses genomas foram considerados representantes de NNAs, também incluímos dados genômicos de antigos indivíduos do sudoeste de Ontário (ASO), que estão intimamente relacionados às populações de Algonquin (NNA) ( 7 ).
Esses antigos indivíduos norte-americanos agruparam-se separadamente das populações SNA em ambas as transformações MDS, e sua distribuição de componentes ancestrais se assemelha muito à das populações NNA ( Fig. 1, C e F ) ( 13 ). No entanto, observamos diferenciação genética entre esses indivíduos e outras populações norte-americanas. Enquanto os antigos indivíduos costeiros da Colúmbia Britânica se agruparam com os atuais falantes de Athabascan e Tsimshian da região, o grupo ASO e Kennewick Man/Ancient One foram colocados em uma posição intermediária entre NNAs e SNAs. Embora o indivíduo Big Bar tenha sido colocado próximo a populações NNA que não carregam mistura siberiana recente ( Fig. 1, C e F ) ( 13 ), estatísticas D da forma D (Aymara, NA; BigBar, Yoruba) e D (USR1, NA ; BigBar, Yoruba) sugerem que Big Bar representa um grupo externo anteriormente não detectado para NAs não-AB, que divergiu antes da divisão NNA-SNA ( 13 ).
To describe the genetic ancestry of these individuals, we used the admixture graph search strategy (13). In agreement with previous results, the ancient coastal British Columbian individuals are best modeled as a clade with Athabascans, who bear Siberian-related admixture (Fig. 2C). However, the best-fitting model suggests that the Big Bar individual represents a population that split before the NNA-SNA divergence but after AB divergence and without Siberian admixture (Fig. 2B) (13). Lastly, in accordance with their placement in both MDS transformations, we observed that Kennewick Man/Ancient One and ASO individuals are best modeled as deriving a fraction of their ancestry from an SNA-related source, represented by Spirit Cave in this case (Fig. 2, D and E) (13). We confirm this through error-corrected D statistics (Fig. 2F) (13) suggesting gene flow between ASO individuals and an SNA group that diverged after the split of Anzick1 and that did not bear recent Mesoamerican-related ancestry.
Thus, the broader population history in this region was evidently marked by admixture between the NNA and SNA branches that most likely gave rise to the ancestors of Kennewick Man/Ancient One and ASO individuals and by isolation between groups in coastal British Columbia (represented by the 939 individual) and interior British Columbia (represented by Big Bar).

Discussion

Os genomas aqui descritos não prejudicam a árvore previamente estabelecida na qual a divisão AB dos NAs ancestrais é seguida pela divisão basal NNA-SNA ao sul do leste de Beringia. No entanto, mostram que a árvore é, na melhor das hipóteses, um esboço do processo de povoamento. Descobrimos agora que, uma vez ao sul do leste da Beringia, os NAs irradiaram rapidamente e deram origem a múltiplas populações, algumas das quais são visíveis no registo genético apenas como populações não amostradas e que em diferentes momentos se expandiram para diferentes porções do continente, embora não tão extensivamente. como no povoamento inicial ( Fig. 6 ).
Abrir no visualizador
O rápido movimento da América do Norte para a América do Sul é geneticamente evidente ( Fig. 6, A e B ) e foi antecipado a partir do aparecimento “arqueologicamente instantâneo” de locais em todo o hemisfério datados de pouco depois de 13 ka atrás ( 50 , 51 ). A evidência sugere que o mecanismo de movimento não foi simplesmente o crescimento populacional gradual e a expansão geográfica incremental, mas sim mais semelhante a um salto em grandes porções da paisagem diversificada interveniente ( 52 ). Se este resultado for válido, ele prevê que amostras terminais adicionais do Pleistoceno se ajustarão a um padrão semelhante a uma estrela, como observado neste estudo.
O facto de a população inicial ter evidentemente se espalhado ampla e rapidamente, mas de forma algo desigual, pelas Américas, por sua vez, sugere que o seu acesso a grandes porções do hemisfério era essencialmente irrestrito ( 52 ). No entanto, o registro genético contém indícios de populações iniciais não amostradas ( 6 ) ( Fig. 5 ), e a cultura material associada a essa rápida disseminação (Clovis e posteriores) é distinta e posterior à presença arqueológica segura mais antiga nas Américas, há 14,6 ka. ( 53 ). A forma como estes primeiros grupos estão relacionados, particularmente aqueles com excesso de ascendência australásia, e o seu grau de estrutura permanecem em grande parte desconhecidos.
O sinal da Australásia não está presente na USR1 ou Spirit Cave e aparece apenas em Lagoa Santa. Nenhum desses indivíduos tem mistura relacionada à UPopA ou à Mesoamérica, o que aparentemente atenuou a assinatura da Australásia em grupos sul-americanos, como os Karitiana ( Figs. 4 e 5 ). Essas descobertas sugerem que o sinal da Australásia, possivelmente presente em uma população ancestral estruturada de NA ( 16 ), estava ausente em NA antes da divisão Spirit Cave-Lagoa Santa. Ou os grupos que transportam este sinal já estavam presentes na América do Sul quando os ancestrais de Lagoa Santa chegaram à região, ou os grupos relacionados à Australásia chegaram mais tarde, mas antes de 10,4 ka atrás (o Lagoa Santa 14 Jaula). O facto deste sinal não ter sido previamente documentado na América do Norte implica que um grupo anterior que o possuía desapareceu ou que um grupo que chegou mais tarde passou pela América do Norte sem deixar qualquer vestígio genético ( Fig. 6, A e C ). Se tal sinal for finalmente detectado na América do Norte, poderá ajudar a determinar quando chegaram grupos com ascendência australásia, em relação à divergência de grupos SNA.
Embora tenhamos detectado o sinal da Australásia em um dos indivíduos de Lagoa Santa identificados como Paleoamericanos, ele está ausente em outros Paleoamericanos ( 2 , 10 ), incluindo o genoma da Spirit Cave com suas fortes afinidades genéticas com Lagoa Santa. Isto indica que a forma craniana paleoamericana não está associada ao sinal genético da Australásia, como sugerido anteriormente ( 6 ), ou a qualquer outro clado NA específico ( 2 ). A forma craniana paleoamericana, se for representativa de padrões populacionais mais amplos, evidentemente não resultou de ancestralidade separada, mas provavelmente de múltiplos fatores, incluindo isolamento, deriva e mecanismos não estocásticos ( 2 , 10 , 13 , 54 ).
Os efeitos atenuantes da distância, agravados (em alguns lugares) por barreiras geográficas, levaram à deriva cultural e às adaptações regionais, mesmo no início do processo de povoamento ( 52 , 55 ). Foi anteriormente presumido que as tecnologias Clovis (Anzick1) e Western Stemmed (Spirit Cave) ( 46 , 56 ) representavam “grupos fundadores geneticamente divergentes” ( 57 ). Parece, em vez disso, que a divergência é principalmente cultural, entre populações geneticamente próximas que vivem em lados opostos das Montanhas Rochosas. Este resultado afirma que os registros arqueológicos, anatômicos e genéticos não são necessariamente congruentes ( 47 ).
That one of the principal isolating mechanisms was likely geographic helps explain the long-term population continuity in the Great Basin. Continuity existed despite fluctuating human population densities and the cultural and linguistic changes that occurred over a 9-ka span (46). In the Pacific Northwest, geographic barriers were less formidable, but we surmise that the region’s natural richness and diversity may have led groups to inhabit different environmental niches, which resulted in the emergence of social boundaries that maintained population separation. In this region’s long history, we find evidence that groups on the coast (e.g., 939) and their contemporaries in the interior (Big Bar) were as genetically distinct as are present-day groups (18) (Fig. 6A). How or whether such differences map to the region’s rich linguistic complexity and material culture differences is not known (13, 58). Previous research on mtDNA and Y sequences hypothesized a shared origin for Pacific Northwest populations, followed by divergence due to isolation and drift (18). That Big Bar represents a previously unseen, isolated population supports its ancestral isolation and drift but implies that the initial peopling of the region was complex and structured.
Também encontrámos provas de uma mistura mesoamericana posterior, que, embora geograficamente extensa, não estava associada a uma “onda” nas Américas, nem conduziu inevitavelmente à substituição. Em vez disso, parece marcar o movimento para norte e para sul ( Fig. 6C ) do que podem ter sido grupos relativamente pequenos que não necessariamente inundaram as populações locais genética ou culturalmente, como ilustrado pela mistura no indivíduo Lovelock 3. Independentemente de isto marcar a Expansão Numica, foi associado a evidências de continuidade cultural, bem como de mudança; não foi um caso de substituição populacional. Não se sabe como ou se essa expansão relacionada à Mesoamérica é expressa culturalmente na América do Sul.
Os genomas aqui relatados preenchem lacunas em nossa cobertura temporal e espacial e são valiosos pontos de ancoragem que revelam a história da população humana nas Américas. Como há muito se esperava ( 52 ) e é característico das histórias da população humana em todo o mundo ( 59 ), o processo de povoamento foi marcado por processos demográficos locais complexos e de longo alcance ao longo do tempo. O povoamento das Américas provavelmente será ainda mais complicado. Como descobrimos, havia uma população até então desconhecida nas Américas (UPopA), bem como uma que abrigava um sinal da Australásia no Pleistoceno Superior e atingiu a América do Sul, mas não deixou vestígios aparentes na América do Norte. Além disso, todas as nossas evidências do processo de povoamento provêm de grupos arqueologicamente conhecidos: Clovis (Anzick) e populações posteriores. No entanto, existem evidências arqueológicas de uma presença anterior, pré-Clóvis, nas Américas, da qual ainda não recuperamos qualquer ADN antigo. Como esses vários segmentos populacionais podem finalmente se unir e como essas populações estão relacionadas com os NAs passados ​​e presentes ainda precisam ser resolvidos.

Materiais e métodos

Procedimentos laboratoriais

O trabalho de DNA antigo foi realizado em laboratórios limpos dedicados no Centro de GeoGenética, Museu de História Natural da Universidade de Copenhague. Os protocolos de extração, tratamento e construção de biblioteca seguidos para cada amostra são detalhados em ( 13 ). O sequenciamento foi realizado em instrumentos Illumina HiSeq.

Processamento de dados

As leituras de sequenciamento foram cortadas para adaptadores Illumina usando AdapterRemoval ( 60 ) e mapeadas para o genoma de referência humano build 37 usando BWA v.0.6.2-r126 ( 61 ) com semeadura desabilitada (parâmetro −l) ( 62 ). Leituras com qualidade de mapeamento inferior a 30 foram descartadas, duplicatas da reação em cadeia da polimerase foram identificadas usando MarkDuplicates ( 63 ) e o realinhamento local foi realizado usando GATK ( 64 ). Chamadas de genótipos para amostras de alta cobertura foram geradas usando SAMtools mpileup ( 65 ) e filtradas de acordo com o método de ( 2 ). Os genótipos chamados foram faseados com impute2 ( 66 , 67 ) usando o painel de variantes faseadas de 1000 genomas (fase 3) como referência e as taxas de recombinação HapMap. O conjunto de chamadas final foi mascarado usando uma máscara de “snpability” de 35 mer com um rigor de 0,5 ( 68 ) e as regiões estritamente acessíveis do Projeto 1000 Genomas ( 69 ).

Autenticação de dados de DNA antigo

Examinamos as distribuições de comprimento de fragmentos e os padrões de substituição de bases usando bamdamage ( 20 ). Estimamos o mtDNA, o cromossomo X e a contaminação nuclear usando contaMix ( 70 ), ANGSD ( 71 ) e DICE ( 72 ), respectivamente.

Análises da estrutura populacional

Nós investigamos as amplas relações entre os genomas antigos e atuais usando agrupamento baseado em modelo, conforme implementado em ADMIXTURE ( 19 ) e MDS aplicado às identidade por estado ( 20 ) e f 3 distância ( 21 , 22 ). matrizes

Estatísticas D

Calculamos estatísticas D para testar formalmente hipóteses de arborização e fluxo gênico. baseadas em genótipo As estatísticas D foram calculadas conforme detalhado em ( 21 corrigidas por erros ), e as estatísticas D foram calculadas de acordo com o método de ( 23 ). Para ambas as abordagens, os erros padrão foram estimados através de uma abordagem jackknife de bloco ponderado em blocos de 5 Mb.

Ajuste do gráfico de mistura

Usamos qpGraph para ajustar f gráficos de mistura baseados em estatísticas ( 4 , 21 ). Implementamos uma pesquisa exaustiva de gráficos de mistura onde consideramos um gráfico semente ao qual uma população de teste foi adicionada como um grupo não misturado ou misturado em todas as posições possíveis. Extensões do gráfico de sementes foram enumeradas usando o pacote admixturegraph R ( 32 ). Avaliamos cada topologia com base em sua pontuação de ajuste, a pontuação z do pior resíduo entre as estatísticas D observadas e previstas e a presença de bordas internas de comprimento zero e realizamos testes de razão de verossimilhança seguindo ( 30 ). Para todos os testes, consideramos apenas polimorfismos de transversão.

Inferência demográfica

Estimamos tamanhos populacionais marginais ao longo do tempo para diferentes grupos de NA usando SMC++ ( 27 ). Em seguida, usamos o momi2 ( 25 , 26 ) para inferir parâmetros demográficos para vários modelos com o SFS conjunto. Os ICs foram obtidos através de um procedimento de bootstrap não paramétrico. Confirmamos a inferência baseada em SFS usando diCal2 ( 28 ), que se baseia em informações de desequilíbrio de ligação, para inferir parâmetros demográficos chave relacionados a pares de populações de NA. Uma descrição detalhada dos métodos laboratoriais e analíticos é fornecida em ( 13 ).

Acknowledgments

Pela permissão e cooperação no fornecimento de restos mortais para este estudo, agradecemos à Vila Nativa de Deering, Alasca; a tribo Fallon Paiute-Shoshone; o Consejo de Monumentos Nacionais, Chile; e o Museu Canadense de História e as Primeiras Nações Stswecem'c Xgat'tem, Metlakatla e Lax Kw'alaams. Veja ( 74 , 75 ) para análises relacionadas de amostras antigas de DNA das Américas. Agradecemos a J. Ramos-Madrigal, L. Orlando, G. Renaud, F. Vieira, L. Benson, A. Bergström, T. Ferraz e JE Santos-Júnior pelas discussões; M. Drummond, F. Zimmermann e T. Tisler para processamento de imagem; B. Chestnut, B. Baldwin e D. Cossette pela ajuda e apoio; e o Centro Nacional Dinamarquês de Sequenciamento de Alto Rendimento para assistência na geração de dados. O St. John's College, da Universidade de Cambridge, proporcionou à EW e à DJM um local agradável para discussões científicas. Financiamento: Os membros da GeoGenetics foram apoiados pela Fundação Lundbeck, pela Fundação Nacional Dinamarquesa de Pesquisa (DNRF94) e pela KU2016. O estudo dos restos mortais de Lagoa Santa foi parcialmente financiado pela Fundação Augustinus. J. Ch. é apoiado em parte por uma bolsa de pesquisa de pós-graduação da NSF. J.Ch., JPS e YSS são apoiados em parte pela concessão R01-GM094402 do National Institutes of Health, um prêmio de pesquisa do Microsoft Azure e uma bolsa Packard para Ciência e Engenharia. A.St. foi financiado pela FAPESP (2017/16451-2). Estudo de amostras da Patagônia por MA-D. foi patrocinado pela National Geographic Society, Programa Genográfico, bolsa 14-01. A HS foi apoiada pela HERA e pelo Programa de Investigação e Inovação Horizon2020 da União Europeia (concessão 649307). O JTR foi apoiado por financiamento do Programa de Patrimônio Compartilhado da Beringia do Serviço Nacional de Parques. A.-SM agradece à Fundação Nacional Suíça para a Ciência e ao Conselho Europeu de Pesquisa (subvenção inicial do ERC) pelo financiamento. YSS é um investigador do Chan Zuckerberg Biohub. DJM é apoiado pelo Quest A Archeological Research Fund e pela Potts and Sibley Foundation. Contribuições do autor: O projeto foi concebido por EW, JVM-M. e DJM e liderado por EWLV, PDBD, CDLF, MEA, AM, MIO, DM e HS processou DNA antigo. Conjuntos de dados montados JVM-M., S.Ra. e TP. JVM-M., J.Ch., JPS, TV, FR, TP e YSS analisaram dados genéticos com informações de análises bioinformáticas e estatísticas supervisionadas por PDBD e CDLFRN, YSS, MS e A.-SM. As análises de radiocarbono foram feitas por LB-V., D.Ch., D.Co., TD e THCV, FM, MV, SW, KG, NL, MML, KK e LS escavados, curados, amostrados ou descritos restos. DJM, DKG, VA, CP, JE, CR-C., S.Re., MQRB, J.Cy., MW, CB, KLH, MML, A.St., A.Sa., FM, MA-D ., e JTR conduziu análises arqueológicas e bioantropológicas e forneceu contextualização. A LG e a HH fizeram parceria com a RSM e a EW para interagir com as comunidades indígenas. Todos os autores contribuíram para a interpretação dos dados. JVM-M., DJM, YSS e EW escreveram o manuscrito, com contribuições de J.Ch., JPS, MA-D., RSM, JTR, TP, FRS, A.-SM e outros autores. Interesses conflitantes : Os autores declaram não haver interesses conflitantes. Disponibilidade de dados e materiais: Os dados de sequência estão disponíveis na ENA sob o acesso PRJEB29074.

Nenhum comentário:

Postar um comentário

Observação: somente um membro deste blog pode postar um comentário.