Principal

A localização geográfica do Norte da África, centrada entre o vasto deserto do Saara, o fértil Oriente Próximo e a Europa Mediterrânea, resultou em uma história humana complexa na área 7 , 8 . O registro fóssil sugere presença hominídea e humana de longo prazo 9 , embora a continuidade ao longo dos últimos 100.000 anos não possa ser deduzida devido à natureza fragmentada do registro. No Pleistoceno Superior, 15.000 anos atrás, os restos de forrageadores escavados no Marrocos mostram uma composição genética distinta intermediária entre os forrageadores levantinos contemporâneos e as populações da África subsaariana 10 . Os norte-africanos atuais são amplamente relacionados às populações eurasianas, o que provavelmente foi causado por migrações de "retorno à África" ​​7 .

Tanto os registros arqueológicos quanto os dados arqueogenômicos mostram que os agricultores neolíticos (geneticamente distintos dos forrageadores europeus) se dispersaram do norte do Levante e da Anatólia para as ilhas do Mediterrâneo, península Itálica e Ibéria 11 , 12 , 13 , 14 , 15 , 16 , 17 , 18 . As rotas costeiras do Mediterrâneo são há muito reconhecidas no registro arqueológico como uma parte importante da expansão neolítica na Europa. No Mediterrâneo ocidental, a tecnologia de cerâmica impressa — e mais adiante o horizonte cardial — se espalhou ao longo da costa continental europeia e ilhas para chegar à península ibérica, onde ambos os fenômenos estão presentes em 7.550 anos calibrados antes do presente (cal  BP ) (refs. 19 , 20 ).

Enquanto alguns estudos apoiam uma aparição simultânea do Neolítico no noroeste da África (Rif Oriental, sítio Ifri Oudadane) e na Península Ibérica por volta de 7.550 cal  A.P. (ref. 21 ), a evidência mais antiga de cerâmica, cereais domésticos e criação de animais é encontrada no norte do Marrocos aproximadamente dois séculos depois em Kaf Taht el-Ghar (KTG) por volta de 7.350 cal  A.P. (refs. 2 , 3 , 22 , 23 ). Embora a cultura material do Neolítico Inicial e os primeiros mamíferos e leguminosas domésticas sugiram uma conexão com a Península Ibérica 1 , 2 , 3 , a extensão e o legado dessas conexões permanecem obscuros. No entanto, a primeira análise genômica de agricultores do Neolítico Inicial do noroeste da África (do sítio Ifri n'Amr o'Moussa (IAM) no centro do Marrocos) não mostra vestígios de mistura com agricultores do Neolítico Europeu. Em vez disso, ele mostra continuidade populacional de longo prazo desde o Paleolítico Superior na região 6 . Este resultado se alinha com a hipótese de que a transição neolítica no noroeste da África foi iniciada por comunidades epipaleolíticas locais adotando inovações tecnológicas 4 , 5 , como aquelas encontradas no IAM: cerâmicas impressas semelhantes às de Cardial, semelhantes às presentes em toda a Europa neolítica do Mediterrâneo ocidental, e cereais domésticos (por exemplo, um grão de Hordeum vulgare datado em torno de 7.050 cal  A.P. ) 2 . Este padrão implica um processo de neolitização que contrasta marcadamente com o da Europa, onde foi estabelecido que a agricultura foi introduzida pela difusão demica para o oeste e norte dos primeiros agricultores da Anatólia 11 , 12 . O desenvolvimento local, ou aculturação, do Neolítico do Norte da África é ainda apoiado por sinais de grupos epipaleolíticos cada vez mais sedentários desenvolvendo estratégias para o gerenciamento de recursos, como a exploração de plantas selvagens e cerâmica 1 , 4 , 24 , 25 , 26 . Mudanças climáticas rápidas favoreceram o pastoreio móvel 27 e, embora tenha sido levantada a hipótese de que o gado foi domesticado independentemente no Saara 28 , dados de radiocarbono sugerem uma introdução gradual do pastoreio no Saara em uma direção sudoeste de 7.000 a 6.000 cal  A.P. , possivelmente do Oriente Próximo 29 , 30 .

Enquanto estudos paleogenômicos sobre a transição neolítica mediterrânea europeia são abundantes 15 , 31 , 32 , 33 , o norte da África tem sido o foco de apenas um único estudo que gerou dados genéticos humanos de um sítio neolítico inicial e um tardio 6 , deixando lacunas substanciais na cronologia dos eventos. É evidente que o sítio do IAM mostra um estilo de vida neolítico e uma ausência de ancestralidade neolítica europeia, mas se este foi um desenvolvimento independente ou se a inspiração veio de outros grupos no noroeste da África ou do outro lado do Mar Mediterrâneo permanece incerto. Portanto, a linha do tempo e os processos envolvidos na neolitização da região, a natureza e a dinâmica de diferentes economias no norte da África e o papel que elas podem ter desempenhado no neolítico europeu mais amplo permanecem pouco estudados e controversos.

Neste estudo, investigamos uma série temporal de restos humanos de quatro sítios arqueológicos que abrangem o Epipalaeolítico ao Neolítico Médio no atual Marrocos: o sítio Epipalaeolítico de Ifri Ouberrid (OUB), os sítios do Neolítico Inicial de IAM e KTG e o cemitério do Neolítico Médio de Skhirat-Rouazi (SKH), coanalisados ​​com dados genéticos publicados anteriormente daquela região 6 , 10 . Ao sequenciar os genomas de nove indivíduos escavados desses quatro sítios arqueológicos, podemos demonstrar que a transição neolítica no noroeste da África foi iniciada pela migração de agricultores neolíticos da Europa Mediterrânea.

Geramos dados de sequência genômica de nove indivíduos antigos do Marrocos moderno (Tabela 1 ), variando em cobertura genômica de 45,75 a 0,017 vezes, incluindo cinco indivíduos com cobertura de mais de uma vez e três com mais de nove vezes. Cronologicamente, os dados abrangem mais de 1.000 anos, cobrindo o Epipaleolítico Tardio ( n  = 1), Neolítico Inferior ( n  = 5) e Neolítico Médio ( n  = 3). Dois sítios do Neolítico Inferior foram estudados — KTG ( n  = 4) e IAM — onde coanalisamos os dados genômicos recém-gerados de um indivíduo e aqueles relatados anteriormente 6 (Fig. 1a,b ). Bibliotecas de DNA foram geradas a partir de extratos de DNA obtidos de ossos e dentes e posteriormente sequenciados shotgun em uma plataforma Illumina. Todas as bibliotecas apresentaram os padrões de degradação esperados do DNA antigo, incluindo tamanhos de fragmentos curtos e desaminação de citosina nas extremidades de leitura (Fig. 1 Suplementar ). As estimativas de contaminação foram geralmente baixas tanto para o genoma nuclear quanto para as mitocôndrias, exceto para o indivíduo skh003, que mostrou 10–16% de contaminação nuclear (Tabela 1 ). Para avaliar a relação dos antigos indivíduos do noroeste da África com outras populações antigas e atuais da Eurásia Ocidental e da África, coanalisamos nossos dados com grupos relevantes antigos (Dados Suplementares  2 ) e atuais da África, Oriente Médio e Europa 34 .

Tabela 1 Resumo das informações de dados arqueológicos e genômicos recém-gerados de indivíduos antigos relatados neste estudo
Fig. 1: Visão geral da composição genética do antigo noroeste da África.
figura 1

a , Localização geográfica dos sítios arqueológicos investigados. Legenda de símbolos dada em c . O mapa foi gerado usando o Sistema de Informação Geográfica QGIS de código aberto, http://qgis.osgeo.org . b , Representação cronológica dos períodos arqueológicos investigados do noroeste da África, com a linha do tempo datada por radiocarbono de cada sítio indicada. c , Visão ampliada de um gráfico PCA (Fig. Suplementar 3 ) com foco nos indivíduos antigos analisados. Cada indivíduo antigo projetado é representado por um símbolo colorido. W. Eur., Europa Ocidental; hist., histórico. d , Proporções de ancestralidade estimadas para indivíduos africanos, do Oriente Médio e europeus (Eur.) modernos e antigos relevantes (assumindo cinco componentes de ancestralidade; resultados adicionais são apresentados na Fig. Suplementar 4 ). Populações/indivíduos pré-neolíticos e neolíticos do noroeste da África são destacados pelos mesmos símbolos usados ​​em a e c .

Oito mil anos de continuidade populacional

Do povo do Paleolítico Superior de Taforalt (TAF) através do Epipalaeolítico em OUB até o Neolítico Inicial em IAM, observamos a persistência da composição genética única que existia nos habitantes do noroeste da África há 15.000 anos (Fig. 1c,d e Fig. Suplementar 5 ), e possivelmente ainda mais para trás no tempo. O indivíduo Epipalaeolítico oub002, datado de 7.660–7.506 cal  BP , é geneticamente muito semelhante aos indivíduos de TAF (15.086–14.046 cal  BP ) 35 e aos indivíduos do Neolítico Inicial de IAM (7.316–6.679 cal  BP ; Fig. 1 ) 6 , 36 . O genoma de Oub002 demonstra uma continuidade populacional marcante no noroeste da África, sem fluxo genético substancial através do Mar Mediterrâneo por pelo menos 7.000 anos durante o Epipaleolítico (Fig. 1c,d ), ligando a ancestralidade genética magrebina encontrada no Paleolítico Superior aos indivíduos do Neolítico Inferior no IAM.

A linhagem Maghrebi mostra uma diversidade genética excepcionalmente baixa 6 , 10 (Fig. 2b e Fig. Suplementar 9 ) e longas e frequentes séries de homozigose (RoH) (Fig. 2a ), provavelmente como consequência de isolamento duradouro. Por meio da investigação do genoma de 45,8 vezes de oub002, mostramos que os antigos africanos do noroeste passaram por um grave gargalo populacional. Até cerca de 70.000–60.000 anos atrás, as mudanças no tamanho efetivo da população ( e ) de oub002 seguem um padrão semelhante ao das populações eurasianas com um tamanho efetivo populacional relativamente pequeno alcançado há 50.000 anos (Fig. 2c ), o que é consistente com a linhagem Maghrebi sendo relacionada às populações que migraram para fora da África. Curiosamente, o tamanho efetivo da população dos eurasianos e norte-africanos modernos, bem como dos eurasianos neolíticos, permaneceu em torno de 5.000 até cerca de 30.000 anos atrás, mas o tamanho efetivo da população da linhagem magrebina continua a diminuir e atingiu seu ponto mais baixo ( e  ≈ 1.400) entre 50.000 e 27.000 anos atrás, durante o pico da Última Glaciação. Padrões notavelmente semelhantes são observados para os caçadores-coletores ocidentais (WHG) do Mesolítico da Europa (representados por Loschbour na Fig. 2c ), para os quais medidas de baixa diversidade foram atribuídas a altos níveis de parentesco de fundo e autozigosidade devido ao pequeno tamanho da população 37 .

Fig. 2: Medidas de diversidade genética em africanos e eurasianos antigos (noroeste e subsaariano), calculadas usando chamadas diploides de indivíduos com maior cobertura (cobertura genômica nove vezes maior).
figura 2

a – c , Indivíduos antigos (incluindo oub002, ktg004 e skh001) são comparados com indivíduos modernos de regiões geograficamente correspondentes. a , Execuções de homozigose. ne1, Neolítico Europeu 1; NSEG, número de segmentos homozigotos. b , Heterozigosidade, calculada a partir do número de posições variáveis ​​por indivíduo dividido pelo número de sítios de polimorfismo de nucleotídeo único (SNP) por indivíduo. c , Tamanho efetivo da população ao longo do tempo, conforme inferido pela coalescência Markoviana sequencial em pares, para três antigos africanos do noroeste com cobertura genômica de mais de nove vezes, bem como para um indivíduo europeu mesolítico (Loschbour) e um indivíduo europeu neolítico (Stuttgart), e indivíduos modernos para comparação.

Agricultores europeus induzem a neolitização

No sítio do IAM, uma multidão de artefatos representando o pacote neolítico foi identificada. No entanto, foi demonstrado que as pessoas que vivem no IAM apresentam ancestralidade magrebina autóctone 6 e eram descendentes de grupos anteriores (Paleolítico Superior e Epipaleolítico) do noroeste da África (Fig. 1c,d ). Essas duas observações apoiam a visão de que o primeiro estágio da transição neolítica no Marrocos foi impulsionado por populações locais adotando inovações tecnológicas com base em contatos através do Mediterrâneo 2 .

O sítio neolítico inicial de KTG, localizado na costa mediterrânea do norte da África, perto do estreito de Gibraltar (Fig. 1a ), é anterior e se sobrepõe parcialmente no tempo ao IAM 2 (Tabela 1 ). No KTG, uma assembleia neolítica completa é encontrada, incluindo uma diversidade de cereais cultivados, mamíferos domésticos e cerâmicas cardiais 38 , 39 . Em contraste com as pessoas no IAM, aquelas no KTG são geneticamente semelhantes às populações neolíticas iniciais europeias (Figs. 1c,d e 3a ). Curiosamente, todos os quatro indivíduos KTG mostram mistura (15,4–27,4%) com grupos locais do norte da África (Fig. 1d ), consistente com valores significativamente positivos para o teste 4 de mistura (KTG, EN Mediterrâneo; TAF, Mbuti) (Dados Suplementares  7 ). Além disso, identificamos uma pequena proporção de ancestralidade WHG em KTG (Fig. 1d ), consistente com a observação de europeus do Neolítico Inicial carregando ancestralidade WHG 14 , 15 , 31 , 33 , 40 . Um modelo de história populacional para o povo KTG com ancestralidade Neolítica Anatólia de 72 ± 4,4%, ancestralidade WHG de 10 ± 2,6% e ancestralidade Magrebina de 18 ± 3,3% é consistente com os dados (qpAdm, P  = 0,193). Tomados em conjunto, esses resultados sugerem uma origem Neolítica Europeia de fazendeiros KTG cujos ancestrais se dispersaram da Anatólia por toda a Europa, misturando-se com caçadores-coletores europeus em seu caminho para o sudoeste da Europa 33 , 40 antes de cruzar o Mediterrâneo para o Norte da África. A presença de ancestrais caçadores-coletores europeus exclui a possibilidade de que migrantes do Neolítico Inferior tenham seguido exclusivamente as costas do Mediterrâneo Norte-Africano a partir da Anatólia ou do Levante.

Fig. 3: Afinidades genéticas dos africanos do noroeste da Idade da Pedra e resumo esquemático da história populacional do Magrebe.
figura 3

a , Afinidade genética de indivíduos analisados ​​do noroeste da África da Idade da Pedra, polarizada entre a ancestralidade Neolítica da Anatólia e Magrebina, usando o teste 4 da forma 4 (Neolítico da Anatólia, TAF011; indivíduos do noroeste da África da Idade da Pedra, Mbuti). b , Afinidade genética de indivíduos do noroeste da África da Idade da Pedra, polarizada entre a ancestralidade Neolítica Ibérica e Levantina usando o teste 4 da forma 4 (Neolítico Inicial da Ibéria, Calcolítico do Levante; indivíduos Neolíticos do noroeste da África, Mbuti). a , b , Cada símbolo representa um único valor 4 individual . As barras de erro indicam ±2 se, computado com uma abordagem de bloco jack-knife (blocos de 5 Mb ponderados pelo número de SNPs). c , Resumo da história populacional inferida do Magrebe da Idade da Pedra.

O Neolítico Inicial Ibérico (tanto como um todo quanto regionalmente) foi considerado a melhor população fonte para a ancestralidade europeia no KTG, seguido pelo Neolítico Inicial Sicília Stentinello (Dados Suplementares  9 ). Isso é consistente com baixos níveis de diferenciação genética em grupos associados à cerâmica Cardial ao longo das costas europeias do Mar Mediterrâneo 41 , confirmado por datações diretas de radiocarbono mostrando que os fazendeiros de cerâmica impressa se expandiram rapidamente pelo Mediterrâneo ocidental 3 , 19 , 42 .

Tem sido debatido se os agricultores europeus cruzaram da Península Ibérica para o Marrocos 2 , 3 ou se travessias anteriores do Mediterrâneo teriam acontecido, através do Estreito Siciliano-Tunísia seguido por uma rota de expansão Magrebi 4 , 43 . Comparações diretas de agricultores do Neolítico Inicial da Sicília e da Península Ibérica como ancestrais de agricultores KTG fornecem evidências mais fortes para uma origem Neolítica Ibérica (Dados Suplementares  9 e Informações Suplementares  8 ), mas não podemos excluir alguma contribuição de agricultores sicilianos. Dados genéticos são consistentes com a explicação mais parcimoniosa para evidências arqueológicas sobre a transição Neolítica no noroeste da África: a travessia do sul da Península Ibérica por agricultores Neolíticos Ibéricos 2 , 23 . A proximidade geográfica entre o sul da Península Ibérica e a Península Tangitana acrescenta força a esta observação, enquanto a falta de evidências arqueológicas confiáveis ​​de elementos domésticos antigos em sítios relevantes ao longo do Magreb oriental e Túnis, incluindo sítios com cerâmica e obsidiana da Ilha de Pantelleria, enfraquece a hipótese do cruzamento Sicília-Túnis 3 . Curiosamente, o fluxo gênico do Norte da África foi encontrado apenas em indivíduos europeus mediterrâneos muito mais tarde, por volta de 4.500 anos atrás 31 , 44 .

Diferentes indivíduos do KTG datam de períodos de tempo ligeiramente diferentes. Encontramos uma proporção duas vezes maior de ancestralidade magrebina em indivíduos KTG anteriores (aproximadamente 25%, ktg001 e ktg005, aproximadamente 7.429–7.267 cal  BP ) do que nos posteriores (cerca de 13%, ktg004 e ktg006, em torno de 7.247–6.945 cal  BP ) (Fig. 1d ). Isso coincide com um aumento na ancestralidade neolítica europeia, mostrado pelo resultado significativamente negativo para 4 (KTG anterior, KTG posterior, Neolítico Inicial da Ibéria, Mbuti; pontuação z = −5,01). Aproximadamente um quarto da ancestralidade magrebina no KTG inicial sugere que eles representam pelo menos a segunda geração de cruzamento entre os grupos. Estimamos o tempo de mistura usando duas abordagens baseadas em padrões de covariância de ancestralidade e decaimento de desequilíbrio de ligação, usando o Neolítico Inicial da Ibéria ou Sicília e TAF como fontes de mistura. Ambos os métodos datam o contato nas últimas seis a 13 gerações (Informações Suplementares 8 ), sugerindo que a mistura entre grupos ocorreu por algumas centenas de anos, o que é consistente com a análise do estilo de cerâmica que aponta para o primeiro contato em 7.500–7.400 cal  BP (ref. 23 ).

Os agricultores de Kaf Taht el-Ghar tinham níveis de diversidade genética ligeiramente mais baixos e maior RoH do que a maioria das populações europeias do Neolítico Inicial (Fig. 2a,b e Fig. Suplementar 9 ). A ancestralidade magrebina carregada pelo povo KTG mostra uma diversidade marcadamente menor e RoH mais extensa, e é provavelmente a causa da redução na diversidade geral. Evidências arqueológicas sugerem que a agricultura do Neolítico Inicial era restrita a enclaves no Magreb mais ocidental, possivelmente devido a restrições climáticas ao sul 4 , 22 . Isso pode ter limitado o potencial desses grupos de se recuperarem de um efeito fundador inicial.

No geral, os padrões genéticos de interação local entre diferentes grupos no noroeste da África são comparáveis ​​aos encontrados na Europa: os agricultores assimilaram a ancestralidade dos forrageadores locais em um processo de mistura unidirecional. Casos de comunidades de caçadores-coletores adotando certos elementos do Neolítico foram descritos na Europa 11 , 14 , 45 . No entanto, o processo de neolitização do noroeste da África envolveu a notável sobrevivência de populações locais geneticamente não misturadas (representadas por IAM), apesar de coexistirem por pelo menos 300 anos com comunidades agrícolas estrangeiras (KTG), e ainda adotaram vários elementos dos modos de vida neolíticos delas. Enquanto as descobertas arqueológicas em IAM e KTG apontam para a troca de ideias entre grupos e apoiam um processo de aculturação de comunidades forrageiras 1 , 4 , nossos dados genéticos mostram que a troca de genes foi unidirecional.

Influxo de ascendência levantina

Outra ancestralidade distinta foi introduzida no noroeste da África durante o Neolítico Médio. Todos os indivíduos do SKH mostram grandes proporções de um componente genético maximizado em indivíduos do Levante Neolítico e Calcolítico, Egito Ptolomaico e populações modernas do Oriente Próximo (Fig. 1d ). A ancestralidade no SKH pode ser modelada como uma mistura bidirecional entre populações do Neolítico do Levante (aproximadamente 76,4 ± 4,0%) e africanos locais do noroeste (representados por TAF; 23,6 ± 4,0%). Se uma população fonte adicional do Neolítico Europeu (por exemplo, da Ibéria) for adicionada, o modelo é rejeitado.

Como essa ancestralidade levantina neolítica não foi observada no lado europeu do Mediterrâneo durante o Neolítico, ela provavelmente representa uma expansão independente de pessoas do Levante para o norte da África. Migrações do Levante para o leste da África foram identificadas para indivíduos pastores neolíticos há cerca de 4.000 anos, que são presumivelmente descendentes de populações não amostradas do nordeste da África associadas à disseminação do pastoreio saariano 46 . Tanto no SKH quanto nos pastores neolíticos do leste da África, a ancestralidade levantina é misturada com ancestralidades locais (Fig. 1d , Informações Suplementares  8 e Dados Suplementares  12 ). A chegada dessa ancestralidade levantina coincide com o surgimento de uma nova tradição cerâmica no norte do Marrocos, frequentemente caracterizada por motivos impressos em cordão ('roleta' ou linha ondulada), como os bens funerários em Skhirat pertencentes à cerâmica Ashakar Ware 47 , 48 . Paralelamente, a pastorícia de gado expandiu-se no actual território do Saara 30 , 47 e os grupos de línguas afro-asiáticas espalharam-se por todo o Norte de África 22 .

Nossas análises mostram que o componente associado ao Levante também permanece no Magreb durante o Neolítico Tardio em indivíduos de Kehf el Baroud (KEB) e nos Guanches das Ilhas Canárias (cerca de 1.000 cal  A.P.; Fig. 1c,d ) 6 , 49. Indivíduos desses locais são deslocados para populações antigas do Levante no espaço de análise de componentes principais (PCA) (Fig. 1c ). Isso destaca os processos demográficos complexos que ocorreram no noroeste da África, em contraste com o aumento gradual na ancestralidade caçadora-coletora descrita na Europa do Neolítico Médio e Tardio 32 , 33 , 40 .

Os indivíduos do Neolítico Tardio do KEB podem ser modelados como uma mistura de ancestrais já presentes no noroeste da África durante o Neolítico Inferior e o Neolítico Médio, sugerindo que não houve ondas de migração substancial para esta região entre o Neolítico Médio e o Neolítico Tardio (Informações Suplementares  8 e Dados Suplementares  13 ).

Conclusão

A complexa estrutura populacional no noroeste da África moderna tem sido associada a vários eventos históricos, como a expansão árabe 7 , 8 . No entanto, nossa cronologia detalhada e dados genômicos de alta resolução fornecem uma nova compreensão desses processos pré-históricos no Magreb e revelam um substrato genético rico e diversificado com origem neolítica. Primeiro, as populações humanas no noroeste da África mostram continuidade genética e isolamento desde o Paleolítico Superior, de pelo menos 15.000 a cerca de 7.500 anos atrás, quando esse período de isolamento foi interrompido pela migração de grupos europeus do Neolítico Inicial que introduziram práticas agrícolas. Portanto, apesar de uma distância geográfica relativamente pequena entre o sul da Península Ibérica e o noroeste da África (a distância hoje é de apenas 13 km através do estreito de Gibraltar) e do fato de que ambas as regiões foram povoadas por forrageadores por muitos milênios antes do Neolítico, o fluxo gênico através do Mar Mediterrâneo não foi estabelecido até o Neolítico Inicial. Os recém-chegados trouxeram novos modos de vida, práticas agrícolas, domesticação e tradições de cerâmica que foram posteriormente adotadas pelas populações locais. Nossos resultados mostram que o processo de neolitização no noroeste da África foi iniciado por europeus neolíticos migrantes, mas que grupos locais (pelo menos os indivíduos analisados ​​no IAM) adotaram algumas dessas práticas sem se misturarem com os recém-chegados. Dois grupos geneticamente distintos coexistiram em estreita proximidade na região. Curiosamente, o conhecimento cultural e tecnológico parece ter sido transferido principalmente de agricultores neolíticos europeus para grupos locais (por exemplo, no IAM), enquanto a ancestralidade genética fluiu apenas de grupos locais para os agricultores que chegavam, como a população de KTG. Além disso, no Neolítico Médio, uma nova ancestralidade com origem oriental é detectada no noroeste da África. Essa ancestralidade indica novos grupos migrantes, potencialmente associados a pastores do Saara, que se misturaram com grupos locais (Fig. 3c ).

As várias ondas de migração e mistura para o noroeste da África durante o Neolítico possivelmente resultaram em uma paisagem econômica e cultural heterogênea naquela região — um mosaico de grupos que incluía agricultores vindos da Península Ibérica, forrageadores adotando práticas agrícolas e pastores orientais se misturando com pessoas locais. A maioria desses grupos mostrou tamanho populacional efetivo reduzido e menor diversidade do que as populações contemporâneas na Europa (Fig. 2 ), sugerindo que os tamanhos populacionais permaneceram modestos durante todo o Neolítico. Esses padrões foram provavelmente causados ​​por períodos de isolamento, o que pode ter contribuído para a ancestralidade genética distinta vista no Magreb hoje. Um estudo recente da Idade do Ferro sugere que o noroeste da África permaneceu como lar de um conjunto diversificado de grupos ao longo da pré-história 50 , tornando esta parte do mundo um dos lugares mais exclusivos a serem estudados com o kit de ferramentas arqueogenômicas.

Métodos

Descrições detalhadas de cada seção podem ser encontradas em  Informações Suplementares .

Amostragem arqueológica

Os restos humanos antigos analisados ​​neste estudo derivam de um acordo de cooperação científica entre as Universidades INSAP, La Trobe e Uppsala. Elementos completos de ossos e dentes foram trazidos para a antiga instalação de DNA em Uppsala, Suécia, para posterior limpeza e amostragem.

Datação por radiocarbono

Todos os indivíduos investigados foram datados diretamente por radiocarbono no Tandem Laboratory, Uppsala, exceto ktg001, que foi datado no laboratório de datação por carbono analítico Beta, e iam004, cuja data foi obtida da referência 6. A calibração de radiocarbono para datas recentemente relatadas e datas relevantes publicadas anteriormente foi realizada usando Oxcal v.4.4 e o conjunto de dados IntCal20 41 .

Recuperação de DNA antigo

Restos humanos foram coletados em laboratórios dedicados de sala limpa na Universidade de Uppsala, Suécia, após uma série de procedimentos rigorosos visando minimizar a contaminação da superfície óssea e dentária. Trinta a sessenta miligramas de pó ósseo ou pedaços sólidos de material ósseo foram usados ​​para extração de DNA seguindo a ref. 51 , com adaptações conforme descrito na ref. 15 , ou seguindo a ref. 52 , com adaptações ao tampão de ligação e uma etapa inicial de pré-digestão com 1 ml de 0,5 M EDTA pH 8,0 por 30 min a 37 °C 53. A digestão da amostra foi realizada durante a noite com 1 ml de 0,45 M EDTA pH 8,0 e 0,2 mg ml –1 de proteinase K. Bibliotecas de DNA de fita dupla e extremidade romba reparada foram construídas com adaptadores P5 e P7 ligados 54 . Após a avaliação da autenticidade, qualidade e quantidade do DNA (por estimativa do conteúdo endógeno de DNA, padrões de desaminação post mortem e distribuição do tamanho do fragmento), o extrato de DNA restante (para amostras com mais de 1% de proporção de DNA humano) foi usado para construir quatro a seis bibliotecas adicionais de DNA fita dupla; para extratos com aproximadamente 5% de conteúdo humano endógeno ou mais, 15–20 µl de extrato de DNA foram tratados com uracil DNA glicosilase (UDG) para construção de biblioteca fita dupla 55 . As bibliotecas foram amplificadas por PCR usando um primer indexado exclusivo de 7 pb 54 , 56 em quatro reações de 25 µl ou duas de 50 µl, com a aplicação de 12–20 ciclos de PCR dependendo da indicação do ciclo de quantificação qPCR anterior. Dois controles negativos de extração, dois controles negativos de biblioteca e um controle negativo de PCR foram incluídos por lote de amostra. As reações de PCR foram reunidas e purificadas com esferas AMPure XP (Agencourt, Beckman Coulter). A qualidade da biblioteca foi verificada por eletroforese em Tapestation (Agilent High Sensitivity D1000 ScreenTape, Agilent) e a concentração de DNA foi quantificada usando um Qubit dsDNA HS (High Sensitivity) Assay Kit (Invitrogen). Pools equimolares de bibliotecas amplificadas e purificadas foram sequenciadas em Illumina HiSeq X na SNP & SEQ Technology Platform em Uppsala. Para atingir uma cobertura maior, entre quatro e dez bibliotecas foram reunidas equimolarmente e sequenciadas até a depleção.

Processamento e autenticação de dados de bioinformática

Os dados foram demultiplexados de acordo com a sequência de primer indexada e os adaptadores foram aparados com MergeReadsFastQ_cc.py 57 ou Adapter Removal v.2.1.7 (ref. 58 ). Leituras de extremidade pareada direta e reversa foram mescladas quando uma sobreposição de pelo menos 11 pb foi encontrada. O mapeamento contra a construção 37 do genoma de referência humano (hs37d5) foi feito usando o alinhador Burrows–Wheeler 0.7.13 (ref. 59 ). Para cada biblioteca, mesclamos os arquivos bam resultantes de todas as rodadas de resequenciamento usando o SAMtools merge v.1.5 (ref. 60 ). Em seguida, mesclamos separadamente os dados das bibliotecas tratadas e não tratadas com UDG para cada indivíduo e usamos dados das primeiras para análise subsequente, exceto para os indivíduos ktg001 (para os quais apenas dados não UDG foram gerados) e iam004 (para os quais os dados tratados e não tratados foram mesclados e processados ​​como não UDG tratados para análise posterior). Usamos uma versão modificada de FilterUniqSAMCons_cc.py 57 para garantir a escolha aleatória de bases para colapsar leituras com posições iniciais e finais idênticas em um consenso, removendo assim duplicatas de PCR. Leituras menores que 35 pb e mais de 10% de incompatibilidades com o genoma de referência humano foram filtradas.

Contaminação, determinação sexual, marcadores uniparentais e análises de parentesco

As estimativas de contaminação da amostra foram obtidas usando três métodos diferentes com base no genoma mitocondrial 61 , no cromossomo X em machos 62 e em dados nucleares 63 (Dados Suplementares  3 ). A proporção de cobertura dos cromossomos X e Y em relação aos autossomos foi usada para determinar o sexo biológico de cada indivíduo 64 . Geramos sequências de consenso mitocondrial usando SAMtools 1.5 mpileup e vcfutils.pl 60 , 65 . As pontuações de qualidade de base (BQ) e de mapeamento (MAPQ) foram definidas como MAPQ > 30 e BQ > 30, e apenas locais com cobertura pelo menos tripla foram usados. Os haplogrupos foram atribuídos usando Haplogrep 2.1.16 (ref. 66 ) e PhyloTree mtDNA tree Build 17 (18 de fevereiro de 2016) 67 (Dados Suplementares  4 ). Para a inferência do haplogrupo Y, chamamos SNPs da Sociedade Internacional de Genealogia Genética ( http://isogg.org ; v.11.110, 21 de abril de 2016)) de arquivos bam usando o SAMtools mpileup com a opção -B. Extraímos locais com mapeamento e qualidade de base maiores que 30. Inserções e deleções, e locais mostrando múltiplos alelos, foram excluídos (Dados Suplementares  5 ).

Executamos análise de parentesco com READ 68 dentro de cada sítio arqueológico (mínimo de três indivíduos; Fig. Suplementar 2 ). Quando um par de indivíduos com parentesco próximo foi encontrado, como relacionamentos de primeiro grau (pai-filho ou um irmão completo), excluímos o indivíduo com menos SNPs cobertos das análises. Isso resultou na remoção da análise de iam4 (mesmo indivíduo que iam5), keb8 (mesmo indivíduo que keb1), iam6 (primeiro grau relativo a iam004) 6 e TAF012 (primeiro grau relativo a TAF011) 10 .

Análise genômica populacional de dados pseudohaplóides

Dados de mais de 300 indivíduos antigos da Eurásia, do Norte da África e da África Subsaariana, organizados de acordo com a geografia e a cronologia (Dados Suplementares  2 ), foram baixados, mapeados e processados ​​pelo mesmo pipeline usado para dados recém-gerados. O conjunto completo de dados de DNA antigo foi mesclado com indivíduos modernos publicamente acessíveis amostrados em todo o mundo do conjunto de dados do Simons Genome Diversity Project (SGDP) 34 para um painel de 2,2 milhões de SNP 64 . Os alelos foram amostrados de arquivos bam, extraindo aleatoriamente uma leitura com MAPQ > 30 e BQ > 30 por local SNP para cada indivíduo antigo (usando SAMtools v.1.5.0 mpileup com a opção -B), e essa posição foi tratada como (pseudo)haploide. Para dados não tratados com UDG (ktg001) ou dados mesclados de UDG e não UDG (iam004), cortamos 10 pb das extremidades da sequência para evitar a integração de substituições de C para T e G para A com codificação incorreta. Para os dados tratados com UDG parciais publicados (metade UDG), 2 pb foram cortados das extremidades da sequência. Os SNPs que mostravam mais de dois alelos foram excluídos dos dados, deixando 1.379.466 SNPs para análise.

A análise de componentes principais foi realizada usando smartpca v.10210 (ref. 69 ). Os componentes principais foram calculados com base em indivíduos de 18 populações modernas do Mediterrâneo, Eurásia ou Norte da África do SGDP. Indivíduos antigos foram projetados no espaço PCA com as opções shrinkmode: YES e lsqproject: YES. Um algoritmo de agrupamento baseado em modelo não supervisionado, implementado em ADMIXTURE v,1.3.0 (ref. 70 ), foi realizado para K  = 3–5 (30 execuções) em um conjunto de dados totalmente pseudo-haploidizado, com desequilíbrio de ligação podado de indivíduos modernos e antigos de populações do Mediterrâneo, Eurásia ou Norte da África, deixando 812.092 SNPs para análise. Os resultados foram analisados, alinhados e plotados com pong 71 .

Popstats 72 foi usado para calcular estatísticas f- 73 , com Mbuti definido como o grupo externo (Dados Suplementares  6 e 7 ). Estatísticas 3 do grupo externo foram computadas com a opção –f3vanilla. Erros-padrão (EPs) foram calculados com uma abordagem de bloco ponderado jack-knife.

A modelagem de mistura foi realizada com qpAdm 74 usando ADMIXTOOLS v.5.0, por meio de uma versão adaptada do qpAdm_wrapper ( https://github.com/pontussk/qpAdm_wrapper ) que percorre todos os subconjuntos possíveis da lista de populações de origem fornecida (selecionada com base em resultados anteriores), para testar modelos de mistura de uma, duas, três e quatro vias. Os SEs foram computados com jack-knife de bloco de 5 cM. Usamos um conjunto de 11 populações de referência cujo poder de desembaraçar linhagens divergentes de ancestralidade presentes na Europa, Norte da África e Oriente Próximo foi descrito anteriormente e que são diferentes relacionadas às fontes testadas 10 , 31 , 75 . Fontes distantemente relacionadas foram exploradas e, quando possível, também grupos mais próximos (geograficamente, cronologicamente ou de acordo com evidências arqueológicas existentes). Tentamos encontrar os modelos mais parcimoniosos consistentes com os dados ( P  > 0,05) verificando o menor número possível de fontes de ancestralidade necessárias para explicar a ancestralidade em cada população de teste (Dados Suplementares  8 – 13 ). O evento de mistura em KTG foi datado usando ALDER 76 e DATES 77 (Informações Suplementares 8 ). Calculamos a diversidade condicional de nucleotídeos 78 pela estimativa do número médio de incompatibilidades entre dois indivíduos da mesma população. Os SEs foram estimados usando uma abordagem de bloco jack-knife e um tamanho de bloco de 2.000 SNPs (Fig. Suplementar 9 ).

Análise genômica populacional de dados diplóides

Chamadas de genótipo diploide para um painel de 49.791.572 SNPs foram realizadas para indivíduos antigos do noroeste da África com cobertura genômica de pelo menos nove vezes (oub002, ktg004 e skh001), bem como indivíduos antigos relevantes publicados anteriormente com genomas de alta cobertura sequenciados. Antes da chamada do genótipo, a qualidade da base nas extremidades de leitura foi reduzida e o realinhamento de indel foi conduzido com GATK 3.5.0. Os genótipos diploides foram chamados usando dbSNP v.142 como SNPs conhecidos, com UnifiedGenotyper 79 do GATK . Calculamos a profundidade média de sequenciamento (avg.DP) sobre todas as posições chamadas para cada indivíduo e filtramos para QUAL > 30 e um intervalo de profundidade de cinco vezes a 3× avg.DP por indivíduo, usando a visualização BCFtools. Este conjunto de dados foi mesclado com dados de indivíduos modernos do conjunto de dados SGDP.

A heterozigosidade individual foi calculada a partir do número de posições variáveis ​​dividido pelo de SNPs sequenciados, usando o comando –het no PLINK 1.9 (ref. 80 ). Estimamos o comprimento e o número de execuções de homozigosidade após a filtragem com o comando PLINK –geno 0. Os arquivos de entrada do MSMC 81 foram gerados a partir de arquivos VCF. Filtros para MAPQ > 30, qualidade mínima do genótipo de 50 e profundidade de sequenciamento foram usados. Os locais que não passaram por esses filtros foram mascarados por indivíduo. O MSMC 0.1.0 foi então executado para cada indivíduo.

Declaração de ética e inclusão

A amostragem para este estudo surgiu de projetos de arqueologia que envolveram universidades e pesquisadores locais, incluindo YB, cujo envolvimento no design da pesquisa incluiu a seleção de material arqueológico para análises, bem como a supervisão da amostragem. A relevância local desta pesquisa está vinculada à história da região, e é localmente relevante no que diz respeito à descrição do passado humano no noroeste da África. O estudo foi realizado com os mais altos padrões de pesquisa arqueogenômica, e pesquisas relevantes de acadêmicos locais foram citadas.

Resumo do relatório

Mais informações sobre o desenho da pesquisa estão disponíveis no  Resumo do Relatório de Portfólio da Nature vinculado a este artigo.