Evidências do mitogenoma
mostram dois eventos de radiação e dispersões de ancestralidade
matrilinear da costa norte da China para as Américas e Japão
Destaques
•
A linhagem nativa americana D4h3a pode traçar sua ancestralidade até a costa norte da China
•
Radiações de D4h contribuem para pools genéticos de nativos americanos e japoneses
•
Radiações costeiras de D4h apoiam a rota costeira dos primeiros nativos americanos
Resumo
Embora
seja amplamente reconhecido que os ancestrais dos nativos americanos
(NAs) vieram principalmente da Sibéria, a ligação entre a linhagem de
DNA mitocondrial (mtDNA) D4h3a (típica dos NAs) e D4h3b (encontrada até
agora apenas no leste da China e Tailândia) levanta a possibilidade que
as fontes ancestrais dos primeiros NAs eram mais variadas do que as
hipóteses. Aqui, analisamos 216 mitogenomas D4h contemporâneos
(incluindo 106 recém-sequenciados) e 39 dados D4h antigos relatados
anteriormente. Os resultados revelam dois eventos de radiação de D4h na
costa norte da China, um durante o Último Máximo Glacial e outro
durante a última deglaciação, o que facilitou a dispersão de
sub-ramificações de D4h para diferentes áreas, incluindo as Américas e o
arquipélago japonês. As distribuições costeiras das linhagens NA
(D4h3a) e japonesas (D4h1a e D4h2), em combinação com as semelhanças
arqueológicas paleolíticas entre o norte da China, as Américas e o
Japão, dão suporte ao cenário de dispersão costeira das primeiras NAs.
Como
o último continente colonizado por humanos modernos, o povoamento das
Américas e as subsequentes dispersões dentro do continente têm sido o
foco de intenso interesse dos geneticistas.
Estudos
anteriores mostraram que os ancestrais dos indígenas americanos, também
chamados de nativos americanos (NAs), se originaram na Ásia,
provavelmente na parte oriental da Ásia,e se estabeleceram nas Américas por meio de múltiplas dispersões pela Sibéria/Beringia10 através da rota costeira e possivelmente do corredor livre de gelo interior,11 seguido por posterior divergência em subgrupos.A
origem dos primeiros NAs, até o momento, foi atribuída a um processo
complexo envolvendo múltiplas dispersões de diferentes locais de origem.
Conforme indicado por investigações substanciais, além da
ancestralidade siberiana amplamente reconhecida, também foram
identificados ancestrais de outros lugares, embora limitados, incluindo o
norte da Ásia,Ásia leste,13 Sudeste da Ásia,e até Australo-Melanésia.
De
acordo com essas observações, evidências de marcadores uniparentais
indicam ainda que a maioria dos NAs mostra afinidade genética mais
próxima aos siberianos, conforme manifestado pelos tipos fundadores de
NA, por exemplo, DNA mitocondrial (mtDNA) haplogrupos A2, B2, C1, C4c,
D1, etc. .,e haplogrupos do cromossomo Y Q-L54 (Q-Z780, Q-M848 e Q-M4303) e C-L1373 (C-MBP373),e assim pode traçar suas fontes ancestrais na Sibéria. Em contraste, uma linhagem irmã do fundador matrilinear de NA D4h3a,viz., D4h3b, foi até agora observado apenas na China25 and Thailand,sugerindo
que as fontes maternais ancestrais para os primeiros NAs não estavam
restritas à Sibéria, mas eram de uma área geográfica muito mais ampla da
Ásia.
To address this issue, an
investigation integrating all available D4h data from a large-scale
dataset covering the whole of Eurasia is needed. Given that D4h3 and its
ancestor type D4h are relatively rare in contemporary populations
(∼0.5%),
pesquisamos
um total de 101.319 indivíduos eurasianos e identificamos os mtDNAs
pertencentes a D4h3 e seu nodo ancestral D4h. dados de sequência
parcial, principalmente dados de segmento hipervariável (HVS) ( Tabela S1 Estes incluíram 60.979 amostras para as quais estavam disponíveis ), e 40.340 amostras com a sequência completa (ou quase completa) do mitogenoma ( Tabela S2 ; Figura 1
). Esta pesquisa identificou 110 mtDNAs que poderiam ser atribuídos
inequivocamente ao haplogrupo D4h com base nas informações do
mitogenoma, bem como 112 mtDNAs provavelmente pertencentes ao D4h com
base em seus HVS ou dados de genotipagem (Tabela S3), cujo
sequenciamento completo revelou 106 mitogenomas D4h adicionais ( Figura S1
) . Além disso, para reconstruir a história evolutiva de D4h, também
pesquisamos esse haplogrupo em 15.460 amostras antigas compiladas por
indo-european.eu ( https://indo-european.eu/ancient-dna/ ),cobrindo
assim praticamente todos os dados de mtDNA antigos relatados
globalmente, bem como 232 dados de mtDNA antigos relatados recentemente
adicionais do leste da Ásia.
Esta pesquisa rendeu 39 amostras D4h antigas (30 com todo o mitogenoma e nove com dados HVS) ( Figura 1 ; Tabelas S4 e S5
), que refletiam a raridade de Dh4 nos tempos antigos. Portanto,
integramos esses dados antigos e contemporâneos desse raro haplogrupo
para investigar completamente sua origem e história de expansão.
Figure 1Geographic sources of mtDNA data employed in this study
Differentiation of D4h3 and D4h in Central and North China
Para
esclarecer a origem do fundador de NA, D4h3a, exploramos seu ancestral
D4h3. Nossos achados permitiram uma atualização da filogenia D4h3 e
seus ramos ( Figuras 2 A e S2
). Especificamente, para evitar qualquer confusão, mantivemos os
nomes de D4h3a e D4h3b e provisoriamente nomeamos seus nós upstream
“pré-D4h3a” e “pré-D4h3b”, respectivamente. Diferente do fundador de
NA, D4h3a, as outras filiais do D4h3 são distribuídas principalmente na
China. Em detalhes, D4h3b1 (tipo de raiz na província de Hebei, no
norte da China) é encontrado no norte e centro da China, enquanto D4h3b2
(tipo de raiz na província de Hubei) é distribuído principalmente na
China central. Coincidentemente, entre os dados de mtDNA antigos
relatados de diferentes locais na Eurásia, encontramos três amostras
antigas pertencentes a D4h3 datadas de 14 a 15 quilos anos atrás (kya)
no vale do rio Amur (localizado no norte da China).
Um desses mtDNAs, amostra NE-5 (∼14 kya), deriva de pré-D4h3a e é filogeneticamente o mais próximo (seis mutações à parte; Figura S2
) do mitogenoma D4h3a fundador de NA. As duas restantes, amostras
NE34 (∼14 kya) e NE-18 (∼7 kya), são ambas membros do pré-D4h3b. No
geral, essas descobertas indicam que a pátria ancestral de D4h3 é
provavelmente a China Central e do Norte e que ambos os ramos de D4h3
estavam lá durante o período Paleolítico. Esses ramos localizam-se no
centro/norte da China e refletem o vínculo matrilinear asiático mais
próximo com D4h3a, um dos fundadores dos haplogrupos mtDNA
pan-americanos.
Figura 2 Filogeografia do haplogrupo D4h e suas sublinhagens
We
then shifted our attention to haplogroup D4h, the most recent common
ancestor of D4h3. Except for the NA D4h3a, the other D4h mtDNAs were
predominantly found in China, mainly in North (48 out of 150
contemporary samples, discarding four with unknown geographic
information) and Central China (44 out of 150) (Table S4; Figure S3).
A relatively small number of D4h mtDNAs were also identified in
Northwest China (n = 14), Southwest China (n = 16), South China (n = 5),
Japan (n = 13), Southeast Asia (n = 7), and North Asia (n = 2) (Table S4; Figure S3). Interestingly, the majority of the ancient D4h samples were detected in the northern regions of China (Figure 1),
supporting a similar D4h distribution in the past. Further
phylogeographic analyses revealed that the ancient and current samples
from the same geographic region tend to cluster together in the same
sub-branch, e.g., D4h1a, D4h1c, D4h1d, and D4h3. Meanwhile, most
sub-haplogroups of D4h are predominant in North/Central China (i.e.,
D4h1b, D4h1d, D4h1e, and pre-D4h3b) or showed connections between
North/Central China and other regions, including western China (D4h1c
and D4h4), Japan (D4h1a), North Asia and Japan (D4h2), and even the
Americas (D4h3a) (Figuras 2 , 3A e S4
). Além disso, amostras do sul da China, sudoeste da China, noroeste
da China, sudeste da Ásia e norte da Ásia foram esporadicamente
distribuídas em todo o haplogrupo D4h e localizadas principalmente nos
ramos terminais ( Figuras 2 A e S2
), provavelmente como resultado do fluxo gênico . Finalmente, as
distribuições peculiares de certas linhagens, por exemplo D4h1a no Japão
e D4h1c no sudoeste da China ( Figuras 2 A, 3 A e S2 ), provavelmente indicam eventos fundadores.
Figure 3Geographic distribution and schematic tree of haplogroup D4h
Dado
que alguns dos dados de mitogenoma da literatura são de estudos
filogenéticos e não populacionais, e dada a relativa escassez de
mitogenomas da Sibéria, que introduzirá viés nas análises
filogeográficas, também coletamos e analisamos dados de mtDNA HVS de
estudos populacionais (Tabela S1
). Apenas algumas amostras potenciais de D4h foram encontradas nas
amostras do norte da Ásia (n = 4.176) (por exemplo, duas pertencentes a
D4h1d, que é definida por T16172C e C16174T, e uma pertencente a D4h1e,
que é definida por C16174T e A16343G) ( Figura S4 ), dando suporte à sua raridade no norte da Ásia. A rede de junção mediana com base nos dados HVS ( Figura S4
) revelou, em vez disso, uma faixa de distribuição muito mais ampla de
D4h na Ásia.
De fato, a maioria dos mtDNAs D4h asiáticos é observada
na China Central (58/228; 25,43%) e Norte (44/228; 21,05%), seguida pelo
Sudoeste da China (35/228; 15,35%), Noroeste da China (15/ 228; 6,57%),
Japão (29/228; 12,72%), Sudeste Asiático (11/228; 4,82%), Sul da China
(6/228; 2,63%) e Norte da Ásia (9/228; 3,94%). Além disso, os tipos de
raiz dos principais ramos, por exemplo, D4h1b, D4h1c, D4h1d, D4h1e e
D4h3b, são encontrados principalmente no centro e norte da China,
enquanto os ramos terminais contêm principalmente amostras de outras
regiões, por exemplo, Sudoeste da China, Noroeste da China , Sudeste
Asiático, Sul da Ásia e Ásia Central. Por fim, D4h1a e D4h2 são
restritos ao Japão e arredores, dando suporte aos eventos fundadores.
Tomados
em conjunto, esses resultados indicam que a diferenciação filogenética
de D4h ocorreu em algum lugar no centro ou norte da China, provavelmente
em uma região geograficamente próxima à costa norte da China. De
fato, entre as amostras da China Norte/Central, mais da metade (64/92,
69,57%) foi encontrada em províncias ao longo (Hebei, Liaoning, Tianjin,
Shandong, Jiangsu, Shanghai e Zhejiang) ou próximas (Heilongjiang,
Jilin, Pequim, Anhui e Jiangxi) na costa norte da China ( Tabela S4
). Portanto, propomos que a costa norte da China pode ter
desempenhado um papel crítico na divergência e disseminação de D4h e
seus sub-haplogrupos.
Dois eventos de radiação da costa norte da China contribuíram para os pools genéticos de NA e japoneses
As
estimativas de idade coalescente, atualizadas por datas de radiocarbono
calibradas de amostras antigas de DNA usando datação de ponta em BEAST (
Tabelas 1 e S6
), indicam que as radiações de linhagens D4h (idade 32,39 kya, 95%
densidade de probabilidade mais alta [HPD], 24,04–41,45 kya ) ocorreram
principalmente em dois períodos de tempo ( Figura 3 B). O primeiro período caiu dentro do Último Máximo Glacial (LGM; 26,5–19,0 kya),
durante
o qual D4h3 (26,39 kya, 95% HPD, 20,19–33,21 kya), pré-D4h3a (22,29
kya, 95% HPD, 17,24–27,68 kya), pré-D4h3b (21,55 kya, 95% HPD,
16,18–27,94 kya) , D4h1 (21,83 kya, 95% HPD, 15,56–29,08 kya) e D4h2
(20,05 kya, 95% HPD, 12,12–29,48 kya) ( Tabelas 1 e S6 ) diferenciados em sub-haplogrupos separados ( Figura 3 B). Entre esses sub-haplogrupos, D4h3a se dispersou ainda mais e se tornou um dos haplogrupos pan-americanos de NAs ( Figura 4 A). Essa radiação ecoa bem com a divergência dos ramos americanos basais dos antigos asiáticos orientais 23-20 kya,o que provavelmente se deveu ao clima inóspito do LGM nas regiões do norte da Ásia.
Durante
a última deglaciação (19,0–11,5 kya), após o LGM, uma segunda radiação
de D4h ocorreu em algum lugar perto da costa norte da China, conforme
documentado por D4h4 (18,11 kya, 95% HPD, 12,67–24,28 kya), D4h1c (16,17
kya kya, 95% HPD, 10,66–22,36 kya), D4h1a (15,59 kya, 95% HPD,
11,43–20,92 kya), D4h3b (13,22 kya, 95% HPD, 7,55–19,93 kya), D4h1c1
(12,77 kya, 95% HPD , 8,21–17,79 kya) e D4h1e (12,10, 95% HPD,
7,16–17,50 kya) ( Figura 4
B). De acordo com esta radiação filogenética, um rápido aumento no
tamanho efetivo da população de D4h ∼15 kya foi observado no gráfico
Bayesiano estendido do horizonte (EBSP) (Figura 3 C) ,
provavelmente devido à melhoria do clima pós-LGM. Esses resultados
revelam duas ondas de dispersões populacionais anteriormente
desconhecidas ao longo da costa norte da China durante o LGM e a última
deglaciação, que levaram à origem e expansão de diferentes linhagens D4h
(Figura 4 )
. As regiões ao redor dos mares de Bohai, Huanghai e da China
Oriental, que ainda eram conectadas por terra ao longo da costa norte
antes do Holoceno,
a Os
dados do mitogenoma antigo foram incluídos nas estimativas de idade
coalescente. As sequências incompletas foram excluídas das estimativas
de idade (consulte a Tabela S4 para obter detalhes).
b
A taxa de mutação foi recalibrada usando o método de datação de pontas.
O modelo de melhor ajuste foi avaliado conforme descrito
anteriormente.
Curiosamente,
dois haplogrupos, D4h1a1 (12,24 kya, 95% HPD, 6,72–15,87 kya) e D4h2
(20,05 kya, 95% HPD, 12,12–29,48 kya), exibiram distribuições
prevalentes no arquipélago japonês (Figuras 2 , 3 A e S4
), sugerindo que as expansões da costa norte da China também exerceram
influência no Japão. A descoberta de D4h1a em amostras antigas datadas
de aproximadamente 11 kya do vale do rio Nenjiang
A rede de junção mediana ( Tabela S5 ; Figura S4
) mostrou que um ramo de D4h2 (ou seja, D4h2a) na China e no Sudeste
Asiático, enquanto o outro (D4h2b) é distribuído em siberianos, bem como
na população Ainu (japoneses indígenas, 3 de 50 amostras) e Jomons
antigos. Isso apóia ainda mais uma contribuição genética possivelmente
da China para diferentes populações, incluindo os do sudeste asiático e
os japoneses antigos. Portanto, provavelmente D4h1a1 e D4h2 se
dispersaram da China para o Japão após o LGM, possivelmente através das
pontes terrestres que conectavam a China e o arquipélago japonês até 12
kya.
A
origem do mtDNA D4h na costa norte da China de NAs ecoa bem também com a
diferenciação do haplogrupo C2a-L1373 do cromossomo Y (ancestral das
linhagens fundadoras de NA C-MPB373 e C-P39) em regiões de baixa
latitude do norte da Ásia.
Para
avaliar ainda mais o potencial centro de radiação de C2a-L1373,
avaliamos as frequências de C2a-L1373 e suas sub-linhagens em diferentes
províncias da China com base em dados de genotipagem do cromossomo Y da
23Mofang Biotechnology Co., Ltd (totalmente 458.805 indivíduos, cada um
com 33.000 SNPs do cromossomo Y genotipados). Detectamos o tipo de
raiz (C2a-L1373 ∗ ) apenas no norte da China (incluindo
Pequim [0,020%], Tianjin [0,031%], Henan [0,004%], Heilongjiang
[0,030%], Jilin [0,063%], Liaoning [0,071 %], Shaanxi [0,035%]) e
noroeste da China (Gansu [0,016%]; Tabela S8 ). Vale ressaltar que as frequências C2a-L1373 ∗ mais altas foram observadas em Liaoning, Jilin, Heilongjiang, Tianjin e Pequim ( Tabela S8
), todas localizadas próximas ao litoral norte da China. Além disso, a
maioria das outras sublinhagens C2a-L1373, incluindo C-FGC28903, que é
um ramo irmão de C-P39, abriga suas frequências mais altas no norte da
China (Tabela S8 )
. Além disso, amostras pertencentes a C2a-L1373 em outros locais como
o sul da Ásia, Ásia Central, Europa, etc., foram encontradas
esporadicamente ou ocuparam principalmente os ramos terminais.
Esta
evidência sugere fortemente que C2a-L1373 se diferenciou no norte da
China, especialmente nas regiões próximas à costa, de forma semelhante
ao mtDNA D4h.
Além disso,
descobriu-se que duas amostras antigas da planície de Songnen, no norte
da China, datadas de aproximadamente 14.000 anos atrás, pertenciam ao
mtDNA D4h3 e ao cromossomo Y C2a-L1373,
revelando
assim a coexistência de linhagens ancestrais maternas e paternas de NAs
na costa norte da China. Curiosamente, C2-M217 (∼39,3 [34,7–44,5] kya)
é
semelhante ao tempo da primeira radiação D4h estimada neste estudo,
tornando provável que uma população ancestral desta região tenha
contribuído para os pools gênicos materno e paterno dos NAs. De fato,
além das linhagens do mtDNA D4h e do cromossomo Y C2-M217, linhagens
maternas e paternas substanciais também foram observadas nesta região,
por exemplo, linhagens do cromossomo Y C-F1067
Isso
dá suporte ao cenário de que esta região era um centro de diferenciação
no leste da Ásia após o LGM, o que provavelmente facilitou a expansão
de diferentes linhagens, incluindo mtDNA D4h3 e cromossomo Y C2a-L1373.
Enquanto isso, o haplogrupo C2-M217 do cromossomo Y também foi
observado com maior frequência nos Ainu (15%) do que em outros japoneses
(3%).
Essas
observações sugerem coletivamente que uma população ancestral do norte
da China carregando o mtDNA D4h e o haplogrupo C2 do cromossomo Y também
se espalhou para as Américas e o arquipélago japonês.
Discussão
Neste
estudo, integrando mitogenomas antigos e contemporâneos de D4h a partir
de um conjunto de dados em grande escala que cobre praticamente toda a
Eurásia, traçamos a ancestralidade de uma rara linhagem fundadora de NA
(D4h3a) para uma região de latitude mais baixa no norte da China
costeira em torno de Bohai e Mares de Huanghai. Esta região é diferente
das fontes geográficas na Sibéria hipotetizadas até agora pelos
componentes maternos comuns, incluindo mtDNA haplogrupos A2, B2, C1,
D4b1a2a1a, etc.Nosso
estudo, portanto, descobriu uma fonte ancestral adicional para os
ancestrais dos NAs além da Sibéria, a partir da perspectiva matrilinear.
Esta ascendência, embora tenha contribuído apenas para uma pequena
proporção do pool genético mtDNA de NAs (D4h3a),
seria importante para complementar todo o quadro das histórias de origem das primeiras NAs.
Suporte
adicional vem do cromossomo Y C2-M217, que abriga uma idade (∼40 kya)
semelhante à do mtDNA D4h e também provavelmente irradiada na costa
norte da China durante o LGM (conforme indicado por C2a-L1373), quando
ocorreu a primeira irradiação de D4h. Curiosamente, essas ascendências
uniparentais ecoam bem com a ancestralidade antiga no leste da Ásia (∼35
kya) que deu origem aos asiáticos orientais, siberianos e NAs em
aproximadamente 26 kya.
Esta
evidência apóia fortemente a existência de uma antiga fonte de
ancestralidade, surgindo entre 40 e 23 kya, que contribuiu para
populações incluindo asiáticos orientais, jomons, siberianos orientais e
NAs (Figura S5 )
. Propomos que mtDNA D4h foi uma das linhagens matrilineares que
testemunharam essas divisões e expansões populacionais. No entanto,
diferente dessa ascendência do Leste Asiático contribuindo
substancialmente para o leste da Sibéria,
Mais dados de mtDNA da Sibéria serão úteis para avaliar melhor esse processo de expansão.
Além
disso, essa conexão genética entre a China, as Américas e o Japão
durante o período do Pleistoceno é paralela às semelhanças
arqueológicas, já no período do Pleistoceno, entre essas regiões. Por
exemplo, no período terminal do Pleistoceno, as microlâminas japonesas
(18–17 kya), que exibem semelhanças com as do nordeste da Ásia
(incluindo o norte da China), exibem semelhanças com pontos de haste
contemporâneos de locais incipientes de Jomon (∼15,5 kya).
É
importante ressaltar que as hastes foram bem distribuídas ao longo da
orla do Pacífico, do Japão à América do Sul, com estreitas afinidades
umas com as outras.
Descobertas
recentes sobre pontos de projéteis com haste na América do Norte (local
da balsa de Cooper, ∼15–16 kya) mostram uma afinidade mais próxima com
as pontas de projétil não caneladas no Japão do que no norte da Ásia.
Atribuímos
essa similaridade na tecnologia paleolítica, bem como as relações
filogenéticas das sublinhagens D4h na China, nas Américas e no Japão, a
uma provável conexão pleistocênica entre essas regiões (Figura 4 B ) .
Nossos
resultados também lançam luz importante sobre a rota de dispersão dos
primeiros NAs nas Américas. Dado que o mtDNA D4h irradiava da costa
norte da China, que é geograficamente próxima à borda costeira do
Pacífico, especulamos que D4h teria documentado dispersões LGM e pós-LGM
ao longo da costa leste do Pacífico. Isso ecoa bem com a dispersão
D4h3a ao longo do caminho costeiro do Pacífico quando o corredor livre de gelo foi fechado.
Da
mesma forma, o cromossomo Y C-L1373, que provavelmente irradiava em
paralelo com o mtDNA D4h, também foi relatado em sul-coreanos ( http://koreangenome.org/ ) e Nivkh,
dando
assim suporte a um cenário de expansão da população costeira iniciado
no litoral norte da China. Isso, juntamente com as afinidades culturais
paleolíticas ao longo do Pacífico, por exemplo, pontas de caule, e a viabilidade paleoecológica de dispersões marítimas (por exemplo, hipótese de autoestrada de algas)dá mais suporte à hipótese da rota costeira das primeiras NAs.
Limitações do Estudo
Ao
dissecar a origem de uma rara linhagem fundadora de NA, nosso estudo
revelou uma raiz ancestral de NAs e dos japoneses na costa norte da
China. No entanto, algumas expansões detalhadas dessa região para as
Américas precisam ser mais dissecadas. Primeiro, são necessários mais
dados sobre mtDNA D4h de amostras antigas e contemporâneas para elucidar
a história de expansão detalhada desta linhagem, especialmente da
Sibéria, onde um número relativamente baixo de mitogenomas foi avaliado.
Em segundo lugar, os dados do cromossomo Y de alta resolução de
C-L1373 do conjunto de dados da população em grande escala ajudarão a
verificar essa radiação da perspectiva paterna. Em terceiro lugar, as
investigações integrando mitogenomas, o cromossomo Y e genomas
autossômicos também são essenciais para explorar se existem diferenças
entre marcadores maternos, paternos e autossômicos e, assim,
complementar todo o quadro da história de origem dos NAs.
STAR★Methods
Tabela de recursos principais
REAGENTE ou RECURSO
FONTE
IDENTIFICADOR
Dados depositados
106 genomas mitocondriais inteiros de amostras D4h
Mais
informações e solicitações de recursos e reagentes devem ser
direcionadas e serão atendidas pelo contato principal, Qing-Peng Kong ( kongqp@mail.kiz.ac.cn ).
disponibilidade de materiais
Este estudo não gerou novos reagentes únicos.
Modelo experimental e detalhes do assunto
Mitogenomas
completos de 106 amostras pertencentes a D4h foram sequenciados neste
estudo. As informações dos sujeitos incluindo origem geográfica,
gênero e idade são apresentadas na Tabela S3
. A coleta de amostras e o protocolo experimental foram aprovados
pelo Comitê de Ética do Instituto de Zoologia Kunming, Academia Chinesa
de Ciências (aprovação nº KIZRKX-2021-011), bem como pelo Escritório de
Administração de Recursos Genéticos Humanos (OHGRA), The Ministério da
Ciência e Tecnologia (MOST), China (Aprovação nº 2022SLCJ0017). O
consentimento informado foi obtido de cada indivíduo antes do estudo.
Para os dados de genotipagem da 23 Mofang Inc., usamos apenas dados do
cromossomo Y de clientes que assinaram o consentimento informado online
para participar deste estudo e concordaram em compartilhar suas
informações de genotipagem.
Detalhes do método
Triagem de mitogenomas D4h do conjunto de dados
Para
desvendar a história evolutiva deste haplogrupo e a expansão de sua
sublinhagem pré-D4h3a nas Américas, realizamos uma busca de D4h mtDNAs
em um conjunto de dados de grande escala: 101.319 indivíduos eurasianos,
incluindo 60.979 para os quais apenas dados de segmento hipervariável
(HVS) ( Tabela S1 ) estavam disponíveis e 40.340 amostras com mtDNA completo (sequenciamento e genotipagem) ( Tabela S2 ). Para os dados de HVS e genotipagem, a estratégia de busca de motivos
foi
adotado para identificar mtDNAs abrigando variantes diagnósticas de D4h
e suas sublinhagens. Isso permitiu a identificação de 112 mtDNAs D4h
potenciais ( Tabela S3
), que após o sequenciamento completo do mitogenoma revelou 106 novos
mitogenomas D4h asiáticos (ver abaixo). Estes foram adicionados a 110
mitogenomas D4h publicados anteriormente de populações contemporâneas e
30 mitogenomas D4h ( Tabela S4 ) selecionados de amostras antigas para análises filogenéticas adicionais e estimativas de idade coalescente.
Extração de DNA, construção de biblioteca, sequenciamento e controle de qualidade
O
DNA genômico total foi isolado usando o kit de extração de DNA genômico
(Axygen). O rendimento e a pureza do DNA foram medidos por
espectroscopia UV. As bibliotecas foram preparadas com um kit de
biblioteca padrão (MyGenostics Inc., Pequim, China). O sequenciamento
foi realizado usando uma plataforma Illumina HiSeq X Ten na MyGenostics,
com profundidades de sequenciamento variando de 3.823,63× a 15.727,02×
(média de 7.359,76×; Figura S1 ). O software Cutadapt
foi
usado para cortar adaptadores e filtrar sequências de baixa qualidade
(incluindo leituras curtas e leituras com pontuação de qualidade média
baixa e muitas bases ambíguas (N) em arquivos fastq. As leituras foram
então alinhadas com a versão do genoma de referência humana GRCH38 (que
tem o Sequência de Referência de Cambridge (rCRS)
como referência mtDNA) por “bwa mem” (v0.7.10) ( http://bio-bwa.sourceforge.net/
). As duplicações foram detectadas e removidas usando o módulo
MarkDuplicates do GenomeAnalysisTK (GATK) e o módulo GATK
HaplotypeCaller foi empregado para gerar o arquivo variante (vcf) usando
parâmetros padrão. As variantes finais de cada amostra em relação ao
rCRS revisado foram registradas ( Tabela S3 ).
Aquisição antiga de mtDNA
Arquivos
fasta de sequências antigas de mtDNA foram baixados da literatura ou
banco de dados público, com exceção da sequência de mtDNA de I4012,
que
foi extraído de todos os dados de sequenciamento do genoma dessa
amostra. Em detalhes, baixamos o raw fastqof I4012 da ENA (European
Nucleotide Archive) e, em seguida, ajustamos os adaptadores usando
leeHom v1.2.16
Finalmente,
obtivemos o arquivo fasta de mtDNA endógeno e o alocamos ao haplogrupo
D4h1c de acordo com as variantes. No entanto, devido à taxa de
contaminação de cerca de 0,99 (calculada por schmutzi v1.5.6),
A filogenia de D4h foi reconstruída manualmente e verificada usando mtPhyl v5.003 ( https://sites.google.com/site/mtphyl/
). Muitos ramos classificados anteriormente foram confirmados,
incluindo D4h4, D4h1, D4h1a e D4h1b, enquanto outros foram atualizados,
incluindo D4h1c, D4h1c1, D4h1d e pré-D4h3b. Além disso, vários novos
ramos também foram definidos, por exemplo, D4h3b1, D4h3b2, D4h1c2 e
D4h1e ( Figura S2 ).
Estimativas de idade coalescente
Modern and ancient sequences (Table S4) were aligned using MUSCLE v3.8.3
Mutações
incluindo 309.1C(C), 315.1C(C), AC indels em 515–522, A16182C, A16183C,
16193.1C(C) e C16519T/T16519C foram excluídas nas estimativas de idade.
bModelTest
O
pacote implementado no BEAST 2.6.6 foi usado para selecionar o modelo
de substituição mais apropriado para nossos dados. Como resultado, o
modelo TN93 (121.131) com heterogeneidade de taxa gama (G) e proporção
de locais invariantes (I) foi suportado por meio da saída de
visualização no Tracer v1.7.2. O Fator de Bayes (logBF = 15) calculado
pelo pacote BEAST NS (32 partículas) indicou que o modelo de relógio
estrito é mais adequado para nossos dados do que o modelo de relógio
relaxado lognormal não correlacionado. Os pontos médios das datas de
radiocarbono calibradas ou períodos arqueológicos das amostras antigas (
Tabela S4 ) foram usados como a data de ponta.
O
uso do BEAST 2.6.6 mostrou que o parâmetro clockRate do conjunto de
dados original de intervalos HPD de 95% (distribuição posterior mais
alta) não se sobrepôs aos conjuntos de dados randomizados por data,
indicando que havia sinal de data de ponta suficiente para calibrar a
taxa de clock. As execuções da Cadeia Monte Carlo (MCMC) de 100.000.000
de etapas foram realizadas com uma amostragem de parâmetros a cada
10.000 etapas e as etapas iniciais de 10% foram descartadas como
burn-in. População Constante Coalescente foi adotada como árvore Prior.
O
BEAUti dentro do pacote do BEAST foi usado para definir o modelo e os
parâmetros. As convergências de MCMC foram avaliadas de acordo com o
tamanho efetivo da amostra (ESS) pelo Tracer v1.7.2 (com ESS >200
como aceitável). Como resultado, mitogenomas inteiros sem partições em
posições de códons foram adotados devido aos valores gerais de ESS mais
altos (com apenas dois valores de ESS entre 100 e 200). Os intervalos
de HPD de 95% das estimativas de idade coalescentes foram registrados no
FigTree v1.4.4.
was also used to evaluate the coalescent ages of each clade in haplogroup D4h (Table S6).
Distribuição geográfica espacial
As
localizações geográficas dos mtDNAs pertencentes a D4h e suas
sublinhagens foram plotadas usando o Surfer v8.0 (Golden Software Inc.
Golden, Colorado, EUA). Mapas de contorno de frequências espaciais
foram construídos usando o algoritmo Kriging no Surfer v8.0. Foram
excluídas amostras não provenientes de estudos populacionais.
assumindo
25 anos para uma geração. Cada simulação de Markov Chain Monte Carlo
(MCMC) foi executada por 500.000.000 gerações e amostradas a cada 5.000
gerações, com as primeiras 50.000.000 gerações descartadas como burn-in.
Os EBSPs foram reconstruídos usando o EBSPAnalyser (10% buin-in) e
visualizados usando um script R interno.
Reconstrução de rede de junção mediana
Um
conjunto de dados de sequências D4h HVS (n = 62), que abrange 53 mtDNAs
de populações contemporâneas e nove de amostras antigas ( Tabela S5
), juntamente com as sequências HVS correspondentes extraídas dos
mitogenomas completos, foi usado para reconstruir uma D4h mediana-junção
rede ( Figura S4 ). A rede de junção mediana foi inicialmente construída pela Rede 4.510 ( http://www.fluxus-engineering.com/sharenet.htm ) e depois verificada e reconstruída manualmente.
Os
dados completos de sequenciamento do mitogenoma (formato fasta) dos 106
indivíduos recém-sequenciados foram depositados no Genome Warehouse no
National Genomics Data Center ( https://bigd.big.ac.cn/gwh/
; NGDC: PRJCA006291). Este artigo não relata o código original.
Qualquer informação adicional necessária para reanalisar os dados
relatados neste documento de trabalho está disponível no contato principal mediante solicitação.
Agradecimentos
Agradecemos
ao Dr. Qiaomei Fu por fornecer os antigos dados de sequenciamento do
mtDNA. Este trabalho foi financiado pela National Natural Science
Foundation of China (31620103907, 81625013, 32170633 e 32150410355); o
Programa Nacional Chave de P&D da China (2022YFC3302004); a Segunda
Expedição e Pesquisa Científica do Planalto Tibetano (2019QZKK0607); o
Programa de Pesquisa Prioritária Estratégica (XDA20040102); Jovens
Cientistas em Pesquisa Básica (YSBR-076); o Programa de Pesquisa Chave
da Ciência de Fronteiras (QYZDB-SSW-SMC020); Programa CAS “Luz da China
Ocidental” (Y.-CL) da Academia Chinesa de Ciências; o Programa de
Digitalização, Desenvolvimento e Aplicação de Recursos Bióticos
(202002AA100007); o Ministério da Educação, Universidade e Pesquisa da
Itália (MIUR) para o Programa Dipartimenti di Eccellenza (2018–2022) -
Departamento de Biologia e Biotecnologia “L. Spallanzani,” Universidade
de Pavia (AA, AT e OS) e Progetti PRIN2017 20174BTC4R (AA); o Projeto
de Treinamento e Promoção de Talentos de Alto Nível de Kunming (Spring
City Plan; 2020SCP001); Yunling Scholar da Província de Yunnan (Q.-PK);
o Plano de Dez Mil Talentos de Yunnan, Projeto de Talentos Jovens e de
Elite (Y.-CL); e Projetos de Pesquisa Fundamental de Yunnan
(202201AW070012).
Contribuições do autor
Q.-PK
concebeu o estudo; Z.-LG, Y.-CL e Q.-PK realizaram as análises;
Z.-LG, B.-YY e L.-QY realizaram o sequenciamento do mitogenoma; Y.-CL,
Z.-LG, K.-JL, J.-YT e ZUR coletaram os dados; Y.-CL, Z.-LG, K.-JL,
Q.-PK, S.-HZ, C.-TL, AA, OS e AT contribuíram para a interpretação dos
resultados; Y.-CL e Q.-PK escreveram o manuscrito.
Declaração de interesses
Os
autores declaram não haver interesses conflitantes. Os autores da
23Mofang Biotechnology Co., Ltd também declaram não ter nenhum interesse
comercial ou associativo em relação a este trabalho.
Inclusion and diversity
Apoiamos a realização de pesquisas inclusivas, diversas e equitativas.
Tabela
S8. Número de amostras (a) e frequência (%) (b) de C-L1373 e
sub-linhagens em diferentes províncias da China (dados do conjunto de
dados interno)
Referências
Brandi S.
Bergamaschi P.
Cerna MF
Gandini F.
Bastaroli F.
Bertolini E.
Cereda C.
Ferretti L.
Gómez-Carballa A.
V batalha
e outros
A entrada paleo-indígena na América do Sul segundo os mitogenomas.
Mitochondrial
genome diversity in arctic Siberians, with particular reference to the
evolutionary history of Beringia and Pleistocenic peopling of the
Americas.
A
variação do DNA mitocondrial e do cromossomo Y fornece evidências de
uma ancestralidade comum recente entre os nativos americanos e os
indígenas altaianos.
As
sequências do cromossomo Y revelam uma curta paralisação beringiana,
rápida expansão e estrutura populacional inicial dos fundadores nativos
americanos.
Os
genomas mitocondriais completos das populações tailandesa e laociana
indicam uma origem antiga de grupos austro-asiáticos e difusão demica na
disseminação das línguas Tai-Kadai.
A aparência e as características do início do Paleolítico Superior no arquipélago japonês.
em: Yōsuke K. Masami I. Ted G. Hiroyuki S. Akira O. Emergência e Diversidade do Comportamento Humano Moderno na Ásia Paleolítica. Texas A&M University Press , 2010.
2015 : 289–313
Mudança
paleoambiental no médio Okinawa Trough desde a última deglaciação:
evidências da taxa de sedimentação e registro de foraminíferos
planctônicos.
Repensando
o desaparecimento da tecnologia de microblade no Pleistoceno Terminal
de Hokkaido, norte do Japão: observando evidências arqueológicas e
paleoambientais.
A
análise do DNA antigo de indivíduos do Holoceno médio da costa noroeste
da América do Norte revela diferentes caminhos evolutivos para os
mitogenomas.
Nenhum comentário:
Postar um comentário
Observação: somente um membro deste blog pode postar um comentário.