Mostrando postagens com marcador sífilis. Mostrar todas as postagens

segunda-feira, 23 de dezembro de 2024

A sífilis teve origem nas Américas, mostra o DNA antigo, mas o colonialismo europeu espalhou-a amplamente

Uma exposição no Museu Médico de Copenhague, na Dinamarca, mostra três crânios com sinais de sífilis terciária (estágio tardio). (Crédito da imagem: Stephen Taylor / Alamy Stock Photo)

O surto de uma doença misteriosa devastou a Europa no final do século XV, pouco depois de Cristóvão Colombo e a sua tripulação regressarem das Américas. Os especialistas debatem há séculos a origem desta doença – agora conhecida como sífilis . Agora, novas pesquisas sobre genomas antigos finalmente forneceram uma resposta: Acontece que a sífilis veio das Américas e não da Europa.

“Os dados apoiam claramente uma raiz da sífilis e dos seus parentes conhecidos nas Américas”, a co-autora do estudo Kirsten Bos , arqueogeneticista do Instituto Max Planck de Antropologia Evolutiva em Leipzig, Alemanha disse em comunicado . “A sua introdução na Europa a partir do final do século XV é mais consistente com os dados.”

Os pesquisadores analisaram esqueletos humanos de vários sítios arqueológicos nas Américas em busca de evidências de sífilis e doenças relacionadas. Eles revelaram suas descobertas em um estudo publicado em 18 de dezembro na revista Nature .

Bactérias do gênero Treponema causam as doenças não venéreas pinta, bejel e bouba, além da sífilis venérea, e estas são conhecidas coletivamente como doenças treponêmicas. Todas essas doenças podem causar a destruição e remodelação dos ossos durante a vida de uma pessoa, por isso os arqueólogos há muito investigam esqueletos pré-colombianos nas Américas em busca de pistas sobre a origem da sífilis.

Mas tem sido mais difícil encontrar provas genéticas claras da sífilis devido à má preservação do ADN treponémico ao longo dos séculos.

Relacionado: 9 das populações humanas mais ‘geneticamente isoladas’ do mundo Dois ossos do quadril estão no meio de um fundo preto

Fragmentos do osso do quadril que produziram um antigo genoma semelhante ao da sífilis (Crédito da imagem: © Darío Ramirez)

“Já sabemos há algum tempo que infecções semelhantes à sífilis ocorreram nas Américas há milênios, mas apenas pelas lesões é impossível caracterizar completamente a doença”, disse o coautor do estudo Casey Kirkpatrick , pesquisador de pós-doutorado no Max Planck, em a declaração.

No novo estudo, os pesquisadores coletaram amostras de dentes e ossos de dezenas de esqueletos das Américas que apresentavam sinais de infecção treponêmica. Depois, graças aos avanços na tecnologia genómica, conseguiram isolar os genomas do Treponema pallidum dos esqueletos de cinco pessoas que morreram onde hoje são o México, o Peru, a Argentina e o Chile antes de 1492.

HISTÓRIAS RELACIONADAS

— Evidência de DNA mais antiga de parente da sífilis descoberta em esqueletos de 2.000 anos no Brasil

— Mais bebês estão nascendo com sífilis, segundo estudo

— Casos de sífilis disparam nos EUA, atingindo o pico mais alto desde a década de 1950

Com base na sua análise genómica, os investigadores descobriram que o T. pallidum , a bactéria que causa a sífilis e doenças relacionadas, originou-se nas Américas durante a época média do Holoceno, já há 9.000 anos, e depois dividiu-se nas subespécies que causam as diversas doenças treponêmicas.

Mas a sífilis moderna pode ter surgido pouco antes da chegada de Colombo, escreveram os cientistas no estudo, e expandido rapidamente no início do período colonial, correspondendo ao aumento do tráfico transatlântico de seres humanos.

“Embora os grupos indígenas americanos abrigassem formas iniciais destas doenças, os europeus foram fundamentais na sua propagação pelo mundo”, disse Bos no comunicado.

terça-feira, 18 de junho de 2024

Redefinindo a história treponêmica através de genomas pré-colombianos do Brasil

Nature volume 627 , páginas 182–188 ( 2024 ) Citar este artigo

28 mil acessos
693 Altmétrico
das métricas Detalhes

Abstrato

As origens das doenças treponémicas permanecem desconhecidas há muito tempo, especialmente considerando o início repentino da primeira epidemia de sífilis no final do século XV na Europa e a sua hipotética chegada das Américas com as expedições de Colombo. ^{1 , 2}. Recently, ancient DNA evidence has revealed various treponemal infections circulating in early modern Europe and colonial-era Mexico^3,4,5,6. No entanto, até onde sabemos, não há nenhuma evidência genómica de treponematose recuperada nas Américas ou no Velho Mundo que possa ser datada de forma fiável como antes dos primeiros contactos transatlânticos. Aqui, apresentamos genomas treponêmicos de restos humanos de quase 2.000 anos de idade no Brasil. Nós reconstruímos quatro genomas antigos de um patógeno treponêmico pré-histórico, mais intimamente relacionado ao agente causador do bejel, Treponema pallidum endemicum . Contradizendo o nicho geográfico moderno do bejel nas regiões áridas do mundo, os resultados questionam a caracterização paleopatológica anterior das subespécies de treponemas e mostram o seu potencial adaptativo. Um genoma de alta cobertura é usado para melhorar as estimativas de data do relógio molecular, colocando firmemente a divergência das subespécies modernas de T. pallidum em tempos pré-colombianos. No geral, nosso estudo demonstra as oportunidades dentro da arqueogenética para descobrir eventos-chave na evolução e emergência de patógenos, abrindo caminho para novas hipóteses sobre a origem e disseminação das treponematoses.

Conteúdo semelhante sendo visualizado por outras pessoas

Genomas antigos revelam insights sobre a vida ritual em Chichén Itzá

Artigo Acesso aberto 12 de junho de 2024

Genomas antigos do Plasmodium lançam luz sobre a história da malária humana

Artigo Acesso aberto 12 de junho de 2024

A sequência completa e análise comparativa dos cromossomos sexuais dos macacos

Artigo Acesso aberto 29 de maio de 2024

As infecções treponêmicas, causadas pela bactéria T. pallidum , estão aumentando a taxas alarmantes em todo o mundo ^7,8,9,10,11. Increasing evidence suggests that many treponemal strains have developed antibiotic resistance, which is expected to facilitate their spread¹². This re-emerging threat has led to many modern genetic and medical studies^8,13,14,15. intimamente relacionadas de T. pallidum As subespécies T. pallidum pallidum (TPA), T. pallidum pertenue (TPE) e T. pallidum endemicum (TEN) - responsáveis pela sífilis, bouba e bejel, respectivamente - têm sequências genômicas altamente semelhantes que diferem em aproximadamente 0,03% ^{16 , 17}.

Hoje, o bejel está geograficamente concentrado em ambientes áridos e quentes, especialmente no Mediterrâneo oriental e no oeste da Ásia, enquanto a bouba é encontrada principalmente nos trópicos úmidos e quentes, como a África ou a América do Sul. ¹⁸. Entre as treponematoses, a sífilis é a mais distribuída globalmente; é comum mesmo em populações ocidentais ricas com fácil acesso a cuidados de saúde ^{7 , 13}. Por outro lado, a bouba e o bejel afetam principalmente os países em desenvolvimento e permanecem menos extensivamente estudados ¹⁸.

Historicamente, a sífilis venérea é conhecida por ter causado um surto devastador na Europa no final do século XV. Os sintomas que podem desenvolver-se na ausência de tratamento eficaz incluem desfiguração física grave, cegueira e deficiência mental. ¹⁹. Como manifestações semelhantes podem aparecer em todas as treponematoses ^{20 , 21 , 22}, a sua distinção ao nível da subespécie é muitas vezes pouco fiável e baseia-se principalmente na localização de úlceras cutâneas características (nos órgãos genitais ou noutros locais), especialmente em países em desenvolvimento com recursos médicos limitados ^{23 , 24 , 25}. Os diagnósticos de casos históricos são igualmente difíceis: embora as treponematoses possam deixar alterações patológicas nos ossos, estas aparecem em apenas aproximadamente 5–30% dos casos avançados. ^{26 , 27}, resultando em provável subestimação da prevalência passada de treponematoses.

The early presence and potential origin of syphilis in Europe was proposed in the pre-Columbian hypothesis, based on osteological analyses of treponemal lesions, whereas the Columbian hypothesis associates its emergence with Columbus’ first American expedition and considers the contradicting palaeopathological evidence to be unreliable². Before the distinctions among the subspecies could be genetically defined^28,29, the unitarian hypothesis claimed that all treponematoses were the same disease, which only manifested differently under different environmental and cultural factors. Attempts to identify subspecies using palaeopathology have had ambiguous results and require DNA evidence as confirmation: previous ancient DNA studies have, for example, revealed that some cases of presumed syphilis instead correspond to yaws^4,5, and recovered at least one previously unknown T. pallidum strain⁴. Since treponemes possess an impressive ability to adjust to various environments and are known to have previously occupied geographical regions outside their present distributions^4,5, apenas evidências inequívocas de DNA treponêmico pré-colombiano podem iluminar as origens da sífilis e também desvendar aspectos importantes da história evolutiva de todos os treponemas.

Aqui, apresentamos evidências de doença treponêmica pré-colombiana no Novo Mundo a partir de um cemitério de sambaqui brasileiro com quase 2.000 anos de idade, Jabuticabeira II, através de quatro genomas reconstruídos de T. pallidum com cobertura de até 33,6x, filogeneticamente basal ao diversidade moderna da subespécie causadora de bejel, T. pallidum endemicum .

Origens geográficas e paleopatologia

Noventa e nove exemplares de Jabuticabeira II da região de Laguna de Santa Catarina, na costa brasileira, com e sem patologias, foram incorporados neste estudo. Análises osteológicas anteriores revelaram patologias relacionadas com infecções, sugerindo potenciais infecções treponémicas ³⁰, como periostite (24 casos), remodelação óssea (4 casos) e marcas de traça no crânio (4 casos). Das 37 amostras consideradas preliminarmente positivas para DNA treponêmico após a triagem inicial, 12 eram de indivíduos com patologias e o restante era proveniente de espécimes não patológicos (Tabela Suplementar 1 ). Quatro amostras ósseas, de quatro indivíduos diferentes, produziram dados genômicos suficientes para análises abrangentes. A amostra ZH1390 (Tabela 1 e Fig. 1a ) representa um fragmento de tíbia apresentando periostite. A amostra ZH1540 veio de um conjunto de ossos misturados de um esqueleto incompleto, nomeadamente de uma fíbula com lesões patológicas (Tabela 1 e Fig. 1a ). As amostras ZH1541 e ZH1557 originaram-se de ossos longos sem nenhuma patologia identificada (Tabela 1 e Figura 1a ). Todas as amostras foram datadas por radiocarbono e testadas quanto ao efeito de reservatório marinho. Os dados brutos, calibrados e corrigidos de ¹⁴A datação C é apresentada em Dados Estendidos Fig. 1a, b , Tabela Suplementar 2 e Métodos , 'Informações Arqueológicas'. Os indivíduos positivos para DNA treponêmico não foram enterrados separadamente dos demais indivíduos em Jabuticabeira II, sugerindo que foram tratados igualmente.

Table 1 Summary of the sample information and central statistics

Full size table

figura 1 — **Fig. 1: The archaeological site and the *T. pallidum*-positive samples that yielded the reconstructed genomes.**

Preliminary pathogen screening

Na triagem inicial a partir de dados de sequenciamento shotgun, 37 de 99 amostras mostraram entre 7 e 133 ocorrências para táxons da família Treponema no banco de dados Kraken e foram incluídas no processo de enriquecimento de alvo (Tabela Suplementar 1 e Métodos , 'Processamento de amostra') . Destas amostras, 9 tiveram mais de 5.000 leituras mapeadas para 3 genomas de referência de T. pallidum (BosniaA, CDC2 e Nichols) pós-captura e foram, portanto, consideradas positivas para infecção treponêmica (Tabela Suplementar 1 ). Para estas amostras positivas, três bibliotecas adicionais de cadeia dupla foram produzidas para uma segunda rodada de enriquecimento de todo o genoma ^{4 , 31}(para uma metodologia detalhada, consulte Métodos , 'Processamento de amostras'). Após o enriquecimento adicional, os dados de todas as bibliotecas feitas a partir dos mesmos extratos originais e todos os dados de sequenciamento produzidos nas duas rodadas de captura foram combinados para cada amostra. Quatro amostras, ZH1390, ZH1540, ZH1541 e ZH1557, tiveram leituras cobrindo 9,2–99,4% do genoma de referência da BósniaA em 1×, com uma cobertura média entre 2× e 33,6× (Tabela 1 ). Essas quatro amostras foram consideradas como tendo maior potencial para reconstrução do genoma completo e análises posteriores.

Estimativa de autenticidade de DNA antigo

A autenticidade do DNA antigo foi confirmada examinando a desaminação de bases nas extremidades das leituras: 21%, 10%, 12% e 7% nas extremidades 5' e 17%, 12%, 14% e 6% nas extremidades 3. ′ termina para as amostras ZH1390, ZH1540, ZH1541 e ZH1557, respectivamente (Extended Data Fig. 1c – f ). As amostras tinham comprimentos médios de fragmentos ^{32 , 33 , 34}variando de 64 pb a 74 pb (Tabela 1 ). Além disso, a atribuição dos cromossomos sexuais dos dados do shotgun foi consistente com XX para as amostras ZH1540 e ZH1541. Embora os indivíduos tenham sido anteriormente considerados prováveis do sexo masculino nas análises osteológicas, as amostras ZH1390 e ZH1557 produziram dados insuficientes para a determinação molecular do sexo (Tabela 1 e Métodos , 'Informações arqueológicas').

Reconstrução do genoma

After high-throughput Illumina sequencing of the enriched DNA from the 4 selected samples, the resulting 20–100 million raw reads were merged sample-wise and duplicate reads were removed (Table 1). Genomes were reconstructed by mapping each sample to three representative high-quality reference genomes of T. pallidum subspecies: CDC2 for TPE, BosniaA for TEN, and Nichols for TPA (Methods, ‘Sample processing’ and ‘Dataset selection’). We filtered positions on the basis of read coverage, variant allele frequency, P value and base quality, and obtained three different consensus sequences for each sample, each with a different number of covered bases, as well as SNPs. The number of SNPs in each sequence, along with the phylogenetic analyses consistently supported a placement of all four samples within the TEN clade (Figs. 1b and 2b, Table 1 and Supplementary Table 3). Although the consensus sequences from three samples, ZH1390, ZH1541 and ZH1557, were assigned to T. pallidum endemicum (Fig. 1b), read coverage was below the threshold required for downstream analyses (for details, see Methods ‘Sample processing’ and ‘Read processing and multiple reference-based genome alignment generation’).

**Figura 2: Análise do genoma de alta cobertura ZH1540.**

A sequência final obtida para a amostra ZH1540 resultou em 99,38% de cobertura em relação ao genoma de referência TEN (BósniaA), uma profundidade de cobertura mínima de 5× e uma profundidade mediana de 33,6× (Tabela 1 e Fig. 2a ). A chamada de variante resultou na identificação de 123 SNPs, cada um dos quais foi verificado individualmente (detalhes fornecidos na Tabela Suplementar 3 e em Métodos , 'Processamento de amostra' e 'Processamento de leitura e geração de alinhamento de genoma baseado em múltiplas referências'). Das referências modernas disponíveis, o novo genoma antigo da TEN exibe uma diferença de 123 SNPs em comparação com as amostras da BósniaA e do IraqueB. No entanto, o número de posições diferentes é muito maior em comparação com os 4 genomas RTE japoneses (205 SNPs) e os genomas RTE cubanos (504 SNPs).

Alinhamento do genoma baseado em múltiplas referências

The new ancient genome ZH1540 was analysed together with an additional 98 publicly available genomes, including 8 modern TEN strains, 30 TPE strains (including 9 genomes from primates and 4 ancient genomes), 30 Nichols-lineage and 30 SS14-lineage TPA strains (including 4 ancient genomes) (Supplementary Table 3). Assembly files for 33 of these 98 genomes were available and downloaded directly from the public databases European Nucleotide Archive (ENA) and National Center for Biotechnology Information (NCBI). For the remaining 65 genomes, we mapped the raw sequencing data to the closest of four representative reference genomes (CDC2, BosniaA, Nichols and SS14), to obtain new assembly files. The genome reference selected for each sample was based on the subspecies and/or lineage classification of each sample from the original publications (Supplementary Table 3). A multiple reference-based genome alignment of 98 sequences from several sources was generated according to the previously published methodology³⁵. O alinhamento resultante abrangeu um total de 1.141.812 nucleotídeos com 6.149 SNPs detectados (consulte Disponibilidade de dados e métodos , 'Processamento de amostras' e 'Processamento de leitura e geração de alinhamento de genoma baseado em referências múltiplas').

Phylogenetic and recombination analyses

Uma reconstrução filogenética confiável exigiu a remoção de regiões genômicas herdadas não verticalmente, como regiões recombinantes ou loci com conversão intra ou intergênica. Em uma análise de recombinação com o método de incongruência filogenética ³⁶ (PIM), we detected 34 recombinant regions across 27 genes, encompassing a total of 957 SNPs (15.56% of the total SNPs) (Supplementary Table 3 and Supplementary Table 4). Owing to the exclusion of the highly passaged Seattle-81 strain, 3 of the previously detected recombinant genes were not detected here, and 11 detected genes were novel in relation to the previously published results. The average length of the recombinant regions was 368 bp, with a minimum length of 4 bp and a maximum of 2,209 bp. Notably, all the recombination events detected here correspond to inter-subspecies transfers with the exception of an intra-subspecies recombination event found in the tp0117 gene and three additional genes for which the putative donors are unidentified external sources (Supplementary Table 4 and Methods, ‘Recombination analysis using PIM’ and ‘PIM procedure for likelihood mapping and topology tests’).

Para construir um alinhamento de herança estritamente vertical, removemos os 27 genes recombinantes detectados aqui junto com três genes, tp0316 , tp0317 e tp0897 , que são conhecidos por serem hipervariáveis e/ou sujeitos à conversão gênica ^{37 , 38}, desde o alinhamento inicial (ver Disponibilidade de dados e métodos , 'Análise filogenética'). O alinhamento final livre de recombinação abrangeu 1.103.436 pb com 3.718 SNPs. Árvores de máxima verossimilhança foram construídas usando alinhamentos múltiplos de genoma (Fig. 2b e Dados Estendidos Figs. 2 e 3 ). Na Fig. 2 de dados estendidos , as topologias das duas árvores de máxima verossimilhança com e sem os loci recombinantes ou hipervariáveis são comparadas.

A eliminação de genes herdados não verticalmente teve um efeito menor na reconstrução da filogenia de T. pallidum (Extended Data Figs. 2b e 3 e Methods , 'Phylogenetic Analysis'). Os resultados após a remoção dos sítios recombinantes detectados no PIM foram confirmados com dois outros programas de detecção de recombinação, Gubbins e ClonalFrameML ( Methods , 'Recombination analysis using Gubbins and ClonalFrameML'). Além disso, foram avaliadas mutações genéticas (A2058G e A2059G) relacionadas à resistência a antibióticos macrólidos ¹², e foram encontrados ausentes no genoma antigo ZH1540 (Methods, 'Caracterização exploratória dos genes 16S-23S').

Molecular clock dating

A datação do relógio molecular foi realizada no mesmo conjunto de dados acima, com 27 genes recombinantes, tp0316 , tp0317 e tp0897 removidos. Na filogenia calibrada no tempo estimada, todas as três subespécies (TEN, TPE e TPA), bem como as linhagens SS14 e Nichols de TPA receberam alto suporte para formar clados distintos (probabilidade posterior> 0,97; Fig. 3a e Tabela de Dados Estendidos 1 ). Tal como na filogenia de máxima verossimilhança, o novo genoma antigo, ZH1540, ocupa uma posição basal dentro do clado TEN, com todas as estirpes modernas de TEN formando um subgrupo monofilético (probabilidade posterior 0,96; Fig. 3a ). A maioria das cepas SS14 se enquadra no subclado SS14-Ω previamente definido ^{4 , 16}, que também recebe alto suporte posterior. De acordo com os resultados das análises de regressão raiz-a-ponta (Extended Data Fig. 4 ), um modelo de relógio relaxado não correlacionado log-normalmente distribuído (UCLD) e um modelo de relógio relaxado não correlacionado distribuído exponencialmente (UCED) foram escolhidos para a análise de datação do relógio molecular, ambos com um prior lognormal estreito com uma média (no espaço real) de 1 × 10 ⁻⁷substituições por site por ano e dp de 0,25 na taxa média de clock. Consistente com os resultados relatados anteriormente de datação por relógio molecular ^{4 , 35}, descobrimos que todas as cepas históricas de TPA são basais a todas as cepas modernas de SS14 e, juntas, formam um clado bem suportado (probabilidade posterior de 0,97). Portanto, consideramos que as cepas históricas se enquadram no clado SS14.

**Figura 3: Resultados da datação por relógio molecular.**

A idade de ZH1540, que é parametrizada pelos resultados da datação por radiocarbono, atua como uma restrição no tempo do ancestral comum mais recente (tMRCA) do clado TEN. A inclusão de uma amostra muito mais antiga resulta em tempos de divergência anteriores, com intervalos de credibilidade mais amplos para todos os clados principais da árvore (Fig. 3b e Dados Estendidos Figs. 5 – 7 ). Este efeito é mais pronunciado para TEN, onde o intervalo de densidade posterior (HPD) 95% mais alto do tMRCA se estende de 780 aC a 449 dC (236-1845 dC para o subclado compreendendo apenas cepas modernas de TEN), mas é limitado a 1077– de 1855 Anúncio ao excluir ZH1540 (Dados Estendidos Figs. 5 – 7 e Tabela de Dados Estendidos 1 ). Para todas as outras linhagens principais, o efeito é mais moderado e, embora o limite inferior do intervalo HPD de 95% possa ser várias centenas de anos mais antigo ao incluir ZH1540 (cerca de 400 anos no caso de TPE), o limite superior nunca é muito maior. mais de 50 anos (Fig. 3c , Tabela de Dados Estendidos 1 e Dados Estendidos Figs. 6 e 7 ).

Embora as estimativas medianas dos tempos de divergência de linhagem sejam mais antigas do que aquelas relatadas anteriormente (TEN, 47 ad ; TPE, 835 ad ; TPA, 844 ad ; Nichols, 1238 ad ; SS14, 1127 ad ; e SS14-Ω, 1738 ad ), o Os intervalos de HPD de 95% se sobrepõem em grande parte às estimativas relatadas em outros lugares ^{5 , 35}(Tabela de dados estendida 1 ). As duas exceções são TEN e SS14-Ω, que estimamos ter uma origem possivelmente muito mais antiga do que se pensava anteriormente, independentemente de ZH1540 estar incluído. Isto provavelmente se deve ao conjunto de dados mais diversificado usado aqui, que representa com mais precisão toda a diversidade genética da linhagem SS14-Ω. Da mesma forma, ao incluir ZH1540, o tMRCA geral de T. pallidum é estimado como muito mais antigo do que o estimado anteriormente ^{4 , 5 , 35}.

Advertimos que, embora tenhamos realizado uma análise de relógio relaxado, não modelamos explicitamente as taxas de substituição específicas da linhagem ou dependentes do tempo. Ambos os fenômenos poderiam explicar a idade mais avançada das linhagens de TPA estimadas aqui em comparação com estudos anteriores, e as taxas dependentes do tempo também poderiam empurrar as subespécies e os tMRCAs gerais de T. pallidum ainda mais para o passado. Como tal, os resultados aqui apresentados devem ser interpretados como limites inferiores nos tempos de divergência dos clados de T. pallidum , deixando aberta a possibilidade de estimar tempos de divergência mais antigos com a recuperação de genomas antigos de maior qualidade e o desenvolvimento de modelos de relógio molecular melhorados. .

Discussão

Muitas hipóteses anteriores – baseadas apenas em evidências paleopatológicas – sugeriram infecções treponêmicas precoces entre as populações pré-históricas nas Américas ^{2 , 30 , 39}. Aqui apresentamos evidências antigas de DNA de uma treponematose pré-colombiana do Novo Mundo, reconstruindo um genoma de T. pallidum de alta cobertura recuperado de restos humanos indígenas brasileiros de quase 2.000 anos de idade, juntamente com três genomas de baixa cobertura do mesmo contexto espaço-temporal. Inesperadamente, estes genomas são notavelmente semelhantes aos do agente causador do bejel moderno, T. pallidum endemicum . Como a sífilis tem sido o foco central da pesquisa sobre o Treponema , as treponematoses endêmicas têm recebido menos atenção ^{2 , 40}. Ao contrário da bouba e da sífilis, ambas encontradas anteriormente em contextos do Velho e do Novo Mundo desde o início do período moderno ^{3 , 4 , 5 , 6}, este genoma recentemente reconstruído representa o primeiro patógeno semelhante ao TEN isolado de vestígios arqueológicos e a única comparação antiga com o conjunto atual de oito genomas de bejel publicados ^{17 , 38 , 41 , 42}. Casos recentes mostraram que as treponematoses são ocasionalmente transmitidas de forma atípica para as suas subespécies geneticamente confirmadas e desafiaram as suas categorizações geográficas e baseadas em sintomas. ^{43 , 44 , 45}. Nossas descobertas neste estudo apenas reforçam esta visão: um antigo agente semelhante ao NET, identificado longe do nicho geográfico moderno da doença, em uma região costeira brasileira úmida, atesta a capacidade dos treponemas de se adaptarem a vários climas e localizações geográficas. Excluindo os danos ósseos observados em alguns dos restos estudados, os sintomas clínicos, a gravidade e a história evolutiva do antigo patógeno semelhante ao NET recém-descoberto permanecem desconhecidos. Na verdade, as descobertas de outros patógenos antigos, como a presença da peste na Eurásia desde o final do Neolítico, ⁴⁶, e Salmonella paratyphi C, com a possível conexão com a grande epidemia de cocoliztli no México em meados do século XVI, mostraram que doenças historicamente devastadoras podem ter representado sorovares inesperados e exibir hoje uma distribuição muito alterada ^{47 , 48 , 49 , 50}. O DNA treponêmico de alta qualidade recuperado de uma fonte pré-histórica valida o uso de técnicas antigas de DNA no estabelecimento de uma hipótese inteiramente nova e mais informada sobre os eventos que levaram à disseminação do Treponema pallidum pelo mundo.

Bejel em foco

Atualmente, a doença tropical negligenciada bejel é encontrada principalmente nas regiões áridas da África, da Ásia Ocidental e do Mediterrâneo, tornando-a uma candidata improvável a uma potencial treponematose sul-americana em um contexto costeiro. ²³. Although genetically unconfirmed, palaeopathological cases of potential treponematoses found worldwide^2,51,52,53 may indicate that bejel was previously more widespread and possibly associated with different environmental habitats. Our genomic investigation, together with the radiocarbon dating of both human remains and stratigraphy, places the newly found treponematosis in South America long before the European contact in the 15th century, even predating the Viking expeditions to the North American coast—firmly attesting to the presence of bejel-like treponemal infections in the pre-contact New World. Phylogenetically, this prehistoric form belongs indisputably to the TEN clade, basal to all of its modern strains. Overall, the TEN genomes are highly similar to each other, which may indicate a slow evolution of the lineage as a whole, at least until recently. Regardless of the improved genomic representation of the modern TEN genomes and the newly reconstructed pre-Columbian genome in this study, a larger representation of this lineage would be needed to draw robust conclusions about the evolution and diversification of the subspecies.

Consequências para do T. pallidum a evolução

Os dados apresentados aqui incluem um genoma treponêmico antigo excepcionalmente de alta qualidade e alta cobertura ^{4 , 5 , 6 , 35}, e adiar as datas das mais antigas cepas de T. pallidum reconstruídas em mais de 1.000 anos. Embora os antigos fragmentos de DNA recuperados neste estudo não fossem adequados para montagem de novo ou análises pan-genômicas, a alta cobertura obtida permitiu-nos realizar uma análise detalhada ao nível do gene e do SNP. Nossas descobertas revelam numerosos eventos de recombinação inter-subespécies, que são conhecidos por serem um mecanismo chave na evolução bacteriana que resulta, por exemplo, na aquisição de fatores de virulência ou outras características adaptativas. Uma vez que os eventos de recombinação aqui identificados envolvem estirpes antigas e modernas, pelo menos uma das formas endémicas permaneceu em proximidade geográfica e num conjunto de hospedeiros comum com as estirpes de TPA após a sua divergência inicial. Quando e onde exatamente esses eventos de recombinação ocorreram é desconhecido. No entanto, a divergência de clados pode ser estimada através da datação por relógio molecular para os diferentes ramos da árvore filogenética de T. pallidum . A calibração deste método é baseada nas idades conhecidas dos genomas utilizados, tornando genomas antigos datados por radiocarbono com segurança indispensáveis para a análise. Nosso novo genoma antigo de alta cobertura fornece um ponto de calibração pré-histórico sem precedentes para a datação do relógio molecular e nos permite concluir que todas as três subespécies já haviam divergido umas das outras antes das viagens de Colombo. As novas estimativas para o tMRCA de todos T. pallidum (12,006–545 bc) and the emergences of the modern clades (TEN: 780 bc–449 ad, TPE: 28–1299 ad and TPA: 42 bc–1376 ad) are much earlier than previous estimates that relied on modern and previously published historical genomes. Yet, these are only the lower bounds of the divergence times, and the subspecies could have originated even earlier. Only genetically ancestral forms of treponemes could illuminate whether the early American strains spread with the early human dispersals—some 15,000–23,000 years ago^29,54—ou resultou de um evento local, talvez zoonótico. Finalmente, como a descoberta revolucionária de uma treponematose pré-colombiana aqui é o resultado de uma combinação de genómica de patógenos antigos e da seleção cuidadosa de amostras arqueológicas, podemos esperar que descobertas futuras iluminem os eventos que levaram ao surgimento e propagação da sífilis venérea, e ajudar a resolver os fatores evolutivos responsáveis pelo sucesso global da Treponema . família

Métodos

Inclusão e ética

Os estudos genéticos de doenças humanas antigas esclarecem como as populações do passado prosperaram e lidaram com problemas de saúde, o que pode desencadear preocupações como a estigmatização devido a doenças ou direitos e questões legais entre as pessoas que vivem hoje. As injustiças históricas, a colonização e a expropriação complicaram frequentemente a capacidade das comunidades indígenas de afirmarem e manterem os seus direitos territoriais num quadro jurídico ou administrativo. É, portanto, crucial considerar, além dos aspectos científicos, também as perspectivas das comunidades e pessoas vivas (indígenas) ao realizar este trabalho. ⁵⁵.

Aqui estudamos restos humanos de indivíduos totalmente anônimos que morreram há mais de 1.000 anos e foram sepultados no sítio arqueológico Jabuticabeira II, no município de Tubarão, no estado de Santa Catarina, Brasil. Este local foi escavado por P. de Blasis e equipe ⁵⁶, financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP). e foi obtida autorização de pesquisa junto ao Instituto do Patrimônio Histórico e Artístico Nacional (IPHAN), conforme correspondência 1793/2019 GAB PRESI-IPHAN do processo 01506.000720/2019-65 de K. Santos Bogia. A utilização das amostras dos restos mortais para este estudo também foi aprovada por P. de Blasis, guardião das coleções Jabuticabeira II do Museu de Arqueologia e Etnologia da Universidade de São Paulo. Os restos mortais foram curados, estudados e amostrados por SE e equipe da Universidade de São Paulo até 2016 e, posteriormente, no Museu de História Natural de Viena.

Os territórios e sítios que abrangem o Rio Grande do Sul, Santa Catarina e Paraná são inerentes à herança ancestral das comunidades Kaingang, Guarani e Xokleng (também chamados de 'povo Sol' ou 'grupo costeiro'), que ainda vivem hoje na região. Estas sociedades não só utilizaram a região para mobilização e migração em busca de abastecimento alimentar, mas também percorreram tradicionalmente distâncias significativas, deixando um rasto de marcas culturais, particularmente no domínio das práticas funerárias. Em um estudo anterior ⁵⁷, samples of five of the individuals exhumed at Jabuticabeira II were studied, revealing some genetic affinity with the Kaingang (a Ge-speaking group of Southern Brazil). However, to the best of our knowledge, the Kaingang are not seen as direct descendants of sambaqui societies, nor do they identify with the people who once dwelled at Jabuticabeira II or request their remains. Finally, research in the Instituto Socioambiental (https://www.socioambiental.org/; for the defence of Brazilian socio-environmental diversity, including Indigenous Rights) states that the region around Jabuticabeira II is not part of any Indigenous reserve, nor are there claims of groups for territorial rights of this region or for the archaeological remains of this site (P. de Blasis, personal communication).

Os processos degenerativos, muitas vezes resultantes de contextos de marginalização, conflito e deslocamento, testemunham o impacto das relações históricas dos grupos indígenas com os colonizadores e invasores. As aflições e doenças vividas por estes grupos carregam ramificações históricas e ambientais de notável significado, garantindo reconhecimento e exame explícitos. Em relação à possível estigmatização das comunidades locais (indígenas) e das pessoas afetadas pelo bejel, deve-se ressaltar que esta doença contagiosa é uma doença endêmica, principalmente não sexualmente transmissível, comum em regiões quentes onde as pessoas vivem em contato próximo umas com as outras, não têm necessidade de cobrir especialmente roupas e compartilhar utensílios. Hoje, o bejel, que pode levar à estigmatização devido a feridas desfigurantes, ocorre especialmente em comunidades do Mediterrâneo Oriental e da África Ocidental com acesso limitado a cuidados médicos modernos. Embora a Organização Mundial da Saúde perceba a importância das ações tomadas para erradicar o bejel em todo o mundo desde 1949 (WHA2.36 Bejel e outras treponematoses ( https://www.who.int/publications/i/item/wha2.36) ), a doença não é vista como um problema atual de saúde pública no Brasil, como é para alguns outros países ^{58 , 59}. Isto contrasta com as altas prevalências de doenças sexualmente transmissíveis, como o HIV e a sífilis venérea, que afetam as comunidades indígenas no Brasil (Em São Paulo, ação em aldeias promove debate e testagem rápida de HIV e Sífilis — Fundação Nacional dos Povos Indígenas ( http://www.gov.br/funai/pt-br/assuntos/noticias/2019/em-sao-paulo-acao-em-aldeias-promove-debate-e-testagem-rapida-de-hiv-e- sífilis )). É notável, entretanto, que, no contexto arqueológico, nada implicava que aqueles povos pré-históricos de Jabuticabeira II portadores da treponematose local teriam sido discriminados em sua época e cultura.

Além disso, as descrições culturalmente insensíveis em artigos de investigação paleogenómica são uma questão ética de preocupação ⁶⁰. Para garantir a discrição, selecionamos expressões potencialmente insensíveis ou discriminatórias no manuscrito. É importante ressaltar que tivemos a ajuda inestimável de E. Krenak, líder da Cultural Survival no Brasil, ativista indígena e doutorando na Universidade de Viena, para analisar criticamente nossos textos e fornecer conselhos sobre o uso eticamente correto e justo da terminologia.

Informação arqueológica

Os sambaquis da região de Laguna

Um sambaqui é o tipo predominante de sítio arqueológico na costa brasileira: um monturo ou montículo de conchas construído pelo homem, de dimensões variadas, localizado em áreas ricas em recursos, como lagoas, manguezais ou estuários. Sambaquis consistem em sedimentos inorgânicos, conchas de moluscos, restos de alimentos e matéria orgânica misturados em intrincadas estratigrafias associadas a funções domésticas e/ou funerárias. ⁶¹. Mais de 1.000 sambaquis estão mapeados ao longo dos 7.500 km de extensão da costa brasileira e são datados entre 7.500 e 1.000 anos bp ^{61 , 62}. Pesquisas arqueológicas recentes sugerem que essas populações construtoras de sambaquis eram sedentárias, com uma abundante e estável subsistência marinha, horticultura e alto crescimento populacional. ^{61 , 63}, rituais funerários elaborados ⁶⁴ e apropriação da paisagem ⁵⁶.

Jabuticabeira II excavation site

Jabuticabeira II (UTM 22 J − 0699479E; 6835488 S) é um sambaqui de médio porte (400 × 250 × 10 m de altura), assentado sobre uma paleoduna e localizado na região de Laguna, área de maior densidade de sambaquis do sul Costa brasileira, a 3 km da Laguna do Camacho, uma das diversas fontes de água associadas a um sistema geológico barreira-lagoa formado durante o Holoceno (Fig. 1 ). Jabuticabeira II, construída ao longo de quase mil anos, é um dos 65 sambaquis mapeados ao redor do sistema lagunar. Este grande número de assentamentos e sua história de ocupação cronologicamente sobreposta atestam uma ocupação bastante densa e intensas interações dos construtores de sambaqui entre 7.500 e 900 anos calibrados (ano cal) bp ⁵⁶. According to stratigraphic studies, Jabuticabeira II is the result of incremental funerary rituals accumulated over centuries. Although Jabuticabeira II was not completely excavated, 204 burials containing the remains of 282 individuals were exhumed from a 373 m² area⁶⁴. Radiocarbon dates of Jabuticabeira II stratigraphy^56,64 suggest a long occupation period between 1214–830 cal bc and 118–413 cal ad or 3137–2794 to 1860–1524 cal yr bp (2σ), roughly in line with the radiocarbon datings from bone material of the four individuals in this study, ranging from 350 cal bc to 573 cal ad.

Os restos mortais do sambaqui Jabuticabeira II foram encontrados em sepultamentos simples, duplos e múltiplos, dispersos em aglomerados. Os esqueletos recuperados estavam em sua maioria incompletos, evitando estimativas categóricas de idade e sexo ou outros achados osteológicos. O padrão de sepultamento era bem flexionado e sugeria tratamento intencional do corpo antes do internamento. O pequeno tamanho das sepulturas sugeria que os corpos sofreram dessecação ou decomposição prévia de tecidos moles, mas não o suficiente para produzir desarticulação completa (os ossos das mãos e dos pés foram encontrados articulados). Muitos enterros vêm de perfis e estão incompletos. Os ossos de vários indivíduos estão manchados de ocre vermelho ⁶⁵, uma prática comum em sítios arqueológicos do estado de Santa Catarina ^{66 , 67}. As oferendas são comuns em contextos funerários de sambaqui e incluem adornos confeccionados com material faunístico e ferramentas líticas em diversas formas, desde entulhos até ferramentas polidas e zoólitos, com diferenças na frequência de ocorrência entre diferentes locais e estratos ⁶⁸. A oferta mais comum na Jabuticabeira II era o peixe.

Ao todo, 99 indivíduos de Jabuticabeira II, com e sem alterações ósseas sugestivas de infecção, foram triados quanto ao conteúdo de DNA do patógeno. 37 amostras foram consideradas positivas para DNA treponêmico na triagem inicial e quatro amostras produziram dados suficientes para a reconstrução do genoma de T. pallidum (Tabela Suplementar 1 ).

Palaeopathological analysis of treponematoses

Bioarchaeological analyses showed results compatible with increasing population growth and high population density in Jabuticabeira II, including high frequencies of nonspecific stress markers⁶⁹ and occasional infant stress⁷⁰, but no evidence of trauma associated with interpersonal conflicts over resources or territory⁶⁹.

Há, no entanto, evidências de doenças sistêmicas transmissíveis em Jabuticabeira II e outros sambaquis locais brasileiros ³⁰. Eleven ¹⁴C accelerator mass spectrometry dates obtained directly from the presumably treponematosis-affected individuals suggest that these diseases are very old on the east coast of South America, with a time-range between 6,300 and 500 yr BP. Among the possible treponemal cases based on osteological analysis, three came from Jabuticabeira II. However, these did not overlap with the individuals yielding the detected genetic evidence in this study.

Informações sobre indivíduos

Indivíduo 41A-L2.05-E4, amostra ZH1390

O indivíduo é um homem adulto de constituição robusta, com estatura estimada em 150,49 ± 2,6 cm (ref. ⁷⁰). Embora fragmentados, os ossos deste indivíduo constituíam um esqueleto quase completo (80%), articulado e enterrado em uma matriz oval rica em conchas em posição hiperflexionada. Os ossos do indivíduo apresentavam sinais de doença infecciosa sistêmica em membros inferiores. Fêmures, tíbias e fíbulas apresentam periostite generalizada discreta e osteoartrose. Também foi observado alargamento na porção lateral das clavículas. Segundo Filippini et al. ³⁰, aplicando o método ESPIRAL ⁷¹, a doença desse indivíduo poderia ser classificada de forma não conclusiva como sífilis, bouba ou bejel. A amostragem foi realizada em lesão ativa no fragmento da tíbia.

FS9–L3–T2 individual, amostra ZH1540

A amostra vem de um conjunto de ossos misturados, provavelmente de mais de um indivíduo. Os ossos atribuídos a este indivíduo consistem em vários elementos esqueléticos, alguns com alterações patológicas, como osteomielite grave no terço distal do úmero direito, periostite grave na ulna esquerda, periostite na diáfise da fíbula e dois corpos vertebrais com osteofitose. A amostra foi retirada do fragmento da fíbula, na área com periostite.

FS3B-L3-T4 individual, amostra ZH1541

A amostra vem de um de três indivíduos separados, encontrados misturados. Os elementos esqueléticos pertencentes a este adulto robusto de idade e sexo desconhecidos incluem um rádio esquerdo com artrite, um fragmento da ulna esquerda (muito robusto), um fragmento do úmero esquerdo, fragmentos de um fêmur, uma tíbia e uma fíbula e um primeiro metatarso. A amostra foi retirada de um fragmento de fêmur, sob a superfície imediata do osso, para melhor evitar a possível introdução de contaminantes externos.

Individual 2B-L6-E3, ZH1557

A amostra provém de um indivíduo provavelmente adulto do sexo masculino. O indivíduo estava articulado e em posição flexionada com outro indivíduo adulto do sexo feminino enterrado em cima. Os achados osteopatológicos nos ossos do indivíduo amostrado incluíram sinais de doença articular degenerativa, osteoartrite intervertebral lombar grave, escoliose e possíveis lesões na patela. No entanto, não foram observadas lesões típicas sugestivas de infecção treponêmica. A amostra foi retirada de um pequeno pedaço de osso longo, sob a superfície imediata do osso, para melhor evitar a possível introdução de contaminantes externos.

Correção do efeito do reservatório marinho para ¹⁴C namoro

A datação por radiocarbono foi realizada pelo Laboratório de Física de Feixes de Íons da ETH Zurich (laboratório número: ETH-127328) utilizando colágeno ósseo purificado por um método de ultrafiltração modificado ⁷². A calibração dos dados foi feita com OxCal v4.4.4. A dieta dos habitantes de Jabuticabeira II, constituída substancialmente por fontes alimentares marinhas, produz efeito reservatório nas datas de radiocarbono calculadas como idade média de 247,8 ( σ = 103,7) anos ⁷³. Considerando a alta contribuição de carbono marinho para o colágeno ósseo dos indivíduos de Jabuticabeira II, as datas de radiocarbono foram modeladas com Calib Rev 8.20 ⁷⁴ ( http://calib.org/calib/calib.htm ) usando a curva de calibração Mixed Marine SHCal20 ^{75 , 76} e aplicando o valor médio estimado de correção de reservatórios de radiocarbono marinhos locais (Δ R ) de -126 ± 29 para a costa sul do Brasil (banco de dados de Correção de Reservatórios Marinhos) ^73,77. We considered the average relative contribution of marine carbon to collagen derived from Bayesian Mixing Models for Jabuticabeira II individuals, calculated at a mean value of 42.5%^78,79. Para as estimativas individuais para as amostras, consulte a Tabela Suplementar 2 .

Sample processing

Samples were documented and carried through sampling, DNA extraction, library preparation and library indexing in facilities dedicated to ancient DNA work at the University of Zurich, including decontamination of samples, laboratory equipment and reagents with UV irradiation and using protective clothing and minimum contamination-risk working methods.

Todas as etapas pós-amplificação foram realizadas nas instalações laboratoriais regulares disponíveis para o Grupo de Paleogenética do Instituto de Medicina Evolutiva (IEM) da Universidade de Zurique (UZH). O sequenciamento de DNA foi realizado nas instalações de Sequenciamento de Próxima Geração das Instalações Principais do BioCenter de Viena (VBCF) ou no Centro de Genômica Funcional da Universidade de Zurique (FGCZ).

Extração de DNA antigo

Todas as superfícies das amostras foram irradiadas com luz ultravioleta para minimizar a contaminação potencial do DNA moderno. O pó ósseo foi obtido utilizando-se broca odontológica e brocas com cabeça diamantada. A extração de DNA foi realizada em cerca de 50-100 mg de pó de osso, de acordo com um protocolo de extração bem estabelecido para DNA antigo. ⁸⁰. Os controles negativos para processos de extração e biblioteca foram processados paralelamente em todos os experimentos, um controle para cada dez amostras, sequenciados e comparados bioinformaticamente com seus correspondentes lotes de amostras, como precaução contra possível contaminação.

Preparação da biblioteca

Bibliotecas de DNA de cadeia dupla foram produzidas para triagem inicial com sequenciamento shotgun, sem tratamento UDG (ou seja, tratamento químico com o objetivo de limitar os danos relacionados à idade no DNA). Duas bibliotecas adicionais para cada uma das amostras potencialmente positivas da primeira rodada de captura foram produzidas para maximizar a complexidade do DNA. Para a preparação de bibliotecas de DNA, 20 µl de extrato de DNA foram convertidos em bibliotecas de DNA de fita dupla ³¹. Códigos de barras (índices) específicos da amostra foram adicionados a ambas as extremidades dos fragmentos de DNA nas bibliotecas ⁸¹. As bibliotecas indexadas foram então amplificadas para atingir uma concentração mínima de DNA de aproximadamente 90 ng ml ⁻¹. A amplificação foi realizada utilizando 1 × tampão Herculase II, 0,4 mM IS5 e 0,4 mM IS6 primer ⁸¹, DNA polimerase de fusão Herculase II (Agilent Technologies), dNTPs 0,25 mM (100 mM; 25 mM cada dNTP) e 5 ml de biblioteca indexada como modelo de DNA. Foram preparadas quatro reações por biblioteca e o volume total da reação de amplificação foi de 100 ml. O perfil térmico incluiu uma desnaturação inicial por 2 min a 95 °C e 3-18 ciclos, dependendo da concentração de DNA após a indexação das bibliotecas, desnaturação por 30 s a 95 °C, 30 s de recozimento a 60 °C e 30 s de recozimento a 60 °C. alongamento a 72°C, seguido por uma etapa de alongamento final por 5 min a 72°C. Todas as divisões de uma biblioteca indexada foram reunidas e purificadas utilizando o kit de purificação QIAGEN MinElute PCR. As bibliotecas de DNA foram então quantificadas com D1000 ScreenTape em um Agilent 2200 TapeStation (Agilent Technologies) e combinadas em pools equimolares para sequenciamento.

Pathogen screening

Os dados do Shotgun foram usados para uma triagem inicial das 99 amostras candidatas, com o software Kraken2 ⁸², e 41 amostras que tiveram mais de 7 ocorrências para T. pallidum foram selecionadas para enriquecimento alvo. As amostras selecionadas foram submetidas a um processo de enriquecimento alvo e posteriormente processadas pelo FastQ Screen v0.15.1 ⁸³para verificar o número de leituras mapeadas em relação a três genomas de referência representativos de alta qualidade da subespécie de T. pallidum (CDC2, BosniaA e Nichols). As nove amostras mais promissoras (> 5.000 acessos de Kraken a T. pallidum após a primeira rodada de captura em solução) foram transformadas em duas bibliotecas extras e recapturadas conforme explicado em detalhes nas seções a seguir.

Enriquecimento alvo para T. pallidum DNA de

O enriquecimento de bibliotecas de cadeia dupla em todo o genoma foi realizado através de kits de enriquecimento de alvo personalizados (Arbor Bioscience). Iscas de RNA com comprimento de 60 nucleotídeos e densidade de ladrilhos de 4 pb foram projetadas com base em três genomas de referência: Nichols ( CP004010.2 ), SS14 ( CP000805.1 ), Fribourg-Blanc ( CP003902 ). Conjuntos de bibliotecas de 500 ng foram enriquecidos de acordo com as instruções do fabricante. As bibliotecas capturadas foram amplificadas em reações de 100 µl contendo 1 unidade de DNA polimerase de fusão Herculase II (Agilent), 1 × tampão de reação Herculase II, dNTPs 0,25 mM, iniciadores IS5 e IS6 0,4 mM. ⁸¹e modelo de biblioteca de 15 µl, com o seguinte perfil térmico: desnaturação inicial a 95 °C por 2 min, 14 ciclos de desnaturação a 95 °C por 30 s, recozimento a 60 °C por 30 s e alongamento a 72 °C por 30 s, seguido de um alongamento final a 72°C por 5 min. As bibliotecas capturadas foram purificadas com colunas de rotação MinElute (QIAGEN) e quantificadas com uma ScreenTape de alta sensibilidade D1000 em um Agilent 2200 TapeStation.

Sequencing

For both shotgun data retrieval and after the capture processing, the samples were pooled in unimolar quantity (for SG sequencing up to 50 samples per pool, and for the capture process 2–8 samples per pool), and sequenced on an Illumina NextSeq500 with 2 × 75 + 8 + 8 cycles using the manufacturer’s protocols for multiplex sequencing at the Functional Genomics Center in Zurich or at the Vienna BioCenter Core Facilities.

Statistical analyses

Dataset selection

Montamos um conjunto de dados genômicos compreendendo 98 genomas de T. pallidum disponíveis publicamente (8 TEN, 30 TPE e 60 TPA) de estudos publicados anteriormente (incluindo 8 genomas antigos) e o recém-gerado genoma ZH1540. Os genomas representam a variação genética das três subespécies conhecidas de T. pallidum (TPA, TPE e TEN) disponíveis até dezembro de 2022, e foram selecionados com foco em TEN e TPE, devido à sua proximidade com o novo genoma antigo classificado como TEN .

Os dados publicados para o conjunto de dados do genoma moderno neste estudo estão disponíveis no banco de dados European Nucleotide Archive (ENA): PRJNA313497 (números de acesso: SRR3268682 , SRR3268724 , SRR3268715 , SRR3268694 , SRR3268696 , SRR3268709 , SRR3268710 ), 11481 (números de acesso: ERR1470343 , ERR3596780 , ERR3596747 , ERR3596783 ), PRJEB28546 (números de acesso: ERR4045394 , ERR3684452 , ERR3684456 , ERR3684465 , SRR13721290 , ERR4853530 , ERR4993349 , ERR485358 7 , ERR4899206 , ERR5207017 , ERR5207018 , ERR5207019 , ERR4899215 , ERR4853623 , ERR4853625 ), PRJNA508872 (números de acesso: SRR8501165 , SRR8501164 , SRR8501167 , SRR8501166 , SRR8501168 , SRR8501171 ), PRJNA723099 (números de acesso: SRR14277267 , SRR14277266 , SRR14277458 , SRR14277444 ), PRJEB11481 (número de acesso: ERR 1470331 ), PRJDB9408 (números de acesso: DRR213712 , DRR213718 ), PRJNA588802 (números de acesso: SRR10430858 , SRS5636328 ), PRJNA322283 (número de acesso: SRR3584843 ), PRJNA754263 (números de acesso: SRR15440297 , SRR15440150 , SRR15440451 , SRR15440240 ), PRJEB40752 (números de acesso: ERR4690809 , ERR4690806 , ERR4690810 , ERR4690812 , ERR4690811 ). Arquivos de montagem foram usados para 9 genomas do banco de dados do National Center for Biotechnology Information (NCBI): CP002375.1 , CP002376.1 , NC_016842.1 , NC_017268.1 , NC_018722.1 , NC_021490.2 , NC_021508.1 , GCA_000813285.1 , CP035193.1 e para 24 genomas modernos do European Nucleotide Archive (ENA): CP021113.1 , CP073572.1 , CP073557.1 , CP073553.1 , CP073536.1 , CP073526.1 , CP073490.1 , CP073487.1 , CP07347 0 .1 , CP073447.1 , CP073446.1 , CP073399.1 , CP040555.1 , LT986433.1 , LT986434.1 , CP032303.1 , CP020366.1 , CP024088.1 , CP024089.1 , CP07812 , 1.1 , CP078090.1 , CP081507.1 , CP051889.1 e CP003902 .1 . Os dados de sequência bruta (arquivos fastq) usados para 6 genomas modernos estão disponíveis no banco de dados NCBI: PRJEB20795 (números de acesso: ERS1724928 , ERS1724930 , ERS1884567 ) e PRJNA343706 (números de acesso: SRR4308604 , SRR4308606 , SRR4308597 ). Genomas treponêmicos antigos publicados anteriormente aqui usados estão disponíveis na ENA: PRJEB37490 (número de acesso: ERR4065503 ), PRJEB37633 (número de acesso: ERR4000645 ), PRJEB35855 , PRJEB21276 (números de acesso: ERS2470995 , ERS2470994 ) e PRJEB62102 . Informações detalhadas sobre a fonte do conjunto de dados de referência estão documentadas na Tabela Suplementar 3 .

Selecionamos todos os oito genomas TEN disponíveis publicamente, todos com mais de 99,4% de cobertura genômica, com exceção de C77 ¹⁷(81,4%). Selecionamos 30 genomas de TPE (Tabela Suplementar 3 ). Para representar cada linhagem ou sub-linhagem, selecionamos pelo menos um genoma, preferindo aqueles com maior profundidade de sequenciamento e cobertura genômica. Todos os genomas TPE incluídos têm mais de 95,3% de cobertura genômica, exceto os quatro antigos genomas TPE: SJN003, AGU007, 133 e CHS119, exibindo 97,4%, 92,7%, 57% e 62% de cobertura genômica, respectivamente. Além disso, foram incluídos 60 genomas de TPA das principais linhagens e sub-linhagens descritas em estudos anteriores (Tabela Suplementar 3 ). Todos esses genomas tinham mais de 90% de cobertura, exceto os quatro genomas antigos, PD28, W86, SJ219 e 94B, todos com cobertura genômica de 30% ou mais. Todos os genomas no conjunto de dados são separados uns dos outros por pelo menos 5 SNPs. A cepa TPA Seattle-81 foi excluída do conjunto de dados final devido a mutações provavelmente acumuladas durante passagens extensas em coelhos que podem causar posicionamento ambíguo em filogenias ^{4 , 16 , 36}.

Os dados brutos e/ou arquivos de montagem para cada genoma em nosso conjunto de dados foram baixados dos bancos de dados públicos: European Nucleotide Archive (ENA) ⁸⁴ e Centro Nacional de Informações sobre Biotecnologia (NCBI) ⁸⁵. Os números de acesso são fornecidos na Tabela Suplementar 3 .

Processamento de leitura e geração de alinhamento de genoma baseado em múltiplas referências

To reconstruct the individual genomes from the raw data, we carried out raw read quality control and preprocessing, removing duplicates, variant calling and filtering using the default parameters when not otherwise specified. After processing the de-multiplexed sequencing reads, sample sequencing quality was analysed with FastQC version 0.11.9⁸³, filtering reads with a QC value < 25. Following processing by cutadapt version 4.1⁸⁶ to remove the sequencing adapters, in order to reduce the reference bias, and improve the posterior phylogenetic inference and assignment⁸⁷, the genome reference selection for mapping each sample was determined according to the results from the original manuscript where the genomes were published (see Supplementary Table 3). The mapping was carried out by BWA mem⁸⁸(usando parâmetros: -k 19, -r 2,5). Foram utilizados quatro genomas de referência; os bem estudados genomas TEN e TPE BosniaA (NZ_CP007548.1) e CDC2 ( NC_016848.1 ), bem como os genomas Nichols ( NC_021490.2 ) e SS14 ( NC_010741.1 ), representando as duas linhagens principais dentro do TPA. No entanto, para as novas amostras antigas obtidas aqui, os genomas de cada amostra foram reconstruídos mapeando três genomas de referência de alta qualidade, representando as três subespécies de T. pallidum (CDC2, BosniaA e Nichols).

CleanSam, do Picard Toolkit versão 2.18.29 ( http://broadinstitute.github.io/picard ), foi usado para limpar os arquivos SAM ou BAM fornecidos. As leituras duplicadas foram removidas usando MarkDuplicates, do kit de ferramentas Picard versão 2.18.29. AddOrReplaceReadGroups, do Picard Toolkit versão 2.18.29, foi usado para atribuir todas as leituras em um arquivo a um único novo grupo de leitura antes de usar mapDamage versão 2.2.0-86-g81d0aca ⁸⁹ para estimar os parâmetros de dano ao DNA e redimensionar os índices de qualidade de posições provavelmente danificadas nas leituras (usando o parâmetro: --rescale).

Depois de gerar uma saída de pilha de texto para os arquivos BAM com a ferramenta mpileup do Samtools versão 1.7 ⁹⁰, os SNPs foram chamados usando o VarScan versão 2.4.3 ⁹¹(usando parâmetros: -p-valor 0,01, -min-reads2 1, -min-coverage 1, -min-freq-for-hom, 0,4 -min-var-freq 0,05, -output-vcf 1). Em seguida, uma filtragem SNP também foi realizada com VarScan (usando para as amostras modernas os parâmetros: -p-value 0,01, -min-reads2, 5 -min-coverage 10, -min-avg-qual 30 -min-freq-for -hom 0,4, -min-var-freq 0,9, -output-vcf 1 e modificação de alguns parâmetros para as amostras antigas devido à sua menor cobertura e qualidade de leitura: -p-value 0,01 -min-reads2 3, -min-coverage; 5, -min-avg-qual 30, -min-freq-for-hom 0,4, -min-var-freq 0,9 -output-vcf 1). Além disso, todas as posições com menos de 3 leituras mapeadas foram mascaradas com Genomecov do Bedtools versão 2.26.0 ⁹²para amostras modernas e antigas. Todas as etapas de geração do genoma foram visualizadas e confirmadas manualmente com Tablet versão 1.21.02.08 ⁹³, verificando cada SNP um por um e descartando os possíveis SNPs espúrios do novo genoma antigo ZH1540. As sequências finais resultantes foram obtidas por maskfasta do Bedtools v2.26.0.

Além disso, utilizamos metodologias testadas de sequenciamento e análise posterior ^{17 , 42}para obter maior cobertura e genomas modernos de T. pallidum mais confiáveis . Sempre que possível, foram obtidos arquivos de montagem em vez de dados brutos (Tabela Suplementar 3 ). Um alinhamento de genoma baseado em referência múltipla para todas as sequências foi gerado no MAFFT v7.467 ⁹⁴(usando parâmetros: --adjustdirection --auto --fastaout --reorder). Porém, devido ao uso de diferentes referências genômicas, regiões com baixa cobertura para alguns genomas, correspondendo principalmente aos genes tpr e arp , foram revisadas e alinhadas manualmente com o Aliview versão 1.25. ⁹⁵.

As amostras ZH1390, ZH1541 e ZH1557 tinham dados suficientes para tentar uma reconstrução do genoma e foram determinadas como tendo o maior número de SNPs em comum com a referência TEN, mas foram excluídas das análises downstream devido à cobertura limitada adquirida para cada uma delas, o que fez os SNPs obtidos são menos confiáveis. A amostra ZH1540, no entanto, rendeu uma cobertura genômica notável de 33,6× e foi selecionada para análises aprofundadas subsequentes.

Proteinorto versão 6.0b ⁹⁶ (usando parâmetros: -p=blastn -singles -keep) foi usado para conduzir um estudo de ortologia a fim de encontrar genes ortólogos nos quatro genomas de referência utilizados ⁹⁶. Cada gene presente em pelo menos um dos quatro genomas de referência teve suas coordenadas genômicas determinadas com base em sua localização no alinhamento final mesclado (ver Tabela Suplementar 3 ).

Para verificar a precisão do alinhamento final do genoma múltiplo, e que nenhum gene codificador de proteína foi inadvertidamente truncado, as traduções de proteínas para cada gene presente em pelo menos um genoma de referência foram comparadas com os arquivos gff3 originais de cada uma das quatro referências (Suplemento Tabela 3 ). O genoma ZH1540 reconstruído e suas principais características foram representados graficamente usando BRIG versão 0.95-dev.0003 ⁹⁷.

Análise de recombinação usando PIM

Como observado anteriormente ³⁶, a presença de recombinação nos genomas de T. pallidum pode interferir nas topologias das árvores filogenéticas inferidas. Para analisar a potencial recombinação genética, usamos o pipeline PIM ³⁶para detectar recombinação gene por gene. Em resumo, o processo envolveu as seguintes etapas:

(1)
Using IQ-TREE version 1.6.10, a maximum-likelihood tree was created for the multiple genome alignment⁹⁸. All maximum-likelihood trees for the remaining steps were obtained using GTR⁹⁹ + G¹⁰⁰ + I¹⁰¹ as an evolutionary model and 1,000 bootstraps replications.
(2)
The 1,161 genes found in at least one of the reference genomes were extracted, and the number of SNPs for each gene was calculated. Genes with less than three SNPs were excluded.
(3)
The phylogenetic signal in each gene alignment for each of the remaining genes was evaluated by likelihood mapping¹⁰² in IQ-TREE (using parameters: -lmap 10000 -n 0), retaining only those genes that showed a phylogenetic signal.
(4)
A maximum-likelihood tree was generated for each of the remaining genes using IQ-TREE.
(5)
Para cada gene incluído, testamos a congruência filogenética entre árvores usando IQ-TREE (usando parâmetros: -m GTR + G8 -zb 10000 -zw), comparando a árvore de máxima verossimilhança obtida a partir do alinhamento do gene e a árvore de máxima verossimilhança obtida do alinhamento do genoma completo usando dois métodos diferentes: Shimodaira – Hasegawa ¹⁰³ e pesos de verossimilhança esperados (ELW) ¹⁰⁴. Genes para os quais pelo menos um teste rejeitou a topologia da árvore de referência com o alinhamento do gene adotando uma abordagem conservadora ( P <0,2, valor de peso próximo a 0, para os testes Shimodaira-Hasegawa e ELW, respectivamente) e o alinhamento completo do genoma rejeitou a topologia de as árvores construídas utilizando o alinhamento gênico (incongruência recíproca, P < 0,2 e valor de peso próximo a 0) em pelo menos um deles foram selecionadas e examinadas mais de perto na etapa seguinte.
(6)
Usando MEGAX ¹⁰⁵, os genes selecionados que apresentavam incongruência recíproca foram posteriormente examinados para avaliar e descrever potenciais eventos de recombinação. Um gene deve ter pelo menos três SNPs homoplásicos próximos – SNPs que são compartilhados por vários grupos (TPE, TEN, TPA-Nichols ou TPA-SS14) e produzir uma distribuição polifilética – para ser rotulado como recombinante. Os SNPs homoplásicos encontrados no alinhamento dos genes serviram como limites das áreas recombinantes.
(7)
Utilizando um critério de parcimônia na distribuição de estados alternativos dos SNPs homoplásticos, foram inferidos os potenciais clados ou cepas doadoras e receptoras de cada evento de recombinação.

DNA sections, a number of genes have a high percentage of sites with missing data. The majority of these genes are members of the tpr and arp families, which include collections of paralogous genes. In order to continue analysing these intriguing genes with the PIM pipeline, strains that had a high percentage of missing data in each of these genes were eliminated. Following previous findings^35,36, the hypervariable gene tprK (tp0897), with seven hypervariable regions that undergo intrastrain gene conversion^{17,37,106,107,108,109}, and the tp0316 and tp0317 genes, also under gene conversion, were completely excluded from the recombination analysis.

PIM procedure for likelihood mapping and topology tests

Um teste de mapeamento de verossimilhança foi realizado usando IQ-TREE para determinar quais genes (Tabela Suplementar 4 ) mostraram um sinal filogenético (dos 382 genes para os quais> 3 SNPs foram encontrados em comparação pareada com pelo menos um genoma de referência). Para cada quarteto (subconjunto de quatro sequências) nos dados, o teste cria árvores filogenéticas não enraizadas. As probabilidades do quarteto são então traçadas dentro de um triângulo, onde a posição denota a “semelhança em árvore” do quarteto em questão. Os quartetos de canto estão completamente resolvidos, os quartetos nas laterais estão parcialmente resolvidos e os quartetos no centro não estão resolvidos. Dos 382 genes, 29 tinham muitos valores faltantes para serem testados usando o método de mapeamento de verossimilhança. Para incluir esses genes nas próximas etapas do pipeline PIM e nas comparações de topologia, as sequências problemáticas com mais de 50% de posições com dados faltantes foram removidas.

Após o teste de mapeamento de verossimilhança, 9 genes pertencentes à zona central do triângulo foram descartados (Tabela Suplementar 4 ). Em seguida, usando os testes de topologia Shimodaira-Hasegawa e ELW, comparamos as árvores gênicas dos genes restantes com a árvore de referência preliminar do alinhamento do genoma completo para avaliar sua congruência filogenética (Tabela Suplementar 4 ). Dos 373 genes que testaram positivo para incongruência filogenética, 27 continham pelo menos três SNPs consecutivos, apoiando um evento de recombinação. A estes adicionamos tp0859 , que foi detectado como recombinante em um estudo anterior ³⁵, resultando em um total de 27 genes recombinantes.

Análise de recombinação usando Gubbins e ClonalFrameML

Gubbins version 2.3.1¹¹⁰ and ClonalFrameML version 1.11-1¹¹¹ are frequently used tools for the genome-wide identification of recombinant positions in bacterial genomes. To test the robustness of our recombination analysis using PIM, we also ran these two programs, with default parameters and the same whole-genome alignment used with PIM. Gubbins identified 301 distinct recombination events associated with 103 genes, ranging in size from 5 bp to 13,866 bp. Similarly, ClonalFrameML detected 656 events, with 32 of them being 1 or 2 bp long, and the longest event spanning 782 bp. Notably, all the genes identified by PIM as having a recombinant region were also detected by both ClonalFrameML and Gubbins, except for gene tp0558, which was missed by ClonalFrameML but detected by Gubbins. Additionally, genes tp0164 and tp0179 were detected by ClonalFrameML but missed by Gubbins.

Phylogenetic analysis

Uma árvore de máxima verossimilhança baseada no alinhamento incluindo todos os genes foi construída com IQ-TREE, usando GTR + G + I como modelo evolutivo e 1.000 replicações de bootstrap (Extended Data Fig. 2a ). Em seguida, os genes identificados como recombinantes pelo PIM foram removidos do alinhamento do genoma múltiplo. Três genes adicionais ( tp0897 , tp0316 e tp0317 ), que contêm regiões repetitivas e foram identificados como hipervariáveis e/ou sob conversão gênica no passado, também foram removidos para evitar a introdução de um viés potencial. Como o gene tp0317 está aninhado dentro do gene tp0316 e as coordenadas do genoma de referência da BósniaA para tp0316 cobriram uma área maior do que as dos outros genomas de referência, tp0316 e tp0317 foram removidos de acordo com as coordenadas tp0316 do genoma de referência da BósniaA. Uma árvore filogenética de referência foi então construída empregando o novo alinhamento do genoma de herança vertical, também com IQ-TREE usando GTR + G + I como modelo evolutivo e 1.000 replicações de bootstrap (Extended Data Fig. 2b ). Ambas as árvores obtidas foram comparadas e são mostradas na Fig. 2 de dados estendidos .

A linhagem SS14 foi descrita anteriormente como um grupo amplamente epidêmico e resistente a macrolídeos que surgiu após, e possivelmente foi motivado pelo, uso clínico de antibióticos após sua descoberta. ^{12 , 16}. Com base nos resultados da nossa análise filogenética e expandindo as classificações filogenéticas anteriores e a nomenclatura da linhagem SS14 ^{12 , 16}, definimos o clado que contém quase todos os genomas SS14 de amostras clínicas e contemporâneas como a sub-linhagem SS14-Ω. No entanto, duas amostras clínicas contemporâneas (MD18Be e MD06B) não foram classificadas como sub-linhagem SS14-Ω, porque essas amostras se agrupam com o genoma do MéxicoA, em linha com resultados publicados anteriormente ⁴².

To compare the PIM-based analysis with other widely used recombination detection methods, Gubbins and ClonalFrameML, we followed a similar procedure of removing the recombinant positions detected by these tools and inferred maximum-likelihood trees with the retained positions in the corresponding multiple genome alignments. All the phylogenetic trees with recombination events removed exhibit general congruence with each other, whether the events were identified by PIM, Gubbins or ClonalFrameML. Furthermore, the placement of the ZH1540 genome remained consistent in the phylogenetic trees, regardless of the recombination detection method employed, and despite the elimination of recombinant genes to generate the vertically inherited alignment.

Exploratory characterization of the 16S-23S genes

T. pallidum contains two rRNA (rrn) operons, each of which encodes the 16S-23S-5S rRNA genes and intergenic spacer regions (ISRs). There is evidence that the random distribution of rrn spacer patterns in T. pallidum may be generated by reciprocal translocation of rrn operons mediated by a recBCD-like system found in the intergenic spacer regions (ISRs)¹¹². De acordo com estudos anteriores ^{112 , 113 , 114 , 115}, descobrimos que os ISRs 16S-23S das cepas de TPA contêm os genes tRNA-Ile (tRNA-Ile-1; tp0012 ) e tRNA-Ala (tRNA-Ala-3; tp00t15 ) dentro dos rrn1 e rrn2 operons , respectivamente . Por outro lado, os genomas TPE mostram um padrão espaçador Ala/Ile, onde os tp0012 e tp00t15 ortólogos estão localizados dentro dos operons rrn2 e rrn1 , respectivamente.

Identificamos 68 SNPs nos genes r0001 , r0002 , r0004 e r0005 , codificando os genes 16S-23S rRNA do novo e antigo genoma ZH1540, colocando-os entre os genes mais variáveis em nosso alinhamento e aumentando o potencial de que incluí-los no alinhamento poderia resultar em uma reconstrução filogenética tendenciosa. Embora os SNPs encontrados pareçam ser bem suportados pelas leituras obtidas a partir do mapeamento de sequências (Tabela Suplementar 3 ), a sua origem de possível contaminação não pode ser completamente descartada e seriam necessárias análises adicionais para os confirmar.

A exclusão destes genes do alinhamento, além dos genes recombinantes e tp0316, tp0317 e tp0897 , não resultou em quaisquer alterações na topologia (Extended Data Figs. 2 b e 3 ), embora os comprimentos dos ramos tenham sido alterados. Como se sabe que esses genes possuem regiões conservadas, além de regiões variáveis, usadas para explorar as relações evolutivas entre bactérias patogênicas ^{116 , 117 , 118}, decidimos mantê-los no alinhamento para todas as análises subsequentes. Finalmente, notamos que o genoma ZH1540 não possuía nenhuma das duas mutações do gene de RNA ribossômico 23 S de T. pallidum conhecidas por conferir resistência a macrólidos (A2058G e A2069G). Em contraste, quatro estirpes modernas de TEN do Japão possuem a mutação A2048G, sugerindo uma recente pressão de selecção para mutações de resistência a antibióticos.

Molecular clock dating

We used the Bayesian phylogenetics package BEAST2 v2.6.7¹¹⁹ to estimate a time-calibrated phylogeny of the context dataset of 98 T. pallidum genomes along with our new ancient genome, ZH1540. We removed hypervariable and recombining genes from the alignment, as described above, reduced it to variable sites and used an ascertainment bias correction to account for constant sites.

Análises de regressão da raiz às pontas (Dados Estendidos Fig. 4 ) mostram que, embora haja uma correlação positiva entre o ano de amostragem e a divergência da raiz às pontas entre todas as cepas clínicas modernas, indicando uma evolução semelhante a um relógio, a correlação é muito fraca quando incluindo também cepas passadas e negativo quando incluindo cepas antigas. Dentro dos clados TPE, TEN e SS14 existe uma correlação positiva entre todas as cepas clínicas modernas e passadas. Por outro lado, a correlação é negativa para cepas de Nichols, mesmo quando se olha apenas para cepas clínicas. A fim de levar em conta a variação da taxa e os longos ramos terminais em algumas cepas (provavelmente devido a uma infinidade de efeitos, incluindo erros de sequenciamento, contaminação e mutações introduzidas durante a passagem do coelho), usamos um modelo de relógio UCLD e UCED para a datação do relógio molecular. análise ¹²⁰. Para ambos os modelos, colocamos um prior lognormal estreito com uma média (no espaço real) de 1 × 10 ⁻⁷substituições por local por ano e desvio padrão de 0,25 na frequência média do clock. Este forte anterior foi usado para compensar o fraco sinal temporal entre os genomas de T. pallidum e foi calibrado em estimativas anteriores da taxa de substituição ^{4 , 35}. Usamos ainda um modelo de substituição GTR + G + I ¹¹⁸ e um gráfico do horizonte bayesiano ¹²¹modelo demográfico (árvore anterior) com 10 grupos. Para todos os genomas onde as datas de amostragem não são conhecidas exatamente, usamos anteriores uniformes ao longo dos intervalos de datas relatados nos estudos originais para levar em conta a incerteza ^{4 , 5 , 6 , 16 , 122}. Para ZH1540, definimos o intervalo de datas para 364–573 dC , de acordo com os resultados da datação por radiocarbono corrigidos pelo efeito do reservatório marinho acima. Priores padrão foram usados para todos os outros parâmetros do modelo. A mesma análise foi repetida sem ZH1540, a fim de avaliar o efeito do nosso novo genoma antigo nas datas de divergência. Repetimos ainda mais a análise usando um lognormal anterior amplo com uma média (no espaço real) de 1 × 10 ⁻⁷ substitutions per site per year and standard deviation 1 on the mean clock rate and using both constant-size and exponential growth coalescent models to assess the impacts of the mean clock rate prior and demographic models on divergence time estimates.

Para cada análise, executamos quatro cadeias de Markov Monte Carlo (MCMC) de 5 × 10 ⁸ steps each, sampling parameters and trees every 10,000 steps. After assessing convergence in Tracer v1.7¹²³ and confirming that all four chains converged to the same posterior distribution, we combined the chains after discarding the first 10% of samples as burn-in. In the resulting combined chains all parameters have effective sample size (ESS) values > 150. TreeAnnotator v2.6.7 was used to compute MCC trees and the results were visualized using ggplot2¹²⁴, ggtree¹²⁵ and custom scripts. The 95% HPD of the coefficient of variation estimated under the UCLD model excluded 0 (median = 1.46, 95% HPD 1.08–1.9), indicating that a strict clock model is not appropriate for our dataset. Robustness analyses show that under a narrow mean clock rate prior both the UCED and UCLD clock models result in similar divergence time estimates (Extended Data Fig. 5a–f), with the UCED model estimates tending to be more recent and the UCLD model estimates usually having longer tails. Under a wide mean clock rate prior, estimates with the UCED are broadly similar, albeit wider, while the UCLD model estimates very wide posterior distributions for divergence times, indicating little information under this model. Divergence time estimates were not sensitive to the demographic model used. The MCC trees under the UCED model with a narrow prior, both with and without ZH1540 included in the analysis are shown in Extended Data Figs. 6 and 7, respectively.

Finalmente, realizamos um teste bayesiano de randomização de datas ^{126 , 127 , 128}(DRT) para avaliar melhor a força do sinal temporal em nosso conjunto de dados, permutando datas de amostragem entre genomas e realizando 50 análises replicadas. Para as análises, utilizou-se o conjunto de dados completo, um modelo de relógio UCED com um anterior estreito e o modelo demográfico Bayesiano do horizonte, fixando as datas de amostragem de cepas antigas às médias dos intervalos de datas de radiocarbono para simplificar. Cadeias MCMC foram executadas por 1 × 10 ⁸passos, amostragem de parâmetros a cada 10.000 passos. A convergência foi avaliada usando a coda ¹²⁹pacote para garantir que todos os parâmetros em todas as cadeias tenham valores de ESS > 150. Os resultados do DRT mostram que os intervalos HPD de 95% da taxa de clock média em réplicas com datas de amostragem permutadas são muito menores do que o esperado se todas as informações vierem da taxa de clock média anterior (Dados Estendidos Fig. 5g ). Em geral, os intervalos HPD não se sobrepõem ao intervalo HPD de 95% da taxa média de clock estimada com as datas de amostragem verdadeiras.

Reporting summary

Further information on research design is available in the Nature Portfolio Reporting Summary linked to this article.

Data availability

Os dados brutos de sequenciamento para os quatro genomas antigos recentemente reconstruídos estão acessíveis no European Nucleotide Archive sob o número de acesso PRJEB62647 ( ERP147759 ). Informações detalhadas sobre a fonte do conjunto de dados de referência estão documentadas na Tabela Suplementar 3 . O alinhamento do genoma baseado em múltiplas referências, com e sem regiões de recombinação removidas, juntamente com árvores e arquivos de log para os resultados principais e todos os dados brutos e scripts necessários para reproduzir as análises para este estudo estão disponíveis em https://github.com/laduplessis /Pré-colombiano-Treponema-pallidum-do-Brasil ( https://doi.org/10.5281/zenodo.10063176 ).

Disponibilidade de código

Nenhum código interno especializado foi utilizado para este estudo. Todos os softwares utilizados para a análise dos dados neste estudo estão disponíveis publicamente e são citados no texto principal e nas informações suplementares. Os scripts customizados e o pipeline utilizado na análise e visualização da datação do relógio molecular estão depositados em https://github.com/laduplessis/Pre-Columbian-Treponema-pallidum-from-Brazil ( https://doi.org/10.5281/zenodo .10063176 ).

Referências

Crosby, AW O intercâmbio colombiano: consequências biológicas e culturais de 1492 (Greenwood Publishing Group, 2003).
Harper, KN, Zuckerman, MK, Harper, ML, Kingston, JD & Armelagos, GJ A origem e antiguidade da sífilis revisitadas: uma avaliação das evidências pré-colombianas do Velho Mundo para infecção treponêmica. Sou. J. Física. Antropol. 146 , 99–133 (2011).
Artigo PubMed Google Scholar
Schuenemann, V. J. et al. Historic Treponema pallidum genomes from colonial Mexico retrieved from archaeological remains. PLoS Negl. Trop. Dis. 12, e0006447 (2018).
Article PubMed PubMed Central Google Scholar
Majander, K. et al. Ancient bacterial genomes reveal a high diversity of Treponema pallidum strains in early modern Europe. Curr. Biol. 30, 3788–3803.e10 (2020).
Article CAS PubMed Google Scholar
Giffin, K. et al. A treponemal genome from an historic plague victim supports a recent emergence of yaws and its presence in 15th century Europe. Sci. Rep. 10, 9499 (2020).
Article ADS CAS PubMed PubMed Central Google Scholar
Barquera, R. et al. Origem e estado de saúde dos africanos de primeira geração do México colonial. Curr. Biol. 30 , 2078–2091.e11 (2020).
Artigo CAS PubMed Google Scholar
Fenton, KA et al. Sífilis infecciosa em ambientes de alta renda no século XXI. Lanceta infecta. Dis. 8 , 244–253 (2008).
Artigo PubMed Google Scholar
Beale, MA et al. A filogenia global das de Treponema pallidum linhagens revela a recente expansão e disseminação da sífilis contemporânea. Nat. Microbiol. 6 , 1549–1560 (2021).
Artigo CAS PubMed PubMed Central Google Scholar
Tsuboi, M. et al. Prevalência de sífilis entre homens que fazem sexo com homens: uma revisão sistemática global e meta-análise de 2000–20. Lanceta Globo. Saúde 9 , e1110–e1118 (2021).
Artigo CAS PubMed PubMed Central Google Scholar
Taouk, M. L. et al. Characterisation of Treponema pallidum lineages within the contemporary syphilis outbreak in Australia: a genomic epidemiological analysis. Lancet Microbe 3, e417–e426 (2022).
Article CAS PubMed Google Scholar
Tao, Y.-T. et al. Global, regional, and national trends of syphilis from 1990 to 2019: the 2019 global burden of disease study. BMC Public Health 23, 754 (2023).
Article PubMed PubMed Central Google Scholar
Beale, MA et al. A epidemiologia genômica da sífilis revela o surgimento independente de resistência aos macrólidos em múltiplas linhagens circulantes. Nat. Comum. 10 , 3255 (2019).
Artigo ADS PubMed PubMed Central Google Scholar
Stamm, LV Sífilis: ressurgimento de um antigo inimigo. Micróbio. Fato celular. 3 , 363–370 (2016).
Artigo CAS Google Scholar
Mitja, O. et al. Re-emergência de bouba após tratamento com azitromicina em massa única seguido de tratamento direcionado: um estudo longitudinal. Lanceta 391 , 1599–1607 (2018).
Artigo PubMed PubMed Central Google Scholar
Beale, MA et al. Reemergência de bouba e seleção de resistência bacteriana a medicamentos após administração em massa de azitromicina: uma investigação epidemiológica genômica. Lancet Microbe 1 , e263–e271 (2020).
Artigo CAS PubMed Google Scholar
Arora, N. et al. Origin of modern syphilis and emergence of a pandemic Treponema pallidum cluster. Nat. Microbiol. 2, 16245 (2016).
Article CAS PubMed Google Scholar
Vrbová, E. et al. Whole genome sequences of Treponema pallidum subsp. endemicum isolated from Cuban patients: the non-clonal character of isolates suggests a persistent human infection rather than a single outbreak. PLoS Negl. Trop. Dis. 16, e0009900 (2022).
Article PubMed PubMed Central Google Scholar
Marks, M., Solomon, A. W. & Mabey, D. C. Endemic treponemal diseases. Trans. R. Soc. Trop. Med. Hyg. 109, 604 (2015).
Rothschild, B. M. History of syphilis. Clin. Infect. Dis. 40, 1454–1463 (2005).
Artigo PubMed Google Scholar
Kanan, MW, Abbas, M. & Girgis, HY Bejel mutilante tardio nos beduínos nômades do Kuwait. Dermatologica 143 , 277-287 (1971).
Artigo CAS PubMed Google Scholar
Erdelyi, RL & Molla, AA Sífilis endêmica queimada (bejel). Plast. Reconst. Surg. 74 , 589–600 (1984).
Artigo CAS PubMed Google Scholar
Román, GC & Román, LN Ocorrência de complicações congênitas, cardiovasculares, viscerais, neurológicas e neuro-oftalmológicas na bouba tardia: um tema para pesquisas futuras. Rev. Infectar. Dis. 8 , 760–770 (1986).
Artigo PubMed Google Scholar
Giacani, L. & Lukehart, SA As treponematoses endêmicas. Clin. Microbiol. Rev. 27 , 89–115 (2014).
Article PubMed PubMed Central Google Scholar
Radolf, J. D. et al. Treponema pallidum, the syphilis spirochete: making a living as a stealth pathogen. Nat. Rev. Microbiol. 14, 744–759 (2016).
Article CAS PubMed PubMed Central Google Scholar
Baker, B. J. in The Routledge Handbook of Paleopathology (ed. Grauer, A. L.) Ch. 16 (2022); https://doi.org/10.4324/9781003130994-18.
Ortner, DJ Identificação de condições patológicas em restos de esqueletos humanos (Academic Press, 2003).
Forrestel, AK, Kovarik, CL & Katz, KA Sífilis sexualmente adquirida: aspectos históricos, microbiologia, epidemiologia e manifestações clínicas. Geléia. Acad. Dermatol. https://doi.org/10.1016/j.jaad.2019.02.073 (2020).
Harper, KN et al. Sobre a origem das treponematoses: uma abordagem filogenética. PLoS Negl. Tropa. Dis. 2 , e148 (2008).
Artigo PubMed PubMed Central Google Scholar
de Melo, FL, de Mello, JCM, Fraga, AM, Nunes, K. & Eggers, S. Sífilis na encruzilhada da filogenética e da paleopatologia. PLoS Negl. Tropa. Dis. 4 , e575 (2010).
Artigo PubMed PubMed Central Google Scholar
Filippini, J., Pezo-Lanfranco, L. & Eggers, S. Um estudo regional sistemático de treponematoses em sambaquis (sambaquis) brasileiros pré-colombianos. Chungara 51 , 403–425 (2019).
Google Scholar
Meyer, M. & Kircher, M. Illumina sequencing library preparation for highly multiplexed target capture and sequencing. Cold Spring Harb. Protoc. 2010, db.prot5448 (2010).
Article Google Scholar
Briggs, A. W. et al. Patterns of damage in genomic DNA sequences from a Neandertal. Proc. Natl Acad. Sci. USA 104, 14616–14621 (2007).
Article ADS CAS PubMed PubMed Central Google Scholar
Adler, C. J., Haak, W., Donlon, D. & Cooper, A. Survival and recovery of DNA from ancient teeth and bones. J. Archaeol. Sci. 38, 956–964 (2011).
Artigo Google Scholar
Dabney, J., Meyer, M. & Pääbo, S. Danos no DNA antigo. Primavera fria Harb. Perspectiva. Biol. 5 , a012567 (2013).
Artigo PubMed PubMed Central Google Scholar
Akgul, G. et al. Inferir padrões de recombinação e divergência com genomas treponêmicos antigos e modernos. Pré-impressão em bioRxiv https://doi.org/10.1101/2023.02.08.526988 (2023).
Pla-Díaz, M. et al. Processos evolutivos no surgimento e disseminação recente do agente da sífilis, Treponema pallidum . Mol. Biol. Evol. 39 , msab318 (2022).
Artigo PubMed Google Scholar
Strouhal, M. et al. Sequências completas do genoma de duas cepas de Treponema pallidum subsp. pertenue da Indonésia: estrutura modular de vários genes treponêmicos. PLoS Negl. Tropa. Dis. 12 , e0006867 (2018).
Article CAS PubMed PubMed Central Google Scholar
Mikalová, L. et al. Whole genome sequence of the Treponema pallidum subsp. endemicum strain Iraq B: a subpopulation of bejel treponemes contains full-length tprF and tprG genes similar to those present in T. p. subsp. pertenue strains. PLoS ONE 15, e0230926 (2020).
Article PubMed PubMed Central Google Scholar
Powell, ML et al. O Mito da Sífilis: A História Natural da Treponematose na América do Norte (Univ. Press of Florida, 2005).
Baker, BJ et al. Avançar na compreensão da doença treponêmica no passado e no presente. Sou. J. Física. Antropol. 171 , 5–41 (2020).
Artigo PubMed Google Scholar
Štaudová, B. et al. Sequência completa do genoma do Treponema pallidum subsp. cepa endemicum Bósnia A: o genoma está relacionado aos treponemas da bouba, mas contém poucos loci semelhantes aos treponemas da sífilis. PLoS Negl. Tropa. Dis. 8 , e3261 (2014).
Artigo PubMed PubMed Central Google Scholar
Lieberman, NAP et al. O sequenciamento do genoma do Treponema pallidum de seis continentes revela variabilidade nos genes candidatos a vacina e dominância das cepas do clado Nichols em Madagascar. PLoS Negl. Tropa. Dis. 15 , e0010063 (2021).
Artigo CAS PubMed PubMed Central Google Scholar
Noda, AA et al. Bejel em Cuba: identificação molecular de Treponema pallidum subsp. endemicum em pacientes com diagnóstico de sífilis venérea. Clin. Microbiol. Infectar. 24 , 1210.e1–1210.e5 (2018).
Article CAS PubMed Google Scholar
Kawahata, T. et al. Bejel, a nonvenereal treponematosis, among men who have sex with men, Japan. Emerg. Infect. Dis. 25, 1581–1583 (2019).
Article PubMed PubMed Central Google Scholar
Shinohara, K. et al. Clinical perspectives of Treponema pallidum subsp. endemicum infection in adults, particularly men who have sex with men in the Kansai area, Japan: a case series. J. Infect. Chemother. 28, 444–450 (2022).
Article PubMed Google Scholar
Lewis, CM Jr, Akinyi, MY, DeWitte, SN & Stone, AC Patógenos antigos fornecem uma janela para a saúde e o bem-estar. Processo. Acad. Nacional. Ciência. EUA 120 , e2209476119 (2023).
Artigo CAS PubMed PubMed Central Google Scholar
Vågene, Å. J. et al. Genomas de Salmonella enterica de vítimas de uma grande epidemia do século XVI no México. Nat. Eco. Evol. 2 , 520–528 (2018).
Artigo PubMed Google Scholar
Zhou, Z. et al. antiga e moderna A análise pan-genômica da Salmonella enterica demonstra a estabilidade genômica da linhagem invasora Para C por milênios. Curr. Biol. 28 , 2420–2428.e10 (2018).
Artigo CAS PubMed PubMed Central Google Scholar
Chave, FM et al. enterica adaptada ao homem O surgimento de Salmonella está ligado ao processo de neolitização. Nat. Eco. Evol. 4 , 324–333 (2020).
Artigo PubMed PubMed Central Google Scholar
Haller, M. et al. Mass burial genomics reveals outbreak of enteric paratyphoid fever in the Late Medieval trade city Lübeck. iScience 24, 102419 (2021).
Article ADS CAS PubMed PubMed Central Google Scholar
Schwarz, S., Skytte, L. & Rasmussen, K. L. Pre-Columbian treponemal infection in Denmark?—A paleopathological and archaeometric approach. Herit. Sci. 1, 19 (2013).
Article Google Scholar
Rissech, C. et al. Esqueleto romano com possível treponematose no Nordeste da Península Ibérica: estudo morfológico e radiológico. Internacional J. Osteoarqueol. 23 , 651–663 (2013).
Artigo Google Scholar
Gaul, JS, Grossschmidt, K., Gusenbauer, C. & Kanz, F. Um provável caso de sífilis congênita na Áustria pré-colombiana. Antropol. Anz. 72 , 451–472 (2015).
Artigo PubMed Google Scholar
Raghavan, M. et al. Evidência genômica do Pleistoceno e da história populacional recente dos nativos americanos. Ciência 349 , aab3884 (2015).
Artigo PubMed PubMed Central Google Scholar
Bardill, J. et al. Avançando a ética da paleogenômica. Ciência 360 , 384–385 (2018).
Artigo ADS CAS PubMed PubMed Central Google Scholar
Blasis, P. A. D., Kneip, A. & Scheel-Ybert, R. Sambaquis e paisagem: dinâmica natural e arqueologia regional no litoral do sul do Brasil. Arqueología Suramericana 3 , 29–61 (2007).
Google Scholar
Posth, C. et al. Reconstructing the deep population history of Central and South America. Cell 175, 1185–1197.e22 (2018).
Article PubMed PubMed Central Google Scholar
Mitjà, O., Šmajs, D. & Bassat, Q. Advances in the diagnosis of endemic treponematoses: yaws, bejel, and pinta. PLoS Negl. Trop. Dis. 7, e2283 (2013).
Artigo PubMed PubMed Central Google Scholar
Martins-Melo, FR, Ramos, AN Jr, Alencar, CH & Heukelbach, J. Mortalidade por doenças tropicais negligenciadas no Brasil, 2000–2011. Touro. Órgão Mundial da Saúde. 94 , 103–110 (2016).
Artigo PubMed Google Scholar
Garra, KG et al. A escavação do Chaco Canyon revela preocupações éticas. Zumbir. Biol. 89 , 177–180 (2017).
Artigo PubMed PubMed Central Google Scholar
Lima, T. A. Em busca dos frutos do mar os pescadores-coletores do litoral centro-sul do Brasil. Rev. USP https://doi.org/10.11606/issn.2316-9036.v0i44p270-327 (1999).
Gaspar, MD, DeBlasis, P., Fish, SK & Fish, PR em The Handbook of South American Archaeology (eds. Silverman, H. & Isbell, WH) 319–335 (Springer, 2008).
Fish, S. K., DeBlasis, P. & Gaspar, M. D. Eventos incrementais na construção de sambaquis, litoral sul do Estado de Santa Catarina. Rev. Mus. Arqueol. Etnol. https://doi.org/10.11606/issn.2448-1750.revmae.2000.109378 (2000).
Klokler, D. M. Food for Body and Soul: Mortuary Ritual in Shell Mounds (Laguna-Brazil). PhD thesis, Univ. of Arizona (2008).
Edwards, H. G. M. et al. Raman spectroscopic study of 3000-year-old human skeletal remains from a sambaqui, Santa Catarina, Brazil. J. Raman Spectrosc. 32, 17–22 (2001).
Article ADS CAS Google Scholar
Beck, A. & Pereira, J. B. B. Variação do Conteúdo Cultural dos Sambaquis: Litoral de Santa Catarina. Doctoral thesis, Univ. of São Paulo (1972).
Prous, A. & Fogaça, E. Arqueologia da fronteira Pleistoceno-Holoceno no Brasil. Quat. Internacional 53-54 , 21–41 (1999).
Artigo Google Scholar
Barbosa, P. N. A Coisa Ficou Preta: Estudo do Processo de Formação da Terra Preta do Sítio Arqueológico Jabuticabeira II. Doctoral thesis, Univ. of São Paulo (2007).
Okumura, MMM & Eggers, S. O povo da Jabuticabeira II: reconstrução do modo de vida em um sambaqui brasileiro. Homo 55 , 263–281 (2005).
Artigo CAS PubMed Google Scholar
Pezo-Lanfranco, L. et al. Desenvolvimento infantil, estresse fisiológico e expectativa de sobrevivência em pescadores-caçadores-coletores pré-históricos do sambaqui Jabuticabeira II, litoral sul do Brasil. PLoS ONE 15 , e0229684 (2020).
Artigo CAS PubMed PubMed Central Google Scholar
Rothschild, B. M. & Rothschild, C. Treponemal disease revisited: skeletal discriminators for yaws, bejel, and venereal syphilis. Clin. Infect. Dis. 20, 1402–1408 (1995).
Article CAS PubMed Google Scholar
Hajdas, I., Michczyński, A., Bonani, G., Wacker, L. & Furrer, H. Dating bones near the limit of the radiocarbon dating method: study case mammoth from Niederweningen, ZH Switzerland. Radiocarbon 51, 675–680 (2009).
Article CAS Google Scholar
Toso, A. et al. Intensificação da pesca como resposta à instabilidade socioecológica do Holoceno Superior no sudeste da América do Sul. Ciência. Rep. 11 , 23506 (2021).
Artigo ADS CAS PubMed PubMed Central Google Scholar
Stuiver, M. & Reimer, PJ estendido ¹⁴Banco de dados C e CALIB 3.0 revisado ¹⁴Programa de calibração de idade C. Radiocarbono 35 , 215–230 (1993).
Artigo Google Scholar
Heaton, TJ et al. Marine20 — A curva de calibração da idade do radiocarbono marinho (0–55.000 cal bp ). Radiocarbono 62 , 779–820 (2020).
Artigo CAS Google Scholar
Hogg, AG et al. Calibração SHCal20 Hemisfério Sul, 0–55.000 anos cal bp . Radiocarbono 62 , 759–778 (2020).
Artigo CAS Google Scholar
Reimer, PJ & Reimer, RW Um banco de dados de correção de reservatórios marinhos e interface on-line. Radiocarbono 43 , 461–463 (2001).
Article Google Scholar
Ramsey, C. B. Bayesian analysis of radiocarbon dates. Radiocarbon 51, 337–360 (2009).
Article CAS Google Scholar
Pezo-Lanfranco, L., DeBlasis, P. & Eggers, S. Weaning process and subadult diets in a monumental Brazilian shellmound. J. Archaeol. Sci. 22, 452–469 (2018).
Google Scholar
Dabney, J. & Meyer, M. in Methods in Molecular Biology, Vol. 1963 (eds Shapiro, B. et al.) 25–29 (Humana Press, 2019); https://doi.org/10.1007/978-1-4939-9176-1_4 (2019).
Kircher, M., Sawyer, S. & Meyer, M. Double indexing overcomes inaccuracies in multiplex sequencing on the Illumina platform. Nucleic Acids Res. 40, e3 (2012).
Article CAS PubMed Google Scholar
Wood, DE, Lu, J. & Langmead, B. Análise metagenômica aprimorada com Kraken 2. Genome Biol. 20 , 257 (2019).
Artigo CAS PubMed PubMed Central Google Scholar
Wingett, SW & Andrews, S. FastQ Screen: uma ferramenta para mapeamento multi-genoma e controle de qualidade. F1000Res 7 , 1338 (2018).
Artigo PubMed PubMed Central Google Scholar
Kanz, C. et al. O banco de dados de sequências de nucleotídeos EMBL. Ácidos Nucleicos Res. 33 , D29–D33 (2005).
Artigo CAS PubMed Google Scholar
Sayers, EW et al. Recursos de banco de dados do Centro Nacional de Informações sobre Biotecnologia. Ácidos Nucleicos Res. 50 , D20–D26 (2022).
Artigo CAS PubMed Google Scholar
Schubert, M., Lindgreen, S. & Orlando, L. AdapterRemoval v2: rapid adapter trimming, identification, and read merging. BMC Res. Notes 9, 88 (2016).
Article PubMed PubMed Central Google Scholar
Valiente-Mullor, C. et al. One is not enough: on the effects of reference genome for the mapping and subsequent analyses of short-reads. PLoS Comput. Biol. 17, e1008678 (2021).
Article CAS PubMed PubMed Central Google Scholar
Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754–1760 (2009).
Article CAS PubMed PubMed Central Google Scholar
Neukamm, J., Peltzer, A. & Nieselt, K. DamageProfiler: fast damage pattern calculation for ancient DNA. Bioinformatics 37, 3652–3653 (2021).
Artigo CAS PubMed Google Scholar
Danecek, P. et al. Doze anos de SAMtools e BCFtools. Gigascience 10 , giab008 (2021).
Artigo PubMed PubMed Central Google Scholar
Koboldt, DC et al. VarScan 2: descoberta de mutação somática e alteração do número de cópias em câncer por sequenciamento de exoma. Genoma Res. 22 , 568–576 (2012).
Artigo CAS PubMed PubMed Central Google Scholar
Quinlan, AR BEDTools: a ferramenta do Exército Suíço para análise de características do genoma. Curr. Protocolo. Bioinformática 47 , 11.12.1–11.12.34 (2014).
Artigo PubMed Google Scholar
Milne, I. et al. Usando Tablet para exploração visual de dados de sequenciamento de segunda geração. Apresentação. Bioinformática 14 , 193–202 (2013).
Article CAS PubMed Google Scholar
Nakamura, T., Yamada, K. D., Tomii, K. & Katoh, K. Parallelization of MAFFT for large-scale multiple sequence alignments. Bioinformatics 34, 2490–2492 (2018).
Article CAS PubMed PubMed Central Google Scholar
Larsson, A. AliView: a fast and lightweight alignment viewer and editor for large datasets. Bioinformatics 30, 3276–3278 (2014).
Article CAS PubMed PubMed Central Google Scholar
Lechner, M. et al. Proteinortho: detection of (co-)orthologs in large-scale analysis. BMC Bioinformatics 12, 124 (2011).
Article PubMed PubMed Central Google Scholar
Alikhan, N.-F., Petty, NK, Ben Zakour, NL & Beatson, SA BLAST Ring Image Generator (BRIG): comparações simples do genoma de procariontes. BMC Genômica 12 , 402 (2011).
Artigo CAS PubMed PubMed Central Google Scholar
Nguyen, L.-T., Schmidt, HA, von Haeseler, A. & Minh, BQ IQ-TREE: um algoritmo estocástico rápido e eficaz para estimar filogenias de máxima verossimilhança. Mol. Biol. Evol. 32 , 268–274 (2015).
Artigo CAS PubMed Google Scholar
Rodríguez, F., Oliver, JL, Marín, A. & Medina, JR O modelo estocástico geral de substituição de nucleotídeos. J. Teor. Biol. 142 , 485–501 (1990).
Artigo ADS MathSciNet PubMed Google Scholar
Estimativa filogenética de máxima verossimilhança a partir de sequências de DNA com taxas variáveis sobre locais: métodos aproximados. J. Mol. Evol. 39 , 306–314 (1994).
Gu, X., Fu, YX & Li, WH Estimativa de máxima verossimilhança da heterogeneidade da taxa de substituição entre sítios de nucleotídeos. Mol. Biol. Evol. 12 , 546–557 (1995).
Strimmer, K. & von Haeseler, A. Likelihood-mapping: a simple method to visualize phylogenetic content of a sequence alignment. Proc. Natl Acad. Sci. USA 94, 6815–6819 (1997).
Article ADS CAS PubMed PubMed Central Google Scholar
Shimodaira, H. & Hasegawa, M. Multiple comparisons of log-likelihoods with applications to phylogenetic inference. Mol. Biol. Evol. 16, 1114–1116 (1999).
Article CAS Google Scholar
Strimmer, K. & Rambaut, A. Inferring confidence sets of possibly misspecified gene trees. Proc. Biol. Sci. 269, 137–142 (2002).
Article PubMed PubMed Central Google Scholar
Kumar, S., Stecher, G., Li, M., Knyaz, C. & Tamura, K. MEGA X: molecular evolutionary genetics analysis across computing platforms. Mol. Biol. Evol. 35, 1547–1549 (2018).
Article CAS PubMed PubMed Central Google Scholar
Pinto, M. et al. não cultivável A análise em escala genômica do Treponema pallidum revela extensa variação genética dentro do paciente. Nat. Microbiol. 2 , 16190 (2016).
Artigo CAS PubMed Google Scholar
Grillová, L. et al. Genomas sequenciados diretamente de cepas contemporâneas de sífilis revelam diversidade impulsionada por recombinação em genes que codificam antígenos expostos à superfície previstos. Frente. Microbiol. 10 , 1691 (2019).
Artigo PubMed PubMed Central Google Scholar
Addetia, A. et al. completa Estimativa da diversidade tprk em Treponema pallidum subsp. pálido . mBio 11 , e02726–20 (2020).
Artigo CAS PubMed PubMed Central Google Scholar
Liu, D. et al. Caracterização molecular baseada em esquemas de tipagem MLST e ECDC e análises de resistência a antibióticos de Treponema pallidum subsp. pallidum em Xiamen, China. Frente. Célula. Infectar. Microbiol. 10 , 618747 (2021).
Artigo PubMed PubMed Central Google Scholar
Croucher, N. J. et al. Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins. Nucleic Acids Res. 43, e15 (2015).
Article PubMed Google Scholar
Didelot, X. & Wilson, D. J. ClonalFrameML: efficient inference of recombination in whole bacterial genomes. PLoS Comput. Biol. 11, e1004041 (2015).
Article ADS PubMed PubMed Central Google Scholar
Cejkova, D., Strouhal, M. & Smajs, D. Heterogeneidade genética intra-estirpe em Treponema pallidum ssp. pálido . Sexo. Transm. Infectar. 89 , A76 (2013).
Artigo Google Scholar
Matějková, P. et al. Sequência completa do genoma de Treponema pallidum ssp. cepa SS14 pallidum determinada com matrizes de oligonucleotídeos. Microbiol BMC. 8 , 76 (2008).
Artigo PubMed PubMed Central Google Scholar
Giacani, L. et al. Variação antigênica em Treponema pallidum : A diversidade da sequência TprK se acumula em resposta à pressão imunológica durante a sífilis experimental. J. Imunol. 184 , 3822–3829 (2010).
Artigo CAS PubMed Google Scholar
Smajs, D., Norris, SJ & Weinstock, GM Diversidade genética em Treponema pallidum : implicações para a patogênese, evolução e diagnóstico molecular de sífilis e bouba. Infectar. Geneta. Evol. 12 , 191–202 (2012).
Artigo PubMed Google Scholar
de la Haba, R. R., Arahal, D. R., Márquez, M. C. & Ventosa, A. Phylogenetic relationships within the family Halomonadaceae based on comparative 23 S and 16 S rRNA gene sequence analysis. Int. J. Syst. Evol. Microbiol. 60, 737–748 (2010).
Article PubMed Google Scholar
Yang, B., Wang, Y. & Qian, P.-Y. Sensitivity and correlation of hypervariable regions in 16 S rRNA genes in phylogenetic analysis. BMC Bioinformatics 17, 135 (2016).
Article PubMed PubMed Central Google Scholar
Martijn, J. et al. Confident phylogenetic identification of uncultured prokaryotes through long read amplicon sequencing of the 16S-ITS-23S rRNA operon. Environ. Microbiol. 21, 2485–2498 (2019).
Artigo CAS PubMed PubMed Central Google Scholar
Bouckaert, R. et al. BEAST 2.5: Uma plataforma de software avançada para análise evolutiva Bayesiana. Computação PLoS. Biol. 15 , e1006650 (2019).
Artigo CAS PubMed PubMed Central Google Scholar
Drummond, AJ, Ho, SYW, Phillips, MJ & Rambaut, A. Filogenética relaxada e namoro com confiança. PLoS Biol. 4 , e88 (2006).
Artigo PubMed PubMed Central Google Scholar
Drummond, AJ, Rambaut, A., Shapiro, B. & Pybus, OG Inferência coalescente bayesiana da dinâmica populacional passada a partir de sequências moleculares. Mol. Biol. Evol. 22 , 1185–1192 (2005).
Artigo CAS PubMed Google Scholar
Schuenemann, VJ et al. Genomas antigos revelam uma alta diversidade de Mycobacterium leprae na Europa medieval. PLoS Pathog. 14 , e1006997 (2018).
Artigo PubMed PubMed Central Google Scholar
Rambaut, A., Drummond, A. J., Xie, D., Baele, G. & Suchard, M. A. Posterior summarization in Bayesian phylogenetics using Tracer 1.7. Syst. Biol. 67, 901–904 (2018).
Article CAS PubMed PubMed Central Google Scholar
Wickham, H. ggplot2: Elegant Graphics for Data Analysis (Springer, 2016).
Yu, G., Smith, D. K., Zhu, H., Guan, Y. & Lam, T. T.-Y. ggtree: an R package for visualization and annotation of phylogenetic trees with their covariates and other associated data. Methods Ecol. Evol. 8, 28–36 (2017).
Artigo Google Scholar
Navascués, M., Depaulis, F. & Emerson, BC Combinando DNA contemporâneo e antigo em estudos genéticos e filogeográficos populacionais. Mol. Eco. Recurso. 10 , 760–772 (2010).
Artigo PubMed Google Scholar
Duchêne, S., Duchêne, D., Holmes, EC & Ho, SYW O desempenho do teste de randomização de data em análises filogenéticas de dados de vírus estruturados no tempo. Mol. Biol. Evol. 32 , 1895–1906 (2015).
Artigo PubMed Google Scholar
Rieux, A. & Balloux, F. Inferências de filogenias calibradas com ponta: uma revisão e um guia prático. Mol. Eco. 25 , 1911–1924 (2016).
Artigo PubMed PubMed Central Google Scholar
Plummer, M., Martin, AD & Quinn, KM Aplicou inferência bayesiana em R usando MCMCpack. R Notícias 6 , 2–8 (2006).
Google Scholar
Neukamm, J., Peltzer, A. & Nieselt, K. DamageProfiler.: fast damage pattern calculation for ancient DNA. Bioinformatics 37, 3652–3653 (2021).
Article CAS PubMed Google Scholar

Download references

Reconhecimentos

Os autores agradecem a I. Hajdas (ETH Zurique) pela realização do ¹⁴C datação deste estudo e C. Steiner pelas ilustrações deste estudo; o Centro de Genômica Funcional de Zurique e o Biocentro de Viena para conduzir o sequenciamento de DNA; ao Museu de Arqueologia e Etnologia da Universidade de São Paulo pelo acesso ao material amostral do sítio Jabuticabeira II e, em especial, ao P. de Blasis pela aprovação da utilização das amostras ósseas, informações sobre a escavação original e aconselhamento sobre as considerações éticas considerando as conexões dos grupos indígenas modernos da região e do sítio arqueológico; e E. Krenak pelo aconselhamento profissional sobre como garantir a discrição para com os povos indígenas sul-americanos em questões de idioma e inclusão. Este trabalho foi apoiado pela Swiss National Science Foundation: concessão número 188963 “Rumo às origens da sífilis” (VJS e KM), o Programa Prioritário de Pesquisa Universitária da Universidade de Zurique 'Evolução em Ação: Dos Genomas aos Ecossistemas' (VJS), e pelos projetos BFU2017-89594R e PID2021-127010OB-100 do Ministério de Ciência e Inovação espanhol (FG-C. e MP-D.). MP-D. foi financiado pelo programa FPU17/02367 do Ministério de Educação espanhol. A LPL foi financiada pela FAPESP - 2017/17580-0.

Informação sobre o autor

Os seguintes autores contribuíram igualmente: Kerttu Majander, Marta Pla-Diaz

Authors and Affiliations

Institute of Evolutionary Medicine, University of Zurich, Zurich, Switzerland
Kerttu Majander & Verena J. Schuenemann
Department of Evolutionary Anthropology, University of Vienna, Vienna, Austria
Kerttu Majander & Verena J. Schuenemann
Department of Environmental Sciences, University of Basel, Basel, Switzerland
Kerttu Majander & Verena J. Schuenemann
Unidad Mixta Infección y Salud Pública, FISABIO/Universidad de Valencia-I2SysBio, Valencia, Spain
Marta Pla-Díaz & Fernando González-Candelas
CIBER in Epidemiology and Public Health, Instituto de Salud Carlos III, Madrid, Spain
Marta Pla-Díaz & Fernando González-Candelas
Departamento de Ciência e Engenharia de Biossistemas, ETH Zürich, Basileia, Suíça
Louis du Plessis
Instituto Suíço de Bioinformática, Quartier Sorge, Lausanne, Suíça
Louis du Plessis
Instituto de Medicina Legal de Zurique, Universidade de Zurique, Zurique, Suíça
Natasha Arora
Department of Genetic and Evolutionary Biology, University of São Paulo, São Paulo, Brazil
José Filippini, Luis Pezo-Lanfranco e Sabine Eggers
Instituto de Ciência e Tecnologia Ambiental (ICTA) e Departamento de Pré-história, Universitat Autònoma de Barcelona, Bellaterra, Espanha
Luis Pezo-Lanfranco
Departamento de Antropologia, Museu de História Natural de Viena, Viena, Áustria
Sabine Eggers
Evolução Humana e Ciências Arqueológicas (HEAS), Universidade de Viena, Viena, Áustria
Verena J. Schuenemann

Contribuições

V.J.S, F.G.-C. and K.M. conceived and led the investigation. V.J.S. and K.M. designed the study. S.E., L.P.L. and J.F. provided samples and archaeological contextualization. V.J.S. and F.G.-C. supervized the laboratory work, sampling or analysis and provided funding. K.M. and M.P.-D. performed laboratory experiments. M.P.-D., F.G.-C. and K.M. analysed the genetic data. L.d.P. and L.P.L. performed the molecular dating analysis. V.J.S., N.A., S.E. and J.F. aided with data interpretation. M.P-D. and L.dP. visualized the results. K.M., M.P.-D. and V.J.S. wrote the manuscript, with contributions from all co-authors.

Corresponding authors

Correspondence to Kerttu Majander, Fernando González-Candelas or Verena J. Schuenemann.

Declarações éticas

Interesses competitivos

Os autores declaram não haver interesses conflitantes.

Revisão por pares

Informações de revisão por pares

A Nature agradece a Maarten Blaauw, James McInerney, Hendrik Poinar e ao(s) outro(s) revisor(es) anônimo(s) por sua contribuição para a revisão por pares deste trabalho.

Informações adicionais

Nota do editor A Springer Nature permanece neutra em relação a reivindicações jurisdicionais em mapas publicados e afiliações institucionais.

Figuras e tabelas de dados estendidas

Dados estendidos Fig. 1 Curvas de datação 14C calibradas de amostras usadas para reconstrução de genoma antigo e perfis de danos para autenticação de aDNA.

Calibration conducted by Calib radiocarbon calibration program, showing the a) pre- and b) post-reservoir effect corrected (modelled) curves for the four samples (ZH1390, ZH1540, ZH141 and ZH1557) included in the genomic analyses. Damage profiles obtained with the DamageProfiler tool¹³⁰ show the misincorporation patterns induced by age, for each sample that yielded a reconstructed genome: c) ZH1540, d) ZH1390, e) ZH1541 and f) ZH1557. A pattern of cytosine-to-thymine base misincorporation accumulating at the end of the reads is indicative of authentic ancient DNA in the sample.

Extended Data Fig. 2 Comparison of the topologies of maximum-likelihood (ML) trees.

a) ML tree topology with all genes included in the multiple genome alignment using GTR + G + I as the evolutionary model and 1000 bootstrap repetitions. b) ML tree topology after excluding tp0897, tp0316 and tp0317 and recombinant genes from the multiple genome alignment using GTR + G + I as the evolutionary model and 1000 bootstrap repetitions. The different clades corresponding to TPE and TEN, and the Nichols and SS14 lineages of TPA are colour-coded according to the legend. Bootstrap support values higher than 70% are indicated by pink circles, with circle size proportional to bootstrap support. The subclade SS14-Ω, that includes all SS14-lineage TPA strains except ancient TPA strains, MD06B, MD18Be and MexicoA, is collapsed.

Dados estendidos Fig. 3 Árvore de máxima verossimilhança (ML) com genes recombinantes, hipervariáveis e 16S, 23S excluídos.

Árvore ML obtida após exclusão de tp0897 , tp0316, tp0317, 16 S, 23 S e genes recombinantes do alinhamento múltiplo do genoma usando GTR + G + I como modelo evolutivo e 1000 repetições de bootstrap. Os diferentes clados correspondentes a TPE e TEN, e as linhagens Nichols e SS14 de TPA são codificados por cores de acordo com a legenda. Valores de suporte de bootstrap superiores a 70% são indicados por círculos rosa, com tamanho de círculo proporcional ao suporte de bootstrap.

Dados Estendidos Fig. 4 Divergência raiz-a-ponta em relação à data de amostragem de cepas de T. pallidum e respectivos coeficientes de correlação de Pearson.

As áreas sombreadas indicam o intervalo de confiança de 95% das linhas de regressão. a ) Conjunto de dados completo. b ) Apenas cepas modernas. c ) Apenas cepas clínicas modernas. d ) Apenas cepas modernas de TPE. e ) Apenas cepas modernas de RTE. f ) Apenas cepas modernas de TPA SS14. g ) Apenas cepas modernas de TPA Nichols. h ) Apenas cepas clínicas modernas de TPA Nichols.

Extended Data Fig. 5 Posterior densities of the times of the most recent ancestors (tMRCAs) of the T. pallidum subspecies and major lineages as estimated by the molecular clock dating under different relaxed clock models and the results of the Bayesian date randomization test (DRT).

a) TPE, b) TPA, c) TPA SS14, d) TPA Nichols, e) TEN and f) T. pallidum. Vertical lines inside the density curves in panels a-f indicate the upper and lower limits of the 95% HPD intervals. g) Posterior distributions for the mean clock rate, using the true, unpermuted sampling dates (far left) and 50 replicates with sampling dates permuted among tips under a UCED model with a narrow mean clock-rate prior. Distributions are truncated at the upper and lower limits of the 95% HPD intervals and horizontal red lines indicate the median estimates. The red dashed lines indicate the median and the limits of the 95% HPD interval of the mean clock rate estimated under the true sampling dates.

Dados estendidos Fig. 6 Árvore de credibilidade máxima do clado (MCC) da análise de datação do relógio molecular do conjunto de dados de contexto do genoma 98 com ZH1540 incluído (n = 99).

A inserção mostra uma visão simplificada de toda a árvore, com a linha tracejada indicando a parte da árvore mostrada na figura principal. Genomas antigos são rotulados em negrito e ZH1540 é marcado por uma estrela. As barras azuis indicam os intervalos HPD de 95% das idades dos nós e o texto em vermelho a probabilidade posterior de um clado ser monofilético (mostrado apenas para nós com probabilidade posterior> 0,8).

Dados estendidos Fig. 7 Árvore de credibilidade máxima do clado (MCC) da análise de datação do relógio molecular do conjunto de dados de contexto do genoma 98 com ZH1540 excluído (n = 98).

A inserção mostra uma visão simplificada de toda a árvore, com a linha tracejada indicando a parte da árvore mostrada na figura principal. Genomas antigos são rotulados em negrito. As barras azuis indicam os intervalos HPD de 95% das idades dos nós e o texto em vermelho a probabilidade posterior de um clado ser monofilético (mostrado apenas para nós com probabilidade posterior> 0,8).

segunda-feira, 23 de dezembro de 2024

A sífilis teve origem nas Américas, mostra o DNA antigo, mas o colonialismo europeu espalhou-a amplamente

terça-feira, 18 de junho de 2024

Redefinindo a história treponêmica através de genomas pré-colombianos do Brasil

Abstrato

Conteúdo semelhante sendo visualizado por outras pessoas

Origens geográficas e paleopatologia

Preliminary pathogen screening

Estimativa de autenticidade de DNA antigo

Reconstrução do genoma

Alinhamento do genoma baseado em múltiplas referências

Phylogenetic and recombination analyses

Molecular clock dating

Discussão

Bejel em foco

Consequências para do T. pallidum a evolução

Métodos

Inclusão e ética

Informação arqueológica

Os sambaquis da região de Laguna

Jabuticabeira II excavation site

Palaeopathological analysis of treponematoses

Informações sobre indivíduos

Indivíduo 41A-L2.05-E4, amostra ZH1390

FS9–L3–T2 individual, amostra ZH1540

FS3B-L3-T4 individual, amostra ZH1541

Individual 2B-L6-E3, ZH1557

Correção do efeito do reservatório marinho para 14 C namoro

Sample processing

Extração de DNA antigo

Preparação da biblioteca

Pathogen screening

Enriquecimento alvo para T. pallidum DNA de

Sequencing

Statistical analyses

Dataset selection

Processamento de leitura e geração de alinhamento de genoma baseado em múltiplas referências

Análise de recombinação usando PIM

PIM procedure for likelihood mapping and topology tests

Análise de recombinação usando Gubbins e ClonalFrameML

Phylogenetic analysis

Exploratory characterization of the 16S-23S genes

Molecular clock dating

Reporting summary

Data availability

Disponibilidade de código

Referências

Reconhecimentos

Informação sobre o autor

Authors and Affiliations

Contribuições

Corresponding authors

Declarações éticas

Interesses competitivos

Revisão por pares

Informações de revisão por pares

Informações adicionais

Figuras e tabelas de dados estendidas

Correção do efeito do reservatório marinho para ¹⁴C namoro