Introdução

Como diferentes condições ambientais moldam a evolução do DNA mitocondrial tornou-se uma questão comum no campo da biologia evolutiva, revelando mais sobre padrões adaptativos em organismos que enfrentam mudanças ecológicas do que o esperado. A mitocôndria é um componente celular diretamente envolvido no uso de oxigênio, metabolismo e produção de energia e, portanto, desempenha um papel importante na respiração aeróbica através da fosforilação oxidativa (OXPHOS) 1 . O mitogenoma é composto por 13 genes que codificam proteínas OXPHOS, 2 rRNAs (12S rRNA e 16S rRNA) e 22 tRNAs 2 , 3 , e acredita-se que evolua sob seleção purificadora contínua para regiões codificantes 4 , 5No entanto, como os genes mitocondriais respondem a mudanças nos requisitos de energia, ambientes extremos podem favorecer a seleção positiva, conduzindo adaptações em diferentes genes do mitogenoma para algumas linhagens 5 , 6 , 7 , 8 .

A seleção nos genes do mtDNA tem sido associada à temperatura ambiental, metabolismo exigente elevado, altitude e disponibilidade de oxigênio em várias espécies 7 , 9 , 10 , 11 , 12 . Entre as condições ambientais extremas, a pesquisa sobre a evolução molecular do mtDNA relacionada à alta altitude tem recebido atenção especial 6 , 13 , 14 , 15 , 16 , principalmente porque a avaliação de pressões seletivas de temperatura ambiental e disponibilidade de oxigênio nas mudanças moleculares do mtDNA pode fornecer informações importantes sobre evolução adaptativa do mitogenoma 14Os ambientes aquáticos apresentam condições desafiadoras semelhantes (hipóxia e baixas temperaturas) e, consequentemente, também exigem adaptações do mitogenoma em vertebrados, que foram relatadas para orcas 17 , botos 18 e pinguins 11 . Apesar da maioria das pesquisas sobre o papel da seleção do mtDNA na evolução dos organismos endotérmicos, recentemente tem havido um interesse crescente em espécies ectotérmicas que são altamente dependentes das condições ambientais. Por exemplo, Escalona et al. 19 estudaram a evolução mitocondrial em tartarugas softshell revelando sítios positivamente selecionados em genes do complexo I para o clado Trionychidae e Carettochelys insculpta, sugerindo evolução convergente dos genes OXPHOS em resposta a um estilo de vida aquático duradouro em ambas as linhagens.

Os quelônios são um grupo com mais de 300 espécies distribuídas em diversos nichos ecológicos ao redor do mundo, incluindo rios, lagos, florestas, desertos e oceanos 20 . Entre os quelônios, várias linhagens se adaptaram independentemente ao ambiente marinho e apenas os representantes do clado Chelonioidea (tartarugas marinhas existentes) sobreviveram até o presente (ver Evers e Benson 21 ). As tartarugas marinhas compreendem sete espécies existentes agrupadas em duas famílias irmãs, Dermochelyidae (uma espécie) e Cheloniidae (seis espécies) 22 . Essas espécies apresentam adaptações aos desafios ambientais marinhos, como nadadeiras, alta excreção de sal por glândulas lacrimais modificadas 23 , conchas hidrodinâmicas e adaptações cardiorrespiratórias para fornecer O 2aos tecidos durante os mergulhos 24 . Além disso, as tartarugas marinhas possuem um estilo de vida ativo, sendo organismos mergulhadores, altamente migratórios e com altas taxas de fecundidade 25 , 26 . As tartarugas marinhas estão entre os répteis existentes que se movem mais rapidamente e, uma vez que a demanda de energia para locomoção é considerada o principal determinante da taxa metabólica dos organismos marinhos 27 , espera-se que o estilo de vida ativo das tartarugas marinhas afete suas demandas energéticas, resultando em taxas metabólicas maiores em comparação com outros répteis 25 , 26 , 28Portanto, é razoável supor que as adaptações de genes mitocondriais podem ter tido um papel importante no sucesso adaptativo de linhagens de tartarugas marinhas no ambiente marinho, deixando pegadas moleculares em seus mitogenomas.

Apesar dos trabalhos anteriores sobre a caracterização de mitogenomas de tartarugas marinhas, utilizados principalmente em abordagens filogenéticas e filogeográficas, apenas análises exploratórias examinaram as potenciais adaptações ao ambiente marinho dessas espécies em nível molecular 29 . Aqui pretendemos investigar os padrões evolutivos dos mitogenomas das tartarugas marinhas e abordar o possível papel da evolução do mtDNA na adaptação às altas demandas energéticas metabólicas dessas espécies. Fornecemos uma análise filogenética abrangente da evolução do mitogenoma em Testudines e investigamos as taxas evolutivas e assinaturas moleculares da seleção natural para todos os 13 genes codificadores de proteínas do mtDNA para tartarugas marinhas, em uma comparação filogenética com linhagens de tartarugas não marinhas e outras tartarugas não aviárias répteis.

Resultados

genomas mtDNA de tartarugas marinhas

A montagem dos 90 mitogenomas produziu comprimentos de mitogenoma completos entre 16.386 e 21.933 pb. Todas as 39 regiões comuns aos mitogenomas de vertebrados foram identificadas, destacando a translocação ND5 na família Platysternidae (Fig. S1 complementar online). Estimativas de diversidade genética de genes codificadores de proteínas (PCGs) recuperaram ATP8 como o gene mais diverso entre todas as espécies (π = 0,156) seguido por genes de NADH desidrogenase com ND6 (π = 0,133) apresentando maior diversidade. Os genes da citocromo c oxidase ( COX1 , COX2 e COX3 ) foram os menos diversos entre os genes do mtDNA (Tabela 1 ).

Tabela 1 Diversidade interespecífica para todos os 13 genes codificadores de proteínas em tartarugas marinhas.

Reconstrução filogenética

As inferências ML e bayesiana recuperaram topologias altamente semelhantes e bem resolvidas para um alinhamento de mitogenomas completos para as 110 espécies (conjunto de dados I) e um alinhamento dos 13 PCGs concatenados para as 110 espécies (conjunto de dados II) com alto bootstrap (BP > 50% ) e probabilidades posteriores (PP > 90%) suportam a maioria dos ramos (Suplementar Fig. S2 online). Poucas diferenças nas topologias de diferentes conjuntos de dados (I × II) obtidos por diferentes métodos (Bayesian × ML) foram encontradas, com foco nas relações entre algumas espécies das famílias Trionychidae, Testudinidae e Geoemydidae (especialmente o grupo Mauremis ) (Fig. Suplementar S2conectados). Como as abordagens ML e Bayesiana para ambos os conjuntos de dados renderam topologias altamente semelhantes, as análises subsequentes foram realizadas usando a árvore Bayesiana do conjunto de dados II (Fig.  1 ).

figura 1
figura 1

Árvore bayesiana (conjunto de dados II) para mitogenomas e topologia de testudines usada para analisar as pressões seletivas em Chelonioidea. Os círculos representam genes mitocondriais com maior dN/dS (ω) para Chelonioidea contra outras linhagens de quelônios identificadas pelo modelo de ramificação no codeML. O número de nós representa probabilidades Bayesianas posteriores.

Análises de seleção

modelo de filial

Para testar o papel da seleção no ramo Chelonioidea na árvore filogenética Testudines dos 13 PCGs, aplicamos testes de modelo de ramo codeML. O modelo de razão livre ajustou-se significativamente melhor aos nossos dados do que a hipótese nula (modelo de razão única) para todos os 13 PCGs, sugerindo diferentes taxas evolutivas entre as linhagens incluídas em nosso conjunto de dados. Os valores de dN , dS e ω para cada ramificação estão disponíveis em Dados Suplementares S1 online. O modelo de duas proporções, usado para calcular as pressões seletivas atuando na linhagem de tartarugas marinhas, ajustou-se melhor para os genes COX2 , ND1 e CYTB quando a linhagem de tartarugas marinhas foi rotulada como ramo de primeiro plano (Fig.  2 ). Além disso, o ATP8O gene apresentou os maiores valores de ω, tanto para os ramos foreground quanto background, quando comparado a outros genes. No entanto, o LRT não foi capaz de indicar o modelo de duas razões como o modelo com melhor ajuste para explicar as diferenças nos valores de ω para esse gene ( p  = 0,09) (Tabela Suplementar S3 online). Além disso, RELAX detectou seleção intensificada significativa (K > 1) nos genes ATP8, COX1 , COX2 , COX3 , CYTB , ND4 , ND4L e ND5 para a linhagem de tartarugas marinhas (Fig.  2 e Tabela Suplementar S4 online) e nenhum gene foi identificado sob relaxamento.

Figura 2
Figura 2

A força da seleção natural e a proporção de substituições não sinônimas para sinônimas (ω) calculadas com o modelo de duas proporções em codeML para os 13 genes mitocondriais codificadores de proteínas (conjunto de dados III) de marinhos (clado Chelonioidea) e não marinhos (todos os outros clados quelônios). Os genes nos quais o modelo duplo se ajusta melhor aos dados ( p  < 0,05) são marcados com um asterisco e foram estimados com o modelo de ramificação de proporção dupla no programa PAML. Os nomes dos genes em negrito representam genes com seleção intensificada significativa em tartarugas marinhas detectadas pelo RELAX ( p  < 0,05).

Modelos de filiais

Para calcular as pressões seletivas atuando apenas na linhagem de tartarugas marinhas da filogenia quelônica, realizamos modelos de ramificação usando codeML, FITMODEL e aBSREL. Os testes de branch-site realizados com codeML e FITMODEL detectam sinais significativos de seleção positiva para algumas proporções dos genes testados na linhagem de tartarugas marinhas (Tabela Suplementar S5 online), correspondendo a apenas três sites sob seleção nos genes ND4 e ND5 (Tabela 2). Aplicamos quatro modelos de substituição de códons (M0, M3, M3 + S1 e M3 + S2) no FITMODEL (Guindon et al. 2004). O LRT entre modelos aninhados (M0 x M3; M3 x M3 + S1; M3 + S1 x M3 + S2) sugeriu que o modelo M3 + S2 se ajusta melhor para todos os 13 PCGs, considerando mudanças entre padrões de seleção em locais individuais na filogenia de Testudines ( Tabela Suplementar S6 online). Além disso, este teste indica a ação da seleção positiva no códon 36 do gene ND4 no ramo da tartaruga marinha (Tabela 2 e Figuras complementares. S3 e S4conectados). aBSREL relata dois ramos sob pressão de seleção diversificante episódica no clado Chelonioidea: seleção positiva no ramo ancestral das linhagens Chelonioidea para 4,2% dos sítios no gene ND5 , e seleção positiva na linhagem Eretmochelys imbricata para 24% dos sítios no gene ND6 (Tabela 2 ).

Tabela 2 Posições de códons sob seleção positiva detectadas pelo modelo de local de ramificação usando codeML, FITMODEL e aBSREL para o conjunto de dados III.

Modelos de sites

Para avaliar melhor os locais sob seleção dentro de Chelonioidea, realizamos análises de seleção positiva usando modelos de locais em FITMODEL, SLAC, MEME e FUBAR (Tabela 3 ). FITMODEL recuperou três locais selecionados positivamente nos genes ATP6 e ND4 (Tabela 3 ). SLAC retornou muitos códons com altos valores de ω (> 1), mas sem assinaturas significativas de seleção positiva. Nos resultados do SLAC, a terceira posição do gene ND5 se destaca com alto valor de ω (ω = 4,06 ep  = 0,085) (Fig.  3 ). MEME revelou seleção positiva diversificada e episódica para ND4 e ND4Lem três posições de códon em linhagens dentro do ramo Chelonioidea (Tabela 3 e Tabela Suplementar S7 online). Como esperado, o teste FUBAR recuperou um padrão geral de seleção purificadora em vários códons para todos os PCGs. ND5 foi o gene com maior número de códons sob seleção purificadora (42,86%) enquanto ND6 com o menor número (10,92%). Apenas duas posições foram atribuídas com seleção positiva diversificada com testes FUBAR: o códon 3 de ND5 (PP = 0,92) e o códon 169 de ND4 (PP = 0,95) (Tabela 3 e Tabela Suplementar S8 online).

Tabela 3 Posições de códons sob seleção positiva detectadas por modelo de site usando FUBAR, MEME e FITMODEL para o conjunto de dados IV.
Figura 3
Figura 3

Assinaturas de seleção para cada códon para 13 genes mtDNA usando o método SLAC dentro da filogenia Chelonioidea (conjunto de dados IV). Seleção positiva (valores positivos) e seleção negativa (valores negativos) são mostradas. ND6 é transcrito a partir da cadeia de luz. * é a terceira posição do códon de ND5 encontrada sob seleção positiva por FUBAR e MEME.

Mudanças nas propriedades físico-químicas de aminoácidos causadas por substituições ao longo da filogenia estimadas usando TreeSAAP sugeriram uma prevalência de seleção purificadora para os três genes com uma diferença significativa na taxa de ω entre o clado Chelonioidea e outros ramos de quelônios identificados no teste de razão de dois modelos com codeML . No entanto, encontramos evidências de seleção positiva em quatro propriedades físico-químicas, com escores z globais > 3,09 ( p  < 0,001) para o gene ND1 [taxa de redução acessível ao solvente; Hidrofobicidade circundante; Poder estar no meio da alfa-hélice e constante de equilíbrio (ionização de COOH)] e em uma propriedade físico-química para o gene CYTB (tendências alfa-hélice) (Fig.  4). A análise funcional revela que a posição do 36º códon selecionada positivamente está localizada dentro do domínio catalítico para a atividade da oxidoredutase do gene da subunidade ND4 (Fig. S3 complementar online).

Figura 4
figura 4

Detecção de alterações físico-químicas significativas de aminoácidos usando TreeSAAP na filogenia Chelonioidea (conjunto de dados IV). Esta análise foi realizada nos genes que apresentam maiores valores de ω identificados pela análise codeML no clado Chelonioidea. Regiões acima do z-score de 3,09 (linha amarela) foram significativamente diferentes do que o assumido sob neutralidade. A respectiva propriedade e categoria são mostradas acima dos gráficos.

Discussão

Neste estudo apresentamos a análise mais abrangente da evolução do mitogenoma em Testudines, incluindo dados para 90 espécies, com foco na evolução molecular dos genes OXPHOS em tartarugas marinhas. Como os dados que compilamos são derivados de fontes disponíveis publicamente, nenhum representante da família Dermatemydidae foi incluído nas análises filogenéticas. Assim, a geração do mitogenoma de Dermatemys mawii é importante para alcançar uma filogenia mitocondrial completa. Além da falta desse mitogenoma, as relações filogenéticas que recuperamos eram congruentes com uma filogenia recente de quelônios baseada em 57 genomas mitocondriais completos de tartarugas 19mas com incongruências quanto às posições da linhagem Chelydridae + Dermatemyidae + Kinosternidae e da linhagem das tartarugas marinhas (Cheloniidae + Dermochelyidae) quando comparadas com filogenias recentes usando genes nucleares 30 , 31 (Fig.  5 ). Várias razões podem explicar as divergências nas relações de linhagem nas filogenias de mtDNA e nuDNA: (1) classificação de linhagem incompleta, mais comum para nuDNA do que para mtDNA devido ao menor tamanho efetivo da população do genoma do mtDNA 4 , 32 , 33 (2) disparidades com viés de sexo na dispersão e na suscetibilidade de introgressão diferencial de alelos mitocondriais versus nucleares, resultando em captura mitocondrial 33 , 34 ,35 e (3) seleção, causando convergência de traços ou diversificando sítios adaptativos 7 , 36 , 37 . A discordância entre árvores recuperadas de mitogenomas e genes nucleares já foi relatada para outros grupos de animais. Por exemplo, Li et al. 38 recuperaram diferentes topologias usando marcadores mtDNA e nuDNA na filogenia felina e se concentraram na segunda hipótese para explicar essa diferença, em que a mistura histórica e a captura mitocondrial podem ter ocorrido entre linhagens de ancestrais felinos que tiveram suas divergências há cerca de 11 milhões de anos (MYA) 38 , 39Aqui encontramos assinatura generalizada de seleção purificadora em mitogenomas quelônios, consistente com a afirmação anterior de que a seleção purificadora atua restringindo a evolução do mitogenoma para conservar a funcionalidade das proteínas OXPHOS 40mas também encontramos evidências de seleção positiva nos genes OXPHOS, reveladas pelo teste baseado em códons ao comparar linhagens de tartarugas marinhas com outras linhagens de quelônios. Além disso, alguns genes OXPHOS parecem estar sob seleção intensificada com base nos resultados RELAX (K > 1) e nos resultados codeML (ω maior em relação a outros genes devido a restrições evolutivas menos conservadoras), sugerindo que em tartarugas marinhas, esses genes experimentaram uma aceleração sobre sua evolução e essa seleção pode ser um fator que poderia explicar a discordância entre as árvores genéticas mitocondriais e nucleares. No entanto, não podemos descartar possível introgressão antiga e classificação incompleta de linhagem (ILS) como fontes plausíveis para essa divergência. Embora os efeitos de hibridização e ILS sejam mais fortes no caso de grupos com tempos de divergência consideravelmente recentes33 , processos microevolutivos também podem impactar divergências profundas 41 como a divergência da linhagem ancestral de tartarugas marinhas de seu grupo irmão não marinho 41 , que data de cerca de 66 MYA (± 30 MYA, 95% HPD) 30 , 31 , 42 . Além disso, a captura mitocondrial antiga já foi sugerida como uma explicação para topologias conflitantes das árvores nucleares e mitocondriais bem suportadas para outros grupos de tartarugas 43 , 44 , 45 e o uso de sequenciamento de espécimes históricos pode ser eficaz para destacar esse problema para o mar tartarugas.

Figura 5
figura 5

Filogenias discordantes mitocondriais e nucleares para famílias Testudines.

A análise PAML mostrou maior ω em três genes OXPHOS ( COX2 , CYTB e ND1 ) especificamente para o clado das tartarugas marinhas em relação a outras espécies de quelônios, embora não haja evidência estatisticamente significativa para a seleção positiva atuando em uma proporção maior desses genes. Além disso, nossa análise mostrou uma taxa de evolução mais rápida para todas as tartarugas para o gene ATP8, quando comparada aos outros genes, evidenciada pela análise da diversidade genética e pelos altos valores estimados de ω. Os resultados do PAML, juntamente com os sinais de intensificação da seleção indicados pelos testes RELAX, sugerem que as linhagens marinhas acumularam um número maior de alterações de aminoácidos não sinônimos do que as outras linhagens de testudines nesses genes.

A utilização de métodos e pressupostos distintos permitiu-nos explorar melhor os padrões de evolução molecular nas tartarugas marinhas. Juntos, todos os testes de seleção foram capazes de identificar 5 sítios evoluindo sob seleção positiva em quatro genes ( ATP6 , ND4 , ND4L e ND5 ) (Tabelas 2 , 3 ). Além disso, a análise aBSREL encontrou evidências de seleção diversificada episódica em 4,2% dos locais no ramo ancestral do clado Chelonioidea. No entanto, apenas os sites fortemente suportados, identificados por mais de um teste de seleção, foram considerados sob seleção positiva real. Esses sites são 169 e 181 do gene ND4 e 3 do ND5gene e foram detectados em linhagens dentro do clado Chelonioidea. Uma exceção que merece ser mencionada é o 36º sítio do gene ND4 , que foi identificado como evoluindo sob seleção positiva pelo FITMODEL e o único sítio positivamente selecionado com substituição de aminoácidos compartilhada por todas as espécies de tartarugas marinhas. Além disso, este sítio está localizado dentro de uma região funcional baseada na organização do domínio da subunidade ND4 da NADH desidrogenase (ubiquinona), sugerindo um impacto fisiológico neste gene em tartarugas marinhas.

Os três genes que mostraram evidências de evolução acelerada codificam subunidades de três complexos separados da cadeia de transporte de elétrons ( COX2 —complexo IV, CYTB —complexo III e ND1 —complexo I). Esse resultado revela que esses genes têm um excesso de substituições não sinônimas do que o esperado para a linhagem de tartarugas marinhas, diferenciando a taxa de evolução desses genes para a linhagem de tartarugas marinhas do restante das tartarugas. Muitos estudos investigaram o papel da seleção em genes mitocondriais em organismos que habitam grandes altitudes 6 , 10 , 14 , 15 , 16, mas poucos se concentraram em organismos com um estilo de vida mais ativo. Por exemplo, estudos comparando espécies voadoras e não voadoras em grupos de morcegos 46 e gafanhotos 13 encontraram sete genes positivamente selecionados ( ATP8 , COX3 , ND2 , ND4 , ND4L , ND5 e ND6 ) relacionados ao voo em gafanhotos, enquanto ND2 , ND3 , ND4L , ND4 , ND5 , ND6 e COX2 apresentaram valores mais altos de ω em morcegos 46Nossos resultados, combinados com esses estudos, sugerem que genes complexos I e IV podem ser importantes candidatos a serem impactados pela ação da seleção positiva relacionada a um estilo de vida mais ativo. Por outro lado, como em outros estudos, os genes COX1 e COX3 apresentaram os menores valores de ω e os maiores sinais de seleção purificadora 7 , 47 .

A análise TreeSaap desses genes indicou que regiões com substituições não sinônimas correspondem a mudanças radicais de aminoácidos, embora não mostrando sinais significativos de seleção positiva. Essas mudanças radicais ocorrem quando o resíduo alterado não compartilha propriedades físico-químicas semelhantes com o resíduo ancestral indicando impacto funcional significativo na proteína 48 . Vários estudos correlacionaram a variação nas propriedades dos aminoácidos nas regiões de codificação mitogenômica em várias espécies com (a) requisitos metabólicos mais especializados, como elefantes e seu grande tamanho corporal 49 , dugongos, preguiças e pangolins e sua dieta de baixa energia 50 , (b) uma maior tolerância na faixa térmica em cetáceos e pinguins 11 , 17, (c) voando em morcegos 46 , e (d) vivendo em grandes altitudes em aves galiniformes 16 e faisões alpinos 15 . Comparado a esses estudos, o mitogenoma das tartarugas marinhas mostrou menos evidências da ação penetrante da seleção natural. Este padrão era esperado porque, apesar da profunda divergência entre as espécies marinhas (pelo menos 30 MYA) 29 , estudos anteriores suportam uma razão evolutiva mais lenta e um relógio molecular mais lento para o mitogenoma quelônio 51 , 52 . Além disso, as tartarugas marinhas, como répteis ectotérmicos, são consideradas de baixa taxa metabólica, usando suas reservas energéticas mais lentamente do que as espécies endotérmicas 53Além disso, essas fracas habilidades termogênicas geralmente confinam as tartarugas marinhas, exceto D. coriacea , a águas tropicais rasas 53 , reduzindo a pressão seletiva da mudança de temperatura, uma das principais hipóteses utilizadas para explicar seus padrões de evolução do genoma mitocondrial 11 . Essas características podem explicar as poucas pegadas moleculares adaptativas neste sistema quelônio em comparação com as inúmeras mudanças moleculares já descritas para organismos endotérmicos.

Os genes OXPHOS compreendem numerosas subunidades que são codificadas tanto pelo mitogenoma quanto pelo genoma nuclear 54 , 55 . Assim, pesquisas considerando seus componentes nucleares podem contribuir para o entendimento completo da evolução dos genes OXPHOS em tartarugas marinhas 56 , 57 , 58 , 59 . Neste cenário, investigar todo o sistema OXPHOS em tartarugas é importante principalmente devido à alta incidência de hibridização entre as espécies de tartarugas marinhas 60 , 61 , 62 , 63 , 64 , 65 , 66 , 67A compatibilidade entre os componentes nucleares e mitocondriais do sistema OXPHOS é de extrema importância para a aptidão metabólica e energética ideal 54 , 55 , e o impacto desse fenômeno pode ser investigado em tartarugas híbridas. Além disso, abordagens integrando estudos de genética populacional com experimentos bioquímicos e fisiológicos podem representar um próximo passo 57 para entender a evolução do sistema OXPHOS nesses organismos.

Conclusão

Em resumo, aqui investigamos padrões evolutivos e pegadas de seleção em genes OXPHOS de tartarugas marinhas sob a hipótese de que o estilo de vida mais ativo das tartarugas marinhas poderia estar exercendo maior pressão seletiva sobre esses genes. Encontramos evidências de seleção positiva no nível de codificação para vários locais nos genes ND4 e ND5 para diferentes espécies de tartarugas marinhas, destacando um local dentro de um domínio funcional do ND4gene com sinal de seleção compartilhado por todas as espécies do clado Chelonioidea. Embora o estilo de vida ativo das tartarugas marinhas não pareça exercer forte pressão seletiva sobre os genes mitocondriais do sistema OXPHOS, os poucos genes com maiores valores de ω em comparação com outros quelônios e a maior fixação de mutações não sinônimas nesses genes encontrados para o A linhagem de tartarugas marinhas pode ser responsável pelas incongruências entre as topologias inferidas por marcadores mitocondriais ou nucleares. Nossos resultados enfatizam a importância do uso de diferentes análises ao avaliar a seleção no nível do mitogenoma. Além disso, nosso estudo fornece os primeiros insights sobre a evolução adaptativa do genoma mtDNA em tartarugas marinhas, o que pode ter facilitado a radiação bem-sucedida e a diversificação de espécies de tartarugas no ambiente marinho.

material e métodos

conjunto de dados

Recuperamos todas as sequências do genoma mtDNA de 90 tartarugas do banco de dados NCBI, compreendendo 13 das 14 famílias Testudines (Tabela Suplementar S1 online). Apenas a família Dermatemyididae não foi incluída em nossas análises devido à ausência do mitogenoma de Dermatemys mawii em bancos de dados públicos, a única espécie viva desta família. Também recuperamos 20 mitogenomas de répteis que abrangem as ordens Squamata, Aves e Crocodylia para serem usados ​​como grupos externos (Tabela Suplementar S1 online). Geramos vários alinhamentos de sequência usando MAFFT versão 7 68 , 69 . As sequências de nucleotídeos foram primeiro alinhadas, traduzidas em aminoácidos, alinhadas novamente e depois convertidas em um alinhamento de códons, usando a ferramenta PAL2NAL 70e inspecionados manualmente. Editamos manualmente essas sequências para preservar o quadro de leitura esperado (quadro 0) antes do alinhamento, pois algumas espécies com inserções e/ou deleções (indels) de deslocamento de quadro de 1 ou 2 pb no gene ND3 foram observadas por 71 . Devido a uma extensa translocação do agrupamento gênico trnH/trnS1/trnL1/nad5 em Platysternon megacephalum 72 e os sítios comuns de sobreposição entre os genes ATP8 e ATP6 encontrados no mitogenoma 19 de tartarugas , extraímos genes individuais e regiões não codificantes para todas as espécies, com base nas anotações do genoma no GenBank e nos alinhamentos de sequência para manter o tamanho correto dos genes e inferir corretamente os modelos de substituição. Todas as sequências paraND6 foram complementados reversamente devido à sua codificação pela fita reversa do mitogenoma. Essas regiões foram alinhadas individualmente e depois concatenadas, resultando em 39 partições. Quatro conjuntos de dados diferentes foram usados ​​em diferentes etapas analíticas: (I) mitogenoma completo para 110 espécies, (II) apenas genes codificadores de proteínas (PCGs) alinhados separadamente e depois concatenados para 110 espécies, (III) PCGs alinhados individualmente para 110 espécies e (IV) PCGs alinhados individualmente apenas para as sete espécies marinhas.

Para explorar os padrões de diversidade nos genes codificadores de proteínas do mtDNA para tartarugas marinhas, estimamos o número de sítios polimórficos (S) e a diversidade de nucleotídeos (π) usando o DNAsp v. 6.12.03 73 para todos os 13 PCGs mitocondriais.

Reconstrução filogenética

Usamos o software IQ-TREE v. 1.6.8 74 para reconstruir as árvores de máxima verossimilhança (ML) para todos os conjuntos de dados, com 1.000 réplicas de bootstrap ultrarrápidas para avaliar o suporte nodal 75 . Apenas nós com valores de suporte ≥ 80 foram considerados robustos. Também estimamos árvores bayesianas para os conjuntos de dados I e II usando MRBAYES v. 3.2.6 76 , aplicando os modelos particionados estimados com PARTITION FINDER v. 2.1.1 77 (Tabela Suplementar S2 online), de acordo com o Bayesian Information Criterion (BIC). A cadeia de Markov Monte Carlo (MCMC) foi executada por 5.000.000 gerações com quatro cadeias, e as árvores foram amostradas a cada 100 gerações. A convergência de parâmetros foi avaliada usando TRACER v. 1.7.1 78, após excluir 10% iniciais para cada execução. Árvores filogenéticas foram construídas usando os conjuntos de dados I e II para comparar a eficiência da presença de regiões não codificantes no conjunto de dados I na resolução da topologia nas abordagens Bayesiana e ML para ambos os conjuntos de dados.

Análises de seleção

Para testar um possível efeito da topologia na inferência dos sítios sob seleção, também realizamos as análises de seleção usando a topologia inferida com dados genômicos. Como não houve diferença, são apresentados apenas os resultados com a topologia inferida com os dados mitocondriais. Realizamos análises de seleção usando um alinhamento dos PCGs alinhados para as 110 espécies (conjunto de dados III) e um alinhamento dos PCGs alinhados apenas para os alinhamentos de 7 espécies do clado Chelonioidea (conjunto de dados IV) após a conversão em alinhamentos de códons no programa PAL2NAL 70 . Para explorar os padrões de seleção natural e identificar os locais visados ​​pela seleção positiva em cada gene de codificação mitocondrial para a linhagem de tartarugas marinhas, exploramos a variação na proporção ⍵ ( dN / dS , ondedN é a taxa de substituições não sinônimas e dS são as substituições sinônimas), em uma estrutura Bayesiana usando FUBAR do pacote HyPhy v. 2.1 79 , uma estrutura ML usando o programa codeML do PAML v. 4.9 h pacote 80 , FITMODEL v. 0.5. 3 software 81 , MEME e RELAX do pacote HyPhy v. 2.1 82 e em uma abordagem conjunta de ML e métodos de contagem em SLAC, também do pacote HyPhy 83 . Ver Spielman et al. 84 para uma comparação detalhada dos métodos de HyPhy.

Análise do modelo de filial

Para testar se o ω nas tartarugas marinhas era diferente do restante da árvore, usamos modelos de ramificação codeML no conjunto de dados III, o que permite que o ω varie entre as ramificações na filogenia 85 . codeML agrupa vários modelos diferentes, que variam em termos de suas suposições sobre como ω varia entre ramificações da filogenia (modelos de ramificação), através da sequência (modelos de local) e entre ambos (modelo de local de ramificação) 86Para modelos de ramificação, primeiro estimamos um valor único de ω para todas as ramificações ao longo da árvore com o modelo de uma razão. Então, usando o modelo de razão livre, assumimos um ω independente para cada ramo. Por fim, estimamos um ω para a linhagem de tartarugas marinhas e outro para o restante da filogenia aplicando um modelo de duas proporções. Rotulamos a superfamília Chelonioidea (linhagem de tartarugas marinhas) como o ramo de primeiro plano em cada árvore filogenética gerada para cada PCG em análises separadas, para o modelo de duas proporções e todos os modelos de local de ramificação descritos abaixo. O clado alvo para essas análises é representado em negrito na Fig.  1(clado Chelonioidea). Todos os ramos restantes, que incluem tartarugas terrestres e de água doce, não foram marcados, sendo considerados pelo algoritmo como ramos de fundo. O mesmo esquema de rótulo de ramificação foi usado em RELAX (conjunto de dados III) para inferir se a força de seleção foi intensificada (K > 1) ou relaxada (K < 1) na superfamília Chelonioidea.

Análise de modelos de filiais

Modelos de locais de ramificação foram usados ​​para determinar se alguma proporção de locais está sujeita à seleção positiva ao longo da linhagem Chelonioidea. Portanto, para análise de local de ramificação em codeML e FITMODEL, também dividimos a árvore inferida do conjunto de dados III em ramo de primeiro plano (clado Chelonioidea), onde os locais podem estar evoluindo sob seleção positiva e ramos de fundo (todas as linhagens restantes ou tartarugas não marinhas) , onde a seleção positiva está ausente 80 , 86 , 87 . No codeML, usamos o modelo A versus o modelo nulo. FITMODEL é adequado para análise exploratória e testamos se nossos dados se ajustavam aos modelos de substituição de códons aninhados M0 e M3 80 , 86 , 87Enquanto o modelo M0 assume que todos os locais em um alinhamento de sequência estão sujeitos ao mesmo processo de seleção, o modelo M3 assume a variação na restrição seletiva entre os locais e é modelado como três classes de razão de taxas com ω 1 , ω 2 e ω 3 . O FITMODEL permite comutações site-specific entre diferentes valores da razão de taxas não sinônimas/sinônimas 81 e testamos os modelos de comutação M3 + S1 e M3 + S2. Sob o teste de comutação no FITMODEL, um processo de Markov reversível no tempo com três parâmetros adicionais é modelado: a taxa geral de intercâmbio entre as classes de razão de taxa (δ), um coeficiente para deslocamentos entre ω 1 e ω 3 (α) e um coeficiente para mudanças entre ω 2e ω 3 (β). O modelo S1 impõe taxas de troca iguais entre classes de razão de taxas ω 1 , ω 2 e ω 3 (α = β = 1), enquanto o modelo S2 permite que α e β variem livremente levando em consideração taxas desiguais de trocas entre classes de seleção 81 . Por fim, aplicamos um terceiro teste de local de filial usando aBSREL (“probabilidade de efeitos aleatórios adaptativos de local de filial”) do HyPhy 88usando o conjunto de dados III. Diferentemente de codeML e FITMODEL, as taxas são calculadas para cada ramo em aBSREL, permitindo a seleção positiva em ramos de fundo. Para evitar sobreparametrização, o aBSREL infere, usando a correção do Critério de Informação de Akaike (AICc) de amostra pequena, o número ideal de categorias de tarifas por ramal, em vez de assumir que cada ramal deva ser equipado com três classes de tarifas. Além disso, os valores de p obtidos a partir de testes individuais para comparações múltiplas foram corrigidos por aBSREL usando o procedimento de Bonferroni-Holm para controlar as taxas de falso-positivo familiar 84 , 88 .

Site-modelos

Também aplicamos análise de modelo de sítio dentro da filogenia de Chelonioidea usando o conjunto de dados IV. Usamos Single-Likelihood Ancestor Counting (SLAC) 89 para obter uma visão geral das 13 assinaturas de seleção de PCGs para tartarugas marinhas. O SLAC infere as taxas de dN e dS por local usando uma combinação de ML e abordagens de contagem. Usamos um modelo de evolução de efeitos mistos (MEME) 90detectar sítios evoluindo sob seleção positiva dentro do ramo Chelonioidea. Semelhante ao FITMODEL, o MEME aplica uma estrutura filogenética de efeitos aleatórios de local de ramificação, permitindo que a distribuição de ω varie de local para local, bem como de ramo para ramo, o que permite ao MEME identificar instâncias de seleção positiva episódica e generalizada. Também usamos o software FUBAR para estimar o número de substituições não sinônimas e sinônimas em cada códon em 13 PCGs para filogenia de tartarugas marinhas, fornecendo a probabilidade posterior de cada códon pertencer a um conjunto de classes de ω (ω = 1, ω < 1 ou ω > 1) 91 . A significância foi avaliada pela probabilidade posterior (PP) > 0,95.

Para todas as análises de seleção baseadas em ML, modelos aninhados foram comparados usando o teste de razão de verossimilhança (LRT) e seus resultados foram avaliados contra com diferentes graus de liberdade de acordo com cada teste. O site da filial do CodeML e o RELAX usam uma , o MEME usa uma mistura de 0,33:0,3:0,37 de , , e , enquanto FITMODEL usa uma mistura de 0,5:0,5 e para comparações M0 × M3, M3 × M3 + S1 e M3 + S1 × M3 + S2, respectivamente. A significância para todas as análises foi estabelecida em p  < 0,05.
χ2χ12χ02χ12χ22χ22

Genes detectados com maiores valores de ω em testes codeML foram então analisados ​​em TreeSAAP v. 3.2 92 dentro da filogenia Chelonioidea (dataset IV). O TreeSAAP conta com o modelo MM01 implementado em baseML do pacote PAML 85 e usa uma filogenia para reconstruir os estados ancestrais mais prováveis ​​para as sequências genéticas sob investigação. Este software atribui valores de peso às alterações de códons não sinônimos, para os quais os efeitos físico-químicos gerais são avaliados usando um modelo com 31 propriedades físico-químicas de aminoácidos. A magnitude da mudança é classificada de 1 (mais conservadora) a 8 (mais radical). Um desvio significativo da evolução neutra é testado por meio de um escore z e interpretado como resultado da seleção positiva. Um escore z altamente significativo calculado no TreeSAAP (z > 3,09,p  < 0,01) indica mais substituições não sinônimas do que assumidas no modelo neutro 92 . Para garantir a chamada conservadora de sítios de códons selecionados positivamente, foram usadas apenas alterações de aminoácidos com pontuação entre 6 e 8 e com pontuação z positiva < 0,001 92 . Finalmente, empregamos a análise funcional de PCGs usando o recurso da Web InterPro 76.0 93 , para prever domínios de proteínas e investigar se os locais identificados sob seleção positiva estão presentes dentro ou perto de regiões funcionais.