segunda-feira, 27 de junho de 2022

 

Montagem de sequência de leitura longa do genoma do gorila

CIÊNCIA
1 de abril de 2016
Vol. 352 , Edição 6281

Melhorando o genoma do gorila

O acesso a genomas completos e de alta qualidade de primatas não humanos também nos ajudará a entender a biologia humana. Gordon et ai. usou a tecnologia de sequenciamento de leitura longa para melhorar os dados do genoma em nosso parente próximo, o gorila. O sequenciamento de um único indivíduo diminuiu a fragmentação de montagem e recuperou genes anteriormente perdidos e loci não codificantes. O mapeamento de sequências de leitura curta de gorilas adicionais ajudou a reconstruir uma sequência de gorilas “pan” documentando a variação genética. A comparação com genomas humanos revelou diferenças específicas da espécie variando em tamanho de uma a milhares de bases de comprimento, incluindo algumas que provavelmente afetarão a regulação dos genes.
Ciência , esta edição p. 10.1126/science.aae0344

Resumo Estruturado

INTRODUÇÃO

A sequência precisa e a montagem dos genomas são fundamentais para nossa compreensão da evolução e da variação genética. Apesar dos avanços na tecnologia de sequenciamento de leitura curta que diminuíram o custo e aumentaram o rendimento, a montagem do genoma inteiro de genomas de mamíferos permanece problemática devido à presença de DNA repetitivo.

JUSTIFICATIVA

O objetivo deste estudo foi sequenciar e montar o genoma do gorila das planícies ocidentais usando principalmente a tecnologia de sequenciamento de molécula única em tempo real (SMRT) e um novo algoritmo de montagem que aproveita as leituras de sequências longas (> 10 kbp). Comparamos especificamente as propriedades desse conjunto com conjuntos de genoma de gorilas que foram gerados usando mais abordagens de leitura de sequência curta de rotina para determinar o valor e o impacto biológico de um conjunto de genoma de leitura longa.

RESULTADOS

Geramos uma sequência shotgun de genoma completo SMRT de 74,8 vezes a partir de DNA de sangue periférico isolado de um gorila de planície ocidental ( Gorilla gorilla gorilla) chamada Susie. Aplicamos um algoritmo de montagem de grafos de string, Falcon, e algoritmo de consenso, Quiver, para gerar um assembly de 3,1 Gbp com um contig N50 de 9,6 Mbp. Dados de sequência de leitura curta de mais seis genomas de gorilas foram mapeados para reduzir erros de indel e melhorar a precisão da montagem final. Estimamos que 98,9% da eucromatina do gorila foi montada em 1854 sequências contig. A montagem representa uma melhoria na contiguidade: >800 vezes em relação à montagem publicada do genoma do gorila e >180 vezes em relação a uma atualização mais recente da montagem do gorila. A maioria das lacunas de sequência estão agora fechadas, aumentando consideravelmente o rendimento de modelos genéticos completos. Estimamos que 87% dos exons ausentes e 94% dos genes incompletos sejam recuperados. Descobrimos que a sequência da maioria das repetições comuns completas é resolvida, com os ganhos mais significativos ocorrendo para os retrotransposons mais longos e ricos em G+C. Embora regiões complexas, como o locus de histocompatibilidade principal, sejam sequenciadas e montadas com precisão, tanto a heterocromatina quanto as duplicações segmentares grandes e de alta identidade não são porque os comprimentos de leitura são insuficientemente longos para atravessar essas estruturas repetitivas. A montagem de leitura longa produz um mapa muito mais fino de variação estrutural até 50 bp de comprimento, facilitando a descoberta de milhares de diferenças de variantes estruturais específicas da linhagem que ocorreram desde a divergência das linhagens humanas e de chimpanzés. Isso inclui a ruptura de genes específicos e a perda de regiões reguladoras previstas entre as duas espécies.

CONCLUSÃO

A montagem do genoma que resulta do uso dos dados de leitura longa fornece uma imagem mais completa do conteúdo do gene, variação estrutural e biologia de repetição, melhorando as inferências genéticas e evolutivas da população. A tecnologia de sequenciamento de leitura longa agora torna prático para laboratórios individuais gerar genomas de referência de alta qualidade para genomas complexos de mamíferos.
Montagem de sequência de leitura longa do genoma do gorila.
A ) Susie, uma fêmea de gorila de planície ocidental, foi usada como amostra de referência para o sequenciamento e montagem do genoma completo [fotografia cortesia de Max Block]. B e C ) Um mapa de árvore representando as diferenças na fragmentação dos conjuntos de genoma de gorilas de leitura longa e leitura curta. Os retângulos são os maiores contigs que compõem cumulativamente 300 Mbp (~10%) da montagem.
ABRIR NO VISUALIZADOR

Abstrato

A sequência e montagem precisas de genomas é um primeiro passo crítico para estudos de variação genética. Geramos uma montagem de alta qualidade do genoma do gorila usando uma única molécula, tecnologia de sequência em tempo real e um algoritmo de montagem de novo de gráfico de string. A nova montagem melhora a contiguidade em duas a três ordens de magnitude em relação a montagens lançadas anteriormente, recuperando 87% dos exons de referência ausentes e modelos de genes incompletos. Embora regiões de grandes duplicações segmentares de alta identidade permaneçam em grande parte não resolvidas, essa montagem abrangente fornece uma nova visão biológica da diversidade genética, variação estrutural, perda de genes e representação de estruturas repetidas dentro do genoma do gorila.

Nenhum comentário:

Postar um comentário

Observação: somente um membro deste blog pode postar um comentário.