Novo método revela alta similaridade entre o gorila e o cromossomo Y humano
Um método novo, mais barato e mais rápido agora foi desenvolvido e usado para determinar a sequência de DNA do cromossomo Y masculino específico no gorila. A técnica permitirá um melhor acesso à informação genética do cromossomo Y de qualquer espécie e, portanto, pode ser usada para estudar distúrbios de infertilidade masculina e mutações específicas do sexo masculino. Ele também pode auxiliar nos esforços de genética de conservação, ajudando a rastrear a paternidade e como os machos se movem dentro e entre as populações de espécies ameaçadas de extinção, como gorilas.
Um artigo que descreve o método e a descoberta resultante da sua utilização na comparação da sequência do gorila cromossoma Y para as sequências dos Y humanos e de chimpanzés cromossomas será publicada em 02 de março de 2016, na edição Advance Online da revista Genome Research . O artigo também será publicado na edição impressa de abril de 2016 da revista.
"Surpreendentemente, descobrimos que em muitos aspectos o cromossomo Y do gorila é mais semelhante ao cromossomo Y humano do que qualquer um dos dois é ao cromossomo Y do chimpanzé", disse Kateryna Makova, Professora de Ciências Francis R. e Helen M. Pentz na Penn State e um dos dois autores correspondentes do artigo. "Nas regiões do cromossomo onde podemos alinhar as três espécies, a similaridade de sequência se encaixa com o que sabemos sobre as relações evolutivas entre as espécies - os humanos são mais intimamente relacionados aos chimpanzés. No entanto, o cromossomo Y do chimpanzé parece ter sofrido mais mudanças no número de genes e contém uma quantidade diferente de elementos repetitivos em comparação com o humano ou gorila. Além disso, uma proporção maior das sequências Y do gorila pode ser alinhada com o cromossomo Y humano do que com o cromossomo Y do chimpanzé. "
O cromossomo Y dos mamíferos é incrivelmente difícil de sequenciar por uma série de razões. Um dos motivos é que o cromossomo Y está presente em apenas uma cópia e representa apenas cerca de um a dois por cento do material genético total encontrado em uma célula de um homem. Para reduzir essa dificuldade, os pesquisadores usaram uma técnica experimental chamada flow-sorting para selecionar preferencialmente o cromossomo Y para sequenciamento com base no tamanho do cromossomo e no conteúdo genético.
"O flow-sorting aumentou a quantidade do cromossomo Y em nosso conjunto de dados para cerca de trinta por cento", disse Paul Medvedev, professor assistente de ciência da computação e engenharia e de bioquímica e biologia molecular da Penn State, o outro autor correspondente do artigo. "Para enriquecer ainda mais nossos dados para o cromossomo Y, desenvolvemos uma técnica computacional - chamada RecoverY - para classificar os dados em sequências Y e não Y com base na frequência com que sequências semelhantes aparecem em nossos dados."
O cromossomo Y, como todo DNA, é composto de uma série de moléculas chamadas "bases" que são representadas pelas letras A, T, C e G. As tecnologias atuais de sequenciamento genético produzem "leituras" de sequência muito mais curtas do que a comprimento total do cromossomo. Essas leituras precisam ser colocadas em ordem e agrupadas encontrando lugares onde elas se sobrepõem em blocos cada vez mais longos. A equipe de pesquisa usou duas tecnologias de sequenciamento diferentes para ajudar com essa montagem da sequência de DNA do cromossomo Y.
Uma tecnologia de sequenciamento usada pelos pesquisadores produz grandes quantidades de leituras muito curtas - cerca de 150 a 250 bases de comprimento. Usando este método, os pesquisadores sequenciaram leituras suficientes para cobrir todo o comprimento do cromossomo Y cerca de 450 vezes. Os pesquisadores reuniram essas leituras curtas em blocos mais longos que depois conectaram usando a segunda tecnologia de sequenciamento que produz leituras mais longas - cerca de sete mil bases de comprimento em média.
"Ao reduzir as leituras do cromossomo não Y de nossos dados com classificação de fluxo e a técnica RecoverY que desenvolvemos, e usando essa combinação de tecnologias de sequenciamento, fomos capazes de montar o cromossomo Y do gorila para que mais da metade dos dados de sequência fossem em pedaços com mais de 100.000 bases de comprimento ", disse Medvedev.
Outra razão pela qual determinar a sequência genética do cromossomo Y é tão difícil é que ele é composto de um número excepcionalmente alto de sequências repetidas - regiões onde a sequência de As, Ts, Cs e Gs são idênticas, ou quase idênticas, para milhares ou milhões de bases em uma fileira. Muitas dessas repetições, incluindo alguns genes, aparecem como séries consecutivas da mesma sequência repetida ou como longos palíndromos que, como a palavra "carro de corrida", são lidos da mesma forma para a frente e para trás. Os pesquisadores usaram uma técnica experimental - "reação em cadeia da polimerase digital em gotículas" - para determinar o número de cópias dos genes que aparecem nessas séries.
"Sequenciar o cromossomo Y é como tentar montar um quebra-cabeça, sem saber a imagem final, de uma pilha de peças onde apenas uma em cada cem é útil, e a maioria das peças de que você precisa parecem idênticas", disse Makova. "Desenvolvemos um pipeline para sequenciar o cromossomo Y que é mais eficiente do que os métodos anteriores e reduz uma série de dificuldades associadas à determinação da sequência genética do cromossomo Y. Nosso método abrirá a porta para estudar o cromossomo Y para mais laboratórios, mais espécies e mais indivíduos dentro dessas espécies. "
Para demonstrar a utilidade da sequência do cromossomo Y do gorila que eles geraram, os pesquisadores criaram marcadores genéticos que podem ser usados para diferenciar o parentesco genético entre os gorilas machos e, assim, ajudar nos esforços de conservação genética voltados para a preservação desta espécie ameaçada.