Decifrando o Genoma: Desvendando os mistérios do ‘unknome’

Por , em 12.08.2023

Iniciado em 1990, o Projeto Genoma Humano revelou sua primeira leitura da sequência de DNA humano com grande entusiasmo em 2000. O genoma humano foi declarado essencialmente completo em 2003, mas levou quase 20 anos a mais antes que a versão final e completa fosse divulgada.

Isso não marcou o fim do quebra-cabeça genético da humanidade, no entanto. Um novo estudo mapeou a ampla lacuna entre a leitura de nossos genes e a compreensão deles. Vastas partes do genoma – áreas que os autores do estudo apelidaram de “Unknome” – são compostas por genes cuja função ainda não conhecemos.

Isso tem implicações importantes para a medicina: os genes são as instruções para criar os blocos de construção proteicos do corpo. Muitos desses genes ainda envoltos em mistério podem ter significado médico profundo e podem ser a chave para distúrbios do desenvolvimento, câncer, neurodegeneração e muito mais.

O estudo torna bem claro quantos genes importantes sabemos pouco ou nada a respeito. Ele estima que um quinto dos genes humanos com uma função vital ainda são praticamente um mistério. A boa notícia é que a pesquisa também descreve como os cientistas podem se concentrar nesses genes misteriosos. “Poderíamos estar agora no início do fim do Unknome”, diz Matthew Freeman, da Escola de Patologia Dunn da Universidade de Oxford, um coautor do estudo.

A equipe de pesquisa usou duas ferramentas para encontrar as lacunas em nosso conhecimento. Primeiro, usando a infinidade de bancos de dados existentes de informações genéticas, eles compararam os códigos genéticos de várias espécies diferentes para revelar genes que se assemelham vagamente.

Essas variações genéticas, conhecidas como genes conservados, são significativas mesmo que não entendamos o que eles fazem, pois a natureza tende a conservar a mesma maquinaria genética para funções importantes em diferentes organismos. “A única coisa em que poderíamos ter confiança é que, se fossem importantes, esses genes seriam bastante conservados ao longo da evolução”, diz Freeman.

Depois de identificar elementos genéticos análogos em vermes, humanos, moscas, bactérias e outros organismos, os pesquisadores puderam examinar o que se sabia sobre a função desses genes claramente importantes e atribuir pontuações de acordo, com uma alta pontuação de “conhecimento” refletindo uma compreensão sólida.

Devido à grande quantidade de informações genéticas já disponíveis em centenas de genomas e registradas de maneira padronizada, foi possível automatizar esse processo de pontuação. “Então, perguntamos quantos desses [genes conservados] têm uma pontuação menor que um, onde essencialmente não sabemos nada sobre eles”, diz Freeman. “Para nossa surpresa, duas décadas após o primeiro genoma humano, ainda é um número extraordinário.”

No total, o número de genes humanos com uma pontuação de conhecimento igual ou inferior a 1 é atualmente 1.723 de um total de 19.664.

Da mesma forma, os 10 principais genes identificados pela equipe ao explorar bancos de dados genéticos correspondiam a “todos os genes mais famosos, o que é tranquilizador”, diz Sean Munro do Laboratório de Biologia Molecular em Cambridge, um coautor do estudo. “Reconhecemos todos eles, e já existem milhares de artigos sobre cada um deles.”

Quanto ao grande número de genes desconhecidos, a equipe conduziu um estudo adicional, utilizando o organismo mais compreendido (ao nível genético) de todos: Drosophila melanogaster. Essas moscas-das-frutas têm sido objeto de pesquisa há mais de um século, pois são fáceis e baratas de criar, possuem um ciclo de vida curto, produzem muitos descendentes e podem ser geneticamente modificadas de várias maneiras.

A equipe usou a edição de genes para reduzir a atividade de cerca de 300 genes com baixa pontuação encontrados em humanos e moscas-das-frutas. “Descobrimos que um quarto desses genes desconhecidos eram letais – quando desativados, as moscas morriam, e ainda assim ninguém sabia nada sobre eles”, diz Freeman. “Outros 25 por cento deles causaram mudanças nas moscas – fenótipos – que pudemos detectar de muitas maneiras.” Esses genes estavam relacionados à fertilidade, desenvolvimento, locomoção, controle de qualidade de proteínas e resistência ao estresse. “O fato de tantos genes fundamentais não serem compreendidos foi surpreendente”, diz Freeman. É possível que variações nesses genes possam ter impactos significativos na saúde humana.

Todas essas informações de “unknomia” estão contidas em um banco de dados, que a equipe está disponibilizando para que outros pesquisadores possam usá-lo para descobrir nova biologia. O próximo passo pode ser passar os dados desses genes misteriosos e as proteínas que eles criam para a IA.

O AlphaFold da DeepMind, por exemplo, pode fornecer insights importantes sobre o que as proteínas misteriosas fazem, especialmente ao revelar como elas interagem com outras proteínas, diz Alex Bateman do Instituto Europeu de Bioinformática, sediado perto de Cambridge, Reino Unido. A criomicroscopia eletrônica, que é uma forma de produzir imagens de moléculas grandes e complexas, também contribui para esse esforço. E uma equipe da University College London mostrou uma maneira sistemática de usar a aprendizagem de máquina para descobrir o que as proteínas fazem em leveduras.

O Unknome é incomum porque é um banco de dados de biologia que diminuirá à medida que o compreendermos melhor. O artigo mostra que, na última década, “passamos de 40 por cento para 20 por cento do proteoma humano tendo um certo nível de desconhecimento”, diz Bateman. No entanto, dadas as taxas de progresso atuais, entender as funções de todos os genes codificadores de proteínas humanas pode levar mais de meio século, estima Freeman.

A descoberta de que muitos genes permanecem incompreendidos reflete o que é chamado de “efeito do lampião” ou o “princípio da busca do bêbado”, um viés observacional que ocorre quando as pessoas procuram algo apenas onde é mais fácil procurar. Neste caso, isso causou o que Freeman e Munro chamam de “viés na pesquisa biológica em direção ao já estudado”.

O mesmo vale para os pesquisadores, que tendem a obter financiamento para pesquisas em áreas relativamente bem compreendidas, em vez de se aventurar no que Freeman chama de “terra incógnita”. É por isso que o banco de dados é tão importante, explica Munro – ele combate a economia da academia, que evita coisas que são muito pouco compreendidas. “Existe a necessidade de um tipo diferente de apoio para lidar com essas incógnitas”, diz Munro.

Mas mesmo com o banco de dados à disposição dos pesquisadores, ainda haverá alguns pontos cegos no conhecimento. O estudo focou principalmente em genes responsáveis ​​pela síntese de proteínas. No entanto, nas últimas duas décadas, áreas inexploradas do genoma foram encontradas para abrigar códigos de pequenos RNAs, que influenciam outros genes e desempenham papéis críticos no desenvolvimento normal e nas funções corporais. Dentro do genoma humano, “desconhecidos desconhecidos” podem ainda estar à espreita.

Por enquanto, há muito território inexplorado, e Freeman espera que este trabalho inspire outros a se aventurarem no reino desconhecido da genética. Ele afirma: “O Unknome oferece território não explorado mais do que suficiente para quem deseja explorar aspectos genuinamente novos da biologia.” [Wired]

Deixe seu comentário!