Depois das proteínas, a IA do Google lê a matéria escura no DNA

Depois do AlphaFold , o modelo de inteligência artificial capaz de decifrar a estrutura 3D das proteínas que rendeu a John Jumper, David Baker e Damis Hassabis o Prêmio Nobel de Química de 2024 , a empresa Google DeepMind apresenta um novo modelo de IA chamado AlphaGenome . Ele foi projetado para ler a chamada "matéria escura" do DNA , ou seja, o conjunto de sequências genéticas que não codificam proteínas, mas que influenciam sua atividade . Erroneamente e por muito tempo rotuladas como "DNA lixo", essas sequências misteriosas constituem a grande maioria do DNA humano, uns bons 98%. O modelo AlphaGenome é descrito em um artigo que ainda não foi examinado pela comunidade científica. "A parte codificadora do nosso genoma, composta por cerca de 20 mil genes, agora é bem conhecida ", disse à ANSA Giuseppe Novelli, geneticista da Universidade de Roma Tor Vergata. " O restante , no entanto, é extremamente heterogêneo : uma parte é composta de DNA repetitivo , outra é composta de elementos móveis que podem mudar de posição. De qualquer forma, trata-se sempre de genes , estimados em 60 a 63 mil , que, no entanto, codificam o RNA (a molécula de fita simples relacionada ao DNA). Dada a sua enorme quantidade - sublinha Novelli - é muito importante ter uma ferramenta como esta , que possa pelo menos indicar a que família pertencem". O AlphaGenome consegue ler longas sequências de DNA, de até 1 milhão de letras , e fazer milhares de previsões sobre seu papel e os possíveis efeitos de quaisquer mutações . Em um exemplo, pesquisadores liderados por Žiga Avsec testaram o modelo com algumas mutações identificadas em pessoas afetadas por leucemia e o AlphaGenome conseguiu prever com precisão que as mutações ativariam indiretamente um gene próximo, considerado uma das causas mais comuns desse tipo de tumor. A nova IA, no entanto, ainda é limitada porque foi treinada apenas com dados de humanos e camundongos e tem dificuldades se as mutações alterarem genes localizados muito distantes. "Dado o grande desenvolvimento que os medicamentos baseados em RNA estão tendo e continuarão a ter no futuro", acrescenta Novelli, "ter uma ferramenta que nos permite prever o papel que essas moléculas desempenham também pode nos ajudar a identificar alvos potenciais para futuros medicamentos mais rapidamente ."
ansa