Os pesquisadores do Google DeepMind conseguiram catalogar 71 milhões de mutações genéticas. O programa também conseguiu classificá-los, constatando que um terço poderia modificar o funcionamento das proteínas, gerando patologias graves.
Descobrir as causas fundamentais das doenças é um dos maiores desafios da genética humana. Com milhões de mutações possíveis e dados experimentais limitados, continua a ser uma tarefa árdua descobrir quais delas podem levar a doenças. Esse conhecimento é crucial para o rápido diagnóstico e desenvolvimento de tratamentos.
Para ajudar nessa tarefa, o Google DeepMind, empresa de inteligência artificial da Alphabet, desenvolveu um catálogo de mutações «sem sentido» (missense variants, em inglês) da ferramenta AlphaMissense; um novo modelo de IA capaz de classificar este tipo de mutações genéticas.
Mutações sem sentido são mutações genéticas que podem afetar a função das proteínas humanas. Em alguns casos, podem causar doenças como fibrose cística, anemia falciforme ou câncer.
As ferramentas de inteligência artificial que podem prever com precisão o efeito das mutações têm o poder de acelerar a investigação em campos que vão da biologia molecular à genética clínica e estatística. Experimentos para descobrir mutações causadoras de doenças são caros e trabalhosos: cada proteína é única e cada experimento deve ser planejado separadamente, o que pode levar meses. Usando previsões de IA, os pesquisadores podem visualizar resultados de milhares de proteínas de uma só vez, ajudando a priorizar recursos e acelerar estudos mais complexos.
Como AlphaMissense classifica mutações
AlphaMissense é baseado no modelo AlphaFold criado pela mesma empresa. Este modelo previu estruturas para quase todas as proteínas conhecidas pela ciência, com base nas suas sequências de aminoácidos, e foi considerado um dos maiores avanços na biologia computacional.
O novo modelo adaptado pode prever a patogenicidade de mutações sem sentido que alteram aminoácidos individuais de proteínas.
Para treinar o AlphaMissense, o AlphaFold foi ajustado a rótulos que distinguem mutações observadas em populações humanas e de primatas intimamente relacionadas. As mutações comumente observadas são tratadas como benignas e as mutações que nunca são observadas são tratadas como patogênicas.
AlphaMissense não prevê a mudança na estrutura da proteína após uma mutação ou outros efeitos na estabilidade da proteína. Em vez disso, utiliza bases de dados de sequências de proteínas relacionadas e contexto estrutural de mutações para produzir uma pontuação entre 0 e 1 que classifica aproximadamente a probabilidade de uma variante ser patogênica. A pontuação contínua permite que os usuários escolham um limite para classificar mutações como patogênicas ou benignas que coincidam aos seus requisitos de precisão.
Desta forma, o modelo seria capaz de alcançar previsões de última geração através de uma ampla gama de benchmarks genéticos e experimentais, tudo sem treinar explicitamente tais dados.
Conforme explicado no site DeepMind, «a ferramenta superou outros métodos computacionais quando usada para classificar mutações do ClinVar, um arquivo público de dados sobre a relação entre mutações humanas e doenças. “O modelo também foi o método mais preciso para prever resultados laboratoriais, mostrando que é consistente com diferentes formas de medir a patogenicidade».
As previsões da Alphabet foram disponibilizadas gratuitamente à comunidade de pesquisa, e a empresa deixou o código do modelo aberto para AlphaMissense.
Fontes: