Una nueva herramienta de inteligencia artificial clasifica los efectos de diversas mutaciones

Noticias

Investigadores de Google DeepMind lograron catalogar 71 millones de mutaciones genéticas. El programa también pudo clasificarlas, encontrando que un tercio podría modificar el funcionamiento de las proteínas generando patologías graves.

Descubrir las causas fundamentales de las enfermedades es uno de los mayores desafíos de la genética humana. Con millones de posibles mutaciones y datos experimentales limitados, sigue siendo una tarea ardua descubrir cuáles podrían dar lugar a enfermedades. Este conocimiento es crucial para un diagnóstico rápido y el desarrollo de tratamientos.

En pos de ayudar en esta tarea, Google DeepMind, la empresa de inteligencia artificial de Alphabet, desarrolló un catálogo de mutaciones «contrasentido» (missense variants, en inglés)  a partir de la herramienta AlphaMissense; un nuevo modelo de IA capaz de clasificar este tipo de variantes genéticas.

Las variantes contrasentido son mutaciones genéticas que pueden afectar la función de las proteínas humanas. En algunos casos, pueden provocar enfermedades como la fibrosis quística, la anemia falciforme o el cáncer.

Las herramientas de inteligencia artificial que pueden predecir con precisión el efecto de las variantes tienen el poder de acelerar la investigación en campos que van desde la biología molecular hasta la genética clínica y estadística. Los experimentos para descubrir mutaciones que causan enfermedades son costosos y laboriosos: cada proteína es única y cada experimento debe diseñarse por separado, lo que puede llevar meses. Al utilizar predicciones de IA, los investigadores pueden obtener una vista previa de los resultados de miles de proteínas a la vez, lo cual ayudar a priorizar recursos y acelerar estudios más complejos.

Cómo AlphaMissense clasifica las variantes

AlphaMissense se basa en el modelo AlphaFold creado por la misma empresa. Este modelo predijo estructuras para casi todas las proteínas conocidas por la ciencia, a partir de sus secuencias de aminoácidos y fue considerado uno de los mayores avances de la biología computacional.

El nuevo modelo adaptado, puede predecir la patogenicidad de variantes contrasentido que alteran aminoácidos individuales de proteínas.

Para entrenar AlphaMissense, se ajustó a AlphaFold en etiquetas que distinguen las variantes observadas en poblaciones humanas y de primates estrechamente relacionados. Las variantes que se ven comúnmente se tratan como benignas y las variantes que nunca se ven se tratan como patógenas.

AlphaMissense no predice el cambio en la estructura de la proteína tras una mutación u otros efectos sobre la estabilidad de la proteína. En cambio, aprovecha bases de datos de secuencias de proteínas relacionadas y contexto estructural de variantes para producir una puntuación entre 0 y 1 que califica aproximadamente la probabilidad de que una variante sea patógena. La puntuación continua permite a los usuarios elegir un umbral para clasificar variantes como patógenas o benignas que coincida con sus requisitos de precisión.

De esta forma, el modelo sería capaz de lograr predicciones de última generación en una amplia gama de puntos de referencia genéticos y experimentales, todo ello sin entrenar explícitamente dichos datos.

Según explican en el sitio web de DeepMind, «la herramienta superó a otros métodos computacionales cuando se utilizó para clasificar variantes de ClinVar, un archivo público de datos sobre la relación entre variantes humanas y enfermedades. El modelo también fue el método más preciso para predecir resultados de laboratorio, lo que demuestra que es consistente con diferentes formas de medir la patogenicidad».

Las predicciones de Alphabet fueron puestas a disposición de la comunidad de investigación de forma gratuita y la empresa ha dejado abierto el código del modelo para AlphaMissense.

Fuentes:

Deepmind

Please follow and like us: