Connect with us

Internacional

La nueva IA de Google permite predecir variaciones de ADN implicadas en enfermedades incurables

Published

on

Parece que solo son cuatro letras. Y es mucho ms. El genoma humano es el manual de instrucciones de la vida. Sin embargo, la ciencia tan solo entenda una pequea parte: el 2% que codifica protenas. El 98% restante, denominado ADN no codificante (o incluso ADN basura), ha sido descrito a menudo como un territorio oscuro y difcil de interpretar, pese a que contiene muchas de las variantes genticas asociadas a las enfermedades. Muchas alteraciones oncolgicas y de las patologas ms raras encuentran ah su razn de ser.

Sin embargo, ahora un nuevo modelo de inteligencia artificial llamado AlphaGenome aspira a cambiar esa situacin. Desarrollado por el equipo liderado por Ziga Avsec y Natasha Latysheva, junto al vicepresidente de Google DeepMind, Pushmeet Kohli,, el sistema acaba de ser presentado ayer en sociedad a travs de la portada de la revista Nature, y ya est disponible para investigacin. Su objetivo es ambicioso: predecir cmo pequeas variaciones en la secuencia del ADN afectan a los complejos mecanismos que regulan la actividad de los genes.

Kohli situ a AlphaGenome como la evolucin lgica tras el xito de AlphaMissense y AlphaFold. Esta IA cientfica fue desarrollada por Demis Hassabis y John Jumper y presentada tambin a travs de Nature en 2020. Su impacto fue tal, que poco tiempo despus sus creadores recibieron con el Premio Nobel en 2024. Entonces la herramienta ya supuso un punto de inflexin. La comunidad cientfica calificaba sostena que iba a cambiar la medicina, la investigacin y la bioingeniera. Pero las protenas son tan solo un captulo de la historia biolgica, apuntaba Kohli en una rueda de prensa de presentacin a los medios.

Si las protenas son los ingredientes de la vida, el ADN es la receta, continuaba el vicepresidente de Google DeepMind con la descripcin del salto cualitativo que supone AlphaGenome. Aunque el Proyecto del Genoma Humano nos proporcion el libro de la vida, leerlo sigue siendo un reto. Tenemos el texto, pero an estamos descifrando la semntica. Comprender la gramtica de este genoma, lo que est codificado en nuestro ADN y cmo gobierna la vida, es la prxima frontera crtica para la investigacin.

La comunidad cientfica valora este avance muy positivamente. Jonathan Frazer, jefe de grupo en el Centro de Regulacin Genmica (CRG), confiesa que es un gran admirador de este trabajo. En los ltimos aos se ha producido un gran avance en la prediccin de los efectos de las variantes, y esta contribucin a la genmica reguladora es especialmente emocionante.

Para Llus Montoliu, investigador en el Centro Nacional de Biotecnologa (CNB-CSI C) y en el CIBERER-ISCIII, esta nueva inteligencia artificial de Google pone luz donde solo haba oscuridad. Y lo hace con un detalle, una sistematicidad y una precisin necesarios. Si bien subraya que estamos ante un trabajo complejsimo, tambin reconoce su gran utilidad dentro y fuera de los laboratorios: Nos va a ayudar muchsimo, sobre todo a completar los diagnsticos genticos de personas con enfermedades congnitas en los cuales habitualmente o bien no encontrbamos la causa o bien era muy difcil interpretarlos

Cmo consigue todo esto?

Leer y comprender qu hay en las secuencias que nos describen las combinaciones de las cuatro letras y cmo intervienen otros procesos es un desafo constante, sobre todo cuando hay fallos que se convierten en enfermedades. En la presentacin a los medios, Natasha Latysheva se centr en las aplicaciones prcticas: cmo los cientficos utilizarn la herramienta y qu la hace diferente en el laboratorio. No solo dice si una mutacin tiene un efecto, sino que predice la direccin (si aumentar o disminuir la expresin de un gen).

AlphaGenome analiza secuencias de ADN de hasta un milln de pares de bases, una escala indita hasta ahora, y genera predicciones a resolucin de letra individual. Esto le permite captar tanto los efectos locales de una mutacin como la influencia de regiones reguladoras situadas a gran distancia, algo fundamental para entender cmo se activan o silencian los genes.

Ziga Avsec enumer las ventajas tcnicas que explican por qu AlphaGenome es un salto tcnico respecto a herramientas anteriores como Enformer. Adems del volumen que puede manejar, a diferencia de modelos anteriores especializados en una sola tarea, esta herramienta modela simultneamente 11 procesos biolgicos distintos.

En cifras, la herramienta permite la prediccin simultnea de 5.930 seales genticas humanas o 1.128 procedentes de ratones relacionadas con funciones especficas, como la expresin gnica, el splicing (el corte y la reorganizacin de genomas) y la modificacin de protenas. Los resultados igualan o superan el rendimiento de los modelos ms avanzados existentes en 25 de las 26 evaluaciones de predicciones de efectos de variantes, como el mencionado Enformer. Su punto fuerte radica en la capacidad de realizar mltiples predicciones sobre una serie de seales genticas y resultados biolgicos simultneamente, subrayaron los investigadores.

Ilustraci

Ilustracin deJosetxu L. Pieiro

De hecho, Frazer destaca tambin estas ventajas del modo multimodal, que combinado con una longitud de contexto tan grande, lo convierte en una herramienta valiosa para el descubrimiento.

Entender el lado oscuro del genoma

Esto marca la diferencia clave: AlphaGenome se adentra de lleno en el ADN no codificante. El modelo predice miles de propiedades moleculares: dnde empiezan y terminan los genes, cmo se procesa el ARN, cunta expresin gnica se produce, qu regiones del ADN estn accesibles o qu protenas se unen a ellas. Para entrenarlo, los investigadores recurrieron a grandes consorcios pblicos como ENCODE, GTEx, 4D Nucleome y FANTOM5, que han recopilado datos experimentales de cientos de tipos celulares, tejidos humanos y de ratn.

Gracias a las mejoras arquitectnicas, el modelo logra este salto sin disparar los costes computacionales. De hecho, entrenar AlphaGenome requiri aproximadamente la mitad del presupuesto de clculo utilizado para Enformer.

Uno de sus avances ms destacados es el modelado explcito de las uniones de splicing, un proceso clave en numerosas enfermedades genticas raras. Hasta ahora, este fenmeno era especialmente difcil de predecir directamente a partir de la secuencia del ADN. Natasha Latysheva explic que reemplaza el kit de herramientas fragmentado (un modelo para splicing, otro para expresin, otro para estructura 3D) por un marco de trabajo nico y ms amigable.

Uno de los investigadores, Ziga Avsec, cont cmo fue ese momento eureka en el que el gran avance dio el salto definitivo al descubrir cmo romper la barrera entre secuencias largas y alta resolucin mediante el entrenamiento en mltiples GPUs y la destilacin de modelos.

Los autores muestran el potencial del modelo con un ejemplo concreto: una mutacin asociada a la leucemia linfoblstica aguda de clulas T. AlphaGenome predijo que dicha mutacin activaba el gen TAL1 al introducir un motivo de unin para la protena MYB, reproduciendo con precisin el mecanismo patolgico ya conocido. Es un hito para el campo, afirma Caleb Lareau, del Memorial Sloan Kettering Cancer Center.

Montoliu manifiesta que tener acceso al detalle genmico marca un punto de inflexin en el diagnstico y tratamiento de las enfermedades. Hay que conocer los elementos reguladores de los genes cuando estn mutados, pues pueden ser causa de una patologa, explica el investigador del CNB-CSIC, ya que en las enfermedades de base gentica, no solamente las mutaciones estn dentro de los genes, sino que estn tambin alrededor de esos elementos reguladores.

Las limitaciones de AlphaGenome

Pese a sus avances, los propios investigadores subrayan las limitaciones del sistema. AlphaGenome no est diseado para la prediccin del genoma personal ni para uso clnico directo, y no puede explicar por s solo cmo una variante gentica desemboca en enfermedades complejas que dependen tambin de factores ambientales y de desarrollo.

Natasha Latysheva admiti que la genmica es ms confusa y desordenada que el plegamiento de protenas, y que el modelo es mejor prediciendo efectos cuando tiene alta confianza, aunque los falsos negativos siguen siendo un reto.

Desde el CRG, Frazer tambin ayuda a poner los pies en el suelo ante las expectativas que pueda levantar la nueva herramienta. Si vemos todo el campo en su conjunto, an no han alcanzado el objetivo final de la prediccin del genoma personal, por lo que es importante sealar que la utilidad clnica de estos modelos sigue siendo algo limitada. No obstante, parece un gran paso en la direccin correcta, certifica. Tambin, resumen los responsables que se podran realizar ms mejoras para ampliar las aplicaciones de esta herramienta, como aumentar la cobertura de especies o ampliar la gama de secuencias no codificantes que conoce el modelo.

Sin embargo, la verdadera potencia de este avance reside en su accesibilidad: AlphaGenome no se ha quedado bajo llave en los servidores de Google. En un ejercicio de ciencia abierta, el equipo ha liberado el modelo, sus pesos y una herramienta digital que ya utilizan ms de 3.000 cientficos en todo el mundo. Esta democratizacin permite que laboratorios sin grandes recursos computacionales puedan investigar enfermedades raras o disear nuevas terapias gnicas en igualdad de condiciones.

Para el vicepresidente de Google DeepMind, el siguiente objetivo es predecir con alta precisin el efecto de cualquier mutacin en el genoma. Con AlphaGenome, la inteligencia artificial no solo da un paso ms hacia uno de los grandes objetivos de la biologa moderna, sino que entrega las llaves de este conocimiento a toda la humanidad para comprender, por fin, cmo el ADN dicta el funcionamiento de la vida.


source

Please follow and like us:
Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Facebook