La Real Academia Sueca de Ciencias otorgó la mitad del Premio Nobel de Química 2024 al estadounidense David Baker, por haber logrado la hazaña casi imposible de construir tipos de proteínas completamente nuevos con computadoras, y la otra mitad al británico Demis Hassabis y al estadounidense John Jumper, por predecir las estructuras complejas de las proteínas con un modelo de inteligencia artificial (IA).
Thank you for reading this post, don't forget to subscribe!Químicos de todo el mundo llevan medio siglo soñando con comprender y dominar por completo las herramientas químicas de la vida: las proteínas. Con ellas se conforman los diferentes tipos de tejidos, células y moléculas que forman los organismos vivos y su enorme diversidad.
Los hoy galardonados lograron predecir sus estructuras y diseñar nuevas formas de las proteínas que están constituidas generalmente por 20 aminoácidos diferentes que se pueden combinar de infinitas maneras.
Utilizando la información almacenada en el ADN como modelo, los aminoácidos se unen entre sí en nuestras células para formar largas cadenas. Son los ladrillos químicos básicos de todos los compuestos químicos.
Cuando se forma la cadena de aminoácidos esta se retuerce y se pliega en una estructura tridimensional específica y compleja; esta configuración es la que da su función a las proteínas.
Algunas se convierten en bloques químicos que pueden crear músculos, cuernos o plumas, mientras que otras pueden convertirse en hormonas, anticuerpos o medicamentos. Muchas de ellas forman enzimas, que impulsan las reacciones químicas de la vida con precisión asombrosa.
Químicos de todo el mundo llevan medio siglo soñando con comprender y dominar por completo las herramientas químicas de la vida: las proteínas.
“El potencial de sus descubrimientos es enorme”, dice la Academia Sueca. Han superado importantes desafíos de la bioquímica moderna que impactan diversos campos como la medicina, farmacéutica, nutrición, cosmética, materiales y muchos otros, en resumen, benefician a la humanidad.
En 2003, David Baker (62 años), investigador de la Universidad de Washington, logró utilizar estos bloques para diseñar con programas de computadoras o software, una nueva proteína que no se parecía a ninguna otra y con funciones completamente distintas.
Demis Hassabis (48 años) y John Jumper (39 años), quienes trabajan en la empresa DeepMind de Google, en Reino Unido, usaron la poderosa herramienta de la inteligencia artificial para lograr algo complicado y que químicos de todo el mundo habían buscado desde mucho tiempo: diseñar estructuras de las proteínas a partir de secuencias de aminoácidos.
La estructura de las proteínas
Desde el siglo XIX los químicos sabían que las proteínas son importantes para los procesos vitales, pero no fue sino hasta la década de 1950 que los investigadores comenzaron a explorar a las proteínas con más detalle gracias al uso de la cristalografía de rayos X, con la que se obtvieron los primeros modelos tridimensionales de proteínas.
Entre la comunidad científica del siglo XX existía la duda sobre si la estructura de las proteínas era única o era un proceso que ocurría al azar, pero, al hacer un cálculo con el plegamiento al azar, se dieron cuenta que se necesitaría más tiempo que la edad del Universo para encontrar la estructura proteica correcta en un laboratorio, mientras que a una célula eso le toma unos cuantos milisegundos.
Para dilucidar este planteamiento, en un experimento lograron plegar y desplegar una proteína en varias ocasiones y observaron que cada vez asumía exactamente la misma forma. Un simple cálculo de una proteína formada por una cadena de 100 aminoácidos arroja, por lo menos, 1047 estructuras tridimensionales diferentes.
Por ello, determinaron que la compleja estructura tridimensional de una proteína está gobernada completamente por la secuencia de los aminoácidos. De ahí surgió una nueva pregunta: ¿La manera en cómo se pliega esta cadena era un proceso predeterminado por la misma secuencia de aminoácidos? o, dicho de otra manera, ¿es posible predecir la estructura tridimensional de las proteínas si se conoce esa secuencia?
La predicción de estas estructuras de las proteínas es uno de los desafíos más importantes de la bioquímica moderna.
La predicción de las complejas estructuras tridimensionales de las proteínas es uno de los desafíos más importantes de la bioquímica moderna.
El reto de la predicción con IA
Hace 30 años, científicos de varios países interesados en este campo de investigación se unieron para iniciar el proyecto llamado Evaluación Crítica de la Predicción de las Estructura de las Proteínas (CASP, por sus siglas en inglés); el objetivo era alentar un desarrollo más rápido en el campo, a través de una competencia: Cada dos años, investigadores de todo el mundo tenían acceso a secuencias de aminoácidos en proteínas, cuyas estructuras se mantenían en secreto para los participantes.
El reto consistía en predecir las estructuras de esas proteínas basándose en las secuencias de aminoácidos conocidas. El CASP atrajo la atención de cientos de investigadores de todo el mundo, ya que resolver el problema de la predicción resultó increíblemente difícil.
David Baker (Seattle, 1962) inició sus estudios en filosofía y ciencias sociales en la Universidad de Harvard, sin embargo, durante un curso de biología evolutiva se encontró con la primera edición del libro de texto clásico sobre las células llamado Biología Molecular de la Célula, que le influyó para cambiar su interés académico y, con el tiempo, quedó fascinado por las estructuras de las proteínas.
En 1993, como jefe de grupo en la Universidad de Washington, en su ciudad natal, decidió asumir el gran reto de la bioquímica. Mediante ingeniosos experimentos, comenzó a explorar cómo hacen las proteínas para plegarse de formas tan complejas. Esto le proporcionó conocimientos que llevó consigo cuando, a finales de los años 90, comenzó a desarrollar un software informático que llamó Rosetta, que podía predecir las estructuras de las proteínas.
Baker participó en la competencia CASP en 1998 usando Rosetta y, en comparación con otros participantes, tuvo un desempeño muy bueno. Luego de este éxito Baker se planteó usar su software a la inversa: en lugar de ingresar secuencias de aminoácidos y obtener estructuras de proteínas, ingresó una estructura de proteína deseada y Rosetta sugirió la secuencia de aminoácidos. Esto permitió crear una proteína completamente nueva llamada Top7.
El campo del diseño de “proteínas a medida” con nuevas funciones comenzó a despegar a fines de la década de 1990 y se le conoce como diseño de novo. Top7 fue una sorpresa para los investigadores que trabajaban en el diseño de proteínas.
Quienes anteriormente habían creado proteínas de novo solo habían podido imitar estructuras existentes y la estructura única de Top7 no existía en la naturaleza. Además, con sus 93 aminoácidos, era la proteína más grande que cualquier otra conocida.
Baker publicó su descubrimiento en 2003 y fue el primer paso de las muchas proteínas espectaculares creadas en su laboratorio, algo que puede describirse como un desarrollo extraordinario.
Olimpiadas de las proteínas
A los cuatro años, Demis Hassabis (Londres, 1976), comenzó a jugar al ajedrez y alcanzó el nivel de maestro a los 13. En su adolescencia, inició una carrera como programador y desarrollador de videojuegos. Empezó a explorar la IA y se dedicó a la neurociencia, campo en el que hizo varios descubrimientos.
Lo que aprendió sobre el cerebro le sirvió para desarrollar mejores redes neuronales para la IA. En 2010, con 34 años de edad, cofundó DeepMind, una empresa pionera en el desarrollo de modelos de IA para juegos de mesa populares.
En 2016 la empresa llamó la atención mundial cuando logró lo que muchos creían que era imposible para la IA: vencer al campeón de uno de los juegos de mesa más antiguos y difíciles del mundo, el Go.
Pero para Hassabis, el Go no era el objetivo sino el medio para desarrollar mejores modelos de inteligencia artificial. Decidió abordar problemas de mayor importancia y complejidad, por lo que en 2018, se inscribió en la decimotercera competencia CASP.
El modelo de IA desarrollado por Hassabis llamado AlphaFold obtuvo una victoria inesperada. En años anteriores, las estructuras de proteínas que los investigadores predijeron secuencias en CASP con una precisión del 40 %, en el mejor de los casos. Con AlphaFold, el equipo de Hassabis alcanzó casi el 60 %, pero la solución aún no era lo suficientemente buena. Para tener éxito, la predicción debía tener una precisión del 90 % en comparación con la estructura objetivo.
“Si he visto más lejos, ha sido subiéndome a hombros de gigantes”: David Baker, premio nobel de química 2024.
Hassabis y su equipo continuaron desarrollando su programa, pero, por mucho que lo intentaban, su algoritmo nunca llegaba a su objetivo, hasta que se incorporó al equipo John Jumper con nuevas ideas decisivas.
La fascinación de John Jumper (Little Rock, 1985) por el universo hizo que estudiara física y matemáticas. Sin embargo, en 2008, cuando empezó a trabajar en una empresa que utilizaba supercomputadores para simular proteínas y su dinámica, se dio cuenta de que sus conocimientos en física le podrían ayudar a resolver interrogantes médicas.
Así, en sus estudios de doctorado en física teórica mantuvo su interés por la proteínas, por lo que desarrolló métodos más sencillos e ingeniosos para simular su dinámica. En 2017, había terminado su doctorado cuando escuchó rumores de que DeepMind Google había comenzado, en secreto, a predecir las estructuras de las proteínas. Su experiencia en simulación de proteínas le permitió tener ideas creativas sobre cómo mejorar AlphaFold.
La nueva versión, AlphaFold2, se vio influida por el conocimiento de Jumper sobre las proteínas e incorporó los avances más recientes en redes neuronales transformadoras, que pueden encontrar patrones en enormes cantidades de datos de una manera más flexible y eficiente.
El equipo entrenó a AlphaFold2 con la vasta información de las bases de datos de todas las estructuras de proteínas y secuencias de aminoácidos conocidas, y la nueva arquitectura basada en IA comenzó a ofrecer buenos resultados.
En 2020, cuando los organizadores de CASP evaluaron los resultados de su competencia, comprendieron que el desafío de 50 años de la bioquímica había terminado. En la mayoría de los casos, AlphaFold2 funcionó casi tan bien como la cristalografía de rayos X, con una precisión de casi el 90 %, lo cual fue asombroso.
Cuando uno de los fundadores de CASP, John Moult, concluyó la competencia el 4 de diciembre de 2020, se preguntó: ¿y ahora qué?
“La tarea de mi vida ha sido buscar aplicaciones de la inteligencia artificial que mejoren la vida de las personas y, en concreto, que aceleren los descubrimientos científicos”, Demis Hassabis, premio nobel de química 2024.
Diversidad de aplicaciones
Con AlphaFold2 el equipo de DeepMind ha podido predecir la estructura de 200 millones de proteínas y científicos de todo el mundo han usado este mismo programa en diversos campos, por ejemplo, para comprender mejor la resistencia a los antibióticos y crear imágenes de enzimas que pueden descomponer el plástico.
Hace cuatro años, este avance sorprendente de diseñar proteínas y luego predecir el ensamblaje de aminoácidos, unidos entre sí en largas cadenas, ha permitido no solo pronosticar las complejas estructuras de las proteínas existentes, sino desarrollar nuevas y cuyas formas son decisiva para diversas funciones.
Por su parte, el sotware de David Baker y su equipo de investigación, ha producido y diseñado una gran cantidad de proteínas, incluidas algunas que se pueden utilizar como fármacos, vacunas, nanomateriales y sensores diminutos.
Al ser informado sobre el premio, en entrevista con el comité Nobel, Baker declaró sentirse emocionado y honrado y agradeció a los científicos que le precedieron y en el campo de estudio, citó la conocida frase de Isaac Newton: “Si he visto más lejos, ha sido subiéndome a hombros de gigantes”.
“La tarea de mi vida ha sido buscar aplicaciones de la inteligencia artificial que mejoren la vida de las personas y, en concreto, que aceleren los descubrimientos científicos”, declaró Hassabis, en una conferencia de prensa ofrecida por DeepMind.
La vida no podría existir sin las proteínas y, al predecir sus estructuras y diseñar nuevas formas, los hoy galardonados con el Premio Nobel de Química han superado importantes desafíos de la bioquímica moderna que benefician a la humanidad.