Hace 20 años se publicó la secuenciación del Genoma Humano, el primer gran hito de la ciencia del siglo XXI. Un punto de inflexión para las ciencias biológicas, biomédicas y la bioeconomía que ha marcado el rumbo de la ciencia y la tecnología actuales y domina buena parte de la economía mundial.
Thank you for reading this post, don't forget to subscribe!Con este proyecto se pudieron descifrar los más de tres mil 200 millones de pares de bases (adenina A, citosina C, guanina G y timina T) o nucleótidos, que conforman los más de 20 mil genes humanos –la mayoría todavía desconocidos–, que se empaquetan en los 23 pares de cromosomas de cada célula del organismo humano.
Este mapa ha sido la columna vertebral de la genómica en las dos últimas décadas, pero tiene una limitante muy importante: ha sido una herramienta defectuosa, pues alrededor del 70% de sus datos provienen de un solo individuo africano-europeo, que no representa a la diversidad genética de la especie humana y que se ha usado como referencia en casi todos los estudios genómicos, hasta ahora.
De ahí la importancia del desciframiento del Pangenoma Humano, cuyo primer borrador fue presentado el 10 de mayo en seis artículos científicos en las revistas Nature, Nature Biotechnology, Genome Research y Nature Methods, que incluyen las secuencias del genoma de 47 personas ancestralmente diversas, llevado a cabo por un equipo internacional de más de 250 científicos (ninguno de México), que conforman el Consorcio de Referencia del Pangenoma Humano y otras instituciones públicas.
Financiado por el Instituto Nacional de Investigación del Genoma Humano (NHGRI, por sus siglas en inglés) –que es parte de los Institutos Nacionales de Salud de Estados Unidos–, tiene el objetivo de secuenciar el genoma de 350 personas étnicamente diversas, para 2024. De esta manera, se tendrá una referencia mucho más diversa y permitirá diagnosticar enfermedades y guiar los tratamientos médicos con mayor precisión en el futuro.
“Los investigadores básicos y los médicos que utilizan la genómica necesitan acceder a una secuencia de referencia que refleje la notable diversidad de la población humana, lo que ayudará a reducir las posibilidades de propagar disparidades en la salud”, dijo Eric Green, director del NHGRI en conferencia de prensa organizada por grupo Springer Nature. “La creación y mejora de una referencia del pangenoma humano se alinea con el objetivo del NHGRI de luchar por la diversidad global en todos los aspectos de la investigación genómica, que es crucial para avanzar en el conocimiento e implementar la medicina genómica de manera equitativa”.
El Genoma humano obtenido en 2003 no representa a la diversidad genética de la especie humana y se ha usado como referencia en casi todos los estudios genómicos, hasta ahora.
Los costos de ambos proyectos son diametralmente opuestos: en el proyecto internacional público-privado del genoma participaron 2 mil 400 científicos de seis países, con un presupuesto de 2 mil 700 millones de dólares; ahora, en el pangenoma colaboran alrededor de 250 investigadores con un presupuesto de 40 millones de dólares, para los primeros 5 años.
Una gran ventaja de este proyecto es que cuenta con desarrollos tecnológicos y equipos de nueva generación y alta precisión que no existían hace 20 años, con los que es posible analizar más del 99% de cada una de las secuencias que se procesan y en mucho menos tiempo.
“Aquí, el Consorcio de Referencia del Pangenoma Humano presenta un primer borrador de referencia que contiene 47 ensamblajes diploides en fases de una cohorte de individuos genéticamente diversos”, indican los científicos en uno de los artículos titulado Un borrador de referencia del pangenoma humano (leer en: https://doi.org/10.1038/s41586-023-05896-x).
Vista al microscopio, la estructura de la molécula de doble hélice del ADN parece una microescalera de caracol y cada peldaño de ella está conformado por los enlaces de las cuatro bases unidas en pares, A siempre con T y C siempre con G. La secuencia de las 3 mil 200 millones de bases o “peldaños” a lo largo del ADN que conforma el genoma humano es lo que codifica las instrucciones de todos los genes que producen las proteínas, tejidos, órganos y las características de cada individuo.
Los seres humanos comparten el 99.8% del genoma y el 0.2% restante son las variaciones que brindan las características singulares de las etnias, los grupos poblacionales, familiares e individuales.
Esas variaciones brindan información sobre la salud de las personas, su predisposición hereditaria, ayuda a diagnosticar enfermedades, predecir resultados médicos e implementar tratamientos.
EL PRIMER BORRADOR DEL PANGENOMA FUE PRESENTADO EL 10 DE MAYO EN SEIS ARTÍCULOS CIENTÍFICOS EN LAS REVISTAS NATURE, NATURE BIOTECHNOLOGY, GENOME RESEARCH Y NATURE METHODS, QUE INCLUYEN LAS SECUENCIAS DEL GENOMA DE 47 PERSONAS ANCESTRALMENTE DIVERSAS.
El pangenoma será la nueva referencia que mejorará la capacidad de los científicos para detectar y comprender esas variaciones y sus implicaciones, en estudios futuros. Arroja más información mucho más precisa sobre el 0.2% de las secuencias genéticas que hacen que cada una de las ocho mil millones de personas en este planeta sea diferente y única.
“En mis primeros años en genómica, me sorprendió descubrir que muchas regiones grandes de la referencia estaban incompletas, pero el pangenoma humano es la primera oportunidad que tenemos de observar su dinámica y evolución”, declaró Erik Garrison, del Departamento de Genética, Genómica e Informática de la Universidad de Tennessee.
“No es solo una oportunidad de mirar hacia lo desconocido. También marca el comienzo de un período en el que podemos ver la secuencia y la variación genómica por completo. Los enfoques que hemos desarrollado para construir el pangenoma harán que la resolución completa de los genomas sea una práctica estándar en medicina y genómica, permitiéndonos asociar estados de salud con secuencias reales en lugar de marcadores correlacionados, esto conducirá a una resolución completa de la base molecular de fenotipos humanos importantes”, dijo Garrison.
La mayoría de los estudios genómicos previos observaron regiones del genoma que son fáciles de mapear en lecturas cortas, dando la impresión de que es plano y todos son muy similares, difiriendo solo en un puñado de mutaciones puntuales.
Pero el pangenoma humano muestra que cada persona porta fragmentos de ADN que son inusuales o únicos y lo más importante es que se convertirá en una referencia que represente por igual a personas de todos los orígenes genéticos.
Nuevas y más precisas técnicas
El proyecto se basa en gran medida en los avances tecnológicos computacionales y de secuenciación llamados de lectura larga y ultralarga utilizados para leer el ADN de muestras biológicas y que ahora pueden decodificar de miles a millones de pares de bases del genoma al mismo tiempo. Los tramos largos se ensamblan a través de algoritmos especializados en secuencias genómicas más completas y, en algunos casos, en ensamblajes de cromosomas completos.
“Estos ensamblajes cubren más del 99% de la secuencia esperada de cada genoma y con una precisión superior al 99% a nivel estructural y de pares de bases”, indica el artículo científico.
Las lecturas largas contienen errores y los algoritmos de ensamblaje actuales no son perfectos, por lo que alrededor del 1% de las secuencias ensambladas son erróneas en algunos lugares, pero los científicos idearon un sistema para verificar y corregir dichos fallos, que hace que los ensamblajes sean más precisos, completos y confiables.
Una vez que ensamblaron las secuencias de cada genoma, los investigadores las alinearon y las superpusieron para compararlas y el resultado es el borrador del pangenoma, que captura variantes y haplotipos conocidos (grupos de variantes genómicos) y revela nuevos alelos (formas alternativas que puede tener un mismo gen), así como el loci o lugar donde se localiza en la estructura del ADN.
Cada persona hereda un genoma de cada progenitor, por ello, los humanos cuentan con dos copias de cada cromosoma –23 pares de cromosomas en total–, lo que se conoce como genoma diploide.
Por ello, cuando se descifra el genoma de una persona, separar el ADN de los progenitores puede implicar todo un desafío, pero su separación es un factor clave para conocer las variaciones genéticas que pueden ser muy amplias, por ejemplo, la madre puede tener 20 copias de un gen, mientras que el padre solo dos del mismo gen.
El pangenoma hizo esta separación en cada individuo, por lo que la secuencia del ADN de 47 personas arrojó 94 genomas distintos, dos para cada conjunto de cromosomas, más el cromosoma “Y” sexual en los hombres.
Una vez secuenciados, los alinearon y superpusieron simultáneamente, permitiendo descubrir 120 millones de pares de bases nuevos que se encontraban en ubicaciones diferentes, por lo que alrededor de 90 millones de ellas son variaciones estructurales, es decir, son diferencias en el ADN que surgen cuando se reorganizan los fragmentos de los cromosomas, ya sea que se han movido, que se eliminaron, se encuentran invertidos o duplicados. De hecho, también se descubrieron mil 115 duplicaciones de genes.
En estudios previos se ha establecido que las variantes estructurales juegan un papel importante en la salud humana, así como en la diversidad específica de las poblaciones. Tienen efecto en las diferencias de los rasgos, en las enfermedades comunes y raras, así como en funciones genéticas.
Los científicos descubrieron 120 millones de pares de bases nuevos que se encontraban en ubicaciones diferentes; alrededor de 90 millones de ellas son variaciones estructurales.
“Si bien todavía es un trabajo en progreso, el pangenoma es público y puede ser utilizado por científicos de todo el mundo como una nueva referencia estándar del genoma humano”, dijo Erich Jarvis, de la Universidad Rockefeller, uno de los investigadores principales. “Las nuevas secuencias identificadas proporcionarán información para nuevos descubrimientos que antes no eran posible”.
Los investigadores obtuvieron secuencias más precisas, con mayor amplitud y profundidad de cada individuo, gracias al uso de técnicas y métodos computacionales que Jarvis perfeccionó en el Proyecto Genómico de Vertebrados, una iniciativa internacional que busca secuenciar 70 mil especies de vertebrados, pero ahora, su laboratorio y sus colaboradores decidieron aplicar estos avances para revelar la variación dentro de un solo vertebrado: el Homo sapiens.
“Ahora, podemos mapear a más variantes estructurales, por lo que estamos encontrando características y áreas en el genoma que simplemente no estaban allí antes”, dijo Karen Miga, directora del Centro de Producción del Consorcio de Investigación del Panegnoma Humano e investigadora de la Universidad de California en Santa Cruz. “Es emocionante porque nos permite observar la regulación genética de una manera única que no podíamos estudiar antes, porque esas áreas probablemente se habrían mapeado de manera inapropiada o simplemente se habrían ignorado por completo”.
Más resultados
El ensamblaje del pangenoma también llenó algunos vacíos debido a secuencias repetitivas o genes duplicados. Un ejemplo de ello es el complejo principal de histocompatibilidad (MHC), un grupo de genes que codifican proteínas en la superficie de las células que ayudan al sistema inmunitario a reconocer antígenos, como los del virus SARS-CoV-2.
Con los nuevos métodos del pangenoma es posible estudiar la diversidad genética de MHC lo que ayudará a entender por qué las respuestas inmunitarias contra patógenos específicos varían entre las personas. Esto mismo se puede aplicar para hacer coincidir mejor a los donantes de trasplantes de órganos con los pacientes, o identificar a las personas en riesgo de desarrollar enfermedades autoinmunes.
Por su parte, Evan Eichler del Departmento de Ciencias Genómicas de la Universidad de Washington y sus colegas desarrollaron un mapa de variaciones de un solo nucleótido (SNP), es decir, las diferencias en una de las letras de los pares de bases dentro de duplicaciones segmentarias o bloques de ADN que ocurren en más de un sitio del genoma en comparación con regiones únicas.
De esta manera pudieron mapear por primera vez casi dos millones de estas variaciones en regiones que antes se consideraban ilegibles, que permitirán comprender mejor cómo, dónde y en qué grado ocurren las mutaciones genéticas.
Curiosamente, observaron que era más probable que el nucleótido citosina se convirtiera en guanina, y viceversa, dentro de secuencias duplicadas, que las conversiones entre adenina y timina.
“Estas propiedades mutacionales distintas ayudan a mantener el contenido más alto de citosina y guanina en las duplicaciones segmentarias de ADN, en comparación con el ADN único”, señalan en el artículo (Leer en https://doi.org/10.1038/s41586-023-05895-y).
Otro hallazgo es el descubrimiento de nuevas y sorprendentes características de los centrómeros, que se encuentran en el centro de los cromosomas y conducen la división celular separándose a medida que las células se duplican. Observaron que las mutaciones en los centrómeros pueden provocar cánceres y otras enfermedades.
Los centrómeros son muy diversos y pueden representar más del 50% de las diferencias genéticas entre personas o haplotipos maternos y paternos, incluso dentro de un mismo individuo; parecen ser una parte del cromosoma que evoluciona rápidamente.
Los investigadores obtuvieron secuencias más precisas, con mayor amplitud y profundidad de cada individuo, lo que permite identificas los alelos raros que confieren importantes rasgos adaptativos.
Sin embargo, el pangenoma actual de 47 personas es solo un punto de partida. El objetivo final de HPRC es producir genomas de alta calidad y casi sin errores de al menos 350 individuos de diversas poblaciones de esta manera se obtendrían 700 genomas, para mediados de 2024, un hito que permitiría capturar alelos raros que confieren importantes rasgos adaptativos.
Los tibetanos, por ejemplo, tienen alelos (formas alternativas que puede tener un mismo gen) relacionados con el uso de oxígeno y la exposición a la luz ultravioleta que les permiten vivir en altitudes elevadas.
Por ello, el pangenoma humano introdujo más diversidad y equidad en el análisis genómico, es más inclusivo y representativo que se puede convertir en un referente para los estudios genómicos futuros, por ello, también será accesible, gratuito y abierto para todos los investigadores, ya que esta colección de secuencias genómicas estan compiladas en una sola estructura de datos.