
La mayoría de las enfermedades complejas, como la obesidad, la longevidad y la diabetes, están influenciadas en gran medida por factores genéticos. Pero al mismo tiempo, también están modulados por estímulos ambientales, como la dieta y la actividad física. Esta interacción entre el entorno y la composición genética hace que cada ser humano sea único y sustenta la necesidad de una medicina personalizada.
Este enfoque médico personalizado se basa en la premisa de que la predicción, el diagnóstico y el tratamiento de enfermedades difieren entre individuos y dependen de sus variaciones genéticas personales integradas dentro de sus entornos específicos. Pero para hacer realidad la medicina personalizada, primero necesitamos una comprensión más profunda de la interacción entre la genética, el medio ambiente y la enfermedad.
Para ello, cientos de grupos de investigación han trabajado sobre una población de ratones, denominada BXD. Esta población de ratones se ha utilizado como modelo para estudiar la base genética de los rasgos fenotípicos y las enfermedades. Durante varias décadas, se han recopilado en bases de datos miles de conjuntos de datos de fenotipo de ratones BXD, que van desde el color del pelaje hasta la vida útil.
Además, los investigadores también han recopilado conjuntos de datos moleculares muy grandes relacionados con la expresión génica en diferentes órganos de ratones BXD, como los niveles de ARNm, proteínas y metabolitos. Hasta ahora, la comunidad BXD ha reunido alrededor de 300 millones de puntos de datos de fenotipo de estos animales, generando, con mucho, el «fenoma» coherente más grande (un conjunto de todos los fenotipos expresados en un organismo) para cualquier cohorte experimental animal. En resumen, el fenoma BXD es un recurso perfecto para modelar poblaciones humanas para estudios genéticos.
«Sin embargo, estos abundantes y extensos datos de fenómenos permanecen en gran parte sin explotar, ya que son de difícil acceso y las herramientas para analizarlos requieren habilidades avanzadas», dice Johan Auwerx, cuyo laboratorio en la EPFL dirigió el estudio con colegas de Alemania, Países Bajos y Estados Unidos. UU., así como los profesores de la EPFL Kristina Schoonjans y Stephan Morgenthaler.
Los científicos abordaron el problema organizando todo este conocimiento en un almacén de datos basado en la nube que integra los 300 millones de puntos de datos recopilados en la población de ratones BXD. Los investigadores desarrollaron un conjunto de herramientas fácil de usar, que se puede utilizar para integrar las diferentes capas de datos «ómicos» de la población de ratones BXD.
El conjunto de herramientas ya está en línea en systems-genetics.org y se espera que facilite significativamente el descubrimiento de vínculos gen-fenotipo y gen-gen. Los científicos ya han utilizado el recurso para identificar cientos de miles de asociaciones de genes y fenotipos, muchas de las cuales son completamente nuevas. «Un ejemplo sorprendente es el vínculo entre la proteína ribosómica Rpl26 y el peso corporal», dice Hao Li, primer autor del artículo. «Los ratones que heredan este gen de uno de los padres pesan en promedio 10 g más que sus primos».
El conjunto de herramientas se puede aplicar a cualquier población con datos disponibles de varias capas de distinta naturaleza (denominados «datos multiómicos»). Esto permite la reutilización de datos existentes para hacer nuevos descubrimientos. «Los hallazgos en las poblaciones son generalmente sólidos y se traducen bien entre cohortes y especies, lo que hace que los datos sean directamente relevantes para la biología humana», dice Li.
«Hemos depositado todos los datos y el conjunto de herramientas en una plataforma pública, lo que ayudará a los investigadores a identificar y validar las funciones de sus genes de interés», dice Auwerx, colocando el proyecto en el contexto de los esfuerzos continuos de EPFL para avanzar en la ciencia abierta. «Este recurso realmente es uno de los primeros esfuerzos para llevar la biología a la nube y sienta las bases de una nueva era de la biología. Los médicos pronto podrán utilizar recursos de naturaleza similar para personalizar los tratamientos para sus pacientes».