Inferencia de patrones de regulación a partir de datos ómicos
Metadatos
Mostrar el registro completo del ítemAutor
López Domínguez, RaúlEditorial
Universidad de Granada
Departamento
Universidad de Granada. Programa de Doctorado en BiomedicinaFecha
2023Fecha lectura
2023-06-23Referencia bibliográfica
López Domínguez, Raúl. Inferencia de patrones de regulación a partir de datos ómicos. Granada: Universidad de Granada, 2023. [https://hdl.handle.net/10481/84440]
Patrocinador
Tesis Univ. Granada.Resumen
La necesidad de conocer cómo interaccionan las biomoléculas entre sí y como afectan dichas
interacciones al funcionamiento global de un tejido o célula es uno de los aspectos clave que,
en los últimos años, están ganando cada vez más importancia. Uno de los elementos más
importantes en el contexto de las redes de regulación son los factores de transcripción (TFs).
Estas proteínas son esenciales en el buen funcionamiento de la regulación de la transcripción
ya que se unen a ciertas regiones del genoma, principalmente asociadas a regiones codificantes,
y actúan activando o inhibiendo la transcripción de un gen determinado.
A lo largo de esta tesis doctoral, los trabajos realizados se han centrado en el análisis de datos
ómicos, principalmente transcriptómica, en el contexto de las enfermedades autoinmunes y, de
forma más específica, en lupus eritematoso sistémico. Esta enfermedad se caracteriza por ser
una patología heterogénea en la que tiene lugar una respuesta inmune contra células y órganos
del propio individuo. Sobre lupus y datos ómicos se han desarrollado múltiples estudios tanto
para identificar biomarcadores, estratificar pacientes o buscar tratamientos potenciales. En el
contexto de los TFs, se sabe que muchas de las mutaciones asociadas a la enfermedad se han
localizado en pacientes de lupus se encuentran en regiones reguladoras, como los sitios de unión
de los TFs. A pesar de este conocimiento, no se aporta información acerca de cómo afectan
estas mutaciones a la actividad de dichos TFs.
Por este motivo, en esta tesis se han aplicado una serie de técnicas que permiten inferir la
actividad de los TFs en base a la expresión de los genes que están regulando (también conocidos
como genes diana). Para ello era necesario conocer qué genes son regulados por cada TF, cuya
información se localiza en múltiples bases de datos y se obtienen a partir de una gran cantidad
de artículos publicados. El conjunto de genes regulados por cada TFs (también llamado
regulones) se obtuvo utilizando la base de datos desarrollada por DoRothEA que incluye
interacciones de fuentes muy diversas y que se clasifican en base a la credibilidad. Para inferir
las actividades de los TFs de cada muestra utilizando los niveles de expresión de sus genes
diana se utilizó el método desarrollado por VIPER (Virtual Inference of Protein-activity by
Enriched Regulon).
Sin embargo, como trabajo previo a la inferencia de los TFs se realizó una recopilación de datos
ómicos públicos de tipo caso-control disponibles en el repositorio público más conocido: NCBIGEO.
Este trabajo permitió el desarrollo de ADEx, una herramienta online con datos ómicos
procesados atendiendo a un mismo método estandarizado y con varios análisis de dichos datos:
expresión diferencial, análisis de rutas, inferencia de redes o meta-análisis.
Posteriormente, elegimos uno de los estudios incluidos en ADEx con datos transcripcionales
de lupus así como los datos de otra cohorte a la que tuvimos acceso gracias a nuestra
colaboración con la doctora Michelle Petri, de la Universidad Johns Hopkins. Estos dos
conjuntos de datos transcripcionales se utilizaron para inferir las actividades de los TFs en los
pacientes de lupus y controles sanos. Las actividades de todos los individuos de lupus se
utilizaron para estratificar pacientes y, en ambos estudios se localizaron dos grupos muy
diferenciados, que además presentaban diferencias clínicas con respecto a las proporciones de
algunos tipos celulares como neutrófilos y linfocitos. Finalmente, mediante análisis de actividad
diferencial, localizamos una firma robusta de 14 TFs que se encontraban diferencialmente
activados en lupus con respecto a controles.
Dada la importancia que se observó en cuanto a los tipos celulares, se decidió aplicar un análisis
similar al anterior pero en datos transcripcionales de célula única, con el fin de analizar en
profundidad los TFs en los que existen diferencias a nivel de tipo celular. Para ello, se utilizó
un conjunto de datos público alojado en NCBI GEO y se aplicó un protocolo de procesamiento
en línea con lo más estándar en el campo. Además, se añadió una capa adicional, la inferencia
de actividad de rutas de señalización. Aunque este trabajo se encuentra incompleto, se han
hallado resultados relevantes, principalmente relativos a tipos celulares en los que hay patrones
de actividad diferentes