Multi-Omics integration and machine learning for the identification of molecular markers of insulin resistance in prepubertal and pubertal children with obesity Anguita Ruiz, Augusto Miguel Aguilera García, Concepción María Alcalá Fernández, Jesús Universidad de Granada. Programa de Doctorado en Nutrición y Ciencias de los Alimentos Adolescent Child DNA methylation Epigenetics Epigenome-Wide Association Study EWAS Gene expression Genetics Genome-wide association study (GWAS) Insulin resistance Multi-omics Pediatric obesity Puberty RNAseq Adolescencia Epigenética Estudio de Asociación del Epigenoma completo, EWAS Estudio de Asociación del Genoma Completo, GWAS Expresión génica Genética Infancia Metilación del ADN Multi-ómicas Obesidad pediátrica Pubertad Resistencia a la insulina THE PRESENT DOCTORAL THESIS WAS FUNDED BY THE FOLLOWING INSTITUTIONS: - Institute of Health Carlos III - Personal funding: “Contratos i-PFIS: doctorados IIS-empresa en ciencias y tecnologías de la salud de la convocatoria 2017 de la Acción Estratégica en Salud 2013–2016, Project number: IFI17/00048”. - Institute of Health Carlos III - Health Research Fund (ERDF FUNDS) - Projects numbers PI05/1968, PI11/01425, PI11/02042, PI11/02059, PI16/01301, PI16/01205, PI16/00871 and PI20/00711. - Redes temáticas de investigación cooperativa RETIC (Red SAMID RD12/0026/0015). - Mapfre Foundation (“Research grants by Ignacio H. de Larramendi 2017”). - ERDF/Regional Government of Andalusia/Ministry of Economic Transformation, Industry, Knowledge and Universities (grant number P18-RT-2248). - University of Granada, Plan Propio de Investigación 2016, Excellence actions: Units of Excellence; Unit of Excellence on Exercise and Health (UCEES). Childhood obesity can develop early in life leading to the appearance of metabolic alterations such as insulin resistance (IR). If maintained during adulthood, obesity and IR usually derive into the development of more serious conditions like Type II Diabetes and cardiovascular disease, which considerably increase morbidity and mortality in affected populations. As many other complex disorders, obesity and its associated cardiometabolic comorbidities constitute a complex phenotype arising from the interaction between an at-risk molecular profile (involving genomics, transcriptomics, epigenomics and proteomics disturbances) and environmental exposures. On this sense, one of the most promising fields of research in obesity has involved the identification of early-life predictive molecular biomarkers able to stratify patients according to their risk for developing cardiometabolic complications later in life. Interestingly, the ideal and most robust biomarker discovery approach would involve the simultaneous analysis of multiple omics data layers at a once, allowing tracking a molecular disturbance from all its possible dimensions. Due to the complexity of omics data, nevertheless, new and innovative analytics approaches have been demanded. In the middle of this need, bioinformatics and artificial intelligence (AI) have experienced a remarkable boost due to their ability to automatically obtain descriptive or predictive models from massive amounts of data (Big Data). The present Doctoral Thesis gathers a series of research works in which bioinformatics and AI are conveniently applied to several obesity observational omics research projects for identifying new molecular biomarkers of IR and metabolic alterations in children and adolescents with obesity. Study populations are composed of more than 2000 Spanish children with ages ranging from 2-18 years. In summary, the results presented in the present Doctoral Thesis indicate that; 1) obesity is a complex disorder resulting from the interaction between genetic and environmental factors, 2) the creation of predictive tools based on the combination of small-risk effects genetic variants is an interesting but simple strategy for predicting future obesity, 3) multi-omics research approaches in obesity are necessary to understand the complex molecular mechanisms underlying disease, and 4) the application of eXplainable Artificial Intelligence (XAI) machine learning (ML) models can help us to unravel the complex relationships between omics molecular elements. The application of multi-omics research approaches and the use of complex analytical tools (such as bioinformatics and AI) are the correct way for approaching a true implementation of a personalized care in obesity. Further studies like those presented in the present Doctoral Thesis and as well as larger cohorts projects should be encouraged in order to validate presented findings. This will require a close collaboration between clinicians and basic researchers, and the creation of multidisciplinary teams, in which the presence of mixed bioinformatics profiles will be of great importance. La obesidad infantil puede desarrollarse en etapas tempranas de la vida y dar lugar a la aparición de alteraciones metabólicas como la resistencia a la insulina (RI). Si se mantienen durante la edad adulta, la obesidad y la RI suelen derivar en el desarrollo de afecciones más graves como la diabetes tipo II y las enfermedades cardiovasculares, que aumentan considerablemente la morbilidad y la mortalidad en las poblaciones afectadas. Como muchos otros trastornos complejos, la obesidad y sus comorbilidades cardiometabólicas constituyen un fenotipo complejo que surge de la interacción entre un perfil molecular de riesgo (que implica alteraciones genómicas, transcriptómicas, epigenómicas y proteómicas) y las exposiciones ambientales. En este sentido, uno de los campos de investigación más prometedores en materia de obesidad ha consistido en la identificación de biomarcadores moleculares predictivos durante las etapas tempranas de la vida, capaces de estratificar a los pacientes en función de su riesgo de desarrollar complicaciones cardiometabólicas en la edad adulta. Uno de los enfoques más interesantes y robustos para el descubrimiento de biomarcadores implicaría el análisis simultáneo de múltiples capas de datos ómicos a la vez, permitiendo el estudio de una alteración molecular desde todas sus posibles dimensiones. Sin embargo, debido a la complejidad de los datos ómicos, se requieren enfoques analíticos innovadores. En medio de esta necesidad, la bioinformática y la inteligencia artificial (IA) han experimentado un notable impulso debido a su capacidad para obtener automáticamente modelos descriptivos o predictivos a partir de cantidades masivas de datos (Big Data). La presente Tesis Doctoral recoge una serie de trabajos de investigación en los que la bioinformática y la IA se aplican convenientemente a varios estudios ómicos de obesidad para identificar nuevos biomarcadores moleculares de RI y alteraciones metabólicas en niños y adolescentes con obesidad. Las poblaciones de estudio de la presente tesis doctoral están compuestas por más de 2000 niños españoles con edades comprendidas entre los 2 y los 18 años. En resumen, los resultados recogidos en la presente Tesis Doctoral indican que 1) la obesidad es un trastorno complejo resultante de la interacción entre factores genéticos y ambientales, 2) la creación de herramientas predictivas basadas en la combinación de polimorfismos genéticos es una estrategia interesante pero sencilla para predecir el desarrollo de obesidad, 3) los enfoques de investigación multiómicos en obesidad son necesarios para comprender los complejos mecanismos moleculares subyacentes a la enfermedad, y 4) la aplicación de modelos de aprendizaje automático de Inteligencia Artificial eXplicable (XAI) puede ayudarnos a desentrañar las complejas relaciones existentes entre los elementos moleculares ómicos. La aplicación de enfoques de investigación multi-ómica y el uso de herramientas analíticas complejas (como la bioinformática y la IA) son el camino correcto hacia una verdadera implementación de una medicina personalizada en la obesidad. En el futuro, deben fomentarse más estudios como los recogidos en la presente Tesis Doctoral, así como proyectos de reclutamiento de cohortes más grandes para validar los hallazgos presentados. Esto requerirá una estrecha colaboración entre clínicos e investigadores básicos, y la creación de equipos multidisciplinares, en los que la presencia de perfiles bioinformáticos mixtos será de gran importancia. 2021-10-07T06:41:38Z 2021-10-07T06:41:38Z 2021 2021-07-15 info:eu-repo/semantics/doctoralThesis Anguita Ruiz, Augusto Miguel. Multi-Omics integration and machine learning for the identification of molecular markers of insulin resistance in prepubertal and pubertal children with obesity. Granada: Universidad de Granada, 2021. [http://hdl.handle.net/10481/70696] 9788411170284 http://hdl.handle.net/10481/70696 eng http://creativecommons.org/licenses/by-nc-nd/3.0/es/ info:eu-repo/semantics/openAccess Atribución-NoComercial-SinDerivadas 3.0 España Universidad de Granada