Energy-aware efficient multi-population models for high-dimensional feature selection biomedical problems
Metadatos
Mostrar el registro completo del ítemAutor
Gómez López, Juan CarlosEditorial
Universidad de Granada
Departamento
Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y ComunicaciónFecha
2025Fecha lectura
2025-07-24Referencia bibliográfica
Gómez López, Juan Carlos. Energy-aware efficient multi-population models for high-dimensional feature selection biomedical problems. Granada: Universidad de Granada, 2025. [https://hdl.handle.net/10481/108905]
Patrocinador
Tesis Univ. Granada.; National research project PGC2018-098813-B-C31 funded by MCIN/AEI/10.13039/501100011033 and by ERDF/EU: Real-Time Integration of Power Consumption in Machine Learning Systems Using Smart Meters and High Accuracy Power Quality Analyzers.; National research project PID2022-137461NB-C31 funded by MCIN/AEI/10.13039/501100011033 and by ERDF/EU:: Brain Modeling for Estimation of Parameters of the Cortical Circuit from Features of Non-Invasive Neuronal Signals using High-Performance and Energy-Efficient Computing Algorithms.Resumen
One field that has gained significant importance in recent times is
bioinformatics, which involves the analysis of large volumes of biological
data using high-performance computing devices. One of the
primary challenges in bioinformatics is to identify and extract the information
underlying the data that is most relevant, while eliminating
information that could potentially distort the model generated to study
new samples. It is essential to perform this task in a rigorous manner
to ensure the data are processed correctly. While data processing involves
multiple stages, the stage responsible for obtaining the subset of
features that best represents the original dataset is known as feature
selection. This is the focus of the present doctoral thesis.
Over the years, there have been numerous attempts to improve the
effectiveness and efficiency of feature selection procedures. The aim
of these attempts has been to obtain better solutions while reducing
resource consumption. However, there is still room for further improvement
and study of these procedures with both premises in mind. This
thesis makes contributions in this direction.
When analyzing high-dimensional data in bioinformatics tasks, it is
essential to configure the hyperparameters that regulate these procedures
with precision and care. While there is a general consensus in
the literature on how to adjust them properly, some areas have not
been fully explored in the context of this type of problem. This question
is of great interest, as the chapters show. The effectiveness and
efficiency of a procedure are both dependent on the adjustment of
hyperparameters. In a world in which resources are increasingly scarce,
it is vital to develop efficient procedures to protect the environment.
High-performance systems have been used to considerably speed up
processing, reducing both execution time and energy consumption. Una disciplina que ha adquirido gran relevancia a día de hoy es la bioinformática, en la que grandes volumenes de datos biológicos son analizados utilizando dispositivos informáticos con una alta capacidad computacional. Una de las cuestiones clave en bioinformática es extraer aquella información subyacente a los datos que resulta realmente relevante, eliminando aquella que pueda distorsionar el modelo generado para estudiar nuevas muestras. Esta tarea se debe realizar de manera rigurosa para procesar los datos adecuadamente. Aunque el procesamiento de los datos está formado por varias etapas, aquella que se encarga de obtener el subconjunto de características que mejor represente al dataset original es conocida como selección de características, y es aquí donde se enmarca la presente tesis doctoral. A lo largo de los años, se han ido realizando numeros intentos para mejorar la eficacia y la eficiencia de los procedimentos de selección de características, con el objetivo de obtener mejores soluciones reduciendo el consumo de recursos. Sin embargo, todavía existe margen para seguir mejorando y estudiando estos procedimientos con ambas premisas en mente, por lo que las aportaciones realizadas en esta tesis van en esta dirección. A la hora de analizar datos de alta diminsionalidad en tareas de bioinformática, es esencial configurar minuciosamente los hiperparámetros que regulan estos procedimientos. Aunque en la literatura existe, en mayor o menor medida, cierto consenso acerca de cómo ajustarlos adecuadamente, algunos de ellos no han sido explorados de manera exhaustiva en este tipo de problemas. Esta cuestión es realmente interesante porque, tal y como se analiza a lo largo de los capítulos, no solo la eficacia del procedimento está condicionada por el ajuste de los hiperparámentros, sino también la eficiencia. En un mundo donde el consumo de recursos aumenta cada año, es crucial desarollar procedimientos eficientes para así cuidar el medio ambiente. En este sentido, las capacidades computacionales de los sistemas de alto rendimiento han sido utilizadas para acelerar considerablemente el procesamiento, logrando así reducir tanto el tiempo de ejecución como la energía consumida.





