Imputación de Datos Faltantes de Variables Meteorológicas y de Contaminación en Series Temporales Multivariantes IoT con Modelos Transformer
Identificadores
URI: https://hdl.handle.net/10481/106439Metadatos
Mostrar el registro completo del ítemMateria
Imputación de Datos Series Temporales Modelos Transformers SAITS Aprendizaje Profundo IoT Datos Faltantes Calidad del Aire Monitorización de Tráfico Smart Poqueira Python PyPOTS
Fecha
2025-06-26Patrocinador
LifeWatch ERICResumen
Este Trabajo de Fin de Grado (TFG) se centra en la generación de datos sintéticos para sustituir valores faltantes, en series temporales multivariantes, en el contexto de sistemas IoT. El propósito es implementar y evaluar la eficacia de arquitecturas de aprendizaje profundo, especialmente modelos transformer como SAITS, para la imputación de datos. La investigación se aplica a un caso de estudio de monitorización de tráfico y contaminación del proyecto Smart Poqueira, buscando restaurar la completitud de los datos. La metodología se fundamenta en las siguientes ramas de las matemáticas: álgebra lineal, métodos numéricos, análisis, probabilidad y estadística; y Deep Learning (DL), complementada con un estudio del estado del arte en imputación. En la parte práctica, se ha elaborado un Jupyter Notebook y un paquete de Python, pampaneira_imputation, que integra diversos métodos de imputación, desde elementales hasta transformer y SAITS. El flujo experimental incluye preprocesamiento, gestión controlada de datos perdidos y evaluación. El código, gestionado con Git, está disponible en licencias de código abierto en GitHub para fomentar la transparencia y reproducibilidad. Los resultados experimentales, mediante métricas estándar de error, demuestran la superioridad de los modelos Transformer sobre los convencionales, logrando una reducción notable y consistente del error de imputación. En conclusión, este estudio confirma que los modelos basados en autoatención, y SAITS en particular, son herramientas precisas y potentes para la imputación en series temporales, generando datos más completos. El trabajo aporta una solución contrastada y sienta bases para futuras investigaciones en IoT, orientadas a la gestión ambiental y la sostenibilidad.





