Utilización de algoritmos de Machine Learning / Deep Learning (ML/DL) para la predicción de parámetros de gestión del transporte aéreo Muros Anguita, Juan Gerardo Díaz Olariaga, Óscar Universidad de Granada. Programa de Doctorado en Física y Matemáticas Aeropuertos Aprendizaje profundo Previsión demanda pasajeros aéreos Air cargo demand forecasting Air passenger demand forecasting Airport Predecir los parámetros de gestión del transporte aéreo en los próximos años es crítico para los principales agentes del transporte aéreo como son: las líneas aéreas, autoridades aeroportuarias, proveedores del servicio de navegación aérea, además de la propia industria de fabricación de aviones, etc. Dado que la industria aeronáutica genera casi 87.7 millones de empleos (directos e inducidos) y 3.4 billones de US$ lo que representa un 4.1% del PIB mundial. El uso de los algoritmos de Machine Learning /Deep Learning (ML/DL), donde recientemente ha irrumpido el ChatGPT para extender el uso masivo de la Inteligencia Artificial (IA), vienen desplazando a otros métodos estadísticos clásicos como ARIMA, etc. en el pronóstico de las series temporales. Esta tesis muestra una doble viabilidad, la de desarrollar y entrenar modelos de ML/DL con reducidos medios propios, y por otro lado demostrar su aplicabilidad a la gestión del transporte aéreo, lo cual ha sido posible gracias sobre todo a la existencia de librerias como Keras, Tensorflow y lenguajes de programación como Python, de código abierto, orientados al aprendizaje profundo (DL). En particular, se abordan tres casos de estudios: el pronóstico de la demanda a corto y medio plazo de pasajeros (nacionales e internacionales), el pronóstico de la carga aérea (domestica e internacional) y el de la predicción de la demora de salida de aviones, todos ellos aplicados usando los datos del caso de estudio de Colombia. Los modelos singulares de ML/DL desarrollados para los dos primeros casos son de aprendizaje profundo con arquitecturas de codificadores-decodificadores realizados con redes neuronales artificiales hibridas que mezclan redes convolucionales con redes recurrentes tipo LSTM, denominadas “ConvLSTM2D” las cuales mejoran el aprendizaje de los patrones temporales de las series históricas multivariable, donde se mezclan las variables aeronáuticas objeto de estudio con otras variables socioeconómicas de contexto. Mientras que, para el tercer caso, relativo a la predicción de las demoras en las salidas de aviones, aplicada con los datos de los aeropuertos de Colombia, la investigación se ha orientado en realizar la selección del mejor del modelo, a través de la comparativa en las prestaciones de varios modelos clásicos de ML y un modelo simple de DL (MLP), tomando como métrica comparativa el error cuadrático medio (RMSE). Un esfuerzo importante de esta investigación se ha centrado en proporcionar robustez a las valoraciones obtenidas por los modelos, aplicando las técnicas de “k-fold cross validation”, dada la naturaleza estocástica del problema (modelo y datos). Mientras que otra parte importante de esta investigación se ha orientado a explicar los resultados obtenidos por los modelos ML/DL, ya que estos algoritmos se comportan como cajas negras al no explicitar los patrones aprendidos, lo que se ha resuelto mediante el uso de técnicas de “permutation importance”, así como aplicando análisis variacional al configurar multiples escenarios obtenidos al combinar diferentes features, para seleccionar los más relevantes del problema. El dataset usado para las demostraciones procede de la Autoridad Aeronáutica colombiana Aerocivil, el cual ha sido preprocesado con técnicas estadísticas de escalado, normalizado, categorizado, etc. para homogeneizar los datos que faciliten el aprendizaje. Es de subrayar que en el dataset usado para el pronóstico de las diferentes demandas no ha sido necesario realizar el proceso de “extracción de los features” o características de las variables de entrada, como por el contrario si se requiere en física mediante p.e. el uso de números adimensionales para categorizar un régimen, etc., ya que los modelos DL, como es el ConvLSTM2D no requieren de dicho preprocesado por parte del ingeniero (tarea que se conoce “feature engineering”), ya que esta extracción de features la realizan de forma automática los modelos de aprendizaje profundo. Esta tesis ha sido posible al haber podido acceder a un gran y fiable volumen de datos aeronáuticos y socioeconómicos para el entrenamiento del modelo. Donde Colombia ha sido el caso de estudio elegido, porque representa el tercer país latinoamericano y el quinto de américa en la industria aeronáutica. Por último, hay que señalar que se han entrenado los modelos ML/DL bajo la modalidad de aprendizaje supervisado (SL), por lo que el dataset contenía no solo las variables de entrada sino también las variables de salida (objetivas) a predecir. Predicting the management parameters of air transport in the coming years is critical for the main air transport agents such as: airlines, airport authorities, air navigation service providers, as well as for the aircraft manufacturing industry itself, etc. given that the aeronautical industry generates almost 87.7 million jobs (direct and induced) and 3.4 trillion US$, which represents 4.1% of global GDP. The use of Machine Learning/Deep Learning (ML/DL) algorithms, where ChatGPT has recently emerged to extend the massive use of Artificial Intelligence (AI), are displacing other classic statistical methods such as ARIMA, etc. in time series forecasting. This thesis shows a double viability, that of developing and training ML/DL models with its own means, and on the other hand demonstrating its applicability to air transport management, thanks above all to the existence of libraries such as Keras and programming languages such as Python, open source, both aimed at deep learning (DL). In particular, three case studies are addressed: the forecast of short and medium-term demand for passengers (national and international), that of air cargo (domestic and international) and that of the prediction of aircraft departure delays, all demonstrated using data from the Colombia application case. The unique ML/DL models developed for the first two cases are deep learning with encoder-decoder architectures made with hybrid artificial neural networks that mix convolutional networks with recurrent LSTM-type networks, called “ConvLSTM2D” which improve the learning of the temporal patterns of multivariable historical series, where the aeronautical variables under study are mixed with socioeconomic variables. While, for the third case, related to the prediction of delays in aircraft departures, demonstrated with data from Colombian airports, the research has been aimed at selecting the best model, through comparison in the performances of several classical ML models and a simple DL model (MLP), based on the measurement of the root mean square error (RMSE) metric. An important effort in this research has been focused on providing robustness to the evaluations obtained by the models, applying “k-fold cross validation” techniques, given the stochastic nature of the problem (model and data). While the other important part of this research has been oriented on interpreting the results obtained by the ML/DL models, since these algorithms behave like black boxes by not making the learned patterns explicit, through the use of “permutation importance” techniques. As well as variational analysis when configuring scenarios obtained by combining different features, to select the most relevant to the problem. The dataset used for the demonstrations comes from the Colombian Aeronautical Authority Aerocivil, which has been preprocessed with statistical techniques for scaling, normalized, categorized, etc. to facilitate the homogenization of data that facilitates learning. It is worth highlighting that in the dataset used for the demand forecast it has not been necessary to carry out the process called “feature extraction” or characteristics of the input variables such as it is necessary to implement e.g. in dimensionless numbers analysis in physics to categorize a regime, etc., since DL models, such as ConvLSTM2D, do not require such preprocessing by the engineer (a task known as “feature engineering”), since this feature extraction is carried out implicitly by deep learning models. In short, this thesis has also been possible by having been able to access a large and reliable volume of aeronautical and socioeconomic data for model training. Colombia has been the chosen case, because it represents the third Latin American country and the fifth in America in the aeronautical industry. Finally, it should be noted that the ML/DL models have been trained under the supervised learning (SL) modality, so the dataset contained not only the input variables but also the objective or output variables to be predicted. 2024-06-20T10:55:55Z 2024-06-20T10:55:55Z 2024 2024-04-26 doctoral thesis Muros Anguita, Juan Gerardo. Utilización de algoritmos de Machine Learning / Deep Learning (ML/DL) para la predicción de parámetros de gestión del transporte aéreo. Granada: Universidad de Granada, 2024. [https://hdl.handle.net/10481/92738] 9788411953504 https://hdl.handle.net/10481/92738 spa http://creativecommons.org/licenses/by-nc-nd/4.0/ open access Attribution-NonCommercial-NoDerivatives 4.0 Internacional Universidad de Granada