Utilización de algoritmos de Machine Learning / Deep Learning (ML/DL) para la predicción de parámetros de gestión del transporte aéreo
Metadatos
Afficher la notice complèteAuteur
Muros Anguita, Juan GerardoEditorial
Universidad de Granada
Director
Díaz Olariaga, ÓscarDepartamento
Universidad de Granada. Programa de Doctorado en Física y MatemáticasMateria
Aeropuertos Aprendizaje profundo Previsión demanda pasajeros aéreos Air cargo demand forecasting Air passenger demand forecasting Airport
Date
2024Fecha lectura
2024-04-26Referencia bibliográfica
Muros Anguita, Juan Gerardo. Utilización de algoritmos de Machine Learning / Deep Learning (ML/DL) para la predicción de parámetros de gestión del transporte aéreo. Granada: Universidad de Granada, 2024. [https://hdl.handle.net/10481/92738]
Patrocinador
Tesis Univ. Granada.Résumé
Predecir los parámetros de gestión del transporte aéreo en los próximos años
es crítico para los principales agentes del transporte aéreo como son: las líneas
aéreas, autoridades aeroportuarias, proveedores del servicio de navegación aérea,
además de la propia industria de fabricación de aviones, etc. Dado que la industria
aeronáutica genera casi 87.7 millones de empleos (directos e inducidos) y 3.4
billones de US$ lo que representa un 4.1% del PIB mundial. El uso de los algoritmos
de Machine Learning /Deep Learning (ML/DL), donde recientemente ha irrumpido
el ChatGPT para extender el uso masivo de la Inteligencia Artificial (IA), vienen
desplazando a otros métodos estadísticos clásicos como ARIMA, etc. en el
pronóstico de las series temporales.
Esta tesis muestra una doble viabilidad, la de desarrollar y entrenar modelos
de ML/DL con reducidos medios propios, y por otro lado demostrar su aplicabilidad
a la gestión del transporte aéreo, lo cual ha sido posible gracias sobre todo a la
existencia de librerias como Keras, Tensorflow y lenguajes de programación como
Python, de código abierto, orientados al aprendizaje profundo (DL). En particular,
se abordan tres casos de estudios: el pronóstico de la demanda a corto y medio
plazo de pasajeros (nacionales e internacionales), el pronóstico de la carga aérea
(domestica e internacional) y el de la predicción de la demora de salida de aviones,
todos ellos aplicados usando los datos del caso de estudio de Colombia.
Los modelos singulares de ML/DL desarrollados para los dos primeros casos
son de aprendizaje profundo con arquitecturas de codificadores-decodificadores
realizados con redes neuronales artificiales hibridas que mezclan redes
convolucionales con redes recurrentes tipo LSTM, denominadas “ConvLSTM2D”
las cuales mejoran el aprendizaje de los patrones temporales de las series
históricas multivariable, donde se mezclan las variables aeronáuticas objeto de
estudio con otras variables socioeconómicas de contexto. Mientras que, para el
tercer caso, relativo a la predicción de las demoras en las salidas de aviones,
aplicada con los datos de los aeropuertos de Colombia, la investigación se ha
orientado en realizar la selección del mejor del modelo, a través de la comparativa en las prestaciones de varios modelos clásicos de ML y un modelo simple de DL
(MLP), tomando como métrica comparativa el error cuadrático medio (RMSE).
Un esfuerzo importante de esta investigación se ha centrado en proporcionar
robustez a las valoraciones obtenidas por los modelos, aplicando las técnicas de
“k-fold cross validation”, dada la naturaleza estocástica del problema (modelo y
datos). Mientras que otra parte importante de esta investigación se ha orientado a
explicar los resultados obtenidos por los modelos ML/DL, ya que estos algoritmos
se comportan como cajas negras al no explicitar los patrones aprendidos, lo que se
ha resuelto mediante el uso de técnicas de “permutation importance”, así como
aplicando análisis variacional al configurar multiples escenarios obtenidos al
combinar diferentes features, para seleccionar los más relevantes del problema.
El dataset usado para las demostraciones procede de la Autoridad
Aeronáutica colombiana Aerocivil, el cual ha sido preprocesado con técnicas
estadísticas de escalado, normalizado, categorizado, etc. para homogeneizar los
datos que faciliten el aprendizaje. Es de subrayar que en el dataset usado para el
pronóstico de las diferentes demandas no ha sido necesario realizar el proceso de
“extracción de los features” o características de las variables de entrada, como por
el contrario si se requiere en física mediante p.e. el uso de números adimensionales
para categorizar un régimen, etc., ya que los modelos DL, como es el ConvLSTM2D
no requieren de dicho preprocesado por parte del ingeniero (tarea que se conoce
“feature engineering”), ya que esta extracción de features la realizan de forma
automática los modelos de aprendizaje profundo.
Esta tesis ha sido posible al haber podido acceder a un gran y fiable volumen
de datos aeronáuticos y socioeconómicos para el entrenamiento del modelo. Donde
Colombia ha sido el caso de estudio elegido, porque representa el tercer país
latinoamericano y el quinto de américa en la industria aeronáutica. Por último, hay
que señalar que se han entrenado los modelos ML/DL bajo la modalidad de
aprendizaje supervisado (SL), por lo que el dataset contenía no solo las variables
de entrada sino también las variables de salida (objetivas) a predecir. Predicting the management parameters of air transport in the coming years is
critical for the main air transport agents such as: airlines, airport authorities, air
navigation service providers, as well as for the aircraft manufacturing industry itself,
etc. given that the aeronautical industry generates almost 87.7 million jobs (direct
and induced) and 3.4 trillion US$, which represents 4.1% of global GDP. The use of
Machine Learning/Deep Learning (ML/DL) algorithms, where ChatGPT has recently
emerged to extend the massive use of Artificial Intelligence (AI), are displacing other
classic statistical methods such as ARIMA, etc. in time series forecasting. This
thesis shows a double viability, that of developing and training ML/DL models with
its own means, and on the other hand demonstrating its applicability to air transport
management, thanks above all to the existence of libraries such as Keras and
programming languages such as Python, open source, both aimed at deep learning
(DL).
In particular, three case studies are addressed: the forecast of short and
medium-term demand for passengers (national and international), that of air cargo
(domestic and international) and that of the prediction of aircraft departure delays,
all demonstrated using data from the Colombia application case. The unique ML/DL
models developed for the first two cases are deep learning with encoder-decoder
architectures made with hybrid artificial neural networks that mix convolutional
networks with recurrent LSTM-type networks, called “ConvLSTM2D” which improve
the learning of the temporal patterns of multivariable historical series, where the
aeronautical variables under study are mixed with socioeconomic variables. While,
for the third case, related to the prediction of delays in aircraft departures,
demonstrated with data from Colombian airports, the research has been aimed at
selecting the best model, through comparison in the performances of several
classical ML models and a simple DL model (MLP), based on the measurement of
the root mean square error (RMSE) metric. An important effort in this research has been focused on providing robustness to the evaluations obtained by the models,
applying “k-fold cross validation” techniques, given the stochastic nature of the
problem (model and data). While the other important part of this research has been
oriented on interpreting the results obtained by the ML/DL models, since these
algorithms behave like black boxes by not making the learned patterns explicit,
through the use of “permutation importance” techniques. As well as variational
analysis when configuring scenarios obtained by combining different features, to
select the most relevant to the problem.
The dataset used for the demonstrations comes from the Colombian
Aeronautical Authority Aerocivil, which has been preprocessed with statistical
techniques for scaling, normalized, categorized, etc. to facilitate the homogenization
of data that facilitates learning. It is worth highlighting that in the dataset used for
the demand forecast it has not been necessary to carry out the process called
“feature extraction” or characteristics of the input variables such as it is necessary
to implement e.g. in dimensionless numbers analysis in physics to categorize a
regime, etc., since DL models, such as ConvLSTM2D, do not require such
preprocessing by the engineer (a task known as “feature engineering”), since this
feature extraction is carried out implicitly by deep learning models. In short, this
thesis has also been possible by having been able to access a large and reliable
volume of aeronautical and socioeconomic data for model training. Colombia has
been the chosen case, because it represents the third Latin American country and
the fifth in America in the aeronautical industry. Finally, it should be noted that the
ML/DL models have been trained under the supervised learning (SL) modality, so
the dataset contained not only the input variables but also the objective or output
variables to be predicted.