Bayesian transfer learning for continuous monitoring of active volcanoes
Metadatos
Mostrar el registro completo del ítemAutor
Bueno Rodríguez, ÁngelEditorial
Universidad de Granada
Departamento
Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y la ComunicaciónMateria
Bayesian transfer learning Monitoring Active volcanoes Aprendizaje por transferencia bayesiano Monitoreo Volcanes activos
Fecha
2021Fecha lectura
2021-09-17Referencia bibliográfica
Bueno Rodríguez, Ángel. Bayesian transfer learning for continuous monitoring of active volcanoes. Granada: Universidad de Granada, 2021. [http://hdl.handle.net/10481/70452]
Patrocinador
Tesis Univ. Granada.; Ministerio de Educación y Ciencia de España, (MINECO) TEC2015-68752 (KNOWAVES) PID2019-106260GB-I00 (FEMALE)Resumen
This thesis builds a bridge between Bayesian deep learning and seismo-volcanic monitoring
systems for waveform recognition and change detection, with short-term volcano forecasting capabilities.
We accomplish this task by proposing three scalable, flexible, and universal architectures
to perform rapid recognition of earthquake transients while estimating uncertainty to identify
volcano dynamics and seismic changes.
The advent of deep learning (DL) has made deep neural networks (DNNs) the preferred choice
in the seismological community, boosting seismo-volcano monitoring to unprecedented levels by
attaining high prediction quality while reducing a broad range of challenging monitoring tasks
to computations within minutes. However, the direct application of DL methods in safety-critical
systems is always conditioned to the data available and the flexibility required to interpret the
unpredictable real world accurately.
A new research field, known as Bayesian deep learning (BDL), fuses the Bayesian theory with
deep learning algorithms. The new BDL approach employs Bayesian neural networks (BNNs) to
capture the uncertainty within the learning model. The BNNs allow rapid and robust Bayesian
inference of complex high-dimensional data distributions, along with the estimation of datainherent
and model uncertainty. BNNs can be used in their standard form with static waveforms,
such as a classifier of acoustic events. However, most acoustic data has a sequential nature. A seismic
station collects seismic data streams, and BNNs may not be suitable to model the intra-event
and temporal dynamics of the recorded data streams that compose the monitoring task. Thus,
the design of robust architectures that can ingest sequential data while providing uncertainty estimation is fundamental for safety-critical tasks, such as seismo-volcano monitoring. Further, a
set of unique geophysical challenges arise due to the nature of the data streams analyzed, leading
to several monitoring drawbacks that impede the exploitation of DL high-capacity models and
uncertainty quantification.
The shortage of large datasets correlated with volcanic activity is considered the foremost challenge
facing a successful deployment of deep learning methods by volcanic observatories. Unfortunately,
such datasets are not often available due to the cost and difficulty in manual labeling.
Furthermore, when available, these seismic datasets cover a very short period of a particular eruptive
episode. From a machine learning perspective, these brief temporary unrest episodes yield a
perpetual problem in which only modest portions of non-uniform data samples are available for
training. Moreover, available data catalogs assume that the geophysical variables and conditions
in the seismic unrest episode will be later encountered or exportable to other volcanoes. Given all
these hindrances, new alternatives have to be studied. We tackle these challenges by invoking a
Bayesian approach over the proposed networks. Esta tesis tiene como objetivo el desarrollo de nuevos sistemas de monitoreo sismo-volcánico
para el reconocimiento de señales y la detección de cambios en volcanes, con potencial para la
predicción de erupciones a corto plazo. Los algoritmos de monitorización volcánicos, a pesar de
ser altamente eficientes en la vigilancia sísmica, adolecen de ciertas deficiencias que impiden su
completo despliegue como modelos de alta capacidad en un observatorio vulcanológico. Abordamos
esta compleja tarea mediante métodos de aprendizaje profundo de tipo bayesiano para
desarrollar sistemas avanzados que permitan la identificación escalable, flexible y rápida de la
señal sísmica, así como estimaciones de incertidumbre asociadas con los cambios en el campo de
onda sísmico monitorizado.
El advenimiento del aprendizaje profundo (DL) ha convertido a las aproximaciones de redes
neuronales profundas (DNN) en la opción preferida y por defecto para la comunidad sismológica.
Esta adopción de sistemas de aprendizaje profundo ha impulsado el monitoreo sismo-volcánico
a niveles sin precedentes, alcanzando tasas de rendimiento muy elevadas mediante cálculos de
pocos minutos. Sin embargo, la aplicación directa de métodos DL en sistemas críticos para la
seguridad humana siempre está condicionada a los datos disponibles y la flexibilidad requerida
para interpretar con precisión el mundo real.
Las DNNs adolecen de una interpretabilidad interna muy limitada, aunque justificable debido
a su formulación funcional. Un nuevo campo de investigación, conocido como aprendizaje
profundo bayesiano (BDL), emerge para proporcionar capacidades interpretativas a las predicciones
de redes DNNs. La nueva metodología BDL emplea redes neuronales bayesianas (BNN) junto con metodologías aproximativas especializadas para capturar la incertidumbre asociada a
un conjunto de datos, a la vez que mantiene todas las ventajas computacionales intrínsecas a los
métodos DL. Las redes BNN permiten estimaciones bayesianas para distribuciones de datos altamente
complejas y multidimensionales, proporcionando valores estimados de la incertidumbre
inherente a los datos y del modelo. Esto algoritmos se pueden utilizar en su forma estándar con
formas de onda segmentadas, como un clasificador de eventos sísmicos. Sin embargo, la mayoría
de los datos acústicos exhiben una naturaleza secuencial. Una estación sísmica recopila flujos de
datos sísmicos secuenciales, lo que implica que las BNN requieren de ciertas modificaciones para
poder modelar la dinámica intra-evento y temporal de las secuencias de datos registrados que
componen la serie sísmica.
La escasez de grandes conjuntos de datos que reflejen la actividad volcánica es el principal desafío
al que se enfrenta un despliegue exitoso de los métodos de aprendizaje profundo por parte de
los observatorios vulcanológicos. Desafortunadamente, estos conjuntos de datos no suelen estar
disponibles debido al costo y la dificultad del etiquetado manual. Cuando están disponibles, estos
conjuntos de datos sísmicos contienen una breve cronología eruptiva, muy específica del volcán
monitorizado. Desde una perspectiva de aprendizaje automático, estas breves series sísmica son el
origen de un problema perpetuo en el que los conjuntos de datos sísmicos, modestos en su origen,
no homogéneos ni estandarizados en el etiquetado, asumen que el episodio sísmico estudiado se
corresponderá con situaciones posteriores en el volcán. Dados este conjunto de deficiencias identificadas,
junto a lo anteriormente expuesto sobre la necesidad del modelado temporal Bayesiano,
debemos estudiar nuevas alternativas.