Bayesian transfer learning for continuous monitoring of active volcanoes

Bueno Rodríguez, Ángel

68468(1).pdf (6.396Mb)

Identificadores

URI: http://hdl.handle.net/10481/70452

ISBN: 9788411170253

Exportar

Editorial

Universidad de Granada

Director

Benítez Ortúzar, María Del Carmen; Ibáñez Godoy, Jesús Miguel

Departamento

Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y la Comunicación

Materia

Bayesian transfer learning

Monitoring

Active volcanoes

Aprendizaje por transferencia bayesiano

Monitoreo

Volcanes activos

Fecha

2021

Fecha lectura

2021-09-17

Referencia bibliográfica

Bueno Rodríguez, Ángel. Bayesian transfer learning for continuous monitoring of active volcanoes. Granada: Universidad de Granada, 2021. [http://hdl.handle.net/10481/70452]

Patrocinador

Tesis Univ. Granada.; Ministerio de Educación y Ciencia de España, (MINECO) TEC2015-68752 (KNOWAVES) PID2019-106260GB-I00 (FEMALE)

Resumen

This thesis builds a bridge between Bayesian deep learning and seismo-volcanic monitoring systems for waveform recognition and change detection, with short-term volcano forecasting capabilities. We accomplish this task by proposing three scalable, flexible, and universal architectures to perform rapid recognition of earthquake transients while estimating uncertainty to identify volcano dynamics and seismic changes. The advent of deep learning (DL) has made deep neural networks (DNNs) the preferred choice in the seismological community, boosting seismo-volcano monitoring to unprecedented levels by attaining high prediction quality while reducing a broad range of challenging monitoring tasks to computations within minutes. However, the direct application of DL methods in safety-critical systems is always conditioned to the data available and the flexibility required to interpret the unpredictable real world accurately. A new research field, known as Bayesian deep learning (BDL), fuses the Bayesian theory with deep learning algorithms. The new BDL approach employs Bayesian neural networks (BNNs) to capture the uncertainty within the learning model. The BNNs allow rapid and robust Bayesian inference of complex high-dimensional data distributions, along with the estimation of datainherent and model uncertainty. BNNs can be used in their standard form with static waveforms, such as a classifier of acoustic events. However, most acoustic data has a sequential nature. A seismic station collects seismic data streams, and BNNs may not be suitable to model the intra-event and temporal dynamics of the recorded data streams that compose the monitoring task. Thus, the design of robust architectures that can ingest sequential data while providing uncertainty estimation is fundamental for safety-critical tasks, such as seismo-volcano monitoring. Further, a set of unique geophysical challenges arise due to the nature of the data streams analyzed, leading to several monitoring drawbacks that impede the exploitation of DL high-capacity models and uncertainty quantification. The shortage of large datasets correlated with volcanic activity is considered the foremost challenge facing a successful deployment of deep learning methods by volcanic observatories. Unfortunately, such datasets are not often available due to the cost and difficulty in manual labeling. Furthermore, when available, these seismic datasets cover a very short period of a particular eruptive episode. From a machine learning perspective, these brief temporary unrest episodes yield a perpetual problem in which only modest portions of non-uniform data samples are available for training. Moreover, available data catalogs assume that the geophysical variables and conditions in the seismic unrest episode will be later encountered or exportable to other volcanoes. Given all these hindrances, new alternatives have to be studied. We tackle these challenges by invoking a Bayesian approach over the proposed networks.

Esta tesis tiene como objetivo el desarrollo de nuevos sistemas de monitoreo sismo-volcánico para el reconocimiento de señales y la detección de cambios en volcanes, con potencial para la predicción de erupciones a corto plazo. Los algoritmos de monitorización volcánicos, a pesar de ser altamente eficientes en la vigilancia sísmica, adolecen de ciertas deficiencias que impiden su completo despliegue como modelos de alta capacidad en un observatorio vulcanológico. Abordamos esta compleja tarea mediante métodos de aprendizaje profundo de tipo bayesiano para desarrollar sistemas avanzados que permitan la identificación escalable, flexible y rápida de la señal sísmica, así como estimaciones de incertidumbre asociadas con los cambios en el campo de onda sísmico monitorizado. El advenimiento del aprendizaje profundo (DL) ha convertido a las aproximaciones de redes neuronales profundas (DNN) en la opción preferida y por defecto para la comunidad sismológica. Esta adopción de sistemas de aprendizaje profundo ha impulsado el monitoreo sismo-volcánico a niveles sin precedentes, alcanzando tasas de rendimiento muy elevadas mediante cálculos de pocos minutos. Sin embargo, la aplicación directa de métodos DL en sistemas críticos para la seguridad humana siempre está condicionada a los datos disponibles y la flexibilidad requerida para interpretar con precisión el mundo real. Las DNNs adolecen de una interpretabilidad interna muy limitada, aunque justificable debido a su formulación funcional. Un nuevo campo de investigación, conocido como aprendizaje profundo bayesiano (BDL), emerge para proporcionar capacidades interpretativas a las predicciones de redes DNNs. La nueva metodología BDL emplea redes neuronales bayesianas (BNN) junto con metodologías aproximativas especializadas para capturar la incertidumbre asociada a un conjunto de datos, a la vez que mantiene todas las ventajas computacionales intrínsecas a los métodos DL. Las redes BNN permiten estimaciones bayesianas para distribuciones de datos altamente complejas y multidimensionales, proporcionando valores estimados de la incertidumbre inherente a los datos y del modelo. Esto algoritmos se pueden utilizar en su forma estándar con formas de onda segmentadas, como un clasificador de eventos sísmicos. Sin embargo, la mayoría de los datos acústicos exhiben una naturaleza secuencial. Una estación sísmica recopila flujos de datos sísmicos secuenciales, lo que implica que las BNN requieren de ciertas modificaciones para poder modelar la dinámica intra-evento y temporal de las secuencias de datos registrados que componen la serie sísmica. La escasez de grandes conjuntos de datos que reflejen la actividad volcánica es el principal desafío al que se enfrenta un despliegue exitoso de los métodos de aprendizaje profundo por parte de los observatorios vulcanológicos. Desafortunadamente, estos conjuntos de datos no suelen estar disponibles debido al costo y la dificultad del etiquetado manual. Cuando están disponibles, estos conjuntos de datos sísmicos contienen una breve cronología eruptiva, muy específica del volcán monitorizado. Desde una perspectiva de aprendizaje automático, estas breves series sísmica son el origen de un problema perpetuo en el que los conjuntos de datos sísmicos, modestos en su origen, no homogéneos ni estandarizados en el etiquetado, asumen que el episodio sísmico estudiado se corresponderá con situaciones posteriores en el volcán. Dados este conjunto de deficiencias identificadas, junto a lo anteriormente expuesto sobre la necesidad del modelado temporal Bayesiano, debemos estudiar nuevas alternativas.

Colecciones

Tesis

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España