Imágenes milimétricas pasivas: procesamiento y mejora para la detección de amenazas
Metadatos
Mostrar el registro completo del ítemEditorial
Universidad de Granada
Departamento
Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y la ComunicaciónMateria
Inteligencia artificial
Materia UDC
004.8 120304
Fecha
2019Fecha lectura
2019-06-18Referencia bibliográfica
Serra Pérez, Juan Gabriel. Imágenes milimétricas pasivas: procesamiento y mejora para la detección de amenazas. Granada: Universidad de Granada, 2019. [http://hdl.handle.net/10481/56431]
Patrocinador
Tesis Univ. Granada.Resumen
La detección y localización de amenazas resulta una tarea de vital
importancia en la seguridad de instalaciones públicas o privadas tales
como, por ejemplo, aeropuertos, instalaciones gubernamentales, estadios o
almacenes de grandes empresas de distribución. Las ondas milimétricas son
emitidas de forma natural por todos los cuerpos debido a su temperatura;
esta radiación es capaz de atravesar tejidos como la ropa mostrando
objetos ocultos bajo esta de distintos materiales: metales, líquidos,
plásticos, etc. Las cámaras milimétricas pasivas son dispositivos que captan
estas ondas formando una imagen sin la emisión artificial de ningún tipo
de radiación, por lo que resultan inocuas. No obstante, la calidad de las
imágenes generadas es típicamente muy limitada debido a su baja
resolución, escasa relación señal a ruido y otras posibles degradaciones
inherentes a los sistemas de captación.
Esta tesis doctoral está dedicada al procesamiento y mejora de las
imágenes captadas con el objetivo final de hacer más precisos los sistemas
de detección. Se proponen soluciones a los problemas de inpainting,
eliminación de ruido y deconvolución ciega desde una misma perspectiva
probabilística en un marco bayesiano haciendo uso de la inferencia
variacional. La aproximación utilizada permite la estimación automática de
los parámetros del modelo conjuntamente con la de las propias imágenes
subyacentes. Los dos primeros problemas se resuelven mediante el
aprendizaje basado en diccionarios, desarrollando un nuevo método para la
estimación de los diccionarios y los vectores de coordenadas que
representas a las señales en estas ((bases)). La deconvolución ciega elimina
el emborronamiento desconocido presente en las imágenes; se propone un
método de estimación de este emborronamiento para la estimación de la
imagen nítida latente. Ambos trabajos presentan un denominador común,
las distribuciones a priori sparseque se utiliza para modelizar nuestro
conocimiento sobre la señal subyacente. La presente tesis aborda la
inferencia variacional con el uso de estas distribuciones, garantizando
soluciones analíticas que aproximan las distribuciones a posteriori de las
imágenes latentes, lo que constituye una novedosa contribución a la
literatura.
Finalmente, se aplican los métodos de mejora de imágenes
desarrollados sobre una base de datos de imágenes propia y se estudia el
efecto sobre dos métodos de detección con filosofías totalmente distintas:
un primer método clásico basado en extracción de características y
detección por bloque; y un segundo basado en una red neuronal
convolucional con estructura de autoencoder. En ambos casos se observarán
mejoras significativas en la detección. Threat detection and localization is a vital task in security and
surveillance applications in private, public or government facilities such as
airports, stadiums, warehouses of large logistics companies or embassies.
All bodies at a temperurate higher than absolute zero naturally emit
millimeter wave radiation which is capable of travelling through layers of
clothing revealing hidden objects of different materials: metals, liquids,
pastics, etc. Passive millimeter wave cameras/scanners receive the
radiation in this band of the spectrum generating an image without the
need of artifficial emission of waves, thus not posing a health hazard.
However, passive millimeter wave images display very limited quality due
to their low signal-to-noise ratio and resolution, as well as other
degradations caused by the acquisition systems.
This doctoral thesis is devoted to the processing and enhancement of
the acquired images with the ultimate goal of improving the accuracy of
the detection systems. We propose comprehensive solutions to the
inpainting, denoising and blind deconvolution problems from a
probabilistic perspective within a Bayesian framework using variational
inference. This approach allows for the automatic estimation of all model
parameters along with the latent images simultaneously. The first two
problems are solved with dictionary learning: we develop an efficient
technique for the estimation of the dictionaries and sparse coordinate
vectors which represent the observed signals in these \bases". Blind
deconvolution supresses the unknown blur in images; a method for the
estimation of this blur is proposed to estimate the underlying sharp
images. Both works share a common denominator: the use of sparse priors
to model the a priori knwledge on the latent signals. This thesis tackles
variational inference with the use of these priors, ensuring tractable
solutions that closely approximate the posterior distribution of the latent
images, constituing a novel contribution to the literature.
Finally, we apply the developed image enhancement techniques on an
image database and study the impact on two detection methods with
radically different philosophies: a classical approach based on feature
extraction and per-block classification and a second one which uses an
autoencoder-like convolutional neural network. In both cases substantial improvement in detection performance will be observed.