Estructuras estocásticas notables en procesos puntuales espacio-temporales y medidas de riesgo bivariantes
Metadatos
Afficher la notice complèteEditorial
Universidad de Granada
Departamento
Universidad de Granada. Programa de Doctorado en Estadística Matemática y AplicadaDate
2023Fecha lectura
2023-01-30Referencia bibliográfica
Escudero Villa, Amalia Isabel. Estructuras estocásticas notables en procesos puntuales espacio-temporales y medidas de riesgo bivariantes. Granada: Universidad de Granada, 2023. [https://hdl.handle.net/10481/80004]
Patrocinador
Tesis Univ. Granada.; Escuela Superior Politécnica de Chimborazo 376.CP.2019Résumé
La modelización estadística constituye un conjunto de formulaciones
matemáticas que proporcionan un mejor entendimiento de los fenómenos,
especialmente en los que subyacen relaciones entre variables que a su vez
poseen influencia aleatoria. En este trabajo de tesis se realiza la modelización
estadística del fenómeno delictivo, mediante el desarrollo de estructuras
estocásticas en procesos puntuales espacio-temporales, con el propósito de
reproducir eventos de la forma más exacta posible a la realidad en función de
su evolución en el espacio, tiempo y espacio-tiempo.
En primer lugar, se estructura la dependencia espacio-temporal de los procesos
auto-excitados espacialmente correlacionados, considerando una ecuación
en diferencias estocástica para la intensidad del proceso espacio-temporal,
que captura tanto la dependencia debida a la auto-excitación como la dependencia
en un proceso espacial subyacente. Se sigue el razonamiento de Clark
y Dixon (2021) y Reinhart (2018), pero capturando la no linealidad de las
covariables espacio-temporales mediante una estructura aditiva generalizada
(GAM) con B-splines. En segundo lugar, se estructura un modelo de proceso
espacio-temporal latente, es decir, un procesos de Cox log-gaussiano (LGCP),
con una función de intensidad separable de primer orden. La componente determinista
temporal es el resultado de un modelo lineal generalizado (GLM)
con efectos de covariables meteorológicas, días y meses del año, parámetros
de regresión armónica, periodicidad anual de las tasas de incidencia y tendencia
global. Para la componente determinista espacial se considera un GAM
siguiendo el razonamiento de Diggle et al. (2005), Taylor et al. (2013) y González
y Mateu (2021), pero con estimación de suavidad integrada con B-splines
univariantes. Por su parte, para la componente estocástica, se considera un
campo gaussiano que modeliza la dependencia y la variación espacio-temporal
de los eventos. En tercer lugar, se identifican los mecanismos de auto-excitación
entre las series de delitos en un tiempo continuo mediante los procesos puntuales
de Hawkes. Se estima la tasa de background de cada componente con
una reconstrucción estocástica no paramétrica; ésta incluye una periodicidad
temporal, una componente espacial separable y una tendencia a largo plazo.
Para la estimación semi-paramétrica de los coeficientes de relajación se utiliza
máxima verosimilitud para estabilizar y asegurar el proceso de estimación. Se
sigue el algoritmo iterativo de Zhuang y Mateu (2019) y Zhuang (2006). Los
modelos de procesos puntuales espacio-temporales son buenas herramientas
matemáticas para analizar datos, por lo que los modelos descritos proporcionan
predicciones confiables, como se muestra a lo largo de esta memoria con
datos de delitos.
Con la intención de ir más allá de la modelización y las predicciones
de patrones puntuales, se formula un procedimiento para identificar las
excedencias espaciales en LGCP bivariantes y sus regiones asociadas, así como
también la cuantificación de la peligrosidad en términos de probabilidades. Para esto, se modeliza la descomposición espacial de los hurtos (delito
sin uso de violencia) y robos a personas (delitos con uso de violencia o
amedrentamiento) para representarlos en una variación asociada a un tipo
de delito en particular, lo que es posible mediante una estructura estocástica
compuesta por una componente dentro del flujo y otra entre flujos. Y se
incorpora un enfoque de medidas de riesgo como el Valor en Riesgo y el
Déficit Esperado (Malevergne y Sornette, 2006). Estas medidas están basadas
en percentiles de la distribución de los delitos que exceden un umbral alto.
Se considera una estructura de dependencia mediante la cópula extrema de
Gumbel-Hougaard (Salvadori et al., 2007) y distribuciones marginales de
Pareto generalizadas (Castellanos y Cabras, 2007; Abad et al., 2014).
En general, se adopta un marco bayesiano con MCMC-MALA y máxima
verosimilitud para la inferencia sobre los parámetros de los diferentes modelos.
Se hace estudio de casos con datos reales de delitos registrados en la ciudad
de Riobamba-Ecuador y algunas covariables temporales, espaciales y espaciotemporales.
Los resultados obtenidos proporcionan información relevante
sobre el modelizado, predicción y comportamiento extremo localizado de
eventos delictivos; sin embargo, pueden ser de mucha utilidad para aplicarse a
conjuntos de datos de diversas áreas. Finalmente, se exponen las conclusiones
y se plantean algunas ideas abiertas. Statistical modeling is a set of mathematical formulations which provide
a better understanding of phenomena, especially those that underlie relationships
between variables that in turn have random influence. In this thesis
work, the statistical modeling of criminal phenomena is carried out through
the development of stochastic structures in spatio-temporal point processes,
in order to reproduce events as accurately as possible to reality in terms of
their evolution in space, time and space-time.
First, the spatio-temporal dependence of spatially correlated self-excited
processes is structured, considering a stochastic difference equation for the
intensity of the spatio-temporal process, which captures both the dependence
due to self-excitation and the dependence on an underlying spatial process.
The reasoning of Clark and Dixon (2021) and Reinhart (2018) is followed,
but capturing the nonlinearity of the spatio-temporal covariates by means
of a generalized additive structure (GAM) with B-splines. Second, a latent
spatio-temporal process model, i.e. a LGCP, is structured with a separable
first order intensity function. The deterministic time component is the result
of a generalized linear model (GLM) with meteorological covariate effects, days
and months of the year, harmonic regression parameters, annual periodicity
of incidence rates and global trend. For the spatial deterministic component
a generalized additive model (GAM) is considered, following the reasoning,
of Diggle et al. (2005), Taylor et al. (2013) and González and Mateu (2021),
but with integrated smoothness estimation with univariate B-splines. And
for the stochastic component, we consider a Gaussian field that models
the spatio-temporal dependence and variation of the events. Thirdly, selfexcitation
mechanisms are identified among the crime serie in a continuous
time by means of Hawkes point processes. The background rate of each
component is estimated with a nonparametric stochastic reconstruction; it
includes a temporal periodicity, a separable spatial component and a long-term
trend. The semi-parametric maximum likelihood estimation of the relaxation
coefficients to stabilize and secure the estimation process, and the iterative
algorithm of Zhuang and Mateu (2019) and Zhuang (2006) are followed.
Spatio-temporal point process models are good mathematical tools for data
analysis, and therefore, the described models provide reliable predictions, as
shown throughout this thesis in crime data.
In order to go beyond modeling and predictions of point patterns, a
procedure is formulated to identify the spatial exceedances in bivariate LGCP
and their associated regions, as well as the quantification of the hazard in
terms of probabilities. For this, we model the spatial decomposition of thefts
(crime without the use of violence) and robberies (crime with the use of
violence or intimidation) to represent them in a variation associated with a
particular type of crime, which is possible by means of a stochastic structure
composed of a within-flow component and anotherone between-flows. For this modeling, we use log-Gaussian Cox processes along the same line of
Taylor et al. (2015). And a focus on risk measures such as Value-at-Risk
and Expeted Shorfall (Malevergne and Sornette, 2006) is incorporated. These
measures are based on percentiles of the distribution of offenses exceeding a
high threshold. A dependency structure using the extreme Gumbel-Hougaard
copula is considered (Salvadori et al., 2007), and generalized Pareto marginal
distributions (Castellanos and Cabras, 2007; Abad et al., 2014).
In general, a Bayesian framework with MCMC-MALA and maximum
likelihood is adopted for the inference on the parameters of the different
models. A case study is developed with real data of crimes registered in the
city of Riobamba-Ecuador and some temporal, spatial and spatio-temporal
covariates. The results obtained provide relevant information on the modeling,
prediction and extreme localized behavior of criminal events; however, they
can be very useful to be applied to data sets of different areas. Finally,
conclusions are drawn and some open ideas are put forward.