Aportaciones en encuestas no probabilísticas y encuestas web
Metadatos
Afficher la notice complèteEditorial
Universidad de Granada
Director
Sánchez Borrego, Ismael RamónDepartamento
Universidad de Granada. Programa de Doctorado en Estadística Matemática y AplicadaMateria
Encuestas Web
Date
2021Fecha lectura
2021-10-05Referencia bibliográfica
Mullo Guaminga, Héctor Salomón. Aportaciones en encuestas no probabilísticas y encuestas web. Granada: Universidad de Granada, 2021. [http://hdl.handle.net/10481/71173]
Patrocinador
Tesis Univ. Granada.Résumé
Antecedentes: El propósito principal del muestreo estadístico es obtener conocimiento sobre una
población utilizando un subconjunto pequeño y accesible de individuos seleccionados. Este objetivo generalmente
se aborda al elegir una muestra representativa, utilizando la probabilidad de selección de cada
individuo determinada por una lista completa de la población objetivo (marco muestral). Sin embargo,
para muchas poblaciones ocultas o de difícil acceso importantes para la Salud publica y la Sociología,
como las que están en riesgo de contraer VIH, la comunidad LGBTI, minorías étnicas, inmigrantes y
niños de la calle, etc, la probabilidad de selección de los individuos no se puede determinar, debido a que
no existe un marco muestral o su construcción es extremadamente costosa y poco practica debido a su
naturaleza. El muestreo dirigido por los participantes (RDS) se introdujo por Heckathorn [4] y es uno de
los métodos más utilizados cuando se toman muestras de poblaciones ocultas o de difícil acceso. La metodología
RDS combina un esquema de muestreo de bola de nieve mejorado, con un modelo matemático
que puede producir estimaciones no sesgadas de la población, cuando se cumplen algunas suposiciones
sobre el proceso de reclutamiento. En RDS existen estrategias bien desarrolladas para estimar medias y
prevalencias. Además, dentro del desarrollo de métodos de regresión, existen trabajos muy interesantes
basados en la modelización que intentan considerar la agrupación de redes subyacentes a la muestra y
la homofi lia inherente al proceso de reclutamiento. Sin embargo, no se tiene un método estandarizado
para el modelado de regresión utilizando datos recopilados a través de RDS. También, en la literatura de
trabajos que aplican la metodología RDS apenas hay trabajos realizados para muestrear poblaciones de
minorías étnicas.
Objetivos: El objetivo de esta tesis es doble. Primero, poner en practica una encuesta no probabilística mediante la metodología RDS, para recoger información sobre poblaciones indígenas y otras
minorías étnicas de relevancia en Sudamérica. En segundo lugar, formular expresiones de estimadores de covarianza y coe cientes de correlación en el contexto del muestreo de poblaciones difíciles de alcanzar.
Contribuciones: Se ha demostrado que, RDS es un método e caz para analizar la estructura de las
redes sociales de minorías étnicas conectadas en la web y se ha implementado con éxito como método de
muestreo en la web en Ecuador, un país en el que las poblaciones minoritarias están muy estigmatizadas
y subrepresentadas en las encuestas ofi ciales. Los métodos estadísticos se desarrollan en el contexto de
regresión para RDS, en este sentido se ha propuesto un nuevo método de estimación de los pesos de la
muestra para datos continuos. El enfoque de nuestro trabajo ha sido proponer un método para estimar
parámetros no lineales con nuevos pesos muestrales. Se han derivado expresiones de las varianzas y
también se ha demostrado que los estimadores propuestos tienen propiedades deseables.
Conclusiones: El muestreo dirigido por los participantes es una herramienta e caz para muestrear
en la web minorías étnicas urbanas en Ecuador. Sin embargo, debido a varias violaciones de los supuestos
de RDS la interpretación de las estimaciones de población de la muestra de RDS en la web debe estar
condicionado a estas incertidumbres. Los resultados sobre la dependencia entre variables continuas presentados
en esta tesis, se suman a la creciente literatura sobre muestreo dirigido por los participantes,
lo que permite a los investigadores obtener mejor información sobre las poblaciones ocultas de interés.
Estos hallazgos son importantes para los métodos de regresión en el contexto de RDS y para muestrear
minoras étnicas sin la limitación de las implementaciones físicas basadas en entrevistas. Background: The main purpose of statistical sampling is to obtain knowledge about a population
using a small and accessible subset of selected individuals. This objective is generally addressed by choosing
a representative sample, using the probability of selection of each individual determined by a complete
list of the target population (sampling frame). However, for many hidden or hard-to-reach populations
important to Public Health and Sociology, such as those at risk of contracting HIV, the LGBTI community,
ethnic minorities, immigrants and street children, etc., the probability of selection of individuals
cannot be determined, because there is no sampling frame or its construction is extremely expensive and
impractical due to its nature. Respondent-Driven Sampling (RDS) was introduced by Heckathorn [4] and
is one of the most widely used methods when sampling from hidden or hard-to-reach populations. The
RDS methodology combines an improved snowball sampling scheme with a mathematical model that can
produce unbiased estimates of the population, when some assumptions about the recruitment process
are met. In RDS there are well-developed strategies for estimating means and prevalences. In addition,
within the development of regression methods, there are very interesting works based on modeling that
attempt to consider the grouping of networks underlying the sample and the homophily inherent in the
recruitment process. However, there is no standardized method for regression modeling using data collected
through RDS. Also, in the literature of works that apply the RDS methodology there are hardly any
works carried out to sample ethnic minority populations.
Objectives: The objective of this thesis is twofold. First, to implement a non-probabilistic survey
using the RDS methodology to collect information on indigenous populations and other relevant ethnic
minorities in South America. Second, formulate expressions of covariance estimators and correlation
coe cients in the context of sampling hard-to-reach populations. Contributions: RDS has been shown to be an e ective method for analyzing the structure of ethnic
minority social networks connected on the web and has been successfully implemented as a web sampling
method in Ecuador, a country where minority populations are present. highly stigmatized and underrepresented
in o cial surveys. The statistical methods are developed in the regression context for RDS,
in this sense a new method of estimating the sample weights for continuous data has been proposed.
The focus of our work has been to propose a method to estimate non-linear parameters with new sample
weights. Expressions of the variances have been derived and the proposed estimators have also been
shown to have desirable properties.
Conclusions: Respondent-Driven Sampling is an e ective tool for sampling urban ethnic minorities
in Ecuador on the web. However, due to various violations of the RDS assumptions the interpretation
of the population estimates of the RDS sample on the web must be conditioned by these uncertainties.
The results on the dependence between continuous variables presented in this thesis add to the growing
literature on Respondent-Driven Sampling, allowing researchers to obtain better information on the
hidden populations of interest. These ndings are important for regression methods in the context of
RDS and for sampling ethnic minorities without the limitation of physical implementations based on
interviews.