Dimensionalidad en multidimensional scaling y su tratamiento computacional Román Montoya, Yolanda González Carmona, Andrés Vera Vera, José Fernando Universidad de Granada.Departamento de Estadística e Investigación Operativa Análisis estadístico multivariable Estadística aplicada Matemáticas Uno de los problemas más importantes en el análisis de datos mediante técnicas MDS es la determinación de la dimensionalidad para la representación de los objetos que se analizan a partir de medidas de proximidad. En la memoria se presenta una solución a este problema basado en la determinación analítica del porcentaje de variabilidad explicada por cada una de las dimensiones consideradas en la configuración. Para ello se procede a la estimación de lo que hemos definido como Configuraciones Anidadas. Una configuración en dipensión p se dice que está anidada en otra de dimensión superior cuando las p primeras coordenadas de los puntos representados en la segunda coinciden con la configuración en p dimensiones. El tratamiento de las configuraciones anidadas en MDS ya fue considerado por Heiser para datos métricos con el algoritmo SMACOF estableciendo una aproximación directa entre las distancias entre los puntos en las configuraciones y las medidas de disimilaridad entre los objetos que se analizan, sin tener en cuenta el principio de representación óptima de Fisher de mantenimiento de las propiedades de medida en los datos. En nuestro estudio hemos considerado la obtención de configuraciones anidadas a partir del análisis de datos no métricos tomando como criterio de minimización el definido por el algoritmo ALSCAL, por las innumerables ventajas que presenta respecto al resto de los algoritmos para MDS no probabilístico. El modelo construído se basa enun procedimiento iterativo en el que se alternan dos etapas: fase de representación óptima, en la que se procede a la estimación de unos nuevos parámetros denominados disparidades, que se definen como estimaciones mediante regresión monótona de las disimilaridades iniciales con objeto de definir unos nuevos valores que permitan mantener las restricciones de medida de los datos originales, y la fase de estimación de la configuración en la que se procede a la determinación del conjunto de configuraciones anidadas. En esta segunda etapa se define un ciclo iterativo en la que circulando a través de las dimensiones que se considerarán en el análisis, minimiza en cada etapa el cuadrado de las diferencias entre las disparidades y las distancias, respecto al actual conjunto de coordenadas activas. El proceso se detiene cuando la mejora producida en la función de pérdidas no sea significativa. Una vez obtenido el conjunto de configuraciones anidadas se observa como la variabilidad total de los datos se puede expresar en términos de los módelos de los vectores asociados a cada una de las dimensiones que se consideran, más un término de error. Por tanto, se tomarán estos módulos dimensionales como medida para determinar la dimensionalidad apropiada del problema. Obtenido el modelo teórico, procedimos a su implementación computacional, que realizamos en lenguaje Visual Basic. De los análisis prácticos realizados posteriormente, se obtienen los siguientes resultados: El modelo anidado reconstruye las configuraciones de los objetos en la dimensión apropiada a partir del análisis de los módulos dimensionales, resultado este confirmado también por los estudios con técnicas procrustianas llevadas a cabo. Además, el modelo anidado,proporciona soluciones que son estables, no sensibles a errores introducidos en los datos, como se observa a partir del estudio de simulación llevado a cabo mediante técnicas de simulación. 2013-10-25T10:26:37Z 2013-10-25T10:26:37Z 2000 info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10481/28668 spa http://creativecommons.org/licenses/by/3.0 Creative Commons Attribution 3.0 License Granada