Recuperación de Información para la Web de las Cosas Manta Caro, Héctor Cristyan Fernández Luna, Juan Manuel Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y Comunicación La Internet y las tecnologías Web han evolucionado notablemente desde su conceptualización, cambiando nuestras vidas y la sociedad en numerosos aspectos. La creación de la Red de Redes y la World Wide Web (www) han además posibilitado una base tecnológica crucial para el progreso de la sociedad digital y la construcción de las ciudades inteligentes. Hoy en día, emergen nuevos paradigmas que enmarcan una nueva era, el de la Internet y la Web de las Cosas. Esto se debe a la posibilidad de interconectar a la Internet no solamente dispositivos tradicionales como lo son los teléfonos inteligentes, los ordenadores portátiles, la computación de tipo móvil y ubicua, sino también cualquier objeto en el mundo real. Esta hiperconexión de objetos animados o inanimados en el mundo real ofrece además la posibilidad de publicar servicios de tipo Web sobre estos objetos con la finalidad de proveer contenido altamente dinámico y datos en tiempo real a los usuarios finales acerca del estado o las acciones permitidas sobre estos. En la actualidad, la Internet de las Cosas (IoT) engloba alrededor de 12 mil millones de dispositivos interconectados, y se esperan unos 16.5 mil millones para 2025 y más de 25 mil millones de cosas para el 2030. El IoT describe tecnologías y disciplinas de investigación que habilitan a la Internet adentrarse en el mundo real de objetos físicos que se interconectan transparentemente y adoptan cierta inteligencia. A través de IoT se obtiene información sobre propiedades, estados y características de las cosas para así accionar sus funcionalidades de forma telemática. La Web de las Cosas (WoT) propone la abstracción de entidades del mundo real en una especie de “avatar” Web virtual o "gemelo" Web inteligente, con el fin de adquirir, procesar y presentar información en tiempo real en relación con este avatar y con la capacidad de conectarse y controlar cosas en el mundo real a través de este. De estos paradigmas complementarios puede surgir una nueva generación de servicios, y muchos de estos también apoyados en la infraestructura de las nuevas redes 5G y 6G. Uno de ellos, crucial para nuestra interacción diaria con este nuevo ciber mundo inteligente, es la Recuperación de Información (RI), principalmente en la forma de motores de búsqueda, que también puede evolucionar hacia herramientas mucho más poderosas. Estos sistemas proporcionarán la capacidad de encontrar información relevante y pertinente sobre las cosas en el mundo real a través de sus abstracciones. Sobre esta base, debe definirse una nueva arquitectura de este tipo de servicios con la sinergia y los desafíos que ambos IoT y WoT imponen, debido a su colosal tamaño e inaudito dinamismo. Desde lo fundamental, los simuladores son una herramienta esencial para investigar y desarrollar nuevos sistemas, arquitecturas o protocolos. Los simuladores han jugado un papel clave en la historia, impulsando el desarrollo de Internet y la Web y sus componentes. Este documento destaca la opinión acerca que la investigación basada en la simulación continuará participando en la evolución de los paradigmas asociados con el IoT y WoT, así como de los sistemas de RI. La aparición de tales paradigmas implica una redefinición, reconstrucción hacia la evolución de los sistemas RI actuales, enfrentando así los nuevos desafíos. Por consiguiente, es esencial desarrollar modelos abstractos de representación Web por medio de la simulación para establecer nuevos enfoques en RI para WoT. Y así construir mecanismos de experimentación y validación de estos enfoques por medio de colecciones sintéticas dinámicas que mimeticen el comportamiento WoT por medio de simulación. Existe aún un desafío latente debido a la heterogeneidad de propuestas que han surgido en el modelado y concepción misma en la arquitectura de WoT, en diferentes niveles, desde el mecanismo de representación Web, el lenguaje de descripción de cosas, hasta el enriquecimiento semántico alrededor de WoT. Todos estos niveles heterogéneos tienen un impacto directo en la construcción de los sistemas RI comúnmente presentados en la forma de motores de búsqueda para IoT o WoT, donde podrían tomarse diferentes direcciones para resolver los problemas de adaptabilidad a WoT para un campo particular de aplicación vía la especialización del sistema RI, su generalización. En cuanto a los principios y arquitectura RI no se evidencia un estudio a profundidad de las técnicas y estrategias de los sistemas RI en su idoneidad y adaptabilidad, dadas las características de dinamismo de la WoT, considerando los requerimientos que impone y los desafíos esperados. En este trabajo doctoral se describe: Una propuesta para modelarWoT basada en una representación XML estructurada. Este modelo ha sido diseñado con flexibilidad y modularidad para permitir la representación de múltiples escenarios, siendo la fuente conceptual para el futuro desarrollo de sistemas RI. Un simulador de eventos discretos, nombrado SIM.WoT cuyo objetivo final es encapsular las dinámicas esperadas de la WoT para el desarrollo de sistemas de RI. El simulador genera una colección sintética de documentos XML en tiempo real que contienen contextos espacio-temporales e información textual con dimensiones altamente dinámicas. El simulador se caracteriza por su flexibilidad y versatilidad para representar escenarios del mundo real y ofrece una perspectiva única para la RI. Una propuesta de RI para la WoT que contempla las etapas claves de indexación, puntuación y presentación, denominada IR.WoT. Se describen en este trabajo las consideraciones de diseño, implementación en la nube y experimentación con base en una colección de documentos XML sintética a partir de simulación. Un estudio de adaptabilidad de los paradigmas y conceptos de la RI convencional al contexto de la WoT en la forma de una Revisión Sistemática de Literatura (RSL) y actualización del estado del arte a 2022. Construcción de un Dataset abierto que como resultado de la RSL contiene los datos y análisis de los motores de búsqueda y de los mecanismos de RI para la IoT y WoT en la literatura científica. Un reporte de experimentación de las etapas de indexación y recuperación en una propuesta de motor de búsqueda IR.WoT junto con una propuesta de evaluación. Finalizando con un análisis de resultados, recomendaciones con base en los resultados experimentalers, conclusiones y trabajo futuro The Internet and Web technologies have evolved remarkably since their conception, changing our lives and society in many ways. The creation of the World Wide Web (www) and the Network of Networks have also provided a crucial technological base for the progress of digital society and the construction of smart cities. Today, new paradigms are emerging that frame a new era, that of the Internet and the Web of Things. This new era is due to the possibility of interconnecting to the Internet, not only traditional devices such as smartphones, laptops, mobile and ubiquitous computing, but also any object in the real world. Hyperconnection of animate or inanimate objects in the real world also allows publishing Web-type services to provide highly dynamic content and real-time data to end users about the status or actions allowed on them. At the same time, these things (also referred to as objects or entities) are endowed with a certain intelligence. Currently, the Internet of Things encompasses around 12 billion interconnected devices, with an expected 16.5 billion by 2025 and more than 25 billion things by 2030. The Internet of Things (IoT) describes technologies and research disciplines that enable the Internet to delve into the real world of physical objects, seamlessly connecting and taking on some intelligence. Through IoT, information is obtained on the properties, states and characteristics of things to activate their functionalities telematically. The Web of Things (WoT) proposes the abstraction of real-world entities into a kind of “avatar” Virtual Web or intelligent Web Agent in order to acquire, process and present information in real-time concerning this Avatar and with the ability to connect to and control things in the real world through it. A new generation of services can emerge from these complementary paradigms, many of which are supported by the new infrastructure of 5G and 6G networks. One of them is crucial for our daily interaction with this new intelligent cyber world, Information Retrieval (IR), mainly in the form of search engines, which can also evolve into much more powerful tools. These systems will provide the ability to find relevant information about things in the real world through their abstractions. On this basis, a new architecture for this type of IR service must be defined. It must consider the synergy and challenges both IoT and WoT impose due to their colossal size and unprecedented dynamism. Simulators are essential for researching and developing new systems, architectures or protocols. Simulators have played a key role in history, driving the development of the Internet and the Web and its components. This paper highlights the view that simulationbased research will continue to participate in the evolution of paradigms associated with the Internet and the Web of Things and information retrieval systems. The appearance of such paradigms implies a redefinition and reconstruction towards the evolution of current IR systems facing new challenges. Therefore, it is essential to develop abstract models of Web representation through simulation to establish new approaches in Information Retrieval for the Web of Things. Moreover, this builds mechanisms for experimentation and validation of these approaches through dynamic synthetic collections that mimic WoT behaviour through simulation. A latent challenge exists due to the heterogeneity of WoT modelling proposals that have emerged in the conception of WoT architecture. At different levels, from the Web representation mechanism and the thing description language to the semantic enrichment around WoT. All these heterogeneous levels directly impact the construction of IR systems in the form of search engines for WoT. Different directions could be taken to solve the problems of adaptability to WoT for a particular field of application via i) specialization of the IR system or ii) generalization of the IR system. As for the IR principles and architecture, there is no evidence of an in-depth study of the techniques and strategies of the IR systems in their suitability and adaptability given the dynamic characteristics of the WoT, considering the requirements it imposes and the expected challenges. This doctoral work describes: A proposal to model theWeb of Things based on a structured XML representation. This model has been designed with flexibility and modularity to allow the representation of multiple scenarios, being the conceptual source for the future development of IR systems. A discrete event simulator named SIM.WoT, whose ultimate goal is to encapsulate the expected dynamics of the WoT for the development of IR systems. The simulator generates a synthetic collection of XML documents in real time containing spatiotemporal contexts and textual information with highly dynamic dimensions. The simulator is characterized by its flexibility and versatility to represent real-world scenarios and offers a unique perspective for IR. An IR proposal for the WoT that contemplates the critical stages of indexing, scoring and presentation, called IR.WoT. This paper describes design considerations, cloud implementation and experimentation based on a collection of synthetic XML documents from simulation. A study of adaptability of conventional IR paradigms and concepts to the WoT context in the form of a Systematic Literature Review (SLR) and update of state of the art to 2022. Construction of an open Dataset which, as a result of the SLR, contains the data and analysis of search engines and IR mechanisms for the Internet and the Web of Things in the scientific literature. A report of experimentation of the indexing and retrieval stages in an IR.WoT search engine proposal along with an evaluation proposal. We are finishing with an analysis of results, conclusions and future work. 2023-06-01T07:51:57Z 2023-06-01T07:51:57Z 2023 2023-04-24 doctoral thesis Manta Caro, Héctor Cristyan. Recuperación de Información para la Web de las Cosas. Granada: Universidad de Granada, 2023. [https://hdl.handle.net/10481/82082] 9788411178587 https://hdl.handle.net/10481/82082 spa http://creativecommons.org/licenses/by-nc-nd/4.0/ open access Attribution-NonCommercial-NoDerivatives 4.0 Internacional Universidad de Granada