Recuperación de Información para la Web de las Cosas
Metadata
Show full item recordAuthor
Manta Caro, Héctor CristyanEditorial
Universidad de Granada
Director
Fernández Luna, Juan ManuelDepartamento
Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y ComunicaciónDate
2023Fecha lectura
2023-04-24Referencia bibliográfica
Manta Caro, Héctor Cristyan. Recuperación de Información para la Web de las Cosas. Granada: Universidad de Granada, 2023. [https://hdl.handle.net/10481/82082]
Sponsorship
Tesis Univ. Granada.Abstract
La Internet y las tecnologías Web han evolucionado notablemente desde su conceptualización,
cambiando nuestras vidas y la sociedad en numerosos aspectos. La creación de la
Red de Redes y la World Wide Web (www) han además posibilitado una base tecnológica
crucial para el progreso de la sociedad digital y la construcción de las ciudades inteligentes.
Hoy en día, emergen nuevos paradigmas que enmarcan una nueva era, el de la Internet y la
Web de las Cosas. Esto se debe a la posibilidad de interconectar a la Internet no solamente
dispositivos tradicionales como lo son los teléfonos inteligentes, los ordenadores portátiles,
la computación de tipo móvil y ubicua, sino también cualquier objeto en el mundo real.
Esta hiperconexión de objetos animados o inanimados en el mundo real ofrece además la
posibilidad de publicar servicios de tipo Web sobre estos objetos con la finalidad de proveer
contenido altamente dinámico y datos en tiempo real a los usuarios finales acerca del estado
o las acciones permitidas sobre estos. En la actualidad, la Internet de las Cosas (IoT) engloba
alrededor de 12 mil millones de dispositivos interconectados, y se esperan unos 16.5 mil
millones para 2025 y más de 25 mil millones de cosas para el 2030.
El IoT describe tecnologías y disciplinas de investigación que habilitan a la Internet
adentrarse en el mundo real de objetos físicos que se interconectan transparentemente y
adoptan cierta inteligencia. A través de IoT se obtiene información sobre propiedades, estados
y características de las cosas para así accionar sus funcionalidades de forma telemática.
La Web de las Cosas (WoT) propone la abstracción de entidades del mundo real en una
especie de “avatar” Web virtual o "gemelo" Web inteligente, con el fin de adquirir, procesar
y presentar información en tiempo real en relación con este avatar y con la capacidad
de conectarse y controlar cosas en el mundo real a través de este. De estos paradigmas
complementarios puede surgir una nueva generación de servicios, y muchos de estos también
apoyados en la infraestructura de las nuevas redes 5G y 6G. Uno de ellos, crucial para nuestra
interacción diaria con este nuevo ciber mundo inteligente, es la Recuperación de Información
(RI), principalmente en la forma de motores de búsqueda, que también puede evolucionar
hacia herramientas mucho más poderosas. Estos sistemas proporcionarán la capacidad de
encontrar información relevante y pertinente sobre las cosas en el mundo real a través de sus
abstracciones. Sobre esta base, debe definirse una nueva arquitectura de este tipo de servicios con la sinergia y los desafíos que ambos IoT y WoT imponen, debido a su colosal tamaño e
inaudito dinamismo.
Desde lo fundamental, los simuladores son una herramienta esencial para investigar y
desarrollar nuevos sistemas, arquitecturas o protocolos. Los simuladores han jugado un papel
clave en la historia, impulsando el desarrollo de Internet y la Web y sus componentes. Este
documento destaca la opinión acerca que la investigación basada en la simulación continuará
participando en la evolución de los paradigmas asociados con el IoT y WoT, así como de los
sistemas de RI. La aparición de tales paradigmas implica una redefinición, reconstrucción
hacia la evolución de los sistemas RI actuales, enfrentando así los nuevos desafíos. Por
consiguiente, es esencial desarrollar modelos abstractos de representación Web por medio de
la simulación para establecer nuevos enfoques en RI para WoT. Y así construir mecanismos
de experimentación y validación de estos enfoques por medio de colecciones sintéticas
dinámicas que mimeticen el comportamiento WoT por medio de simulación.
Existe aún un desafío latente debido a la heterogeneidad de propuestas que han surgido
en el modelado y concepción misma en la arquitectura de WoT, en diferentes niveles,
desde el mecanismo de representación Web, el lenguaje de descripción de cosas, hasta el
enriquecimiento semántico alrededor de WoT. Todos estos niveles heterogéneos tienen un
impacto directo en la construcción de los sistemas RI comúnmente presentados en la forma
de motores de búsqueda para IoT o WoT, donde podrían tomarse diferentes direcciones para
resolver los problemas de adaptabilidad a WoT para un campo particular de aplicación vía la
especialización del sistema RI, su generalización. En cuanto a los principios y arquitectura RI
no se evidencia un estudio a profundidad de las técnicas y estrategias de los sistemas RI en su
idoneidad y adaptabilidad, dadas las características de dinamismo de la WoT, considerando
los requerimientos que impone y los desafíos esperados.
En este trabajo doctoral se describe:
Una propuesta para modelarWoT basada en una representación XML estructurada. Este
modelo ha sido diseñado con flexibilidad y modularidad para permitir la representación
de múltiples escenarios, siendo la fuente conceptual para el futuro desarrollo de
sistemas RI.
Un simulador de eventos discretos, nombrado SIM.WoT cuyo objetivo final es encapsular
las dinámicas esperadas de la WoT para el desarrollo de sistemas de RI. El
simulador genera una colección sintética de documentos XML en tiempo real que
contienen contextos espacio-temporales e información textual con dimensiones altamente
dinámicas. El simulador se caracteriza por su flexibilidad y versatilidad para
representar escenarios del mundo real y ofrece una perspectiva única para la RI.
Una propuesta de RI para la WoT que contempla las etapas claves de indexación,
puntuación y presentación, denominada IR.WoT. Se describen en este trabajo las
consideraciones de diseño, implementación en la nube y experimentación con base en
una colección de documentos XML sintética a partir de simulación.
Un estudio de adaptabilidad de los paradigmas y conceptos de la RI convencional al
contexto de la WoT en la forma de una Revisión Sistemática de Literatura (RSL) y
actualización del estado del arte a 2022. Construcción de un Dataset abierto que como
resultado de la RSL contiene los datos y análisis de los motores de búsqueda y de los
mecanismos de RI para la IoT y WoT en la literatura científica.
Un reporte de experimentación de las etapas de indexación y recuperación en una
propuesta de motor de búsqueda IR.WoT junto con una propuesta de evaluación.
Finalizando con un análisis de resultados, recomendaciones con base en los resultados
experimentalers, conclusiones y trabajo futuro The Internet and Web technologies have evolved remarkably since their conception,
changing our lives and society in many ways. The creation of the World Wide Web (www)
and the Network of Networks have also provided a crucial technological base for the progress
of digital society and the construction of smart cities. Today, new paradigms are emerging
that frame a new era, that of the Internet and the Web of Things. This new era is due
to the possibility of interconnecting to the Internet, not only traditional devices such as
smartphones, laptops, mobile and ubiquitous computing, but also any object in the real world.
Hyperconnection of animate or inanimate objects in the real world also allows publishing
Web-type services to provide highly dynamic content and real-time data to end users about
the status or actions allowed on them. At the same time, these things (also referred to as
objects or entities) are endowed with a certain intelligence. Currently, the Internet of Things
encompasses around 12 billion interconnected devices, with an expected 16.5 billion by 2025
and more than 25 billion things by 2030.
The Internet of Things (IoT) describes technologies and research disciplines that enable
the Internet to delve into the real world of physical objects, seamlessly connecting and taking
on some intelligence. Through IoT, information is obtained on the properties, states and
characteristics of things to activate their functionalities telematically. The Web of Things
(WoT) proposes the abstraction of real-world entities into a kind of “avatar” Virtual Web
or intelligent Web Agent in order to acquire, process and present information in real-time
concerning this Avatar and with the ability to connect to and control things in the real world through it. A new generation of services can emerge from these complementary paradigms,
many of which are supported by the new infrastructure of 5G and 6G networks. One of
them is crucial for our daily interaction with this new intelligent cyber world, Information
Retrieval (IR), mainly in the form of search engines, which can also evolve into much more
powerful tools. These systems will provide the ability to find relevant information about
things in the real world through their abstractions. On this basis, a new architecture for this
type of IR service must be defined. It must consider the synergy and challenges both IoT and
WoT impose due to their colossal size and unprecedented dynamism.
Simulators are essential for researching and developing new systems, architectures or
protocols. Simulators have played a key role in history, driving the development of the
Internet and the Web and its components. This paper highlights the view that simulationbased
research will continue to participate in the evolution of paradigms associated with
the Internet and the Web of Things and information retrieval systems. The appearance of
such paradigms implies a redefinition and reconstruction towards the evolution of current IR
systems facing new challenges. Therefore, it is essential to develop abstract models of Web
representation through simulation to establish new approaches in Information Retrieval for
the Web of Things. Moreover, this builds mechanisms for experimentation and validation of
these approaches through dynamic synthetic collections that mimic WoT behaviour through
simulation.
A latent challenge exists due to the heterogeneity of WoT modelling proposals that
have emerged in the conception of WoT architecture. At different levels, from the Web
representation mechanism and the thing description language to the semantic enrichment
around WoT. All these heterogeneous levels directly impact the construction of IR systems in
the form of search engines for WoT. Different directions could be taken to solve the problems
of adaptability to WoT for a particular field of application via i) specialization of the IR
system or ii) generalization of the IR system. As for the IR principles and architecture, there
is no evidence of an in-depth study of the techniques and strategies of the IR systems in their
suitability and adaptability given the dynamic characteristics of the WoT, considering the
requirements it imposes and the expected challenges.
This doctoral work describes:
A proposal to model theWeb of Things based on a structured XML representation. This
model has been designed with flexibility and modularity to allow the representation
of multiple scenarios, being the conceptual source for the future development of IR
systems.
A discrete event simulator named SIM.WoT, whose ultimate goal is to encapsulate
the expected dynamics of the WoT for the development of IR systems. The simulator
generates a synthetic collection of XML documents in real time containing spatiotemporal
contexts and textual information with highly dynamic dimensions. The simulator
is characterized by its flexibility and versatility to represent real-world scenarios and
offers a unique perspective for IR.
An IR proposal for the WoT that contemplates the critical stages of indexing, scoring
and presentation, called IR.WoT. This paper describes design considerations, cloud implementation
and experimentation based on a collection of synthetic XML documents
from simulation.
A study of adaptability of conventional IR paradigms and concepts to the WoT context
in the form of a Systematic Literature Review (SLR) and update of state of the art to
2022. Construction of an open Dataset which, as a result of the SLR, contains the data
and analysis of search engines and IR mechanisms for the Internet and the Web of
Things in the scientific literature.
A report of experimentation of the indexing and retrieval stages in an IR.WoT search
engine proposal along with an evaluation proposal. We are finishing with an analysis
of results, conclusions and future work.