Development of recommender systems using social media data in order to palliate the cold start problem
Metadata
Show full item recordAuthor
Herce Zelaya, JulioEditorial
Universidad de Granada
Departamento
Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y la ComunicaciónDate
2023Fecha lectura
2023-06-26Referencia bibliográfica
Herce Zelaya, Julio. Development of recommender systems using social media data in order to palliate the cold start problem.Granada: Universidad de Granada, 2023. [https://hdl.handle.net/10481/84449]
Sponsorship
Tesis Univ. Granada.; TIN2016-75850-R, titulado "Sistemas inteligentes de toma de decisión y consenso en ambiente difuso: Aplicaciones en e-salud y e-comercio" y financiado por el Ministerio de Economía y Competitividad; PID2019-103880RB-I00, titulado "Sistemas de toma de decisiones en grupo disruptivos en ambiente difuso: aplicaciones en gestión inteligente de energía y empleados" y financiado por el Ministerio de Ciencia e Innovación; P20_00673, titulado "Nuevos sistemas difusos para la toma de decisiones: Aplicaciones en entornos digitales" y financiado por la Conserjería de Transformación Económica, Industria, Conocimiento y Universidades. Junta de Andalucía.Abstract
Nowadays we live in a period where there are plenty of options for consuming content online,
either books, films or music. New material is released every day and users can consume this
content with just a couple of clicks. Despite of this vast amount of options, or maybe due to
that, it is more difficult than ever for users to find content that they would enjoy consuming.
Sometimes this process can feel like looking for a needle in a haystack. The role of recommender
systems is to filter all this content and to provide only the interesting items to the users. These
systems are normally based on historical data from the users with other items. For example
previous ratings of items can be used to recommend similar items to the ones were ranked
highest. One of the most common pitfalls from these systems is the cold start problem. This
problem occurs when either a new user or new item is introduced in the system and, therefore,
there are no previous data that could be leverage by the recommender systems in order to
create recommendations. This problem has an ever-growing importance due to the huge
offer of online services for consuming content. These systems need to be prepared to engage
users that recently join their platforms by offering them contents that the users would enjoy.
Otherwise there is a high risk that these users would leave and find another platform. This topic
is widely studied in the literature but due to its importance and its peculiarities, like different
domain behaviour or lack of appropriate datasets to study this problem, there is still much to
study and research and the current state-of-the-art algorithms have room for improvement.
In this proposal, this issue is addressed from different perspectives and applied for different
domains and scenarios. The goal of this work is to alleviate the cold start problem and for that
we develop models using artificial intelligence algorithms that make use of users’ contextual
data from their social media profiles. These models outperform the state-of-the-art models for
cold start problem. In addition to that, in this proposal a dedicated dataset has been created.
This dataset is optimised for the study of the cold start problem and has data about movie rating,
movie description and user description. This will ease future researches since such datasets
are rather scarce in the literature. Other areas of this proposal is hedge fund management
or reinforcement for recommendation of education resources in the field of oral surgery and
implantology and how to address these topics when there is not much previous data available.
This work obtained optimal results, matching, and even improving results from state-of-
the-art algorithms for recommendation systems with cold-start problem. This is obtained
through the leverage of implicit data, extracted automatically from different sources not having
to require the user to provide any manual data A día de hoy vivimos en la edad de la información y estamos expuestos a una sobrecarga de
contenido. En los últimos años la cantidad de opciones disponibles para consumir contenido
ha crecido exponencialmente. A veces, esta gran cantidad de contenido dificulta la elección del
usuario cuando tiene que tomar alguna decisión, por lo que es de gran importancia contar con
herramientas automáticas que ayuden en esa toma de decisiones. Es aquí donde cobran una
gran importancia los sistemas de recomendación, que usando nuestros patrones de búsqueda,
visionado y valoraciones son capaces de recomendarnos productos que sean de nuestro interés.
Sin embargo uno de los problemas más comunes de los sistemas de recomendación es el
problema del arranque en frío, esto es, la situación de cuando un usuario acaba de unirse a
una plataforma y la plataforma no tiene ningún dato sobre él que pueda ser usado para crear
recomendaciones. Este problema tiene una importancia creciente a día de hoy ya que cada vez
hay más servicios distintos de retransmisión de películas en streaming (Netflix, Prime Video,
HBO, Filmin, Apple TV, Disney+), de reproducción de música en streaming (Spotify, Apple Music,
Amazon Music) y no es raro que usuarios cambien de una plataforma a otra frecuentemente. Es
por eso que se convierte en un problema de gran relevancia y se vuelve vital que las plataformas
dispongan de sistemas de recomendación que sean resilientes al problema de arranque en frío.
En esta propuesta, el problema del arranque en frío se palia mediante el uso de información
implícita sobre el usuario usando datos de distintas fuentes como redes sociales, portales de
noticias o información acerca de la confianza en otros usuarios similares. Este problema ha
sido ampliamente estudiado en la literatura, pero por su importancia y peculiaridades, como
comportamiento variables en distintos entornos o la dificultad de encontrar datos en los que
basar este tipo de sistemas, aún hay mucho trabajo por hacer. En este trabajo se abordan los
sistemas de recomendación desde enfoques y dominios tan diversos como la recomendación
de películas a usuarios de portales de películas basándose en datos extraídos de redes sociales;
la elección de acciones para optimizar inversiones usando históricos del mercado y datos de
noticias relacionadas con esas acciones; y recomendación de recursos académicos usando un
sistema de confianza entre usuarios.
Los resultados obtenidos en las diferentes propuestas de este trabajo han sido promete-
dores porque igualan e incluso sobrepasan resultados obtenidos en la literatura con respecto a
recomendación bajo la influencia del problema de arranque en frío. Estos resultados se obtienen
gracias al uso de información implícita acerca del usuario extraída de distintas fuentes de manera
automática, sin necesitar que el usuario proporcione, activamente, datos de forma manual.