Learning expressive numerical planning domains by integrating machine learning techniques
Metadatos
Mostrar el registro completo del ítemAutor
Segura Muros, José ÁngelEditorial
Universidad de Granada
Departamento
Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y de la ComunicaciónMateria
Machine learning Automatic Planning Learning algorithms learning STRIPS action models
Fecha
2022Fecha lectura
2021-12-21Referencia bibliográfica
Segura Muros, José Ángel. Learning expressive numerical planning domains by integrating machine learning techniques. Granada: Universidad de Granada, 2022. [http://hdl.handle.net/10481/72367]
Patrocinador
Tesis Univ. Granada.; Ministerio de Ciencia, Innovación y Universidades de España BES-2016-076700; Proyectos Nacionales de Investigación Españoles TIN2015-71618-R y RTI2018-098460-B-I00Resumen
Esta tesis doctoral plantea una novedosa metodología para el aprendizaje de Modelos
de Acción para Planificación Automática. Esta metodología se enmarca dentro
del campo de la Ingeniería de Conocimiento, concretamente en el área de la Adquisición
de Conocimiento. Específicamente, esta tesis doctoral presenta un proceso
de aprendizaje que combina de forma jerárquica distintas técnicas de Aprendizaje
Automático, con un especial enfoque en el uso de técnicas de Inteligencia Artificial
Explicable.
Los objetivos considerados en el desarrollo de la tesis doctoral son:
• Implementación de un algoritmo de aprendizaje capaz de aprender
modelos de acción STRIPS cuyas precondiciones y efectos también
contengan expresiones aritméticas y relacionales. El estudio empírico
realizado para la evaluación de este objetivo compara la solución propuesta
con algoritmos de referencia con el fin de analizar su comportamiento y
situarlo dentro del estado del arte.
• Diseño de un algoritmo de aprendizaje que mejore las capacidades del
anterior a la hora de trabajar bajo situaciones en las que la calidad de
los datos de entrada es baja. Para testear el nuevo procedimiento se implementa
un proceso experimental con el objetivo de confrontarlo respecto
al algoritmo desarrollado previamente usando datos de entrada con incertidumbre.
Además, con afán de obtener una mejor visión de conjunto de la
calidad de los métodos desarrollados, se compara la nueva metodología con
algoritmos de referencia del estado del arte.
• Desarrollo de un algoritmo de aprendizaje de modelos de acción capaz
de funcionar a partir de datos obtenidos de un entorno simulado. Para
un correcto análisis de la metodología implementada se usan datos obtenidos
de las ejecuciones de agentes sobre entornos simulados, comprobando que los
procesos propuestos pueden replicar el comportamiento de dichos agentes.
Los tres objetivos han sido alcanzados de forma satisfactoria implementando
una serie de algoritmos de aprendizaje que combinan de forma jerárquica técnicas
de regresión, clasificación estadística y análisis de grupos. Cada uno de estos
procesos de aprendizaje es el producto de la consecución de cada uno de los objetivos
propuestos anteriormente y supone una contribución al estado del arte por sí
mismo. Para la correcta implementación de cada algoritmo de aprendizaje se han
diseñado diversos métodos de preprocesamiento de datos, de tratamiento de la incertidumbre
y de adquisición de modelos de clasificación, usando para ello técnicas
bien conocidas del campo del Aprendizaje Automático. Finalmente, indicar que
las contribuciones presentadas en la tesis doctoral se han evaluado usando, no solo
dominios de planificación de referencia tomados de la comunidad de Planificación
Automática, si no también, del entorno de trabajo de videojuegos GVG-AI. This doctoral thesis proposes a novel methodology for learning Action Models for
Automatic Planning. This methodology is framed within the field of Knowledge
Engineering, specifically in the area of Knowledge Acquisition. Particularly, this
doctoral thesis presents a learning process that hierarchically combines different
Machine Learning techniques, with a special focus on the use of Explainable Artificial
Intelligence techniques.
The objectives considered in the development of the doctoral thesis are:
• Implementation of a learning algorithm capable of learning STRIPS
action models whose preconditions and effects also contain arithmetic
and relational expressions. The empirical study carried out for the evaluation
of this objective compares the proposed solution with reference algorithms
in order to analyse its behaviour and situate it within the state of the
art.
• Design of a learning algorithm that improves the capabilities of the
previous one when working under situations where the quality of the
input data is low. To test the new procedure, an experimental process is implemented
to compare it with the previously developed algorithm using input
data with uncertainty. Furthermore, in order to obtain a better overview of
the quality of the developed methods, the new methodology is compared with
state-of-the-art reference algorithms.
• Development of an action model learning algorithm capable of operating
from data obtained from a simulated environment. For a correct
analysis of the implemented methodology, data obtained from the execution
of agents in simulated environments are used, verifying that the proposed
processes can replicate the behaviour of these agents.
All three objectives have been successfully achieved by implementing a series of
learning algorithms that hierarchically combine regression, statistical classification
and cluster analysis techniques. Each of these learning processes is the product of
the achievement of each of the above objectives and is a contribution to the state
of the art in its own right. For the correct implementation of each learning algorithm,
several methods of data pre-processing, uncertainty treatment and acquisition
of classification models have been designed, using well-known techniques
from the field of Machine Learning. Finally, it should be noted that the contributions
presented in the doctoral thesis have been evaluated using reference planning
domains taken from the Automatic Planning community and, also, from the GVGAI
videogame working environment.
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.