Learning expressive numerical planning domains by integrating machine learning techniques

Segura Muros, José Ángel

73861.pdf (2.267Mb)

Identificadores

URI: http://hdl.handle.net/10481/72367

ISBN: 9788411172110

Exportar

Editorial

Universidad de Granada

Director

Fernández Olivares, Juan; Pérez Rodríguez, Francisco G.Raúl

Departamento

Universidad de Granada. Programa de Doctorado en Tecnologías de la Información y de la Comunicación

Materia

Machine learning

Automatic Planning

Learning algorithms

learning STRIPS action models

Fecha

2022

Fecha lectura

2021-12-21

Referencia bibliográfica

Segura Muros, José Ángel. Learning expressive numerical planning domains by integrating machine learning techniques. Granada: Universidad de Granada, 2022. [http://hdl.handle.net/10481/72367]

Patrocinador

Tesis Univ. Granada.; Ministerio de Ciencia, Innovación y Universidades de España BES-2016-076700; Proyectos Nacionales de Investigación Españoles TIN2015-71618-R y RTI2018-098460-B-I00

Resumen

Esta tesis doctoral plantea una novedosa metodología para el aprendizaje de Modelos de Acción para Planificación Automática. Esta metodología se enmarca dentro del campo de la Ingeniería de Conocimiento, concretamente en el área de la Adquisición de Conocimiento. Específicamente, esta tesis doctoral presenta un proceso de aprendizaje que combina de forma jerárquica distintas técnicas de Aprendizaje Automático, con un especial enfoque en el uso de técnicas de Inteligencia Artificial Explicable. Los objetivos considerados en el desarrollo de la tesis doctoral son: • Implementación de un algoritmo de aprendizaje capaz de aprender modelos de acción STRIPS cuyas precondiciones y efectos también contengan expresiones aritméticas y relacionales. El estudio empírico realizado para la evaluación de este objetivo compara la solución propuesta con algoritmos de referencia con el fin de analizar su comportamiento y situarlo dentro del estado del arte. • Diseño de un algoritmo de aprendizaje que mejore las capacidades del anterior a la hora de trabajar bajo situaciones en las que la calidad de los datos de entrada es baja. Para testear el nuevo procedimiento se implementa un proceso experimental con el objetivo de confrontarlo respecto al algoritmo desarrollado previamente usando datos de entrada con incertidumbre. Además, con afán de obtener una mejor visión de conjunto de la calidad de los métodos desarrollados, se compara la nueva metodología con algoritmos de referencia del estado del arte. • Desarrollo de un algoritmo de aprendizaje de modelos de acción capaz de funcionar a partir de datos obtenidos de un entorno simulado. Para un correcto análisis de la metodología implementada se usan datos obtenidos de las ejecuciones de agentes sobre entornos simulados, comprobando que los procesos propuestos pueden replicar el comportamiento de dichos agentes. Los tres objetivos han sido alcanzados de forma satisfactoria implementando una serie de algoritmos de aprendizaje que combinan de forma jerárquica técnicas de regresión, clasificación estadística y análisis de grupos. Cada uno de estos procesos de aprendizaje es el producto de la consecución de cada uno de los objetivos propuestos anteriormente y supone una contribución al estado del arte por sí mismo. Para la correcta implementación de cada algoritmo de aprendizaje se han diseñado diversos métodos de preprocesamiento de datos, de tratamiento de la incertidumbre y de adquisición de modelos de clasificación, usando para ello técnicas bien conocidas del campo del Aprendizaje Automático. Finalmente, indicar que las contribuciones presentadas en la tesis doctoral se han evaluado usando, no solo dominios de planificación de referencia tomados de la comunidad de Planificación Automática, si no también, del entorno de trabajo de videojuegos GVG-AI.

This doctoral thesis proposes a novel methodology for learning Action Models for Automatic Planning. This methodology is framed within the field of Knowledge Engineering, specifically in the area of Knowledge Acquisition. Particularly, this doctoral thesis presents a learning process that hierarchically combines different Machine Learning techniques, with a special focus on the use of Explainable Artificial Intelligence techniques. The objectives considered in the development of the doctoral thesis are: • Implementation of a learning algorithm capable of learning STRIPS action models whose preconditions and effects also contain arithmetic and relational expressions. The empirical study carried out for the evaluation of this objective compares the proposed solution with reference algorithms in order to analyse its behaviour and situate it within the state of the art. • Design of a learning algorithm that improves the capabilities of the previous one when working under situations where the quality of the input data is low. To test the new procedure, an experimental process is implemented to compare it with the previously developed algorithm using input data with uncertainty. Furthermore, in order to obtain a better overview of the quality of the developed methods, the new methodology is compared with state-of-the-art reference algorithms. • Development of an action model learning algorithm capable of operating from data obtained from a simulated environment. For a correct analysis of the implemented methodology, data obtained from the execution of agents in simulated environments are used, verifying that the proposed processes can replicate the behaviour of these agents. All three objectives have been successfully achieved by implementing a series of learning algorithms that hierarchically combine regression, statistical classification and cluster analysis techniques. Each of these learning processes is the product of the achievement of each of the above objectives and is a contribution to the state of the art in its own right. For the correct implementation of each learning algorithm, several methods of data pre-processing, uncertainty treatment and acquisition of classification models have been designed, using well-known techniques from the field of Machine Learning. Finally, it should be noted that the contributions presented in the doctoral thesis have been evaluated using reference planning domains taken from the Automatic Planning community and, also, from the GVGAI videogame working environment.

Colecciones

Tesis

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España