Show simple item record

dc.contributor.advisorGarcía López, Salvador 
dc.contributor.advisorHerrera Triguero, Francisco 
dc.contributor.authorGarcía Gil, Diego Jesús
dc.contributor.otherUniversidad de Granada. Programa de Doctorado en Tecnologías de la Información y la Comunicaciónes_ES
dc.date.accessioned2020-05-29T10:49:50Z
dc.date.available2020-05-29T10:49:50Z
dc.date.issued2020
dc.date.submitted2020-03-10
dc.identifier.citationGarcía Gil, Diego Jesús. Big Data ensembles for classification and Smart Data extraction. Granada: Universidad de Granada, 2020. [http://hdl.handle.net/10481/62290]es_ES
dc.identifier.isbn9788413065014
dc.identifier.urihttp://hdl.handle.net/10481/62290
dc.description.abstractLa presente tesis aborda diferentes temas: clasificación supervisada estándar, filtrado de ruido y clasificación desbalanceada. Todos ellos girando en torno a un denominador común, métodos de ensemble en Big Data para obtener Smart Data. Los objetivos considerados han sido: 1. Estudio del estado actual en escalabilidad de herramientas Big Data, proveyendo un estudio analítico y experimental de dichas herramientas con el objetivo de adquirir un mayor conocimiento sobre el rendimiento de las plataformas actuales. 2. Estudio del estado del arte en preprocesamiento de datos Big Data como un método para obtener Smart Data, incluyendo un estudio teórico y empírico, mostrando todas las debilidades y fortalezas de los desarrollos actuales en dichas áreas. 3. Desarrollo de un ensemble distribuido para clasificación basado en preprocesamiento de datos, centrado en la creación de datos altamente diversos a través del preprocesamiento de datos en Big Data. 4. Abordar el problema del ruido en los datos en entornos Big Data, demostrando que el ruido en los datos no puede ser ignorado en Big Data, así como proveyendo las primeras soluciones propuestas para abordar este problema. 5. Desarrollo de un método de ensemble basado en Smart Data para clasificación de datos Big Data desbalanceados usando preprocesamiento de datos, capaz de abordar problemas Big Data de forma eficiente. Para cumplir estos objetivos, varias técnicas escalables y distribuidas han sido desarrolladas utilizando una plataforma para computación distribuida, denominada Apache Spark. Nuestras propuestas nos han permitido aplicar diversos métodos de tipo ensemble tanto para clasificación como para preprocesamiento de datos en Big Data, con el objetivo de obtener datos de calidad o Smart Data. Así mismo, hemos contribuido a completar la escasez presente en muchas bibliotecas de métodos para aprendizaje automático a gran escala, proveyendo métodos para clasificación supervisada estándar, filtrado de ruido, así como clasificación desbalanceada.es_ES
dc.description.sponsorshipTesis Univ. Granada.es_ES
dc.description.sponsorshipSupported by the Spanish National Research Projects TIN-2014-57251-P and TIN-2017-89517-P, and the Project BigDaP-TOOLS - Ayudas Fundación BBVA a Equipos de Investigación Científica 2016.es_ES
dc.format.mimetypeapplication/pdfen_US
dc.language.isoenges_ES
dc.publisherUniversidad de Granadaes_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 España*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.subjectBases de datos es_ES
dc.subjectAnálisis de datoses_ES
dc.subjectBig dataes_ES
dc.subjectSmart Dataes_ES
dc.titleBig Data ensembles for classification and Smart Data extractiones_ES
dc.typeinfo:eu-repo/semantics/doctoralThesises_ES
europeana.typeTEXTen_US
europeana.dataProviderUniversidad de Granada. España.es_ES
europeana.rightshttp://creativecommons.org/licenses/by-nc-nd/3.0/en_US
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessen_US


Files in this item

[PDF]

This item appears in the following Collection(s)

  • Tesis
    Tesis leídas en la Universidad de Granada

Show simple item record

Atribución-NoComercial-SinDerivadas 3.0 España
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España