<rdf:RDF xmlns:rdf="http://www.openarchives.org/OAI/2.0/rdf/" xmlns:ow="http://www.ontoweb.org/ontology/1#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:ds="http://dspace.org/ds/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/rdf/ http://www.openarchives.org/OAI/2.0/rdf.xsd">
   <ow:Publication rdf:about="oai:digibug.ugr.es:10481/52504">
      <dc:title>Dealing with Imbalanced and Weakly Labeled Data in Machine Learning using Fuzzy Set and Rough Set Methods</dc:title>
      <dc:creator>Vluymans, Sarah</dc:creator>
      <dc:contributor>Cornelis, Chris</dc:contributor>
      <dc:contributor>Saeys, Yvan</dc:contributor>
      <dc:contributor>Universidad de Granada.</dc:contributor>
      <dc:subject>Tecnologías</dc:subject>
      <dc:subject>Datos</dc:subject>
      <dc:subject>Máquina</dc:subject>
      <dc:subject>Métodos</dc:subject>
      <dc:description>This thesis focuses on classification. The goal is to predict the class label of elements (that&#xd;
is, assign them to a category) based on a previously provided dataset of known observations.&#xd;
Traditionally, a number of features are measured for all observations, such that they can be&#xd;
described by a feature vector (collecting the values for all features) and an associated outcome,&#xd;
if the latter is known. In the classic iris dataset, for example, each observation corresponds to&#xd;
an iris plant and is described by its values for four features representing biological properties&#xd;
of the flower. The associated class label is the specific family of irises the sample belongs&#xd;
to and the prediction task is to categorize a plant to the correct family based on its feature&#xd;
values. A classification algorithm does so based on its training set of labelled instances, that&#xd;
is, a provided set of iris flowers for which both the features values and class labels are known.&#xd;
One of the most intuitive classifiers is the nearest neighbour algorithm. To classify a new&#xd;
element, this method locates the most similar training instance (the nearest neighbour) and&#xd;
assigns the target to the class to which this neighbour belongs. Other methods build an&#xd;
explicit classification model from the training set, for example in the format of a decision&#xd;
tree.</dc:description>
      <dc:description>Esta tesis se enfoca en el problema de la clasificación. El objetivo consiste en predecir las&#xd;
etiquetas de clase de determinados datos (es decir, asignarlos a una categoría), basándonos&#xd;
en un conjunto de datos, proporcionado previamente, que contiene observaciones conocidas.&#xd;
Tradicionalmente, se miden algunas características para todas las observaciones, de forma&#xd;
que estas ´ultimas se pueden describir por un vector de características (recopilando los valores&#xd;
para todas las características) y por un resultado asociado, a condición de que esté disponible.&#xd;
Por ejemplo, en el conjunto de datos clásico iris, cada observación corresponde a una planta&#xd;
de iris y está descrita por los valores de sus cuatro características representando propiedades&#xd;
biológicas de la flor. La etiqueta de clase asociada es la familia especifica de iris a la cual&#xd;
pertenece la muestra y la tarea de predicción consiste en asignar la planta a la familia correcta&#xd;
basándonos en los valores de sus características. Un algoritmo de clasificación efectúa&#xd;
esta tarea basándose en un conjunto de entrenamiento de instancias etiquetadas, es decir, un&#xd;
conjunto de flores de iris para las cuales se conocen tanto los valores de las características&#xd;
como las etiquetas de clase. Uno de los clasificadores más intuitivos es el algoritmo de vecinos&#xd;
más cercanos. Para clasificar un dato nuevo, este método localiza la instancia de entrenamiento&#xd;
más similar (el vecino más cercano) y lo asigna a la clase a la cual pertenece este&#xd;
vecino. Otros métodos construyen un modelo de clasificación explícito a partir del conjunto&#xd;
de entrenamiento, por ejemplo en forma de un árbol de decisión.</dc:description>
      <dc:date>2018-07-26T09:54:02Z</dc:date>
      <dc:date>2018-07-26T09:54:02Z</dc:date>
      <dc:date>2018</dc:date>
      <dc:date>2018-06-29</dc:date>
      <dc:type>doctoral thesis</dc:type>
      <dc:identifier>Vluymans, Sarah. Dealing with Imbalanced and Weakly Labeled Data in Machine Learning using Fuzzy Set and Rough Set Methods. Granada: Universidad de Granada, 2018. [http://hdl.handle.net/10481/52504]</dc:identifier>
      <dc:identifier>9788491639480</dc:identifier>
      <dc:identifier>http://hdl.handle.net/10481/52504</dc:identifier>
      <dc:language>eng</dc:language>
      <dc:rights>http://creativecommons.org/licenses/by-nc-nd/3.0/es/</dc:rights>
      <dc:rights>open access</dc:rights>
      <dc:rights>Atribución-NoComercial-SinDerivadas 3.0 España</dc:rights>
      <dc:publisher>Universidad de Granada</dc:publisher>
   </ow:Publication>
</rdf:RDF>