METODOS MATEMATICOS EN CIENCIAS DE LA COMPUTACION 05-06
UNIVERSIDAD DEL PAIS VASCO - EUSKAL HERRIKO UNIBERTSITATEA, UPV-EHU

PRACTICA II: RECONOCIMIENTO DE PATRONES CON WEKA

Tareas a realizar para el Tema 11 (Inducción de Reglas):

  1. Para tu base de datos en formato WEKA habitual de trabajo, construye con este software las reglas correspondientes al clasificador RIPPER visto en clase:
  2. Categorización-Predicción:
    Pensando que tras construir el clasificador final con todos tus casos (sea del tipo que sea) llegan en el futuro nuevas instancias para ser clasificadas de las cuales nuestro experto en el problema duda o desconoce la clase de pertenencia (variable clase desconocida), genera un nuevo fichero arff de WEKA con 5  instancias inventadas por ti y en el que ubiques el valor perdido ‘?’ en el de la variable clase.
    Ten en cuenta que el nuevo fichero debe seguir el formato del fichero de entrenamiento del clasificador final que contienen todas las instancias etiquetadas (con clase): y siguiendo también la misma definición (en su cabecera) de las variables del problema... (predictoras y clase)
    A esta tarea se la suele conocer como categorización (o "class prediction"). Aquí ya el clasificador, "se la está jugando, a ciegas"... Esperemos que "por debajo" subyazca-tenga el mismo (o mejor) porcentaje de acierto que creemos-estimamos que tiene.

    Mediante el GUI de WEKA y su manual de uso, descubre cómo se puede obtener en WEKA cuál es la clase que predicen para cada una de estas 5 instancia por ti inventadas los clasificadores RIPPER y naive-Bayes: para hacer esto, ten en cuenta que en el interfaz de WEKA hay cuatro maneras de validar un clasificador, y hasta ahora sólo hemos visto tres de ellas...
    Ten en cuenta que debes proveer tus nuevos casos de clase desconocida en un fichero arff independiente-nuevo, y que la forma de ver la clase predicha por el clasificador construido con todos tus casos para estos nuevos casos, la tienes dentro de las opciones de "More options" en la fase de testeo de WEKA: es necesario para ver la clase predicha activar una opción del "More options". Descubre por ti mismo cómo se hace esto en WEKA...(el manual de uso te lo dirá en un momento en sus páginas 6 y 7...).
    Muestra la clase predecida por cada uno de estos clasificadores (RIPPER y naive Bayes) para cada una de estas nuevas instancias (no se quiere la matriz de confusión, en la que no se puede diferenciar la clase predicha para cada caso concreto). En dicha salida de WEKA en el "Classifier Output" del GUI aparecen los siguientes conceptos, para cada instancia para la que hay que predecir su clase de pertenencia: "actual", "predicted", "error", "probability distribution": comenta brevemente qué crees que significa cada uno de ellos.