METODOS MATEMATICOS EN CIENCIAS DE LA COMPUTACION
05-06 UNIVERSIDAD DEL PAIS VASCO - EUSKAL HERRIKO
UNIBERTSITATEA, UPV-EHU
PRACTICA II: RECONOCIMIENTO DE PATRONES CON
WEKA
Tareas a realizar para el Tema 11 (Inducción
de Reglas):
Para tu base de datos en formato WEKA habitual de trabajo, construye con
este software las reglas correspondientes al clasificador RIPPER visto en
clase:
¿cuántas reglas produce el clasificador RIPPER?
¿tienen las reglas inducidas un alto grado de parecido con la estructura
propuesta por el árbol de C4.5?
¿aparecen los atributos que has considerado como relevantes para el
naive Bayes en las reglas de RIPPER?
¿qué crees que están representando los números entre paréntesis al final
de cada regla?
¿qué significado-efecto crees que tiene la última regla de
todas?
Categorización-Predicción: Pensando que tras
construir el clasificador final con todos tus casos (sea del tipo que sea)
llegan en el futuro nuevas instancias para ser clasificadas de las cuales
nuestro experto en el problema duda o desconoce la clase de pertenencia
(variable clase desconocida), genera un nuevo fichero arff de WEKA con
5 instancias inventadas por ti y en el que ubiques el
valor perdido ‘?’ en el de la variable clase. Ten en cuenta que el nuevo
fichero debe seguir el formato del fichero de entrenamiento del clasificador
final que contienen todas las instancias etiquetadas (con clase): y siguiendo
también la misma definición (en su cabecera) de las variables del problema...
(predictoras y clase) A esta tarea se la suele conocer como
categorización (o "class prediction"). Aquí ya el clasificador, "se la
está jugando, a ciegas"... Esperemos que "por debajo" subyazca-tenga el mismo
(o mejor) porcentaje de acierto que creemos-estimamos que
tiene.
Mediante el GUI de WEKA y su manual de uso, descubre cómo se
puede obtener en WEKA cuál es la clase que predicen para cada una de estas 5
instancia por ti inventadas los clasificadores RIPPER y naive-Bayes: para
hacer esto, ten en cuenta que en el interfaz de WEKA hay cuatro maneras de
validar un clasificador, y hasta ahora sólo hemos visto tres de
ellas... Ten en cuenta que debes proveer tus nuevos casos de clase
desconocida en un fichero arff independiente-nuevo, y que la forma de ver la
clase predicha por el clasificador construido con todos tus casos para estos
nuevos casos, la tienes dentro de las opciones de "More options" en la fase de
testeo de WEKA: es necesario para ver la clase predicha activar una opción del
"More options". Descubre por ti mismo cómo se hace esto en WEKA...(el manual
de uso te lo dirá en un momento en sus páginas 6 y 7...). Muestra la
clase predecida por cada uno de estos clasificadores (RIPPER y naive
Bayes) para cada una de estas nuevas instancias (no se quiere la matriz de
confusión, en la que no se puede diferenciar la clase predicha para
cadacaso concreto). En dicha salida de WEKA en el "Classifier
Output" del GUI aparecen los siguientes conceptos, para cada instancia para la
que hay que predecir su clase de pertenencia: "actual", "predicted", "error",
"probability distribution": comenta brevemente qué crees que significa cada
uno de ellos.