METODOS MATEMATICOS EN CIENCIAS DE LA COMPUTACION 05-06
UNIVERSIDAD DEL PAIS VASCO - EUSKAL HERRIKO UNIBERTSITATEA, UPV-EHU
PRACTICA II: RECONOCIMIENTO DE PATRONES CON WEKA
Tareas a realizar para el Tema 9 (Clasificadores k-NN - vecino más próximo):
Aunque no se haya visto en las clases teóricas, la discretización es una cuestión relevante en el Reconocimiento de Patrones. Muchos clasificadores no puedes trabajar con variables con valores continuos, y deben categorizarse-discretizarse sus valores. Los clasificadores k-NN son capaces de trabajar con ambos tipos de variables:
Escoge una base de datos en formato arff de WEKA que tenga todas (o algunas) variables predictoras con valores continuos.
Estudia y comenta las funciones que realiza la técnica de filtrado-preprocesado
("Filter") "Discretize",
que se ubica en el primer planel de trabajo ("Preprocess") del interfaz de WEKA, dentro
de las técnicas de filtrado-"Filter" no-supervisadas respecto a las variables
("attributes") del
problema: explica la función de sus
parámetros "bins" y "useEqualFrequency". Se
considera una técnica "no-supervisada" porque no hace uso de la clase
del problema.
¿Qué efecto se ha
producido en los valores de las variables (indaga en los valores de las
variables discretizadas)? ¿El porcentaje de acierto es
el mismo discretizando o no? Indaga en cuestiones de este estilo, y
coméntalas.
Comprueba que el funcionamiento del clasificador k-NN al discretizar sus
valores continuos y al no hacerlo, no es el mismo.