METODOS MATEMATICOS EN CIENCIAS DE LA COMPUTACION 05-06
UNIVERSIDAD DEL PAIS VASCO - EUSKAL HERRIKO UNIBERTSITATEA, UPV-EHU

PRACTICA II: RECONOCIMIENTO DE PATRONES CON WEKA

Tareas a realizar para los Temas 7 (Regresión Logística) y 8 (Redes Neuronales):

  1. Regresión Logística: escoge una base de datos con dos valores de su variable clase. Construye para ella un modelo de regresión logística con el procedimiento "Logistic" de WEKA. Lee las explicaciones de este clasificador concreto de WEKA. Analiza:
  2. Regresión logística en SPSS: con su propia terminología y manejo de datos, el software SPSS también nos ofrece la posibilidad de construir modelos de regresión logística sobre nuestros datos. Mi opinión es que su manejo de los datos, conceptos teóricos y la construcción del modelo es "más oscura" que con WEKA: quizás son conceptos de estadística utilizados hace unos años en el análisis de datos.
    Para hacer pruebas de trabajo con SPSS, convierte la base de datos utilizada en la tarea anterior (2 clases) desde WEKA al formato de SPSS para que puedas trabajar en él: y guárdala en su formato para poder trabajar también en el futuro sobre ella en otras tareas. O si crees que esto es demasiado dificultoso, carga alguna de las bases de datos que ya tiene SPSS por defecto en su instalación (da igual que conozcas si hay problema de clasificación detrás de ellas o no, pero pienso que es sencillo plantearlo-intuirlo si asumes que una variable discreta es "tu clase").

    Considera las dos formas de regresión logística que ofrece el SPSS (binaria y multinomial) y accede a la "Ayuda" de ambas:
  3. Redes neuronales: accede al algoritmo de Perceptron Multicapa disponible en WEKA y visita sus distintos parámetros y relaciónalos con la teoría vista en clase, explicando los parámetros que se te hacen conocidos y aparecen en la teoría.
    Date cuenta cómo, por medio del interfaz gráfico (activar la opción "GUI"), puedes "modelar tu mismo" la estructura de la red.
    Date cuenta cómo, por medio del parámetro "HiddenLayers", puedes definir el número de capas ocultas de la red, así como el número de nodos en cada una de ellas.
  4. Redes neuronales: utilizando distintas semillas de aleatorización en WEKA, realiza una comparativa estadística mediante un test estadístico (no paramétrico) de los porcentajes de acierto estimados en base a 5 ejecuciones del método H (2/3 del fichero para entrenar, 1/3 para testeat), entre:

    Decide para ambos algoritmos el mismo número de nodos en cada capa oculta.
    ¿Se puede hablar, con una base estadística, de una propuesta ganadora/perdedora? Analiza y comenta los resultados de la comparativa realizada.

     

  5. Para l@s que os guste el futbol, visitad este enlace y ved el uso de las redes neuronales en él: http://www.acmilan.com/en/InfoPage.aspx?id=13439