METODOS MATEMATICOS EN CIENCIAS DE LA COMPUTACION 07-08
UNIVERSIDAD DEL PAIS VASCO - EUSKAL HERRIKO UNIBERTSITATEA, UPV-EHU

Profesores: Abdelmalik Moujahid - responsable sesiones teóricas (abdel--sc.ehu.es) e Iñaki Inza - responsable de sesiones prácticas (inza--sc.ehu.es)
Calendario lectivo Facultad
Presentación de la asignatura
Tutorías: Abdel - despacho 329 (miércoles: 10:00-14:00;  jueves: 9:00-11:00), Iñaki - despacho 257 (martes y viernes: 9:00-11:00;  miércoles: 17:30-19:30)

 

Notas Septiembre 2008 --- 2 prácticas y Examen: Grupo16, Grupos17y18

 

A grosso modo: Práctica I (2 puntos): heurísticos estocásticos de búsqueda ----- Práctica II (3 puntos): reconocimiento de patrones --- Examen teórico (5 puntos).
Las sesiones prácticas se desarrollan en el Laboratorio 018 de la planta baja de la Facultad.
Recordad vuestro password de LDAP: si no recordáis, contactad con los técnicos de la facultad que tanto mañana y tarde están en la planta baja de la facultad.

El primer laboratorio práctico será en la semana que va del 25 al 29 de febrero: 4ºA (grupo 16) el jueves/viernes (según el desdoble que os corresponda); 4ºB (grupos 17 y 18) el martes/miércoles (según el desdoble que os corresponda). Es necesario que acudáis a este laboratorio. En este primer laboratorio se explicarán las líneas generales de forma de trabajo en los laboratorios de todo curso, y os presentaré la Práctica I y una pequeña parte de la Práctica II.

Los siguientes laboratorios prácticos que considero "necesarios" que vengáis para poder hacer las prácticas serán:
- los de la semana que va del 31 de marzo al 4 de abril (según el día y desdoble que os corresponda)
- los de la semana del 7 al 11 de abril (según el día y desdoble que os corresponda)
(el miércoles 9 "día especial de tarde " de esa semana daré clase normal)
En estos dos laboratorios explicaré las principales tareas a realizar de la Práctica II ("Reconocimiento de Patrones") y daré puntos de apoyo que considero necesarios para su desarrollo. Considero como "necesario" estos laboratorios, ya que en ellos daré explicaciones que considero son imprescindibles: arrancar en la práctica sin ellas considero que es fuerte "handicap" para realizarla.

Los laboratorios están pensados para que vayáis desarrollando tareas relacionadas con la teoría recibida en esos días y semanas anteriores (a cada tema de la teoría trataremos que se le asocien unas tareas prácticas), marcando el ritmo de las clases prácticas, así como indicándoos una fecha de entrega parcial cercana (con alrededor de 9-10 días de antelación). Para que estén íntimamente relacionados con el ritmo y temas de las clases teóricas de los días anteriores, las tareas concretas a realizar en los laboratorios, así como la fecha de entrega parcial, se anunciarán en esta página web los días anteriores, según avance el curso.

Ambas prácticas se realizarán individualmente: aunque os animo a que compartáis y realimentéis vuestro trabajo unos a otros, busco una implicación y compromiso personal en el desarrollo y documentación de los trabajos prácticos.
Realizaré entrevistas personales sobre los resultados de las prácticas y la documentación que entreguéis con todos los alumnos que pueda.

Se deben cumplimentar todos los requisitos exigidos en el enunciado de cada práctica para que ésta se pueda considerar como aprobada. Es necesario aprobar cada una de las prácticas, junto con el examen, para aprobar la asignatura. En caso de entregar alguna de las prácticas, se os considerará como "presentados" en esa convocatoria. En caso de no entregar las prácticas en las fechas que se indiquen, como fecha tope para ser evaluadas en la convocatoria de septiembre se considerará la del examen teórico en esa convocatoria. 

En caso de considerar algún otro día de laboratorio como "necesario" por mi parte (o cambiar sus fechas), en el cual tenga que daros explicaciones imprescindibles para realizar las prácticas, se os lo anunciaría por esta web y en las clases teórico-prácticas. En los demás laboratorios, estaré en las horas de laboratorio para asesoraros-guiaros en las tareas a realizar.

TEMA
APUNTES TEORÍA
TRANSPARENCIAS
EJERCICIOS
Tema 0: Introducción a la asignatura
 
Tema 1: Heurísticos en Optimización Combinatorial
Tema 2: Algoritmos Genéticos
Tema 3: Algoritmos de Estimación de Distribuciones
 
Tema 4: Aprendizaje Automático - Minería de Datos

pdf: Aprendizaje Automático              pdf:  Minería de Datos

Tema 5: Clasificadores k-NN
Tema 6: Evaluación de Modelos de Clasificación Supervisada  

Tema 7: Teoría de la Información  

 
Tema 8: Árboles de Clasificación
Tema 9: Inducción de Reglas de Clasificación

 
Tema 10: Selección de Variables

 
Tema 11: Clustering - Clasificación no supervisada

Tema 12: Clasificadores Bayesianos
Tema 13: Regresión Logística
Tema 14: Redes Neuronales
Tema 15: Combinación de Clasificadores
 
 
       
       

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Práctica II - Reconocimiento de Patrones:

 


 

Varios enlaces de Clasificación y Reconocimiento de Patrones:

  1. "Benchmark" del Reconocimiento de Patrones: bases de datos del Repositorio UCI (University California Irvine)

    • Si tienen problemas con el protocolo de datos FTP en el que tiene albergadas las bases de datos el enlace anterior, utiliza el siguiente "mirror" que utiliza el protocolo HTTP: las explicaciones acerca de la naturaleza de las bases de datos aparece al final de la página

    • Para cada base de datos: en el fichero *.names se explica el problema ("Data Set Description"), en el fichero *.data están los datos en crudo ("Data Folder")
       

  2. Esquema general del proceso de Data Mining - Machine Learning - Knowledge Discovery

  3. Kdnuggets.com y KMining.com: portales sobre minería de datos con mucha información: empresas, software, cursos...

  4. Cursos sobre Aprendizaje Automático: Machine Learning Courses ------ Oregon State University, Carnegie Mellon University, Universidade de Aveiro (Portugal)

  5. Softwares (libres) para Análisis-Minería de Datos: WEKA, R-project, RapidMiner, Orange.
     

  6. Ofertas de trabajo aparecidas en periódicos sobre Minería de Datos - Data Mining
     

  7. Principales conferencias internacionales en el área:

    • International Conference on Machine Learning, ICML 2007

    • European Conference on Machine Learning, ECML 2007

    • International Conference on Data Mining, ICDM 2007

    • Red Española de Minería de Datos y Aprendizaje
       

  8. Página principal del software WEKA ("Waikato Environment for Knowledge Analysis")

  9. Manual de uso del interfaz GUI de WEKA, "Explorer"

  10. Sobre la base de datos "Iris": fotos de las plantas

  11. Universidad de Sevilla: varias bases de datos en formato *.arff de WEKA de microarrays de ADN

  12. Fichero de prueba-ejemplo para realizar la comparativa estadística con SPSS: comparar porcentajes de acierto de clasificadores

 

 




Enunciado Práctica I. Fecha tope de entrega: 14 de marzo (viernes).


Varios enlaces de Heurísticos de búsqueda y Algoritmos genéticos:

  1. Principales conferencias internacionales sobre heurísticos de búsqueda:

    • Genetic and Evolutionary Computation Conference (GECCO-2007)

    • International Conference on Parallel Problem Solving from Nature (PPSN VIII)

    • Congress on Evolutionary Computation (CEC-2007): sesiones de la conferencia

    • Congreso Español sobre Metaheurísticos, Algoritmos Evolutivos y Bioinspirados (MAEB-2007): aquí trabajos presentados

    • HEUR: Red Española de Metaheurísticos. En su sección de métodos se explican brevemente una buena cantidad de heurísticos.
       

  2. Aplicaciones-demos "on-line" de GAs:

    • The GA Playground (tiene una aplicación interactiva para el TSP en círculo, así como de varias funciones del enlace anterior)

    • Tutorial y enlaces de M. Obitko: Introduction to Genetic Algorithms (tiene una aplicación interactiva para el TSP)

    • Theo Jansen: the GA show. Mecanos diseñados con GAs.
       

  3. Noticias, aplicaciones y artículos "divulgativos" sobre GAs:

  4. "Benchmark" for GAs: grupo de funciones (continuas) clásicas a optimizar con Algoritmos Genéticos (se hacen "competiciones" sobre ellas)
     

  5. Repositorios con más información sobre GAs:

Overview  acerca de los algoritmos de estimación de distribuciones
Tutoriales sobre algoritmos de estimación de distribuciones (EDAs)


Exámenes de convocatorias pasadas:  junio'04, septiembre'04, junio'06, septiembre'06, junio'07, septiembre'07.