METODOS MATEMATICOS EN CIENCIAS DE LA COMPUTACION 05-06
UNIVERSIDAD DEL PAIS VASCO - EUSKAL HERRIKO UNIBERTSITATEA, UPV-EHU

PRACTICA II: RECONOCIMIENTO DE PATRONES CON WEKA

Tareas a realizar para los Temas 4 (Aprendizaje Automático) y 5 (Evaluación de Modelos de Clasificación Supervisada):

  1. En la siguiente página web de la Universidad de Stanford puedes encontrar una recopilación de términos básicos del aprendizaje automático y el reconocimiento de patrones en inglés. Indica cuáles de ellos asocias con los términos y definiciones vistas en el Tema 5 de la teoría ("Evaluación de Modelos de Clasificación Supervisada"), y dí cual es la definición (en una o dos frases) que conoces de ellos en castellano. Indica también qué otros términos de esa página asocias con definiciones vistas en el Tema 4.
     
  2. Los archivos que puedes encontrar en el siguiente subdirectorio (excepto el último del subdirectorio, "UsoDeChipsDeADN.pdf", que lo trataremos en otro apartado. Del segundo artículo del subdirectorio, "DetectionOfSuccessMusicHits.pdf", lee únicamente su primera y segunda páginas) contienen artículos periodísticos divulgativos que recogen distintas aplicaciones de la minería de datos. Indica cuál de ellos ha llamado más tu atención (no hagas esto para el último artículo indicado, "UsoDeChipsDeADN.pdf"), y para ese artículo en concreto en el que más te has fijado, responde a las siguientes preguntas:

  3. Propón desde tu invención e intuición un nuevo problema de clasificación supervisada a partir de datos, especificando (no tienes por qué hacer la especificación de manera detalladísima, si no lo crees: se trata de dar información de la forma que tú creas, para entender el problema planteado):
  4. En base al empuje del proyecto Genoma Humano se desarrollaron una gran cantidad de novedosas técnicas de recogida masiva de datos biológicos acerca de distintas moléculas, fundamentales para la vida: DNA, RNA, proteínas, ... Donde las técnicas de medición permitían antes examinar, por ejemplo docenas de genes, con estas nuevas técnicas es posible examinar los niveles de expresión de miles de moléculas concretas. Todo ello ha generado una nueva disciplina conocida como "Bioinformática", y que se fundamenta en el uso de técnicas computacionales y de inteligencia artificial para tratar de dar respuesta a preguntas médicas y biológicas y descubrir nuevo conocimiento, utilizando como base los datos generados a partir de este tipo de técnicas. Una de estas novedosas técnicas es conocida como los microarrays (o chips) de DNA, que mide el nivel de expresión de miles de genes de un tejido concreto: en el siguiente artículo tienes una amena introducción acerca de esta tecnología de recogida de datos. Tras leer el artículo, indica:

     

  5. En el siguiente directorio puedes encontrar una serie de artículos científicos que abordan aplicaciones (problemas) concretas de minería de datos. En base a lectura del "abstract" (resumen) del artículo (suficiente con leer el "abstract", con lo que hayas entendido a partir del "abstract", adelante), indica:
  6. Indica para los siguientes artículos científicos, cuál es el método concreto que utilizan para estimar el porcentaje de bien clasificados (Tema 5) de los clasificadores que utilizan en sus fases de experimentación: