Ministerio de Cultura y Educación
Universidad Nacional de San Luis
Facultad de Ciencias Físico Matemáticas y Naturales
Departamento: Informatica
Área: Area V: Automatas y Lenguajes
(Programa del año 2008)
(Programa en trámite de aprobación)
(Programa presentado el 30/07/2008 10:00:10)
I - Oferta Académica
Materia Carrera Plan Año Periodo
(OPTATIVAS) APRENDIZAJE AUTOMATICO Y MINERIA DE DATOS LIC.EN CS.DE LA COMPUTACION 2008 2° cuatrimestre
II - Equipo Docente
Docente Función Cargo Dedicación
ERRECALDE, MARCELO LUIS Prof. Responsable P.Adj Exc 40 Hs
LEGUIZAMON, MARIO GUILLERMO Prof. Co-Responsable P.Adj Exc 40 Hs
III - Características del Curso
Credito Horario Semanal Tipificación Duración
Teórico/Práctico Teóricas Prácticas de Aula Práct. de lab/ camp/ Resid/ PIP, etc. Total B - Teoria con prácticas de aula y laboratorio Desde Hasta Cantidad de Semanas Cantidad en Horas
Periodo
 Hs. 2 Hs. 2 Hs. 3 Hs. 7 Hs. 2º Cuatrimestre 11/07/2008 21/11/2008 15 100
IV - Fundamentación
A partir de la popularización de Internet y el crecimiento del número de bases de datos accesibles, se ha producido en los últimos años un gran crecimiento en los volúmenes y disponibilidad de datos alrededor del mundo. Se ha estimado que la cantidad de datos almacenados en las bases de datos del mundo se duplica cada veinte meses. Este crecimiento cuantitativo de los datos no se ha reflejado en un crecimiento cualitativo de la información disponible. Existe un "gap" creciente entre la generación de los datos y nuestro entendimiento de los mismos.

Una alternativa para solucionar este problema que ha recibido un interés creciente es el área de Minería de datos.
La Minería de datos (en ingles Data Mininig y de ahora en más MD) es el proceso de descubrir patrones en los datos. Este proceso debe ser automático (o más usualmente) semi-automático. Los patrones descubiertos deben ser significativos en el sentido que deben conducir a alguna ventaja (generalmente económica). Los datos generalmente consitirán en grandes volúmenes de datos "crudos" (no estructurados).


V - Objetivos / Resultados de Aprendizaje
Introducir al alumno en los principales conceptos vinculados a la Minería de datos. Al finalizar el curso los alumnos deberán ser capaces de identificar las principales etapas y procesos de la Minería de datos, los mecanismos estadísticos y de aprendizaje automático frecuentemente utilizados en este área. Se espera además que los mismos sean capaces de detectar y aplicar las técnicas de Minería de datos en aplicaciones concretas del mundo real.
VI - Contenidos
Unidad 1: Introducción a la Minería de Datos (MD). Conceptos involucrados. Diferentes enfoques de MD: Extracción de conocimiento y predicción. Vínculo entre MD, Aprendizaje de Máquina y Métodos Estadísticos. Etapas del proceso de KDD. Aplicaciones del mundo real. Principales tareas de la minería de datos.


Unidad 2: Modelos y algoritmos para MD. Sus principales características y aplicabilidad. Tendencias de los modelos y algoritmos para MD.


Unidad 3: Definición de Aprendizaje. Diseño de un sistema de aprendizaje. Aprendizaje de Conceptos. Aprendizaje como Búsqueda. Sesgo Inductivo.


Unidad 4: Aprendizaje de árboles de decisión. ID3. Medidas de entropía y ganancia de información. Sesgo inductivo en ID3. Métodos para evitar el sobre-entrenamiento. Aprendizaje Basado en instancias. K-vecinos más cercanos. Medidas de distancia. Métodos Bayesianos. Algoritmos para clustering. Regresión


Unidad 5: Aspectos avanzados de Aprendizaje automático. Evaluación de hipótesis. Conceptos básicos de teoría de muestras. Diferencia en el error de dos hipótesis. Comparación de algoritmos de aprendizaje. Boosting. Nuevos enfoques para Minería de datos. Algoritmos Genéticos. Ant Systems. Enfoques estadísticos. Minería de textos.


Unidad 6: Otras componentes del proceso de KDD. Preparación de los datos. Evaluación, interpretación y visualización de patrones.


Unidad 7: Aspectos prácticos involucrados en el desarrollo de aplicaciones de MD para un problema particular. Herramientas de desarollo de aplicaciones para MD. El sistema Weka. Bases de datos públicas.


VII - Plan de Trabajos Prácticos
Práctico 1: Preparación de los datos.

Práctico 2: Minería de datos con aprendizaje de máquina.

Práctico 3: Minería de datos con métodos estadísticos.

Práctico 4: Desarrollo de un proyecto de programación a ser entregado a final de cuatrimestre.

VIII - Regimen de Aprobación
La materia sólo tiene régimen Promocional: se aprueba con la entrega de los trabajos prácticos, un proyecto de programación propuesto más un informe adicional vinculado a los principales conceptos de MD. La nota de promoción es el promedio de las notas obtenidas en cada una de estas tareas.
IX - Bibliografía Básica
[1] "Data Mining". Witten y Frank. Morgan Kaufmann. 2000.
[2] "Introducción a la Minería de datos". Orallo, J. H., Ramírez Quintana, Ma. J. y Ramírez, C.F.. Pearson Prentice Hall. 2004.
[3] "Machine Learning". Tom Mitchell. McGraw-Hill Series in Computer Science, 1997.
[4] "Readings in Machine Learning". Shavlik, J. y Dietterich, Thomas. Morgan Kaufmann, 1990.
[5] "The Elements of Statistical Learning". T. Hastie, R. Tibshirani, J. H. Friedman. Springer, 2002.
[6] "Principles of Data Mining (Adaptive Computation and Machine Learning)". David J. Hand, Heikki Mannila, Padhraic Smyth. MIT Press, 2001.
X - Bibliografia Complementaria
[1] Publicaciones y apuntes complementarios sobre los distintos tópicos del curso que estarán disponibles en http://www.dirinfo.unsl.edu.ar/~aamd
XI - Resumen de Objetivos
Introducir al alumno en los principales conceptos vinculados a la Minería de datos. Al finalizar el curso los alumnos deberán ser capaces de identificar las principales etapas y procesos de la Minería de datos, los mecanismos estadísticos y de aprendizaje automático frecuentemente utilizados en este área. Se espera además que los mismos sean capaces de detectar y aplicar las técnicas de Minería de datos en aplicaciones concretas del mundo real
XII - Resumen del Programa
Unidad 1: Introducción al Aprendizaje Automático y la Minería de Datos.
Unidad 2: Modelos y algoritmos para Minería de Datos.
Unidad 3: Conceptos generales de aprendizaje.
Unidad 4: Métodos tradicionales de Aprendizaje automático.
Unidad 5: Aspectos avanzados de Aprendizaje automático
Unidad 6: Otras componentes del proceso de KDD.
Unidad 7: Desarrollo de aplicaciones de Minería de Datos.
XIII - Imprevistos
 
XIV - Otros