Ministerio de Cultura y Educación
Universidad Nacional de San Luis
Facultad de Ciencias Físico Matemáticas y Naturales
Departamento: Informatica
Área: Area V: Automatas y Lenguajes
(Programa del año 2009)
(Programa en trámite de aprobación)
(Programa presentado el 30/10/2009 00:36:18)
I - Oferta Académica
Materia Carrera Plan Año Periodo
(OPTATIVA) APRENDIZAJE AUTOMATICO Y MINERIA DE DATOS LIC.EN CS.DE LA COMPUTACION 2009 2° cuatrimestre
II - Equipo Docente
Docente Función Cargo Dedicación
ERRECALDE, MARCELO LUIS Prof. Responsable P.Adj Exc 40 Hs
INGARAMO DIEGO Auxiliar de Práctico E.Beca Fac 10 Hs
III - Características del Curso
Credito Horario Semanal Tipificación Duración
Teórico/Práctico Teóricas Prácticas de Aula Práct. de lab/ camp/ Resid/ PIP, etc. Total B - Teoria con prácticas de aula y laboratorio Desde Hasta Cantidad de Semanas Cantidad en Horas
Periodo
 Hs. 2 Hs. 2 Hs. 3 Hs. 7 Hs. 2º Cuatrimestre 31/08/2009 04/12/2009 14 100
IV - Fundamentación
A partir de la popularización de Internet y el crecimiento del número de bases de datos accesibles, se ha producido en los últimos años un gran crecimiento en los volúmenes y disponibilidad de datos alrededor del mundo. Se ha estimado que la cantidad de datos almacenados en las bases de datos del mundo se duplica cada veinte meses. Este crecimiento cuantitativo de los datos no se ha reflejado en un crecimiento cualitativo de la información disponible. Existe un "gap" creciente entre la generación de los datos y nuestro entendimiento de los mismos.

Una alternativa para solucionar este problema que ha recibido un interés creciente es el área de Minería de datos.
La Minería de datos (en ingles Data Mininig y de ahora en más MD) es el proceso de descubrir patrones en los datos. Este proceso debe ser automático (o más usualmente) semi-automático. Los patrones descubiertos deben ser significativos en el sentido que deben conducir a alguna ventaja (generalmente económica). Los datos generalmente consitirán en grandes volúmenes de datos "crudos" (no estructurados).


V - Objetivos / Resultados de Aprendizaje
Introducir al alumno en los principales conceptos vinculados a la Minería de datos. Al finalizar el curso los alumnos deberán ser capaces de identificar las principales etapas y procesos de la Minería de datos, los mecanismos estadísticos y de aprendizaje automático frecuentemente utilizados en este área. Se espera además que los mismos sean capaces de detectar y aplicar las técnicas de Minería de datos en aplicaciones concretas del mundo real.
VI - Contenidos
Unidad 1: Introducción a la Minería de Datos (MD). Conceptos involucrados. Diferentes enfoques de MD: Extracción de conocimiento y predicción. Vínculo entre MD, Aprendizaje de Máquina y Métodos Estadísticos. Etapas del proceso de KDD. Aplicaciones del mundo real. Principales tareas de la minería de datos.


Unidad 2: Modelos y algoritmos para MD. Sus principales características y aplicabilidad. Tendencias de los modelos y algoritmos para MD.


Unidad 3: Definición de Aprendizaje. Diseño de un sistema de aprendizaje. Aprendizaje de Conceptos. Aprendizaje como Búsqueda. Sesgo Inductivo.


Unidad 4: Aprendizaje de árboles de decisión. ID3. Medidas de entropía y ganancia de información. Sesgo inductivo en ID3. Métodos para evitar el sobre-entrenamiento.


Unidad 5: Análisis de Clusters: Conceptos básicos y Algoritmos. Grupos significativos vs. Grupos útiles. Tipos de agrupamientos. Particional vs Jerárquico. Difuso vs. No Difuso. Tipos de clusters. Medidas de similitud. Validación de grupos. Algoritmos de clustering.


Unidad 6: Análisis de Asociaciones: Conceptos básicos y algoritmos. Regla de asociación. Soporte y confidencia. Itemsets frecuentes. El algoritmo Apriori.


Unidad 7: Aspectos avanzados de Aprendizaje automático. Nuevos enfoques para Minería de datos. Algoritmos Genéticos. Ant Systems. Enfoques estadísticos. Minería de textos.


Unidad 8: Otras componentes del proceso de KDD. Preparación de los datos. Evaluación, interpretación y visualización de patrones.


Unidad 9: Aspectos prácticos involucrados en el desarrollo de aplicaciones de MD para un problema particular. Herramientas de desarollo de aplicaciones para MD. El sistema Weka. RapidMiner. Bases de datos públicas.


VII - Plan de Trabajos Prácticos
Práctico 1: Preparación de los datos.

Práctico 2: Minería de datos con aprendizaje de máquina.

Práctico 3: Minería de Textos.

Práctico 4: Desarrollo de un proyecto de programación a ser entregado a final de cuatrimestre.

VIII - Regimen de Aprobación
La materia sólo tiene régimen Promocional: se aprueba con la entrega de los trabajos prácticos, un proyecto de programación propuesto más un informe adicional vinculado a los principales conceptos de MD. La nota de promoción es el promedio de las notas obtenidas en cada una de estas tareas.
IX - Bibliografía Básica
[1] "Introduction to Data Mining". Tan, Steinbach y Kumar. Pearson. 2006.
[2] "Data Mining: Practical Machine Learning Tools and Techniques". Second Edition. Witten y Frank. Morgan Kaufmann. 2005.
[3] "Introducción a la Minería de datos". Orallo, J. H., Ramírez Quintana, Ma. J. y Ramírez, C.F.. Pearson Prentice Hall. 2004.
[4] "Machine Learning". Tom Mitchell. McGraw-Hill Series in Computer Science, 1997.
[5] "Readings in Machine Learning". Shavlik, J. y Dietterich, Thomas. Morgan Kaufmann, 1990.
[6] "The Elements of Statistical Learning". T. Hastie, R. Tibshirani, J. H. Friedman. Springer, 2002.
[7] "Principles of Data Mining (Adaptive Computation and Machine Learning)". David J. Hand, Heikki Mannila, Padhraic Smyth. MIT Press, 2001.
X - Bibliografia Complementaria
[1] "The Text Mining HandBook: Advanced Approaches in Analyzing Unstructured Data". Feldman and Sanger. Cambridge University Press. 2007.
[2] Publicaciones y apuntes complementarios sobre los distintos tópicos del curso que estarán disponibles en http://www.dirinfo.unsl.edu.ar/~aamd
XI - Resumen de Objetivos
Introducir al alumno en los principales conceptos vinculados a la Minería de datos. Al finalizar el curso los alumnos deberán ser capaces de identificar las principales etapas y procesos de la Minería de datos, los mecanismos de aprendizaje automático frecuentemente utilizados en este área. Se espera además que los mismos sean capaces de detectar y aplicar las técnicas de Minería de datos en aplicaciones concretas del mundo real.
XII - Resumen del Programa
Unidad 1: Introducción al Aprendizaje Automático y la Minería de Datos.
Unidad 2: Modelos y algoritmos para Minería de Datos.
Unidad 3: Conceptos generales de aprendizaje.
Unidad 4: Tareas de clasificación. Arboles de Decisión.
Unidad 5: Análisis de Clusters.
Unidad 6: Análisis de Asociaciones.
Unidad 7: Aspectos avanzados del Aprendizaje automático.
Unidad 8: Otras componentes del proceso de KDD.
Unidad 9: Desarrollo de aplicaciones de Minería de Datos.
XIII - Imprevistos
 
XIV - Otros