Ministerio de Cultura y Educación
Universidad Nacional de San Luis
Facultad de Ciencias Físico Matemáticas y Naturales
Departamento: Informatica
Área: Area I: Datos
(Programa del año 2010)
(Programa en trámite de aprobación)
(Programa presentado el 24/11/2010 11:55:48)
I - Oferta Académica
Materia Carrera Plan Año Periodo
(OPTATIVAS) BASES DE DATOS AVANZADOS LIC.EN CS.DE LA COMPUTACION 006/05 2010 1° cuatrimestre
II - Equipo Docente
Docente Función Cargo Dedicación
GAGLIARDI, EDILMA OLINDA Prof. Responsable P.Adj Exc 40 Hs
HERRERA, NORMA EDITH Prof. Responsable P.Adj Exc 40 Hs
III - Características del Curso
Credito Horario Semanal Tipificación Duración
Teórico/Práctico Teóricas Prácticas de Aula Práct. de lab/ camp/ Resid/ PIP, etc. Total B - Teoria con prácticas de aula y laboratorio Desde Hasta Cantidad de Semanas Cantidad en Horas
Periodo
7 Hs.  Hs.  Hs.  Hs. 7 Hs. 2º Cuatrimestre 09/08/2010 19/11/2010 15 100
IV - Fundamentación
Con la evolución de las tecnologías de información y comunicación, han surgido repositorios o almacenamientos no estructurados de información. No sólo se consultan nuevos tipos de datos tales como datos geométricos, texto libre, imágenes, audio y video, sino que además, en algunos casos, ya no se puede estructurar más la información en claves y registros. Aún cuando sea posible una estructuración clásica, nuevas aplicaciones tales como la minería de datos (data mining) requieren acceder a la base de datos por cualquier campo y no sólo por aquellos marcados como “claves”, muchas veces haciendo uso de herramientas no tradicionales.
Por lo tanto, se necesitan nuevos modelos para buscar y administrar la información en almacenamientos de este tipo. Los escenarios anteriores requieren modelos más generales tales como las bases de datos espacio-temporales, bases de datos de texto, espacios métricos, entre otros.
Así, es necesario contar con herramientas teóricas, de base, que permitan modelar estos tipos de datos, realizar operaciones sobre ellos, definir lenguajes de consulta, etc.
V - Objetivos
• Introducir conceptos básicos sobre técnicas de almacenamiento, recuperación y actualización de datos masivos no estructurados (Bases de Datos no tradicionales), tales como datos geométricos, texto, imágenes, sonido, etc.
• Proveer los criterios para decidir sobre técnicas alternativas de almacenamiento, como así también los elementos para evaluar el rendimiento de las mismas.
• Estudiar diversos algoritmos que permiten resolver problemas geométricos que aparecen en este área.
• Estudiar algunas aplicaciones particulares de estas técnicas.
• Proveer los criterios para decidir cuándo es posible aplicar las técnicas estudiadas.

VI - Contenidos
1. Bases de Datos Espacio-Temporales:
Almacenamiento para datos espaciales e índices. Bases de datos móviles.

2. Bases de Datos de Textos:
Introducción a la problemática. El problema de pattern matching. Árboles y arreglos de sufijos. Indices para búsqueda de patrones en memoria secundaria. Indices Comprimidos. Autoíndices.

3. Bases de Datos Métricas:
Introducción, definiciones básicas. Tipos de datos métricos. Dimensionalidad. Consultas. Indices para funciones de distancia discretas y continuas, basados en pivotes y basados en particiones compactas. Modelo Unificado.

VII - Plan de Trabajos Prácticos
Los trabajos consisten en la realización de las siguientes actvidades: presentaciones de temas asignados por los docentes, evaluación crítica del software disponible, elaboración de informes sobre los temas estudiados, búsqueda de material disponible en Internet, desarrollo en pseudo-código de rutinas sobre algunas de las estructuras de almacenamiento estudiadas y análisis de las mismas.
VIII - Regimen de Aprobación
Para regularizar el alumno deberá:
1) Asistir al 80% de la clases.
2) Entregar y aprobar los trabajos prácticos asignados por los docentes.
3) Aprobar un examen (oral o escrito), o su recuperación.

Para Promocionar deberá regularizar, aprobando el examen con una nota de 7 puntos o más, y deberá realizar una monografía sobre un tema que será asignado por el docente.

Modalidad de examen final: El examen final podrá ser oral y/o escrito.

Examen Libre: No se admiten alumnos libres por la modalidad de la asignatura.
IX - Bibliografía Básica
[1] Computational Geometry: An Introcuction. Franco P. Preparata y Michael Ian Shamos.
[2] Computational Geometry. Mark de Berg, Marc Van Kreveld, Mark Overmars y Otfried Schwarzkopf.
[3] Foundations of Multidimensional and Metric Data Structures, H
[4] Hanan Samet, 2006.
[5] Flexible Pattern Matching in Strings, Gonzalo Navarro , Mathieu Raffinut, 2002.
[6] Proximity Searching in Metric Spaces. Edgar Chávez, Gonzalo Navarro, Ricardo Baeza-Yates y José Luis Marroquín. ACM Computing Surveys 33(3):273-321, 2001.
[7] Searching in High Dimensional Spaces: Index Structures for Improving the Preformance of Multimedia Databases. Christian Böhm, Stefan Berchtold y Daniel Keim. ACM Computing Surveys 33(3): 322-373 (2001).
[8] Data Structures for Spatial Database Systems. Octavian Procopiuc. http://www.cs.duke.edu/~tavi/
[9] Multidimensional Access Methods. Volker Gaede y Oliver Günther. ACM Computing Surveys 30(2): 170-231 (1998).
[10] Geometría Computacional y Bases de Datos: Búsquedas por Rangos. Edilma Gagliardi. Tesis de Maestría de la UNSL, octubre de 2002.
[11] Índices Dinámicos para Espacios Métricos de Alta Dimensionalidad. Nora Reyes. Tesis de Maestría de la UNSL, diciembre de 2002.
[12] Diseño e Implementación de Estructuras Optimizadas para Búsqueda en Espacios Métricos”. Norma Herrera. Tesis de Maestría de la UNSL, octubre de 2003.
[13] Artículos de divulgación relacionados con la temática.
X - Bibliografia Complementaria
[1] * Modern Information Retrieval. R. Baeza-Yates and B. Ribeiro-Neto. Addison-Wesley, Wokingham, UK, 1999.
XI - Resumen de Objetivos
• Introducir conceptos básicos sobre técnicas de almacenamiento, recuperación y actualización de datos masivos no estructurados (Bases de Datos no tradicionales), tales como datos geométricos, texto, imágenes, sonido, etc.
• Proveer los criterios para decidir sobre técnicas alternativas de almacenamiento, como así también los elementos para evaluar el rendimiento de las mismas.
• Estudiar diversos algoritmos que permiten resolver problemas geométricos que aparecen en esta área.
• Estudiar algunas aplicaciones particulares de estas técnicas.
• Proveer los criterios para decidir cuándo es posible aplicar las técnicas estudiadas.

XII - Resumen del Programa
1. Bases de Datos Espacio-Temporales:
Almacenamiento para datos espaciales e índices. Bases de datos móviles.

2. Bases de Datos de Textos:
Introducción a la problemática. Indices.

3. Bases de Datos Métricas:
Introducción. Tipos de datos métricos. Dimensionalidad. Consultas. Indices. Modelo Unificado.


XIII - Imprevistos