Ministerio de Cultura y Educación
Universidad Nacional de San Luis
Facultad de Ciencias Físico Matemáticas y Naturales
Departamento: Informatica
Área: Area I: Datos
(Programa del año 2025)
I - Oferta Académica
Materia Carrera Plan Año Periodo
() BASES DE DATOS AVANZADAS LIC.CS.COMP. 32/12 2025 1° cuatrimestre
() BASES DE DATOS AVANZADOS ING. EN COMPUT. 28/12 2025 1° cuatrimestre
() BASE DE DATOS AVANZADAS ING. INFORM. 026/12- 08/15 2025 1° cuatrimestre
II - Equipo Docente
Docente Función Cargo Dedicación
REYES, NORA SUSANA Prof. Responsable SEC U EX 2 Hs
TARANILLA, MARIA TERESA Prof. Colaborador P.Asoc Exc 40 Hs
HERRERA, NORMA EDITH Prof. Co-Responsable P.Asoc Exc 40 Hs
KASIAN, FERNANDO ANDRES Responsable de Práctico P.Adj Exc 40 Hs
LUDUEÑA, VERONICA DEL ROSARIO Responsable de Práctico P.Asoc Exc 40 Hs
III - Características del Curso
Credito Horario Semanal Tipificación Duración
Teórico/Práctico Teóricas Prácticas de Aula Práct. de lab/ camp/ Resid/ PIP, etc. Total B - Teoria con prácticas de aula y laboratorio Desde Hasta Cantidad de Semanas Cantidad en Horas
Periodo
 Hs. 2 Hs. 2 Hs. 1 Hs. 5 Hs. 1º Cuatrimestre 12/03/2025 24/06/2025 15 75
IV - Fundamentación
Con la evolución de las tecnologías de información y comunicación, han surgido repositorios o almacenamientos no estructurados de información. No sólo se consultan nuevos tipos de datos tales como datos geométricos, texto libre, imágenes, audio y video, sino que además, en algunos casos, ya no se puede estructurar más la información en claves y registros. Aún cuando sea posible una estructuración clásica, nuevas aplicaciones tales como la minería de datos (data mining) requieren acceder a la base de datos por cualquier campo y no sólo por aquellos marcados como “claves”, muchas veces haciendo uso de herramientas no tradicionales.
Por lo tanto, se necesitan nuevos modelos para buscar y administrar la información en almacenamientos de este tipo. Los escenarios anteriores requieren modelos más generales tales como las bases de datos espacio-temporales, bases de datos de texto, espacios métricos, entre otros.
Así, es necesario contar con herramientas teóricas, de base, que permitan modelar estos tipos de datos, realizar operaciones sobre ellos, definir lenguajes de consulta, etc.
V - Objetivos / Resultados de Aprendizaje
• Introducir conceptos básicos sobre técnicas de almacenamiento, recuperación y actualización de datos masivos no estructurados (Bases de Datos no tradicionales), tales como datos geométricos, texto, imágenes, sonido, etc.
• Proveer los criterios para decidir sobre técnicas alternativas de almacenamiento, como así también los elementos para evaluar el rendimiento de las mismas.
• Estudiar diversos algoritmos que permiten resolver problemas geométricos que aparecen en este área.
• Estudiar algunas aplicaciones particulares de estas técnicas.
• Proveer los criterios para decidir cuándo es posible aplicar las técnicas estudiadas.
VI - Contenidos
Bases de Datos Multimedia y Métricas
Introducción. Definiciones básicas. Representación de datos multimedia. Búsqueda basada en contenido. Tipos de datos métricos y funciones de distancia. Dimensionalidad intrínseca. Consultas, modelo unificado. Indices para búsquedas por similitud basados en pivotes y basados en particiones compactas. Ejemplos de índices. Búsquedas por similitud exactas y aproximadas. Medidas de calidad. Otras operaciones.

Bases de Datos Espaciales
Introducción. Datos Espaciales. Almacenamiento para datos espaciales e índices espaciales. Procesamiento de consultas espaciales. Aplicaciones: Sistemas de Información Geográfica. Extensiones espaciales en SQL.

Bases de Datos Temporales y Espacio Temporales.
Dominio tiempo. Registro. Datos Espacio Temporales. Métodos de Acceso Espacio Temporales. Consultas Espacio Temporales. Extensiones en SQL.

Bases de Datos de Texto.
Introducción a la problemática. El problema de pattern matching. Árboles y arreglos de sufijos. Indices para búsqueda de
patrones en memoria secundaria. Indices Comprimidos. Autoíndices. Índices para texto en lenguaje natural: listas invertidas. Indexación de textos en los Sistemas de Gestión de Bases de Datos.

VII - Plan de Trabajos Prácticos
METODOLOGÍA DE LA ENSEÑANZA

Para cada unidad temática, los estudiantes tendrán disponible el material correspondiente a los contenidos de la unidad: el trabajo práctico a desarrollar, las diapositivas de clase teórica y la recomendación de la bibliografía a leer.
Las actividades prácticas a desarrollar por el estudiante involucran el desarrollo de ejercicios en papel y, cuando la temática así lo requiera, desarrollo de ejercicios en máquina.
De cada práctico se brindarán consultas con el objetivo de aclarar dudas que surjan sobre los ejercicios a desarrollar y de incentivar el trabajo con los compañeros.
De cada práctico se requiere que el alumno entregue resuelto un ejercicio (a definir por el docente) que será corregido y devuelto con el suficiente detalle en las correcciones como para que el alumno pueda medir su avance en la apropiación de conocimientos. Además de la presentación escrita, se fomentará que los alumnos realicen la presentación oral de la resolución de ejercicios a fin de desarrollar las capacidades de comunicación del alumno y de promover el debate en la clase.

TRABAJOS PRÁCTICOS A DESARROLLAR

Trabajo Práctico 1: Bases de Datos de Texto
Este práctico incluye ejercicios en papel tendientes a lograr que el alumno sea capaz de:
- Comprender la problemática de indexación y búsqueda en bases de datos de texto
- Comprender los métodos de indexación básicos para texto plano.
- Comprender la problemática de compresión de índices.
- Poder índexar y realizar búsquedas usando los índices comprimidos enseñados en la teoría.


Trabajo Práctico 2: Bases de Datos de Texto en Lenguaje Natural
Este práctico incluye ejercicios en papel tendientes a lograr que el alumno sea capaz de:
- Comprender la problemática de indexación y búsqueda en bases de datos de texto en lenguaje natural.
- Comprender las distintas versiones de Lista Invertida eneseñadas en la teoría.

Trabajo Práctico 3: Bases de Datos Métricas
Este práctico incluye ejercicios en papel y en laboratorio tendientes a lograr que el alumno sea capaz de:
- Comprender la problemática de indexación y búsqueda en bases de datos métricas
- Comprender los métodos de indexación del estado del arte para resolver operaciones por similitud.
- Comprender la problemática del almacenamiento de índices por similitud para memoria secundaria.
- Poder índexar y realizar búsquedas usando las implementaciones disponibles de los índices vistos.
- Utilizar y analizar un administrador de base de datos que incorpora capacidades para datos y operaciones propias de bases de datos métricas.


Trabajo Práctico 4: Bases de Datos Espaciales y Espacio Temporales
Este práctico incluye ejercicios que tienen como objetivo que el estudiante sea capaz de:
-Comprender el manejo de datos espaciales y espacio temporales en una base de datos.
-Comprender los métodos de almacenamiento, índices espaciales y cómo se procesan las consultas.
-Utilizar extensiones espaciales en SQL para realizar consultas básicas.


VIII - Regimen de Aprobación
Condiciones para regularizar
1) Asistir al menos al 80% de las clases.
2) Entregar y aprobar los trabajos prácticos asignados por los docentes responsables, con nota mayor o igual a siete (7).
3) Realizar investigaciones sobre temáticas indicadas, que los docentes responsables en coloquio evaluarán y aprobarán con nota mayor o igual a siete (7) puntos.

Condiciones para promocionar
1) Haber dado cumplimiento a las condiciones para regularizar.
2) Presentar y aprobar un proyecto escrito que muestre la solución a una problemática mediante la aplicación e integración de los temas vistos. O presentar y aprobar un informe escrito sobre alguna temática a investigar, en la que se integren los temas vistos. Los trabajos pueden ser grupales, entre dos personas máximo; a excepción de que el tema amerite la participación de más integrantes, y los docentes responsables presten acuerdo.
La nota mínima de aprobación sobre este punto es siete (7).

Modalidad de examen final: El examen final podrá ser oral y/o escrito.
Examen Libre: No se admiten alumnos libres por la modalidad de la asignatura.
IX - Bibliografía Básica
[1] Artículos de divulgación relacionados con las temáticas.
[2] Encyclopedia of Distances. Michel Marie Deza and Elena Deza. Springer Berlin Heidelberg, 2009.
[3] Foundations of Multidimensional and Metric Data Structures, Hanan Samet, 2006.
[4] Improving the Performance of Multimedia Databases. Christian Böhm, Stefan Berchtold y Daniel Keim. ACM Computing Surveys 33(3): 322-373 (2001).
[5] Lu Chen, Yunjun Gao, Xuan Song, Zheng Li, Yifan Zhu, Xiaoye Miao, and Christian S Jensen. Indexing metric spaces for exact similarity search. ACM Computing Surveys, 55(6):1–39, 2022.
[6] Multidimensional Access Methods. Volker Gaede y Oliver Günther. ACM Computing Surveys 30(2): 170-231, 1998.
[7] Pavel Zezula, Giussepe Amato, Vlatislav Dohnal, and Michal Batko. Similarity Search: The Metric Space Approach, volume 32 of Advances in Database Systems. Springer, 2006.
[8] Proximity Searching in Metric Spaces. Edgar Chávez, Gonzalo Navarro, Ricardo Baeza-Yates y José Luis Marroquín.ACM Computing Surveys 33(3):273-321, 2001.
[9] R Tree Theory and applications. Manolopoulos Yannis, Papadopoulos Apostolos, Vassilakopoulos Aristotle, 2006
[10] Searching in High Dimensional Spaces: Index Structures for Improving the Preformance of Multimedia Databases.Christian Böhm, Stefan Berchtold y Daniel Keim. ACM Computing Surveys 33(3): 322-373 ,2001.
[11] Spatial Database: Technologies, Techniques and Trends. Manolopoulos Yannis, Papadopoulos Apostolos,Vassilakopoulos Aristotle, 2005.
[12] Spatial Databases. A tour. Shashi Shekhar. Sanjay Chawla. Prentice Hall; Edición: New (1 de junio de 2002). ISBN-10: 0130174807. ISBN-13: 978-0130174802.
[13] Computational Geometry. Mark de Berg, Marc Van Kreveld, Mark Overmars y Otfried Schwarzkopf.(Third edition).Springer-Verlag, Heidelberg, 2008.
[14] Tópicos avanzados de bases de datos. C. Bender; C. Deco; J.Gonzales; M. Hallo; J. Gallegos. Iniciativa Latinoamericana de Libros de Texto Abiertos (LATIn), 2014. 113 pag. Primera Edición: Marzo 2014. http://www.proyectolatin.org/
[15] Information Retrieval: Data Structures & Algorithms. William Frakes, Ricardo Baeza-Yates, Prentice Hall,1992.
[16] Modern Information Retrieval: The Concepts and Technology Behind Search.Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison-Wesley, 2011.
X - Bibliografia Complementaria
[1] Figueroa, K., Navarro, G., Chávez, E.: Metric spaces library (2007), available at http://www.sisap.org/Metric Space Library.html
[2] Magnus Hetland. The basic principles of metric indexing. In Carlos Coello, Satchidananda Dehuri, and Susmita Ghosh, editors, Swarm Intelligence for Multi-objective Problems in Data Mining, volume 242 of Studies in Computational Intelligence, pages 199–232. Springer Berlin / Heidelberg, 2009.
[3] Paredes, Rodrigo; Reyes, Nora; Figueroa, Karina; Hoffhein, Manuel: A new dynamic, secondary-memory metric index Libro de Actas - 30° Congreso Argentino de Ciencias de la Computación - CACIC 2024, 520-529, ISBN 978-950-34-2428-5.
[4] Navarro, G., Paredes, R., Reyes, N., Bustos, C.: An empirical evaluation of intrinsic dimension estimators. Information Systems 64, 206–218 (March 2017)
[5] Navarro, G., Reyes, N.: Dynamic spatial approximation trees. ACM Journal of Experimental Algorithmics 12, Article 1.5 (2009)
[6] Navarro, G., Reyes, N.: New dynamic metric indices for secondary memory. Information Systems 59, 48–78 (2016).ISSN 0306-4379, https://doi.org/10.1016/j.is.2016.03.009
[7] Edgar Chávez, Verónica Ludueña, Nora Reyes, Patricia Roggero: Faster proximity searching with the distal SAT, Information Systems 59, 15-47 (2016), ISSN 0306-4379,, https://doi.org/10.1016/j.is.2015.10.014.
XI - Resumen de Objetivos
• Introducir conceptos básicos sobre técnicas de almacenamiento, recuperación y actualización de datos masivos no
estructurados (Bases de Datos no tradicionales), tales como datos geométricos, texto, imágenes, sonido, etc.
• Proveer los criterios para decidir sobre técnicas alternativas de almacenamiento, como así también los elementos para
evaluar el rendimiento de las mismas.
• Estudiar algunas aplicaciones particulares de estas técnicas.
• Proveer los criterios para decidir cuándo es posible aplicar las técnicas estudiadas.
XII - Resumen del Programa
Bases de Datos Espaciales, Temporales y Espacio Temporales. Bases de Datos Métricas. Bases de Datos de Texto.

XIII - Imprevistos
En caso de imprevistos comunicarse con el equipo docente:
Contacto:
Dra. REYES, NORA - email: reyesnora@gmail.com
M. Cs. HERRERA, NORMA - email: norma.herrera@gmail.com
M. Cs. TARANILLA, MARÍA TERESA - email: tetetaranilla@gmail.com
XIV - Otros