![]() Ministerio de Cultura y Educación Universidad Nacional de San Luis Facultad de Ciencias Físico Matemáticas y Naturales Departamento: Informatica Área: Area II: Sistemas de Computacion |
I - Oferta Académica | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
|
II - Equipo Docente | ||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
III - Características del Curso | |||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
IV - Fundamentación |
---|
El volumen de datos recopilados y almacenados por las tecnologías actuales tiene el potencial de generar un impacto transformador en las organizaciones. Sin embargo, para aprovecharlo, es fundamental unificar la información en formatos específicos, realizar procesos de limpieza y desarrollar capacidades de interpretación.
Por ello, esta asignatura aborda conceptos esenciales de ETL (Extracción, Transformación y Carga), así como la creación y manipulación de bases de datos relacionales, junto con técnicas de visualización e interpretación de datos. Los conocimientos adquiridos en este curso constituyen la base que serán utilizadas por diversas asignaturas de años superiores. |
V - Objetivos / Resultados de Aprendizaje |
---|
El objetivo principal de la asignatura es brindar a los estudiantes una formación sólida en el campo de los datos, abordando sus principios fundamentales, tecnologías y aplicaciones para el almacenamiento, transformación y visualización de información. El enfoque está orientado a facilitar la reducción de la incertidumbre y la toma de decisiones fundamentadas.
Al finalizar el curso, se espera que los estudiantes sean capaces de: * Aplicar con solvencia los conceptos relacionados con los procesos de ETL, almacenamiento, visualización e interpretación de datos. * Comprender el uso y los ámbitos de aplicación de las distintas tecnologías asociadas. * Desarrollar una actitud crítica frente al uso de estructuras para la manipulación de datos. |
VI - Contenidos |
---|
Unidad I: Introducción a los datos.
El dato como unidad de análisis. Tipos de datos. Características de los datos. Información. Conocimiento. Definición de Bases de Datos. El concepto de esquema e instancia. Sistemas de Gestión de Bases de Datos (SGBD). Unidad II: Preprocesamiento y Análisis Exploratorio de Datos. Limpieza de datos (data cleaning). Análisis exploratorio de datos (EDA). Análisis univariado y bivariado. Ruidos y anomalías (Outliers). Normalización de datos. Discretización y Binarización de variables. Análisis de las principales Herramientas ETL disponibles. Unidad III: Almacenamiento en Base de Datos Creación, modificación y almacenamiento de bases de datos. Tablas, índices, generación de scripts. Programar consultas, manipular datos y administrar índices. Unidad IV: SQL (Structure Query Language) Estudio de SQL. El lenguaje de consultas SQL. Conjunto de instrucciones básicas del SQL: create table, drop, update, insert, delete y select. Funciones agregadas. Consultas sumarias: group by y having. Unidad V: Visualización de datos Definición y objetivos de la Visualización de datos. El proceso de la Visualización. Estados y transformaciones de los datos. Variables Visuales. Interacciones. Dashboards. Aplicaciones prácticas en el campo técnico y social con software estadístico para el análisis y la descripción de datos. Visualización, análisis e interpretación. Aplicación en el campo técnico y social. |
VII - Plan de Trabajos Prácticos |
---|
El aprendizaje se fomentará mediante una combinación de clases teóricas con instancias de participación activa y clases prácticas de laboratorio, con un fuerte énfasis en el Aprendizaje Basado en Proyectos (ABP). A lo largo del curso, los estudiantes trabajarán con un conjunto de datos, ya sea seleccionado por ellos mismos o proporcionado por la cátedra, aplicando cada etapa del proceso de extracción de conocimiento con el objetivo de obtener algún conocimiento buscado.
Dado el carácter a distancia de la carrera, los trabajos prácticos se diseñarán para desarrollarse en entornos virtuales, utilizando plataformas colaborativas. Para ello, se dispondrá de guías detalladas, recursos multimedia y espacios de consulta sincrónica y asincrónica. Además, se fomentará el trabajo grupal colaborativo y proactivo, promoviendo el uso de foros de discusión, videoconferencias y entornos de desarrollo compartidos. Plan de Trabajos Prácticos de Laboratorio Laboratorio 1: Análisis exploratorio y preprocesamiento de datos Introducción al uso de herramientas para la manipulación y limpieza de datos. Identificación de valores atípicos, datos faltantes y estrategias de tratamiento. Generación de estadísticas descriptivas y visualización inicial de los datos. Laboratorio 2: Almacenamiento y consulta de datos Instalación y configuración de una base de datos relacional en un entorno local o en la nube. Introducción al lenguaje SQL: creación de tablas, inserción y modificación de datos. Ejecución de consultas para la extracción de información relevante. Laboratorio 3: Visualización e interpretación de datos Uso de herramientas de visualización para representar datos de manera efectiva. Aplicación de principios de diseño para la creación de gráficos y dashboards. Análisis de los resultados obtenidos y su comunicación efectiva. Los laboratorios 1, 2 y 3 conformarán el trabajo integrador a presentar al finalizar la materia, en el cual los estudiantes deberán aplicar los conocimientos adquiridos para desarrollar un proyecto de análisis de datos completo. Dicho proyecto incluirá el procesamiento y almacenamiento de datos, consultas estructuradas y una presentación visual de los resultados, con una justificación basada en el contexto analizado. |
VIII - Regimen de Aprobación |
---|
El curso se implementa con condiciones específicas para estudiantes promocionales, regulares y libres (Ordenanza C.S. 13/03 y modificatoria Ordenanza C.S. 32/14).
Régimen para Regularizar el curso: 1. Participar al menos en un 60% en los foros obligatorios. 2. Aprobar los Trabajos Prácticos Evaluativos (TPE) con al menos el 60%. 3. Aprobar el trabajo final integrador con un 60%. 4. Aprobar el examen parcial con al menos el 60% o sus respectivas recuperaciones. Se darán 2 recuperaciones. Si cualquier punto no fuese cumplimentado, implica que el alumno pase a condición de libre. Régimen para promocionar el curso: 1. Participar al menos en un 80% en los foros obligatorios. 2. Aprobar los Trabajos Prácticos Evaluativos (TPE) con al menos el 70%. 3. Aprobar el trabajo final integrador con al menos el 70%. 4. Aprobar el examen parcial con al menos el 70% o sus respectivas recuperaciones. Se darán 2 recuperaciones. 5. La nota final se computará promediando las notas obtenidas en cada uno de los puntos mencionados previamente. Trabajos Prácticos Evaluativos (TPE): Los contenidos evaluados en estos TPE de conocimiento serán: • TPE Nº1: Unidades 1 y 2: Análisis Exploratorio de Datos. • TPE Nº2: Unidades 3 y 4 Base de datos y lenguaje SQL • TPE Nº2: Unidades 5: Visualización de datos. Los TPE programados serán virtuales e individuales y, cada uno de ellos, tendrá 2 (dos) recuperaciones. Examen final para estudiantes regulares: El examen final para estudiantes regulares consistirá en una evaluación escrita (virtual) teórico-práctica, con temas de todas las unidades previstas en el programa, y se aprueba con un porcentaje igual o superior al 60%. Examen Libre: No se admiten alumnos libres dado que los prácticos de máquina y laboratorios se desarrollan de manera incremental desde comienzo de cuatrimestre, por consiguiente no es posible en un examen poder evaluar correctamente este proceso. **En caso de inscribirse para rendir en mesa de examen, una vez realizada la inscripción, debe ponerte en contacto con el profesor Mercedes Barrionuevo al mail mdbarrio@email.unsl.edu.ar para acordar consulta, modalidad y horario de examen.** |
IX - Bibliografía Básica |
---|
[1] Apuntes de cátedra.
[2] Data Science Concepts and Techniques with Applications. Usman Qamar, Muhammad Summair Raza. Springer 2020, ISBN: 978-981-15-6132-0. [3] Texts in Computer Science, The Data Science Design Manual. Steven S. Skiena. Springer 2017. ISBN: 978-3-319-55443-3. [4] Probabilidad y Estadística para Ingeniería y Ciencias. 9th Edición. Ronald E. Wallpole, Raymond H. Myers, Sharon L. Myers and Keying Ye. Pearson Education, 2012. ISBN: 978-607-32-1417-9. [5] Hernández Orallo, Ramírez Quintana, Ferri Ramírez. Introducción a la Minería de Datos. Prentice Hall. 2004. ISBN 84-205-4091-9. [6] Ian H. Witten, Eibe Frank, Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques, (Fourth Edition). Morgan Kaufmann. 2017. ISBN 978-0-12-804291-5. [7] Charu C. Aggarwal . Data Mining: The Textbook. Springer, 2015. ISBN 978-3319141428. [8] Visualization of Time-Oriented Data. Springer Publishing Company, Incorporated, 1st edition, 2011. [9] Tamara Munzner and Eamonn Maguire. Visualization analysis and design. A K Peters visualization series. CRC Press, Boca Raton, FL, 2015. |
X - Bibliografia Complementaria |
---|
|
XI - Resumen de Objetivos |
---|
Manejar con idoneidad los conceptos que involucran el análisis exploratorio de datos, el correcto almacenamiento, la visualización e interpretación de los datos.
|
XII - Resumen del Programa |
---|
El dato como unidad de análisis.
Preprocesamiento y análisis exploratorio de datos Almacenamiento en Base de datos SQL (Structure Query Language) Visualización de datos |
XIII - Imprevistos |
---|
|
XIV - Otros |
---|
Mail de la docente responsable
Esp. Mercedes Barrionuevo: mdbarrio@email.unsl.edu.ar mail de los tutores pedagógicos. Lic. Paula Villegas: villegasmariapaula74@gmail.com Prof. Enrique Vallejo: evallejo@email.unsl.edu.ar mail de la Tutora Tecnológica Prof. Paola Vilela: pevilela@email.unsl.edu.ar |