Ministerio de Cultura y Educación
Universidad Nacional de San Luis
Facultad de Ciencias Físico Matemáticas y Naturales
Departamento: Informatica
Área: Area II: Sistemas de Computacion
(Programa del año 2026)
(Programa en trámite de aprobación)
(Programa presentado el 29/04/2026 09:49:51)
I - Oferta Académica
Materia Carrera Plan Año Periodo
FUNDAMENTOS DE CIENCIAS DE DATOS LIC.CS.COMP. RD-3-1/2023 2026 1° cuatrimestre
II - Equipo Docente
Docente Función Cargo Dedicación
BARRIONUEVO, MERCEDES DEOLINDA Prof. Responsable P.Adj Exc 40 Hs
ARROYUELO BILLIARDI, JORGE A. Prof. Co-Responsable P.Adj Exc 40 Hs
TISSERA, PABLO CRISTIAN Prof. Co-Responsable P.Adj Exc 40 Hs
III - Características del Curso
Credito Horario Semanal Tipificación Duración
Teórico/Práctico Teóricas Prácticas de Aula Práct. de lab/ camp/ Resid/ PIP, etc. Total B - Teoria con prácticas de aula y laboratorio Desde Hasta Cantidad de Semanas Cantidad en Horas
Periodo
2 Hs.  Hs. 2 Hs. 3 Hs. 7 Hs. 1º Cuatrimestre 11/03/2026 23/06/2026 15 105
IV - Fundamentación
En la actualidad, diversas tecnologías tienen la capacidad de generar y almacenar una cantidad multivariada e ingente de datos. Estos datos pueden otorgar beneficios transformadores para las organizaciones y la sociedad en su conjunto, siempre y cuando seamos capaces de interpretarlos y comunicarlos de manera efectiva.
Los datos son los cimientos de la innovación, pero su valor proviene del conocimiento que los científicos de datos pueden extraer de ellos y luego utilizar.
Obtener conocimiento a partir de grandes volúmenes de datos implica un gran desafío ya que plantea la necesidad de explorar un universo de estrategias, técnicas y tecnologías provenientes de diferentes áreas como lo son las matemáticas, en particular la estadística, las ciencias de la computación y la visualización de datos, entre otras.
V - Objetivos / Resultados de Aprendizaje
El objetivo general es que los estudiantes puedan hacer suyos conceptos fundamentales utilizados en la ciencia de datos, puedan aplicar diversas metodologías y realicen un correcto uso de herramientas básicas para gestión de datos de manera tal que ayude al usuario a tomar las mejores decisiones.

En este sentido, se plantean los siguientes objetivos específicos:

* Introducir y utilizar metodologías para el desarrollo de un proyecto de ciencia de datos que incluya el proceso ETL (Extract, transform and load), minería de datos y visualización de datos.
* Interpretar de manera correcta los resultados obtenidos luego de la aplicación de técnicas de análisis y visualización de datos.
* Desarrollar la capacidad de reconocer la estrategia a utilizar en base al problema planteado.
* Promover el uso de nuevas tecnologías para el análisis de datos.
* Desarrollar habilidades para trabajo en equipo, comunicación efectiva en forma oral, visual y escrita.
* Promover el aprendizaje autónomo.

Durante el dictado de la asignatura se abordan los siguientes ejes transversales:

* Concepción, diseño y desarrollo de proyectos de informática
* Gestión, planificación, ejecución y control de proyectos de informática
* Utilización de técnicas y herramientas de aplicación en la informática.
* Generación de desarrollos tecnológicos y/o innovaciones tecnológicas
* Fundamentos para el desempeño en equipos de trabajo.
* Fundamentos para la comunicación efectiva.
* Fundamentos para el aprendizaje continuo
* Fundamentos para la acción ética y responsable
VI - Contenidos
UNIDAD I: Introducción a la Ciencia de Datos
¿Qué es la ciencia de datos? Justificación. Tipos de problemas que se pueden resolver mediante la ciencia de datos. Metodología fundamental para la ciencia de datos.

Unidad II: El proceso de extracción de conocimiento.
Etapas. Minería de datos en contexto. Tareas de la minería de datos. Tareas descriptivas y predictivas. Análisis de datos estructurados y no-estructurados. Conceptos de estadística paramétrica y no-paramétrica: repaso. Fuentes de Datos. Ética, seguridad y privacidad en el Análisis de Datos. Aplicaciones.

Unidad III: Recolección, almacenamiento y acceso de datos
Captura de datos. Obtención de datos en tiempo real. Utilización de APIs y herramientas para capturar datos. Recuperación de datos públicos.
Base de datos no estructurada. Descripción y tipos de bases de datos NoSQL. Ventajas y desventajas de las bases de datos NoSQL con respecto a las bases de datos relacionales.

Unidad IV: Preprocesamiento de datos y Análisis de datos.
Datos. Tipos y características de datos. Importancia de los tipos de atributos. Análisis Exploratorio de los Datos (EDA).
Limpieza de datos (data cleaning): reparación y eliminación de datos incorrectos, duplicados, formateados incorrectamente e incompletos.
Análisis de relación entre datos. Correlación. Covarianza. Ruido y valores anómalos (Outliers). Normalización de datos. Agregación. Muestreo. Discretización y Binarización de variables.

Unidad V: Aprendizaje de máquina.
Aprendizaje de modelos predictivos. Predicción con datos de entrenamiento reducidos. Métodos semi-supervisados. Transfer Learning. Zero y few-shot learning. Validación de modelos y búsqueda de hiperparámetros. Fusión de información. Aprendizaje de modelos descriptivos. Agrupamiento. Cohesión y separación de
grupos. Evaluación intrínseca y extrínseca de un agrupamiento. Autocodificadores. Reglas de asociación. Análisis de datos secuenciales. Codificadores y decodificadores. Ciencia de Datos y Aprendizaje por refuerzo.

Unidad VI: Visualización y comunicación efectiva de datos.
El proceso de la Visualización. Estados y transformaciones de los datos. Variables Visuales.
Interacciones. Técnicas de Visualización para grandes conjuntos de datos. Herramientas de visualización. Dashboard interactivos e informes. PKIs.

VII - Plan de Trabajos Prácticos
Metodología de enseñanza:
Para cada unidad se deja disponible el material correspondiente a los contenidos de la unidad, las diapositivas de clase, el apunte teórico y su correspondiente trabajo práctico en el repositorio digital. Con el objetivo de realizar una evaluación formativa y continua, cada entrega correspondiente a cada una de las etapas del proceso de obtención de conocimiento en un proyecto de ciencia de datos será evaluado en tiempo y forma de manera tal de asegurar un correcto desarrollo del proyecto.

TRABAJO PRÁCTICO 1: Preprocesamiento de datos
Objetivos generales: Mejorar la calidad y la utilidad de un conjunto de datos.
Objetivos específicos: Limpiar, integrar, transformar, reducir, discretizar, normalizar y tratar valores faltantes de un dataset determinado.

TRABAJO PRÁCTICO 2: Análisis de datos
Objetivos generales: Reconocer el mejor algoritmo de predicción o descripción para un conjunto de datos en particular.
Objetivos específicos:Conocer el comportamiento de diversos algoritmos frente a los datos a analizar. Optimizar parámetros dentro de los algoritmos para obtener respuestas más adecuadas. TRABAJO

PRÁCTICO 3: Visualización de datos
Objetivos generales: Realizar representaciones visuales significativas y acordes al tipo de dato ingresado.
Objetivos específicos: Seleccionar la mejor herramienta de visualización Seleccionar los gráficos más adecuados para la comunicación de las respuestas a dar al usuario final. Integrar los diversos gráficos para la creación de un dashboard que proporcione una correcta visualización de resultados.


TRABAJO PRÁCTICO INTEGRADOR
Objetivos:
El objetivo de este práctico es que el alumno pueda integrar los conceptos abordados durante la cursada por medio del desarrollo de un proyecto que implica el diseño e implementación de una solución completa para una problemática real dada. El desarrollo de este práctico se inicia en el práctico 1 y finaliza con la entrega de un informe final escrito, exposición y defensa oral del mismo frente a los docentes y alumnos de la materia. Para la realización de este trabajo se planifican entregas parciales correspondientes a subtareas del proyecto. Dichas entregas parciales comprenden breves presentaciones por parte de los alumnos y la entrega de una corrección informada por parte de los docentes. Se pretende que los estudiantes utilicen, tanto en la exposición oral como en el informe escrito, un vocabulario acorde a los contenidos vistos en la asignatura. A continuación se describe cómo se abordan y cómo se evalúan los ejes transversales trabajados en la asignatura:
* “Concepción, diseño y desarrollo de proyectos de informática” Se aborda desde el práctico 1 presentándole al alumno casos reales sobre los cuales se puede aplicar la ciencias de datos. La evaluación se realiza mediante la corrección de entregas parciales de los prácticos de laboratorio.
* Gestión, planificación, ejecución y control de proyectos de informática Se aborda desde el práctico 1 a partir del problema a abordar para su solución mediante la utilización de la ciencias de datos. La evaluación se realiza mediante la entrega de ejercicios y el cumplimiento de la planificación planteada por los alumnos.
* Utilización de técnicas y herramientas de aplicación en la informática. Se aborda desde el práctico 1 presentando al alumno las diversas herramientas posibles para la captura, almacenamiento, preprocesamiento, análisis y visualización de datos a utilizar en la materia. La evaluación se realiza mediante la entrega de ejercicios.
* Generación de desarrollos tecnológicos y/o innovaciones tecnológicas.Se aborda desde el práctico 1 presentándole al alumno casos reales sobre los que se quiere realizar ciencias de datos para que mediante las herramientas aprendidas en la materia propongan soluciones a los casos dados mediante la creación de un desarrollo tecnológico o innovación tecnológica. La evaluación se realiza mediante la entrega de ejercicios.
* Fundamentos para el desempeño en equipos de trabajo. Se aborda desde el inicio integrando grupos de trabajo para el desarrollo de los prácticos de máquina y del trabajo integrador. La evaluación se realiza mediante la entrega de ejercicios por grupos de trabajo y mediante las presentaciones parciales y final del práctico integrador.
* Fundamentos para la comunicación efectiva. Se aborda desde el inicio mediante diferentes entregas y la presentación oral de ejercicios. La evaluación se realiza teniendo en cuenta la exposición oral, la redacción de las soluciones propuestas y la correcta visualización de los resultados y conocimiento obtenidos.
* Fundamentos para el aprendizaje continuo Se aborda desde el inicio fomentando el uso de la bibliografía recomendada, promoviendo la búsqueda de material por parte del alumno, el análisis crítico de la información, sus ventajas, desventajas y aplicaciones y el estudio de material adicional para un actualización continua de estos contenidos. Se evalúa con la corrección informada de los prácticos que incluirán ejercicios que implican la búsqueda bibliográfica.
* Fundamentos para la acción ética y responsable Se aborda desde el inicio estableciendo cronogramas de entrega que deben ser cumplidos por el estudiante para regularizar y/o promocionar la materia. La evaluación se realiza teniendo en cuenta que las entregas, para ser aprobadas, tienen que ser realizadas en tiempo y forma por los alumnos. Por otra parte se evaluará el tratamiento que se les da a los datos resguardando los datos confidenciales y/o personales como así también la correcta selección de características que no involucren sesgos que privilegien o perjudiquen a unas personas sobre otras.
VIII - Regimen de Aprobación
Régimen para Regularizar el curso:
1. Tener un mínimo de 70% de asistencia a las clases teóricas y prácticas.
2. Aprobar los laboratorios con al menos el 60% de la nota.
3. Aprobar el trabajo final integrador con al menos el 60% de la nota.
4. Aprobar el examen parcial con al menos el 60% de la nota.
5. El alumno tendrá a lo más 2 instancias de recuperación.
6. Si cualquier punto no fuese cumplimentado, implica que el alumno pase a condición de libre.

Régimen para promocionar el curso:
1. Tener un mínimo de 80% de asistencia a las clases teóricas y prácticas.
2. Aprobar los laboratorios con al menos el 70% de la nota.
3. Aprobar el trabajo final integrador con al menos el 70% de la nota.
4. Aprobar el examen parcial o en sus respectivas recuperaciones (a lo mas 2 recuperaciones) con al menos el 70% de la nota.
5. Aprobar la exposición oral del proyecto con al menos el 70% de la nota.
6. La nota final se computará promediando las notas obtenidas en cada uno de los puntos mencionados previamente.

El curso no admite rendir el examen final en condición de Libre. El examen final puede ser oral y/o escrito.
IX - Bibliografía Básica
[1] Data Science Concepts and Techniques with Applications. Usman Qamar, Muhammad Summair Raza. Springer 2020, ISBN: 978-981-15-6132-0.
[2] Texts in Computer Science, The Data Science Design Manual. Steven S. Skiena. Springer 2017. ISBN: 978-3-319-55443-3.
[3] Probabilidad y Estadística para Ingeniería y Ciencias. 9th Edición. Ronald. E. Wallpole, Raymond H. Myers, Sharon L. Myers and Keying Ye. Pearson. Education, 2012. ISBN: 978-607-32-1417-9.
[4] Introducción a la Minería de Datos. Hernández Orallo, Ramírez Quintana, Ferri Ramírez. Prentice Hall. 2004. ISBN 84-205-4091-9.
[5] Ian H. Witten, Eibe Frank, Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques, (Fourth Edition). Morgan Kaufmann. 2017. ISBN 978-0-12-804291-5.
[6] Data Mining: The Textbook. Charu C. Aggarwal. Springer, 2015. ISBN 978-3319141428.
[7] Visualization of Time-Oriented Data. Wolfgang Aigner, Silvia Miksch, Wolfgang Müller, Heidrun Schumann, and Christian Wolfgang Aigner, Silvia Miksch, Heidrun Schumann, and Christian Tominski. Springer Publishing Company, Incorporated, 1st edition, 2011.
[8] Tamara Munzner and Eamonn Maguire. Visualization analysis and design. A K Peters visualization series. CRC Press, Boca Raton, FL, 2015.
[9] NoSQLfor Mere Mortals 1st Edición. Dan Sullivan Sullivan. Addison-Wesley, 2015.
X - Bibliografia Complementaria
 
XI - Resumen de Objetivos
Mostrar la diferencia entre el análisis de datos y la ciencia de datos
Identificar las fuentes de obtención y almacenamiento de los datos
Reconocer el mejor algoritmo de predicción o descripción para un conjunto de datos en particular.
Visualizar los datos de manera efectiva.
XII - Resumen del Programa
El Proceso de Extracción de Conocimiento. Recolección, almacenamiento y acceso de datos. Depuración y preprocesamiento de los datos. Análisis de datos. Proceso de Visualización de datos.
XIII - Imprevistos
 
XIV - Otros
Contacto
Mail de la materia:
laboratoriodedatos.unsl@gmail.com
Prof. Barrionuevo Mercedes
mdbarrio@email.unsl.edu.ar
Prof. Arroyuelo Jorge
jarroyu@gmail.com
Prof. Tissera Cristian
ptissera@gmail.com

Oficina 8,9 y 16. Dpto. de Informática. FCFMyN.