![]() Ministerio de Cultura y Educación Universidad Nacional de San Luis Facultad de Ciencias Físico Matemáticas y Naturales Departamento: Informatica Área: Area II: Sistemas de Computacion |
| I - Oferta Académica | |||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
| II - Equipo Docente | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
| III - Características del Curso | |||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|||||||||||||||||||||||||||||||
| IV - Fundamentación |
|---|
|
En la actualidad, las organizaciones generan y reciben grandes volúmenes de datos provenientes de diversas fuentes: sistemas propios, organismos públicos y privados, redes sociales, sensores, entre otros. Estos datos representan una oportunidad valiosa para mejorar procesos y tomar decisiones más acertadas, siempre que se cuente con las herramientas y técnicas necesarias para analizarlos de manera adecuada.
El trabajo con grandes conjuntos de datos supone un desafío que requiere poner en práctica conocimientos y habilidades provenientes de distintas áreas, como la estadística, la informática y la gestión de la información. Este curso se orienta a la aplicación práctica de herramientas y tecnologías que permitan recopilar, organizar, analizar y visualizar datos, con el objetivo de convertirlos en información útil para la toma de decisiones en contextos reales. |
| V - Objetivos / Resultados de Aprendizaje |
|---|
|
La asignatura Taller de Ciencia de Datos tiene como propósito brindar al estudiante una formación sólida y aplicada en el campo de la ciencia de datos, explorando sus principios fundamentales, metodologías, tecnologías y aplicaciones. El curso se centra en el uso práctico de herramientas para recopilar, organizar, analizar y visualizar datos provenientes de diversas fuentes —tales como sistemas propios, organismos públicos y privados, redes sociales y sensores—, con el fin de transformarlos en información útil para la reducción de la incertidumbre y la toma de decisiones fundamentadas.
Resultados de Aprendizaje Esperados Al finalizar el curso, se espera que el estudiante sea capaz de: Aplicar metodologías para el desarrollo de un proyecto de ciencia de datos que incluya procesos de ETL (Extract, Transform and Load), minería de datos y visualización de resultados. Interpretar de manera crítica y correcta los resultados obtenidos a partir de técnicas de análisis y visualización de datos. Seleccionar la estrategia de análisis más adecuada en función del problema planteado. Utilizar tecnologías actuales y emergentes para el análisis y procesamiento de datos. Desarrollar habilidades de trabajo en equipo y comunicación efectiva en distintas modalidades: oral, visual y escrita. Fomentar el aprendizaje autónomo y la capacidad de actualización permanente en un campo en constante evolución. |
| VI - Contenidos |
|---|
|
UNIDAD I: Introducción a la Ciencia de Datos
¿Qué es la ciencia de datos? Justificación. Tipos de problemas que se pueden resolver mediante la ciencia de datos. Marco metodológico para el análisis de datos. Metodología fundamental para la ciencia de datos. Metodología KDD y fases del proceso de extracción del conocimiento. UNIDAD II: Preprocesamiento de los datos. Datos. Tipos y características de datos. Limpieza de datos (data cleaning). Análisis exploratorio de datos (Análisis univariado, bivariado). Ruidos y anomalías (Outliers). Normalización de datos. Discretización y Binarización de variables. Selección de características. Correlación de datos. Análisis Exploratorio de Datos. UNIDAD III: Aprendizaje de Máquina. Aprendizaje de máquina aplicado a la ciencia de datos. Aprendizaje de modelos predictivos. Predicción con datos de entrenamiento reducidos. Métodos semi-supervisados. Validación de modelos. Fusión de información. Aprendizaje de modelos descriptivos. Agrupamiento. Cohesión y separación de grupos. Autocodificadores. Reglas de asociación. Análisis de datos secuenciales. Codificadores y decodificadores. UNIDAD IV:Visualización y comunicación efectiva de la información. El proceso de la Visualización. Estados y transformaciones de los datos. Variables Visuales. Interacciones. Herramientas de visualización. Dashboard interactivos e informes. |
| VII - Plan de Trabajos Prácticos |
|---|
|
Laboratorio 1: Pre-procesamiento de datos
Laboratorio 2: Aprendizaje supervisado y no supervisado Laboratorio 3: Utilización de herramientas de análisis y modelado de datos. Laboratorio 4: Utilización de herramientas de visualización para la muestra de resultados. |
| VIII - Regimen de Aprobación |
|---|
|
Régimen para Regularizar el curso:
1. Tener un mínimo de 60% de asistencia a las clases teóricas y prácticas. 2. Aprobar los laboratorios con al menos el 60%. 3. Aprobar el trabajo final integrador con al menos el 60%. Si cualquier punto no fuese cumplimentado, implicará que el alumno pase a condición de libre. Régimen para promocionar el curso: 1. Tener un mínimo de 80% de asistencia a las clases teóricas y prácticas. 2. Aprobar los laboratorios con al menos el 70%. 3. Aprobar el trabajo final integrador con al menos el 70%. La nota final se computará promediando las notas obtenidas en cada uno de los puntos mencionados previamente. El curso no admite rendir el examen final en condición de Libre por las características inherentemente practicas de la misma. |
| IX - Bibliografía Básica |
|---|
|
[1] Data Science Concepts and Techniques with Applications. Usman Qamar, Muhammad Summair Raza. Springer 2020, ISBN: 978-981-15-6132-0.
[2] Probabilidad y Estadística para Ingeniería y Ciencias. 9th Edición. Ronald E. Wallpole, Raymond H. Myers, Sharon L. Myers and Keying Ye. Pearson Education, 2012. ISBN: 978-607-32-1417-9. [3] Hernández Orallo, Ramírez Quintana, Ferri Ramírez. Introducción a la Minería de Datos. Prentice Hall. 2004. ISBN 84-205-4091-9. [4] Tamara Munzner and Eamonn Maguire. Visualization analysis and design. A K Peters visualization series. CRC Press, Boca Raton, FL, 2015. [5] Wolfgang Aigner, Silvia Miksch, Heidrun Schumann, and Christian Tominski. Visualization of Time-Oriented Data. Springer Publishing Company, Incorporated, 1st edition, 2011. |
| X - Bibliografia Complementaria |
|---|
|
|
| XI - Resumen de Objetivos |
|---|
|
Mostrar la diferencia entre el análisis de datos y la ciencia de datos.
Identificar las fuentes de obtención y almacenamiento de los datos. Mejorar la calidad y la utilidad de un conjunto de datos. Realizar una correcta representación del conjunto de datos a trabajar. Reconocer el mejor algoritmo de predicción o descripción para un conjunto de datos en particular. Realizar representaciones visuales significativas y acordes al tipo de dato ingresado. |
| XII - Resumen del Programa |
|---|
|
El Proceso de Extracción de Conocimiento. Recolección, almacenamiento y acceso de datos. Preprocesamiento de los datos. Representación de datos. Análisis de datos. Proceso de Visualización de datos.
|
| XIII - Imprevistos |
|---|
|
|
| XIV - Otros |
|---|
|
Contacto:
mail de la materia: laboratoriodedatos.unsl@gmail.com Box 8. 1° Piso. Bloque 2. |