Ministerio de Cultura y Educación
Universidad Nacional de San Luis
Facultad de Ciencias Físico Matemáticas y Naturales
Departamento: Matematicas
Área: Matematicas
(Programa del año 2026)
(Programa en trámite de aprobación)
(Programa presentado el 14/05/2026 15:42:51)
I - Oferta Académica
Materia Carrera Plan Año Periodo
ANÁLISIS MULTIVARIADO LICENCIATURA EN ANÁLISIS Y GES OCS-1-27/22 2026 1° cuatrimestre
II - Equipo Docente
Docente Función Cargo Dedicación
VRDOLJAK, JUAN ESTEBAN Prof. Responsable P.Adj Simp 10 Hs
III - Características del Curso
Credito Horario Semanal Tipificación Duración
Teórico/Práctico Teóricas Prácticas de Aula Práct. de lab/ camp/ Resid/ PIP, etc. Total C - Teoria con prácticas de aula Desde Hasta Cantidad de Semanas Cantidad en Horas
Periodo
6 Hs.  Hs.  Hs.  Hs. 6 Hs. 1º Cuatrimestre 16/03/2026 26/06/2026 15 90
IV - Fundamentación
La estadística multivariada constituye un conjunto de herramientas fundamentales para el análisis de datos complejos, en los cuales múltiples variables son medidas simultáneamente sobre un mismo conjunto de unidades de estudio. En un contexto científico y profesional cada vez más orientado al manejo de grandes volúmenes de información, el abordaje multivariado permite explorar patrones, identificar estructuras subyacentes, reducir la dimensionalidad de los datos y evaluar hipótesis en sistemas de alta complejidad.

Esta asignatura se fundamenta en la necesidad de proporcionar a los/las estudiantes herramientas conceptuales y metodológicas que les permitan analizar datos multivariados de manera rigurosa, integrando bases de álgebra lineal, probabilidad y estadística con enfoques contemporáneos provenientes del aprendizaje automático. Se enfatiza tanto la comprensión de los supuestos y limitaciones de cada método como su correcta implementación e interpretación.

El curso articula enfoques exploratorios (no supervisados) y confirmatorios (supervisados), abarcando técnicas de ordenación, clasificación y diferenciación. Asimismo, promueve el uso del entorno de programación R como herramienta para la implementación de análisis reproducibles, favoreciendo la autonomía en el procesamiento, visualización e interpretación de datos.

Finalmente, la materia busca desarrollar una mirada crítica sobre los métodos multivariados, reconociendo que distintas técnicas pueden ofrecer representaciones complementarias de los datos, y que la elección metodológica debe estar guiada por las preguntas de investigación, la naturaleza de los datos y los supuestos involucrados.
V - Objetivos / Resultados de Aprendizaje
Objetivo general

Brindar a los/las estudiantes los fundamentos teóricos y herramientas prácticas de la estadística multivariada necesarios para explorar, modelar e interpretar datos complejos, promoviendo un uso crítico, reproducible y adecuado de los distintos métodos en función de los problemas de análisis planteados.

Objetivos específicos
- Comprender los fundamentos matemáticos básicos (álgebra lineal, distancias, distribuciones multivariadas) que sustentan los métodos multivariados.
- Reconocer la estructura y características de los datos multivariados, así como las implicancias de su naturaleza (escala, distribución, dependencia).
- Aplicar técnicas de reducción de dimensionalidad (PCA, análisis factorial, MDS, CA, entre otros) para la exploración e interpretación de patrones en los datos.
- Implementar métodos de clasificación y agrupamiento (jerárquicos, particionales y basados en modelos), evaluando su estabilidad y validez.
- Comprender y aplicar métodos de diferenciación multivariada (MANOVA y enfoques basados en permutaciones), interpretando correctamente sus alcances y limitaciones.
- Integrar enfoques clásicos con métodos modernos de aprendizaje automático (e.g., t-SNE, UMAP), reconociendo sus diferencias conceptuales y aplicaciones.
- Desarrollar habilidades en el uso del lenguaje R para la manipulación, análisis y visualización de datos multivariados.
- Interpretar críticamente los resultados de los análisis, evitando sobreinterpretaciones y reconociendo la influencia de los supuestos metodológicos.
- Comunicar resultados de análisis multivariados de manera clara, tanto en forma escrita como gráfica.
VI - Contenidos
Unidad 1: Introducción a la estadística multivariada. Introducción a R. Algebra lineal básica: vectores y aritmética matricial. Operaciones básicas con matrices orientadas a la estadística multivariada: determinante, matriz inversa, autovalores y autovectores, matrices diagonalizables. Distancias: euclidianas, Manhattan, chi-cuadrado, Mahalanobis. Coeficientes de disimilitud: simple matching, Jaccard, Sorensen, Bray-Curtis, Gower. Correlación de Pearson y Spearman. Distribución normal univariada, bivariada y multivariada: parámetros y sus requerimientos. Otras distribuciones multivariadas.


Unidad 2: Reducción de dimensionalidad. Definición de análisis no supervisado y supervisado. Análisis de Componentes Principales (PCA): descomposición de autovalores y descomposición en valores singulares; Procedimiento; características de interés, reglas para elección de cantidad de componentes (stopping rules). Análisis factorial. Escalado miltidimensional clásico y no-métrico: objetivos de cada uno; comparación con PCA. Análisis de Correspondencia (CA): perfiles filas y columnas, masas y promedios; inercia; chi-cuadrado; Multi AC. Métodos basados en el Machine Learning: t-SNE y UMAP.


Unidad 3: Clasificación: análisis de agrupamiento (clustering). Análisis jerárquico: procedimiento; dendrograma. K-medias (k-means): cantidad de grupos (k); azar y semillas iniciales; porcentaje de variabilidad explicada. Diagnóstico y validación: bootstrap, submuestreo, reemplazo de puntos por ruido, agregado de ruido (jittering), siluetas de agrupamientos (cluster silhouette). Agrupamientos basados en modelos de mixturas finitas Gaussianas: Algoritmo Expectativa-Maximización (EM); tipos de modelos y parámetros, espacios multidimensionales Gaussianos. DBSCAN y OPTICS: vecindad, tipos de puntos, densidad y alcanzabilidad; distancia al núcleo. Métricas de comparación: asignación correcta y puntuaciones de Brier. Análisis de Redundancia. Análisis de Correspondencia Canónica. Análisis de la Variación Canónica (CVA) y Análisis de Componentes Principales entre grupos (bgPCA).


Unidad 4: Diferenciación. Análisis Multivariado de la Varianza (MANOVA): supuestos y alcance; tipos de suma de cuadrados; limitaciones. Análisis de permutaciones. Análisis de Similitud (ANOSIM). Prueba de Mantel. Análisis de permutaciones Multi-respuesta (MRPP). Análisis Multivariado de la Varianza mediante Permutaciones (PERMANOVA). Tipo y dispersión de datos. Aleatorización de Residuos en un Procedimiento de Permutación (RRPP). Permutaciones restringidas para modelos con variables aleatorias.


VII - Plan de Trabajos Prácticos
Trabajos Integradores
Al finalizar cada una de las cuatro unidades temáticas, los/las estudiantes deberán presentar un Trabajo Integrador. La entrega se realizará a través de la plataforma indicada y deberá incluir tres componentes obligatorios:
1. Script en R: debidamente comentado, incluyendo la justificación de los procedimientos utilizados, la interpretación de los resultados y conclusiones generales.
2. Video explicativo (máx. 10 minutos): exposición del análisis realizado, resultados obtenidos e interpretación.
3. Registro de uso de IA: archivo que incluya los prompts y respuestas generadas mediante herramientas de Inteligencia Artificial, en caso de haber sido utilizadas.
Se requerirá que los scripts sean reproducibles, correctamente documentados y que toda función no abordada en clase sea adecuadamente explicada. El uso de herramientas de IA deberá ser explícitamente declarado y se espera que su utilización sea complementaria y no sustitutiva del trabajo propio.

Trabajo Final
El Trabajo Final consistirá en el análisis integral de un conjunto de datos multivariados asignado de manera individual. Se evaluará la capacidad de seleccionar e implementar métodos adecuados, así como la correcta interpretación e integración de los resultados.
El trabajo es de carácter individual, aunque su presentación podrá realizarse de manera grupal.

VIII - Regimen de Aprobación
La asignatura se aprueba mediante únicamente el régimen de promoción sin examen final; es decir, no se puede rendir libre. La calificación final será igual o superior a 7 (siete) puntos sobre 10, y se obtendrá a partir de:
• Promedio de los Trabajos Integradores: 50%
• Trabajo Final: 50%

La no entrega en tiempo y forma de cualquiera de los componentes de los trabajos integradores implicará:
- Dentro de las 24hs de vencido el horario de entrega: 2 puntos menos sobre 10 en la nota del trabajo.
- Luego de las 24hs de vencido el horario de entrega: la no aprobación del Trabajo Integrador correspondiente.
Es obligatorio para la aprobación de la materia entregar todos los trabajos integradores y el trabajo final con su presentación.
IX - Bibliografía Básica
[1] Bakker J.D. (2024). Applied multivariate statistics in R - https://uw.pressbooks.pub/appliedmultivariatestatistics/
[2] Greenacre, M., Groenen, P. J., Hastie, T., d’Enza, A. I., Markos, A., & Tuzhilina, E. (2022). Principal component analysis. Nature Reviews Methods Primers, 2(1), 100.
[3] Greenacre & Primicerio (2013). Multivariate Analysis of Ecological Data- https://www.fbbva.es/wp-content/uploads/2017/05/dat/DE_2013_multivariate.pdf
[4] Manly, B. F., Alberto, J. A. N., & Gerow, K. (2024). Multivariate statistical methods: a primer. Chapman and Hall/CRC.
[5] Palacio, F. X., Apodaca, M. J., & Crisci, J. V. (2020). Análisis multivariado para datos biológicos: teoría y su aplicación utilizando el lenguaje R. Fundación de Historia Natural Félix de Azara. - https://fundacionazara.org.ar/img/libros/analisis-multivariado-para-datos-biologicos/analisis-multivariado-para-datos-biologicos.pdf
[6] Everitt, B., & Hothorn, T. (2011). An introduction to applied multivariate analysis with R. Springer Science & Business Media.
X - Bibliografia Complementaria
[1] Página de interés: https://scikit-learn.org/stable/
[2] Libros recomendados:
[3] Collyer, M. L., Sekora, D. J., & Adams, D. C. (2015). A method for analysis of phenotypic change for phenotypes described by high-dimensional data. Heredity, 115(4), 357-365.
[4] Greenacre, M. (2017). Correspondence analysis in practice. chapman and hall/crc.
[5] Scrucca, L., Fraley, C., Murphy, T. B., & Raftery, A. E. (2023). Model-based clustering, classification, and density estimation using mclust in R. Chapman and Hall/CRC.
[6] Thioulouse, J., Dray, S., Dufour, A. B., Siberchicot, A., Jombart, T., & Pavoine, S. (2018). Multivariate analysis of ecological data with ade4.
[7] Zelterman, D. (2015). Applied multivariate statistics with R (Vol. 393). Cham: Springer.
[8] Artículos:
[9] Anderson, M. J. (2001). A new method for non‐parametric multivariate analysis of variance. Austral ecology, 26(1), 32-46.
[10] Anderson, M. J., & Walsh, D. C. (2013). PERMANOVA, ANOSIM, and the Mantel test in the face of heterogeneous dispersions: what null hypothesis are you testing?. Ecological monographs, 83(4), 557-574.
[11] Anderson, M. J. (2014). Permutational multivariate analysis of variance (PERMANOVA). Wiley statsref: statistics reference online, 1-15.
[12] Anderson, A. A. (2019). Assessing statistical results: magnitude, precision, and model uncertainty. The American Statistician, 73(sup1), 118-121.
[13] Camargo, A. (2022). PCAtest: testing the statistical significance of Principal Component Analysis in R. PeerJ, 10, e12967.
[14] Scrucca, L. (2010). Dimension reduction for model-based clustering. Statistics and Computing, 20(4), 471-484.
[15] Scrucca, L. (2016). Identifying connected components in Gaussian finite mixture models for clustering. Computational Statistics & Data Analysis, 93, 5-17.
[16] Scrucca, L., Fop, M., Murphy, T. B., & Raftery, A. E. (2016). mclust 5: clustering, classification and density estimation using Gaussian finite mixture models. The R journal, 8(1), 289.
[17] Vasco, M. N. C. S. (2012). Permutation tests to estimate significances on Principal Components Analysis. Computational Ecology and Software, 2(2), 103.
[18] Zhao, S., Zhang, B., Yang, J., Zhou, J., & Xu, Y. (2024). Linear discriminant analysis. Nature Reviews Methods Primers, 4(1), 70.
XI - Resumen de Objetivos
Desarrollar competencias teóricas y prácticas para el análisis de datos multivariados.
Aplicar métodos estadísticos clásicos y modernos para explorar, reducir dimensionalidad, clasificar y diferenciar estructuras en datos complejos.
Promover el uso crítico, reproducible e interpretativo de herramientas estadísticas mediante el entorno R.
XII - Resumen del Programa
Unidad N° 1: Fundamentos de la estadística multivariada y herramientas básicas en R.
Unidad N° 2: Reducción de dimensionalidad.
Unidad N° 3: Clasificación y análisis de agrupamiento.
Unidad N° 4: Diferenciación y contrastes multivariados.
XIII - Imprevistos
---
XIV - Otros
Correo electrónico para comunicarse con el docente de la materia: multivariado.unsl@gmail.com