Ministerio de Cultura y Educación
Universidad Nacional de San Luis
Facultad de Ciencias Físico Matemáticas y Naturales
Departamento: Informatica
Área: Area V: Automatas y Lenguajes
(Programa del año 2018)
I - Oferta Académica
Materia Carrera Plan Año Periodo
(OPTATIVA) AGENTES Y SISTEMAS MULTIAGENTE LIC.CS.COMP. 32/12 2018 1° cuatrimestre
II - Equipo Docente
Docente Función Cargo Dedicación
ERRECALDE, MARCELO LUIS Prof. Responsable P.Asoc Exc 40 Hs
FERRETTI, EDGARDO Responsable de Práctico JTP Exc 40 Hs
III - Características del Curso
Credito Horario Semanal Tipificación Duración
Teórico/Práctico Teóricas Prácticas de Aula Práct. de lab/ camp/ Resid/ PIP, etc. Total B - Teoria con prácticas de aula y laboratorio Desde Hasta Cantidad de Semanas Cantidad en Horas
Periodo
 Hs. 2 Hs. 2 Hs. 1 Hs. 5 Hs. 1º Cuatrimestre 12/03/2018 23/06/2018 15 75
IV - Fundamentación
Los agentes inteligentes artificiales (AIAs) se han convertido en los últimos años, en uno de los principales enfoques para abordar la complejidad creciente de los problemas a los que deben dar respuesta los sistemas computacionales. Estos problemas involucran tanto aplicaciones de software (en general basadas en la Web), como por ejemplo asistentes personales y sistemas recomendadores, como aplicaciones estrechamente relacionados a componentes físicas como la administración de edificios inteligentes, la coordinación de robots, la conducción autónoma de vehículos, etc. Este tipo de dominios requieren, en general, que los AIAs exhiban un comportamiento flexible (reactivo, proactivo y social), autónomo, adaptativo y la conexión directa del sistema al entorno del problema. Para lograr estas capacidades, se han propuesto los más diversos modelos y arquitecturas tales como los sistemas basados en comportamientos, arquitecturas BDI, enfoques de planning determinístico y no determinístico y enfoques basados en teoría de decisión clásica, cualitativa y teoría de juegos, entre otros. Sin embargo, no existen en general, estudios que analicen estos enfoques de una manera comparativa y crítica, analizando sus principales ventajas, desventajas y conexiones con aplicaciones concretas del mundo real. Este curso se enfoca en este último aspecto identificando, en primer lugar, las características principales del ambiente de un problema que incidirán directamente en el tipo de arquitectura requerida para resolverlo de manera satisfactoria. Posteriormente, se describirán los principales modelos y arquitecturas propuestas en los últimos años en el área de los AIAs para abordar estos problemas. Si bien se abordarán los principios teóricos y conceptuales de cada modelo y arquitectura, el énfasis estará puesto en analizar implementaciones concretas de cada uno de ellos que han resultado exitosas en problemas del mundo real.
V - Objetivos / Resultados de Aprendizaje
El principal objetivo del curso es introducir al alumno en los conceptos fundamentales vinculados al desarrollo de agentes artificiales inteligentes y sistemas multiagente, modelos teóricos subyacentes, aplicaciones y herramientas de desarrollo. Al finalizar el curso, el alumno debería ser capaz de reconocer en que tipos de dominios es viable el enfoque basado en agentes, cuales son las herramientas adecuadas en cada caso y debería servir de base para aquellos alumnos que deseen profundizar en aspectos teóricos y prácticos avanzados en el tema.
VI - Contenidos
CONTENIDOS MINIMOS:
Agentes inteligentes artificiales. Conceptos generales. Ambientes. Tipos. El agente racional. Clases y arquitecturas de agentes. Sistemas basados en comportamientos. Arquitecturas BDI. Planning determinístico y no determinístico. Procesos de decisión Markov. Aprendizaje por refuerzo. Conceptos introductorios a los Sistemas Multiagente. Modelos formales. Teoría de Juegos. Interacciones multiagente. Mecanismos de interacción. Votación. Negociación. Argumentación. Comunicación. Aplicaciones.

PROGRAMA:


Unidad 1: Conceptos introductorios, repaso.
Agentes inteligentes artificiales. Concepto de agente. Racionalidad. Autonomía. Tipos de Ambientes. Agentes reactivos. Agentes reflejos basados en modelo. Agentes basados en objetivos. Agentes basados en utilidades. Agentes físicos y de software.

Unidad 2: Modelos y Arquitecturas.
Arquitecturas deliberativas, reactivas e Híbridas. Arquitecturas basadas en comportamientos. Coordinación de comportamientos.

Unidad 3: Modelos y Arquitecturas II.
Modelos de planning determinístico y no determinístico. MDPs. POMDPs. Arquitecturas BDI. MDP versus BDI. Emociones en arquitecturas de agentes. Aprendizaje basado en MDPs. Modelos cualitativos.

Unidad 4: Sistemas multiagente.
Conceptos introductorios. Características de los Sistemas Multiagente. Teoría de Juegos. Componentes y representación de un juego. Criterios de racionalidad en juegos. Juegos estocásticos.

Unidad 5: Interacciones multiagente.
Tipos de interacciones. Mecanismos de interacción. Criterios de evaluación. Planning multiagente. Protocolo de red de contratos. Sistemas de pizarra. Coordinación sin comunicación. Mecanismos de negociación, votación y subastas. Argumentación.

Unidad 6: Aprendizaje en Agentes Inteligentes
Aprendizaje supervisado. Aprendizaje en Redes Neuronales (RN). Aprendizaje por Refuerzo (AR). Enfoques de AR basados en RNs. Deep Reinforcement Learning

Unidad 7: Aplicaciones.
Agentes para: manufacturación, control de procesos, y simulación social. Agentes de interfaz y para comercio electrónico. Agentes recomendadores. Aplicaciones industriales y académicas. Agentes para la Web inteligente. Agentes de Web mining. Agent mining.

VII - Plan de Trabajos Prácticos
Prácticos de Aula

Práctico N°1: “Aspectos introductorios en Agentes y Sistemas multiagente”.

Práctico N°2: “Teoría de Juegos y Mecanismos de Interacción”.

Prácticos de Laboratorio:

Práctico N°1: “Implementación de una Arquitectura Basada en Comportamientos para controlar al robot Khepera 2”.

Práctico N°2: “Experimentación con un agente BDI en el mundo de los azulejos (Tile world domain)”.

Práctico N°3: “Desarrollo de un algoritmo de aprendizaje por refuerzo (Q-Learning) basado en Redes Neuronales para sintetizar un comportamiento de evasión de obstáculos para el robot Khephera 2”.

Proyecto de trabajo final.
VIII - Regimen de Aprobación
Debido a que la materia es optativa y no está garantizado su dictado todos los años, por motivos organizativos el único régimen de aprobación es PROMOCIONAL. Esto significa que los alumnos no pueden aprobar la materia como REGULAR ni tampoco rendirla como libre. Para promocionar la materia, se requerirá un porcentaje mínimo de asistencias a clase del 80%, la entrega de todos los trabajos prácticos, un proyecto de programación propuesto y un informe adicional vinculado a los principales aspectos de agentes inteligentes. Este informe, que deberá ser presentado y defendido en forma oral por el alumno, cumplirá el rol de evaluación integradora requerido por la reglamentación vigente. De igual forma, la entrega y corrección de los distintos prácticos garantiza los aspectos vincualdos a la evaluación continua de los alumnos a lo largo de la cursada.
IX - Bibliografía Básica
[1] “An Introduction to Multiagent Systems”. Michael Wooldridge. Second edition. John Wiley & Sons. 2009.
[2] “Artificial Intelligence: A Modern Approach”. S. Russell y P. Norvig. Prentice Hall; 3ra. edición, 2009.
[3] “Artificial Intelligence: Foundations of Computational Agents”. D. Poole y A. Mackworth. Cambridge University Press, 2010.
[4] “Fundamentals of Multiagent Systems (with NetLogo examples). José M. Vidal. 2010.
[5] “Multiagent Systems: Algorithmic, Game Theoretic and Logical Foundations. Yoav Shoham y Kevin Leyton-Brown. Cambridge University Press. 2008.
[6] “Multi-agent Systems. An introduction to Distributed Artificial Intelligence”. Jacques Ferber. Addison-Wesley. 1999.
[7] “Multiagent Systems. A Modern Approach to Distributed Artificial Intelligence”. Gerhard Weiss. The MIT Press. 2000.
X - Bibliografia Complementaria
[1] Kakas A., Maudet N., Moraitis P., “Layered Strategies and Protocols for Argumentation-Based Agent Interaction”, Argumentation in Multi-Agent Systems, LNCS vol. 3366, pp. 64-77, 2005.
[2] Bentahar J., Alam R., Maamar Z., “An Argumentation-based Protocol for Conflict Resolution”, KR2008 – Workshop on Knowledge Representation for Agents and Multi-Agent Systems, pp. 19-35, 2008.
[3] M. Errecalde, G. Aguirre, F. González. Agentes y mecanismos de votación. In Anales del X Congreso Argentino de Ciencias de la Computación (CACIC), 2004.
[4] Pirjanian, P., Christensen, H.I., Fayman, J.A.: Application of voting to fusion of purposive modules: An experimental investigation. Robotics and Autonomous Systems 23(4) (1998)
[5] Sosa Toranzo C., Schlesinger F., Ferretti E., Errecalde M., “Integrating a voting protocol within an argumentation-based BDI System”. Proceedings del XVI Congreso Argentino de Ciencias de la Computación (CACIC 2010), págs. 82-91, ISBN 978-950-9474-49-9, Universidad de Morón, 18 al 22 de Octubre de 2010.
[6] J. S. Rosenschein and G. Zlotkin. Rules of Encounter - Designing Conventions for Automated Negotiation among Computers. The MIT Press, 1998.
[7] H. J. Müller, Negotiation Principles, Chapter 7, Foundations of Distributed Artificial Intelligence, G. M. P. O'Hare and N. R. Jennings, eds., John Wiley & Sons, 1996.
[8] S. Kraus. Strategic Negotiation in Multiagent Environments. The MIT Press, 2001.
[9] T. W. Sandholm. Distributed rational decision making. In G. Weiss, editor, Multiagent Systems: A Modern Approach to Distributed Artificial Intelligence, chapter 5, pages 201–258. The MIT Press, 1999.
[10] S. Kalenka and N. R. Jennings. Cognition, Agency and Rationality, chapter Socially Responsible Decision Making by Autonomous Agents, pages 135-149. Kluwer, 1999.
[11] S. Ossowski. Co-ordination in Artificial Agent Societies – Social Structures and its Implications for Autonomous Problem-Solving Agents. Springer, 1999.
[12] R. C. Arkin. Integrating behavioral, perceptual and world knowledge in reactive navigation. Robotics and Autonomous Systems, 1990.
[13] R. C. Arkin. Behaviour-Based Robotics. The MIT Press, 1998.
[14] Rodney A. Brooks. A robust layered control system for a mobile robot. IEEE Journal of Robotics and Automation, 1986.
[15] M. E. Pollack. Planning technology for intelligent cognitive orthotics. In Proceedings of 6th International Conference on AI Planning and Scheduling, 2002.
[16] E. Gat. Integrating planning and reacting in a heterogeneous asynchronous architecture for mobile robots. SIGART Bulletin, 1991.
[17] E. Gat. On three-layer architectures. In Artificial Intelligence and Mobile Robots, 1998.
[18] Paolo Pirjanian. Multiple Objective Action Selection and Behaviour Fusion using Voting. PhD thesis, Department of Medical Informatics and Image Analysis, Institute of Electronic Systems, Aalborg University, Denmark, August 1998.
[19] Julio K. Rosenblatt. “DAMN: A distributed architecture for mobile navigation”. In Proc. AAAI Spring Symposium on Lessons Learned from Implemented Software Architectures for Physical Agents. AAAI Press, 1995.
[20] M. E. Bratman, D. J. Israel, and M. E. Pollack. Plans and resource-bounded practical reasoning. Computational Intelligence, 4:349–355, 1988.
[21] Boutilier, C., Dean, T. and Hanks, S. "Decision-Theoretic Planning: Structural Assumptions and Computational Leverage", Volume 11, pages 1-94. Journal of AI Research (JAIR). 1999.
[22] Michael Bowling and Manuela Veloso. “An Analysis of Stochastic Game Theory for Multiagent Reinforcement Learning”. Technical report CMU-CS-00-165, Computer Science Department, Carnegie Mellon University, 2000.
[23] Schlesinger, F., Errecalde, M., Aguirre, G.: An approach to integrate web services and argumentation into a bdi system. In: 9th International Conference on Autonomous Agents and Multiagent Systems (AAMAS). (2010) 1371–1372 (Extended Abstract).
[24] Schlesinger, F., Ferretti, E., Errecalde, M., Aguirre, G.: An Argumentation-based BDI Personal Assistant. In: 23rd IEA-AIE. Volume 6096 of LNAI., Springer (2010) 701–710.
[25] Minsky, M. “The Society of Mind”. Simon and Schuster. New York. 1986.
[26] Mackenzie, D. C., Arkin, R. C., Cameron, J. R., “Multiagent mission specification and execution”, Autonomous Robots, 1, 4, 1997, 29-52.
[27] David L. Chandler. “Rethinking artificial intelligence”. MIT News Office. December 2009. http://web.mit.edu/newsoffice/2009/ai-overview-1207.html.
[28] Zeeshan-Ul-Hassan Usmani. “Web Intelligence and Intelligent Agents”. ISBN 978-953-7619-85-5, InTech. March 2010.
[29] Luo, X., Miao, C., Jennings, N., He, M., Shen, Z. and Zhang, M. (2011) KEMNAD: A Knowledge Engineering Methodology for Negotiating Agent Development. Computational Intelligence . (In Press)
[30] Sen, S., Haynes, T., Arora, N.: Satisfying user preferences while negotiating meetings. International Journal of Human-Computer Studies 47(3) (1997) 407–427.
[31] G. I. Simari and S. D. Parsons: “Markov Decision Processes and the Belief-Desire-Intention Model: Bridging the Gap for Autonomous Agents”. SpringerBriefs in Computer Science, 1st Edition (2011), ISBN 978-1-4614-1471-1.
[32] G. I. Simari and S. D. Parsons: “On the Relationship between MDPs and the BDI Architecture”, Proceedings of the Fifth International Joint Conference on Agents and Multiagent Systems (AAMAS 2006), pp. 1041-1048.
XI - Resumen de Objetivos
El principal objetivo del curso es introducir al alumno en los conceptos fundamentales vinculados al desarrollo de agentes artificiales inteligentes y sistemas multiagente, modelos teóricos subyacentes, aplicaciones y herramientas de desarrollo. Al finalizar el curso, el alumno debería ser capaz de reconocer en que tipos de dominios es viable el enfoque basado en agentes, cuales son las herramientas adecuadas en cada caso y debería servir de base para aquellos alumnos que deseen profundizar en aspectos teóricos y prácticos avanzados en el tema.
XII - Resumen del Programa
Unidad 1: Conceptos introductorios, repaso.
Unidad 2: Modelos y Arquitecturas.
Unidad 3: Modelos y Arquitecturas II.
Unidad 4: Sistemas multiagente.
Unidad 5: Interacciones multiagente.
Unidad 6: Aprendizaje en Agentes Inteligentes.
Unidad 7: Aplicaciones.
XIII - Imprevistos
 
XIV - Otros