Architecture d’agent adaptatif pour l’autonomie à long terme

Par Cedric Herpson, 7 décembre, 2017

Mots-clés : autonomie à long terme, adaptation, robustesse, apprentissage incrémental
Localisation : Paris – Université Pierre et Marie Curie, campus Jussieu – LIP6.
Durée : 6 mois - 589 euros net mensuel
Envoyer  (CV, LM) à : cedric.herpson@lip6.fr

--

Contexte :
Ce stage s’inscrit dans le cadre d’activités de recherche structurées autour de l’étude et la conception d’une architecture adaptative pour l’autonomie à long terme d’une entité artificielle (CARLOTA). Qu’elles soient issues de la robotique ou de l’intelligence artificielle, les architectures existantes [1,2] ne permettent pas d’envisager un fonctionnement autonome sur plusieurs mois ou année en environnement Ouvert, Dynamique et Partiellement observable (ODP).
Afin de permettre l’avènement de ce type d’entité, il apparaît nécessaire de privilégier des solutions incarnées, non déportées, où la robustesse des comportements est privilégiée à leur optimalité [3].

--

Sujet :
L'objectif de ce stage est de concevoir et mettre en œuvre une architecture cognitive élémentaire mais opérationnelle intégrant les mécanismes nécessaires à une telle entité pour évoluer à long terme et de manière autonome en environnement ODP : représentation des connaissances [7], prise de décision robuste [4] et apprentissage incrémental [5,6].
Une fois l’architecture élémentaire élaborée – on s’intéressera en particulier au mécanisme décisionnel proposé dans [8] – il s’agira de développer un mécanisme adaptatif permettant à l’agent de maintenir son degré d’autonomie suite à un événement engendrant une altération de son environnement. La mise en œuvre expérimentale de l’architecture se fera au choix de l’étudiant sur Thymio ou au sein de la plateforme existante DELTA. Ce travail est susceptible de se poursuivre en thèse.
Prérequis :
Connaissances des architectures d’agents adaptatifs (bottom-up et top-down) et des grandes classes d’algorithmes d’apprentissage. Expérience de développement avec le paradigme objet. Maîtrise des langues française et anglaise.

--

Bibliographie partielle:
[1] Pat Langley, John E Laird, and Seth Rogers, Cognitive architectures: Research issues and challenges, Cognitive Systems Research 10 (2009), no. 2, 141–160.
[2] John E Laird, The soar cognitive architecture, MIT Press, 2012.
[3] R.Pfeifer and J. Bongard, How the body shapes the way we think: a new view of intelligence, 2006
[4] P. Kouvelis and G. Yu. Robust discrete optimization and its applications. Kluwer
Academic Pub, 1997.
[5] C. Giraud-Carrier (2000) -  A note on the utility of incremental learning
[6] A. Cornuéjols. (2009)  - On-line learning: where are we so far?
[7] Affordances for robots: a brief survey,” AVANT. Pismo Awangardy Filozoficzno-
Naukowej, no. 2, pp. 70–84, 2012.
[8] C. Herpson, ADS2 : Approche multi-agents pour la supervision adaptative des systèmes distribués, Ph.D. thesis, Université Pierre et Marie Curie, 2012

Lieu
LIP6 - Campus Jussieu
Thématiques
Encadrant
Cédric Herpson
Référent universitaire
Cédric Herpson
Fichier descriptif
Document
Tags
Attribué
Non
Année
2018