Apprentissage et représentation des connaissances pour l’autonomie à long terme

Mots-clés : autonomie à long terme, adaptation, robustesse, représentation des connaissances

------
COntexte
------

Ces travaux s’inscrivent dans le cadre de recherches sur l’autonomie à long terme (mois, années) d’une entité
artificielle. L’objectif est d’étudier et concevoir des mécanismes non déportés permettant à une entité d’évoluer de
manière autonome en environnement ouvert, dynamique et partiellement observable. Ces hypothèses de travail nous
conduisent à nous intéresser à des méthodes d’apprentissage et de prise de décision en-ligne privilégiant la
robustesse à l’optimalité (perçue comme un effet de bord).

------
Stage
------
Concevoir des mécanismes non-déportés à même de doter une entité artificielle non-connectée d’un tel niveau
d’autonomie nécessite de se poser la question de la représentation et de la mise à jours des connaissances manipulées
(Ces dernières sont par nature multimodales). La grande majorité des travaux en informatique se sont principalement
restreint à l’étude de l’autonomie et des mécanismes sous-jacents dans des environnements contrôlés, sans
contraintes computationnelles, et/ou pour des durées relativement courtes (quelques heures). Cela conduit ces
approches à privilégier l’utilisation de représentations définies a-priori, souvent figées, et des mécanismes
d’apprentissage réapprenant périodiquement leurs représentation à partir du total des données rencontrées (anciennes
+ nouvelles) plutôt que de modifier l’existant.
Cependant, dans notre cadre de travail, le flux de données potentiellement infini arrivant à chaque instant via ses
capteurs représente un volume d’information trop important pour pouvoir être conservé ou même retraité. De plus,
en environnement dynamique et dans la durée, certaines des connaissances acquises peuvent devenir obsolètes. Ce
contexte d’exécution nécessite l’utilisation d’algorithmes adaptatifs anytime [1,2,3]. Les questions centrales des
travaux portant sur cette problématique sont : La détermination de l’impact d’un nouvel exemple sur la structure
multimodale précédemment apprise, et l’identification de ce qui doit être, ou non, supprimé [4,5].
Après avoir identifié les principales approches existantes de ce problème, identifiées dans la littérature sous les
terme de dérive de concept (Concept Drift), de changement de représentation, et d’approche développementale
[9,10], l’étudiant devra s’appuyer sur ses lectures pour discuter des travaux de [6,7,8,11,12] pour répondre à cette
problématique. Fort de cette analyse, l'étudiant élaborera une extension de la solution proposée dans [7] au cadre
multimodal.

Voir pdf pour les références.

Lieu: 
Campus Jussieu
Encadrant: 
Cédric Herpson
Référent Universitaire: 
n/a
Attribué: 
No
Année: 
2 021
Deprecated: 
No

User login