Apprentissage et représentation des connaissances pour l’autonomie à long terme
Apprentissage incrémental et inférence sur des graphes multimodaux
• Mots-clés : autonomie à long terme, adaptation, robustesse, représentation des connaissances
• Localisation : Paris – Sorbonne Université/CNRS, campus Jussieu – LIP6.
• Durée : 6 mois - 589 euros net mensuel
• Envoyer (CV, LM) à : cedric.herpson@lip6.fr
• Poursuite en thèse possible sous réserve de financement
Contexte
Ces travaux s’inscrivent dans le cadre de recherches sur l’autonomie à long terme (mois, années) d’une entité artificielle. L’objectif est d’étudier et concevoir des mécanismes non déportés permettant à une entité d’évoluer de manière autonome en environnement ouvert, dynamique et partiellement observable. Ces hypothèses de travail nous conduisent à nous intéresser à des méthodes d’apprentissage et de prise de décision en-ligne privilégiant la robustesse à l’optimalité (perçue comme un effet de bord).
Stage
Concevoir des mécanismes non-déportés à même de doter une entité artificielle non-connectée d’un tel niveau d’autonomie nécessite de se poser la question de la représentation et de la mise à jours des connaissances - par nature multimodales - manipulées.
La grande majorité des travaux en informatique et en robotique se sont restreint à l’étude de l’autonomie et des mécanismes sous-jacents dans des environnements contrôlés, sans contraintes computationnelles, et/ou pour des durées relativement courtes (quelques heures). Cela conduit ces approches à privilégier l’utilisation de représentations définies a-priori, souvent figées, et des mécanismes d’apprentissage réapprenant périodiquement leurs représentation à partir du total des données rencontrées (anciennes + nouvelles) plutôt que de modifier l’existant.
Dans notre cadre de travail, le flux de données potentiellement infini arrivant à chaque instant via les capteurs de l’entité artificielle (incarnée ou non) représente un volume d’information trop important pour pouvoir être conservé dans son intégralité, et encore moins retraité. De plus, en environnement dynamique et dans la durée, certaines des connaissances acquises peuvent devenir obsolètes au cours du temps. Ce contexte d’exécution nécessite l’utilisation d’algorithmes adaptatifs anytime [1,2,3,15,16,17]. Les questions centrales des travaux portant sur cette problématique sont : Le choix de la structure de représentation multimodale [13], la détermination de l’impact d’un nouvel exemple sur celle-ci, et l’identification de ce qui doit être, ou non, supprimé [4,5,6,7].
Après avoir identifié les principales approches existantes pour l’apprentissage et la représentation de connaissances dans un contexte multimodal [13,14,11], vous analyserez celles-ci sous l’angle de l’autonomie à long-terme d’un système déconnecté, et de l’approche développementale [9,10,12,8]. Vous porterez notamment attention aux propriétés liées aux capacités d’adaptation et de robustesse [7] induites par ces approches.
Fort de cette analyse, vous proposerez une architecture apprentissage-représentation-exploitation adaptée à l’autonomie à long terme.
Éléments de Bibliographie
[1] C. Giraud-Carrier (2000) - A note on the utility of incremental learning
[2] A. Cornuéjols. (2009) - On-line learning: where are we so far?
[3] P. Domingos et al (2001) - Catching up with the data: Research issues in mining data streams.
[4] A. Tsymbal (2004) - The problem of concept drift: definitions and related work.
[5] G. Widmer et al (1996) - Learning in the presence of concept drift and hidden contexts.
[6] E. Ikonomovska et al (2010) - Incremental option trees for handling gradual concept drift.
[7] C. Herpson (2012) - Approche multi-agents pour la supervision adaptative des systèmes distribués
[8] Doncieux, Stephane, et al.(2020) - "DREAM Architecture: a Developmental Approach to Open-Ended Learning in Robotics."
[9]Mehler, Jacques, and Emmanuel Dupoux (2002) - Naître humain. Odile Jacob,
[10] Pfeifer, Rolf, and Josh Bongard (2006). How the body shapes the way we think: a new view of intelligence. MIT press.
[11] Eloi Zablocki, Benjamin Piwowarski, Laure Soulier, Patrick Gallinari. Apprentissage multimodal de représentation de mots à l’aide de contexte visuel (2018). Conférence sur l’Apprentissage Automatique, Rouen, France. hal-01842358
[12] Affordances for robots: a brief survey (2012). Pismo Awangardy, Filozoficzno Naukowej, no. 2, pp. 70–84
[13] Multimodal Machine Learning: A Survey and Taxonomy (2017) .Madas Baltruˇsaitis, Chaitanya Ahuja, and L-P. Morenc
[14] Representation Learning: A Review and New Perspectives (2014). Yoshua Bengio†, Aaron Courville, and Pascal Vincent†
Department of computer science and operations research, U. Montreal †also, Canadian Institute for Advanced Research (CIFAR)
[15] Lifelong Machine Learning: A Paradigm for Continuous Learning by and Bing Liu. Frontiers of Computer Science, 2017.
[16] CHILD: A First Step Towards Continual Learning by and Mark B Ring. Machine Learning, 1997.
[17] Continual AI https://github.com/ContinualAI/continual-learning-papers