Apprentissage et représentation des connaissances pour l’autonomie à long terme
By Cedric Herpson on Thu, 2020-11-19 13:20Mots-clés : autonomie à long terme, adaptation, robustesse, représentation des connaissances
------
COntexte
------
AgeNts Distribues, Robotique, Recherche Opérationnelle, Interaction, DEcision
Mots-clés : autonomie à long terme, adaptation, robustesse, représentation des connaissances
------
COntexte
------
-
En robotique en essaim, la démonstration de comportements collectifs repose essentiellement sur la programmation logicielle des comportements des robots, les spécificités physiques des robots étant considérées comme des contraintes fixées au préalable. Pourtant, les interactions physiques entre robots et la diversité des comportements possibles sont rarement exploitées: les comportements sont soit conçus à la main, souvent en imitant le vivant, ou obtenu par apprentissage.
-
-
-
-
Reinforcement learning methods allow to build a policy that maximizes a given reward in a particular environment. The generated policy heavily depends on the domain it has been tested on. It creates two different issues: (1) the domain may be too hard for the learning process to proceed efficiently (bootstrap problem) and (2) the policy may not generate the same expected behavior in different domains (generalization issue).
In order to be able to interact with its environment and solve non-trivial object-based tasks (e.g. manipulation), a robot must be able to locate objects in its perceptual field, and to track them throughout the interaction. In the case of a static task and structured environment, for example objects on a tabletop, those perceptual abilities can be hardcoded.