Apprentissage social et imitation pour la robotique en essaim

Co-encadrement: Nicolas Bredèche et Stéphane Doncieux

L'objectif de ce projet Androide est d'explorer la possibilité d'apprendre par imitation dans le contexte d'un essaim de robots.

En effet, l'apprentissage "social" en robotique en essaim se base généralement sur le transfert des paramètres de contrôles (par exemple, les poids d'un réseaux de neurones artificiels) entre robots. Ce n'est pas le cas dans le vivant, ou l'apprentissage social de nouvelles compétences se produit lorsqu'un individu en observe un autre, que l'autre soit en train de montrer explicitement comment faire une action, ou simplement en train de la faire pour son propre intérêt.

On pourrait penser que le transfert direct de paramètres de contrôle entre robots est plus efficace, car sans perte d'information, cependant apprendre par imitation offre deux avantages. Le premier est que l'information transférée ne concerne qu'un tâche particulière, indépendante de toute autre compétence utile ou non. Le second est qu'une imitation réussie n'implique pas forcément que la compétence acquise soit identique dans sa manière d'être exécutée même si elle atteint le même objectif (par exemple, il est tout à fait possible d'écrire de la main droite ou de la main gauche).

On utilisera un simulateur de robotique en essaim pour concevoir et implémenter un algorithme d'apprentissage social basé sur l'imitation. En pratique, on considèrera un essaim de robots dans lequel certains robots, les "innovateurs", sont capables de réaliser une tâche, alors que d'autres robots, les "apprenants", doivent apprendre et diffuser les compétences apprises. Les robots "innovateurs" pourront transmettre aux robots "imitateurs" comment leur comportement est accompli, en utilisant des descripteurs comportementaux (p.ex. vitesse, comportement prêt des murs, etc.). Les robots "imitateurs" devront ensuite apprendre à imiter au mieux ces comportements, en tentant de minimiser la différence entre leur propre comportement et celui des robots innovateurs. Vous testerez cette stratégie sur une tâche classique de la robotique en essaim, le fouragement, où il s'agit pour les robots de récupérer des objets répartis dans l'environnement.

Dans un premier temps, nous utiliserons des robots "imitateurs" simples, puis dans un second temps les robots "imitateurs" seront aussi capables de s'imiter les uns les autres. Il s'agira alors d'observer la diffusion de compétence dans la population. Enfin dans un troisième temps, on considèrera que chaque robot peut être tour à tour innovateur ou imitateur, ce qui présente une hypothèse plus réaliste. En effet dans la nature, on observe une interaction entre apprentissage individuel (qui mène parfois à une innovation) et apprentissage social (qui permet la diffusion de ces innovations).

Le travail demandé consistera à implémenter des descripteurs comportementaux permettant aux robots d'échanger sur la manière dont est réalisée une tâche, et à définir la stratégie de sélection des individus à imiter (par exemple: imiter la majorité? imiter le plus vieux? imiter les plus semblables génétiquement? ou les plus différents?)

Encadrant: 
Nicolas Bredeche
Nombre d'étudiants: 
2
Attribué: 
No
Deprecated: 
No
Etudiants affectés: 
Dorian Lancelin et Alessia Kalessia

User login