Context-aware adaptive swarm robotics

Le contexte de ce stage est celui de la robotique en essaim adaptive. Il s'agit de concevoir et déployer des algorithmes d'apprentissage distribués permettant à un ensemble de robots de résoudre une tâche collectivement (p.ex. transport collectif d'objets, exploration de l'environnement, recherche et récupération de ressources). Dans ce cadre, deux types de contraintes apparaissent principalement: (1) l'environnement de déploiement des robots est inconnu au préalable et (2) les capacités de communication et de calcul des robots sont limitées. La classe d'algorithmes que nous étudions s'apparentent à une forme artificielle d'apprentissage social: chaque robot peut innover par la découverte d'un comportement, et les comportements les plus efficaces se diffusent ensuite de proche en proche dans l'essaim. L'échange d'information entre robots de l'essaim porte ainsi exclusivement sur des paramètres de fonction de contrôle (ex. poids de réseaux de neurones) et une estimation de leur utilité (ie. une mesure de performance, souvent sous la forme d'un scalaire). Les informations utilisées par un robot pour la prise de décision viennent par conséquent exclusivement de ce qui peut être perçu par ses senseurs -- en d'autres termes il s'agit d'une information microscopique (ie. mesurée directement par le robot).

Au cours de ce stage, nous nous intéressons à l'acquisition et à l'utilisation d'information macroscopique, c'est à dire d'informations accessibles de manière distribuée par l'ensemble des robots, mais hors d'atteinte d'un robot seul (par exemple, l'essaim forme t'il un ligne ou un cercle?). Pour cela, nous utiliserons les capacités de communication des robots pour transmettre (du robot vers l'essaim) et fusionner (de l'essaim vers le robot) des informations sur le statut de l'essaim et de l'environnement. Il s'agit donc de concevoir un système de communication (implicite ou explicite) permettant d'appréhender la structure de l'environnement et de l'essaim, d'abord de manière ad hoc puis de manière automatique. L'objectif est de permettre à chaque robot de l'essaim de disposer localement d'une information macroscopique qui ne peut être perçue que par l'essaim dans son ensemble, et de pouvoir utiliser cette information (si elle est pertinente) pour décider quelles actions effectuer.

Pour permettre aux robots d'accéder à des informations au niveau macroscopique, nous nous intéresserons en particulier aux modèles de réaction-diffusion et a leurs implémentations dans un monde discret (ie. le graphe formé par les robots). Il s'agira d'écrire les règles (par exemple sous la forme d'un réseau de neurones) déterminant quelles informations locales (mesurées par le robot) et globales (reçues des voisins) sont pertinentes et comment les transmettre, en considérant l'essaim de robots comme un modèle discret de réaction-diffusion. En première instance, on implémentera un système de réaction-diffusion discret permettant de distinguer des groupes de robots (problème d u "french flag" adapté).

L'objectif visé ensuite est d'augmenter la complexité des comportements collectifs d'un essaim de robots grâce à la mise à disposition de chaque robot d'informations macroscopiques sur l'essaim et l'environnement. En particulier nous étudierons la prise de décision collective lorsque seule une partie des robots d'un essaim peut détecter un signal nécessaire pour résoudre un problème (exemple: la répartition d'un essaim de manière homogène ou hétérogène dans deux sous-arènes de tailles différentes selon la présence ou l'absence d'un signal situé en un lieu particulier de l'environnement).

Ce stage sera mené sur des robots réels, les Pogobots, que nous avons développés à l'ISIR. Pendant le stage, il s'agira de prendre en main ces robots (5 cm de diamètres, communication infra-rouge, modèle de locomotion par vibration) et d'implémenter les algorithmes proposés pour les évaluer en condition réelle. Le stage sera mené à l'ISIR avec notre plateforme expérimentale de robotique en essaim. Une poursuite en thèse peut être envisagée en fonction des résultats obtenus et de la motivation du ou de la candidat·e. Ce stage s'insère dans le cadre d'une collaboration avec le laboratoire LIMMS (unité CNRS au Japon).

Lieu: 
ISIR, Sorbonne Univ.
Encadrant: 
Nicolas Bredeche
Référent Universitaire: 
n/a
Attribué: 
No
Année: 
2 023

User login