Exploration automatique de l'espace des comportements pour la robotique en essaim

En robotique en essaim, la démonstration de comportements collectifs repose essentiellement sur la programmation logicielle des comportements des robots, les spécificités physiques des robots étant considérées comme des contraintes fixées au préalable. Pourtant, les interactions physiques entre robots et la diversité des comportements possibles sont rarement exploitées: les comportements sont soit conçus à la main, souvent en imitant le vivant, ou obtenu par apprentissage. Cette dernière méthode permet potentiellement d'obtenir des comportements originaux, mais est souvent contrainte par la structure de l'espace de recherche, ce qui limite le nombre de comportements que l'on peut obtenir.

Pour ce stage, nous utiliserons des méthodes d'exploration de l'espace de recherche. Par opposition aux approches classiques d'apprentissage ou d'optimisation, les méthodes d'exploration n'utilisent pas de critères de succès, mais tente de maximiser la diversité des comportements obtenus. L'objectif général du stage est de démontrer que l'on peut obtenir des comportements collectifs complexes avec un minimum de contrôle.

Ce stage se déroulera en utilisant une centaine de robots Kilobots, dans une arène équipée d'une caméra. Dans un premier temps, il s'agit d'explorer les comportements collectifs possibles de manière exhaustive dans un espace contraint (ie. en définissant un sous espace des comportements possibles de taille raisonnable). On développera par la suite un algorithme dit d'illumination (Map-Elite) permettant d'explorer l'espace des solutions en fonction d'une mesure de performance et de certains des descripteurs comportementaux (temps de persistance moyen, biais directionnel, homogénéité de la densité, alignement moyen, distance moyenne entre individus, densité, nombre de collisions, etc.). On s'intéressera en particulier à la robustesse de la méthode Map-Elite lorsque les évaluations sont bruitées, en étudiant l'opportunité d'un mécanisme de réévaluations pour garantir la stabilité des comportements obtenus.

Il sera nécessaire de mettre en place un dispositif expérimental automatique (contrôle des robots et analyse visuelle), permettant de contrôler la remise à des zéros de l'expérience et permettant de mesure la diversité des comportements obtenus selon les descripteurs comportementaux choisis.

En terme de contrôle, on s'intéressera tout d'abord à des robots fonctionnant en boucle ouverte (modulation des moteurs sans prendre en compte les entrées sensorielles) puis en boucle fermée avec des comportements ad hoc, et enfin des comportements capables d'apprentissage.

Enfin, si le temps le permet, on étudiera aussi la conception d'exosquelettes imprimés en 3D pour "habiller" des robots de type Kilobots (3cm de diamètre) afin de tester en situation réelle les effets de la morphologie sur les comportements collectifs d'un groupe de robots.

Le stage aura lieu à l'ISIR, en collaboration avec le laboratoire Gulliver de l'ESPCI. Le stage s'inscrit dans le cadre du projet ANR "Morpho-functional Swarm Robotics" (2019-2022).

Lieu: 
ISIR, Sorbonne Université
Encadrant: 
Nicolas Bredeche
Référent Universitaire: 
n/a
Attribué: 
Yes
Année: 
2 020

User login