Robotique adaptative en essaim: effet de l'environnement sur l'apprentissage de stratégies collectives

Ce sujet porte sur l'apprentissage en ligne et distribué de comportement pour la robotique en essaim. L'apprentissage dépendant en partie de facteurs exogènes (diversité et fréquence des rencontres, durée des interactions), un même algorithme d'apprentissage peut donner des résultats très différents selon le contexte.

Dans le cadre ce projet, on s'intéressera dans un premier temps à l'apprentissage de la spécialisation dans un essaim de comportement, c'est à dire lorsque plusieurs groupes de robots adoptent des stratégies différentes, robustes et pertinentes. On utilisera pour cela une modélisation numérique à un haut niveau d'abstraction permettant de rapidement étudier l'influence d'un grand nombre de paramètres (en particulier: le degré et la fluidité du graphe de connexions).

Dans un second temps, on s'intéressera à l'apprentissage de la coopération pour un problème proche du dilemme du prisonnier, pour lequel la fréquence du renouvellement des voisins peut avoir une importance. En effet, lorsque l'environnement est "visqueux", le voisinage d'un individu est composé d'autres individus partageant une ascendance proche. Cette proximité génotypique, associées à la lente diffusion des stratégies dans la population peut faire apparaître des effets de coopération altruiste.

A titre d'expérience contrôle, on comparera les résultats obtenus avec une approche ou tous les individus de l'essaim apprennent de manière indépendante. En l'absence de diffusion des stratégies efficaces, on s'attend à une performance moindre dans certains cas, mais qui n'est pas certaine lorsque l'essaim fait face à des niches en terme de comportements (ex.: la spécialisation ne pose pas de problème si deux agents apprennent indépendamment, alors qu'elle devient très difficile si les deux agents s'imitent l'un-l'autre).

Bibliographie:

[1] J-M. Montanier, S. Carrignon, N. Bredeche (2016) Behavioural Specialisation in Embodied Evolutionary Robotics: Why so Difficult? Frontiers in Robotics and AI, Volume 3, number 38.

Ce projet peut-être attribué à un binôme ou un trinôme d'étudiants.

Encadrant: 
Nicolas Bredeche
Nombre d'étudiants: 
2
Attribué: 
Yes
Deprecated: 
No

User login