Projets

Les propositions de projets de M1. Vous devrez faire votre choix (en contactant directement les encadrants) pour le 26 Janvier.
Attention les projets s'affichent sur plusieurs pages!

Par Stéphane Doncieux , 2 janvier, 2022

Les algorithmes d'apprentissage par renforcement visent à trouver une politique permettant de déterminer l'action à appliquer dans un état donné pour maximiser une récompense sur un certain horizon. La robotique cumule plusieurs défis pour ces algorithmes. Les espaces d'états comme les espace d'action sont continus, les récompenses sont rares, les fonctions de transition peuvent être bruitées, etc.

Par Bruno Escoffier , 2 janvier, 2022

Le problème des mariages stables est au coeur de nombreuses procédures d'affectation, la plus connue en France
étant probablement ParcourSup. Il y a dans ce problème deux types de joueurs (hommes/femmes, candidat(e)s/universités,...),
chaque joueur d'un type donnant ses préférences sur les joueurs de l'autre type (les universités classent les
candidat(e)s par exemple). Le but est de trouver une affectation/un couplage vérifiant une propriété de stabilité.

Par Cedric Herpson , 17 décembre, 2021

L’objectif de ce sujet est, en s'appuyant sur le travail réalisé l'année passée, d'enrichir le comportement d'un agent de supervision afin de permettre aux utilisateurs de suivre dynamiquement le comportement des protocoles en cours d’exécution sur la plateforme JADE [5]. L'agent de supervision a la capacité de voir passer tous les messages des agents qui lui sont rattachés. Il lui faut maintenant détecter, identifier et signaler les éventuels dysfonctionnements.

Par Cedric Herpson , 17 décembre, 2021

l'objectif de ce p-androide est de faire évoluer une application existante qui réalise une interface entre une station sol définissant le plan de de vol d'un drone, un controleur de vol (IA ou humain), et une plateforme de réalisation (simulateur gazebo ou un drone réel), afin de pouvoir tester différentes stratégies de vol.

Par Pierre-Henri W… , 16 décembre, 2021

Les réseaux bayésiens (BNs) sont un modèle probabiliste qui s’appuie sur un graphe (orienté sans cycle) pour représenter une distribution jointe d’un grand nombre de variables aléatoires. Ce modèle à la fois numérique (distribution) et qualitatif (graphe) est un point de contact intéressant entre probabilités, statistiques et intelligence artificielle.

Il permet d’implémenter des outils de raisonnement, de calcul de fiabilité, d’explications causales, mais aussi d’apprentissages statistiques et des outils de classification (machine learning, etc.).

Par Olivier Sigaud , 25 novembre, 2021

Résumé :

L'algorithme Stein Variational Policy Gradient (SVPG) est un algorithme à mi-chemin entre des approches évolutionnaires et des algorithmes d’apprentissage par renforcement. Un code en python est disponible sur github. L’objectif de ce projet est de prendre en main ce code et d’analyser de façon détaillée diverses propriétés de cet algorithme, notamment par des comparaisons avec les algorithmes proches.

Sujet développé :

Par Olivier Sigaud , 25 novembre, 2021

Résumé :

L’objectif du projet est de permettre d’utiliser les Radial Basis Function Networks (RBFN) comme approximateurs de fonctions pour l’apprentissage par renforcement dans la librairie Stable Baselines 3.

Sujet développé :

Par ai2d , 17 janvier, 2021

On s'intéresse au problème multiagents du partage de véhicule pour effectuer un trajet, dans un cadre où les agents doivent s'accorder sur un sous-ensemble de destinations à visiter. Une approche récemment proposée consiste à utiliser le vote itératif sur des comités.
L'objectif du projet sera de:
* reproduire les résultats de l'article: http://ceur-ws.org/Vol-1678/paper15.pdf
* proposer une plateforme permettant à un utilisateur de simuler de tels scenarios de partage de véhicule

Par Stéphane Doncieux , 12 janvier, 2021

Le projet R-STEPPS piloté par Mohamed Zaoui s'intéresse au développement d'une flotte de robots pour lutter contre la désertification dans des zones arides et semi-arides. Différents types de robots permettent de creuser un trou, de planter un arbre et de l'arroser pour reboiser des zones désertiques. Ces robots doivent opérer de façon aussi autonome que possible sur des durées longues. Ils doivent donc être autonomes en énergie.