Projets | Algorithmes, Intelligence Artificielle, Interactions et Décision

Les propositions de projets de M1. Vous devrez faire votre choix (en contactant directement les encadrants) pour le 26 Janvier.
Attention les projets s'affichent sur plusieurs pages!

Par Olivier Sigaud , 25 novembre, 2021

Apprentissage par renforcement profond : analyse détaillée de SVPG

Résumé :

L'algorithme Stein Variational Policy Gradient (SVPG) est un algorithme à mi-chemin entre des approches évolutionnaires et des algorithmes d’apprentissage par renforcement. Un code en python est disponible sur github. L’objectif de ce projet est de prendre en main ce code et d’analyser de façon détaillée diverses propriétés de cet algorithme, notamment par des comparaisons avec les algorithmes proches.

Sujet développé :

Par Olivier Sigaud , 25 novembre, 2021

Apprentissage par renforcement avec approximateurs RBFN

Résumé :

L’objectif du projet est de permettre d’utiliser les Radial Basis Function Networks (RBFN) comme approximateurs de fonctions pour l’apprentissage par renforcement dans la librairie Stable Baselines 3.

Sujet développé :

Par ai2d , 17 janvier, 2021

Partage de véhicules par vote itératif

On s'intéresse au problème multiagents du partage de véhicule pour effectuer un trajet, dans un cadre où les agents doivent s'accorder sur un sous-ensemble de destinations à visiter. Une approche récemment proposée consiste à utiliser le vote itératif sur des comités.
L'objectif du projet sera de:
* reproduire les résultats de l'article: http://ceur-ws.org/Vol-1678/paper15.pdf
* proposer une plateforme permettant à un utilisateur de simuler de tels scenarios de partage de véhicule

Par Stéphane Doncieux , 12 janvier, 2021

Gestion d'énergie dans une flotte de robots de reboisement

Le projet R-STEPPS piloté par Mohamed Zaoui s'intéresse au développement d'une flotte de robots pour lutter contre la désertification dans des zones arides et semi-arides. Différents types de robots permettent de creuser un trou, de planter un arbre et de l'arroser pour reboiser des zones désertiques. Ces robots doivent opérer de façon aussi autonome que possible sur des durées longues. Ils doivent donc être autonomes en énergie.

Par Vanda Luengo , 7 janvier, 2021

Automatic Data Analysis of research papers related to Technology Enhanced Learning

We investigate using a quantitative analysis led between 2007 and 2017 through: a social network analysis of the 3 communities, involving the 1822 scientists who participated in program committees and/or appeared as au-thors of the associated journals (IJAIED, JEDM and JLA); and a text analysis of abstracts of articles published in these journals.

We would like to apply the same methods to analyse French papers in the ECTEL community (in french Environnements informatiques pour l'apprentissage humain).

Par ai2d , 6 janvier, 2021

Explications qualitatives de trajectoires de robots

On se place dans le cadre d'un robot devant effectuer une tâche de navigation dans un environnement 2D, en présence d'objets dotés de propriétés différentes (fragilité, valeur, etc.). Par simulation, différentes trajectoires peuvent être obtenues, répondant à plusieurs critères (chemin le plus court, le plus sûr, etc.). L'objectif de ce projet est de permettre d'obtenir :
* une description qualitative de la trajectoire retenue ("je passe /à droite/ de l'objet A, puis /entre les objets/ C et D")

Par ai2d , 6 janvier, 2021

Robotique adaptative en essaim: effet de l'environnement sur l'apprentissage de stratégies collectives

Ce sujet porte sur l'apprentissage en ligne et distribué de comportement pour la robotique en essaim. L'apprentissage dépendant en partie de facteurs exogènes (diversité et fréquence des rencontres, durée des interactions), un même algorithme d'apprentissage peut donner des résultats très différents selon le contexte.

Par ai2d , 6 janvier, 2021

Robotique en essaim et apprentissage: influence du périmètre d'apprentissage et de la récompense

La robotique en essaim s'intéresse aux grandes populations de robots aux capacités de communication et de calcul limitée. Ce projet porte sur la conception automatique de stratégies comportementales pour l'ensemble des robots, la conception à la main de ces stratégies étant rapidement difficiles lorsque les tâches sont complexes. Il s'agit d'un problème d'apprentissage par renforcement pour la recherche directe de politique (i.e. trouver les poids d'un réseaux de neurones contrôlant chaque robot).

Par ai2d , 5 janvier, 2021

Identification et indexation d'entité nommées

Il s'agit d'un projet dans le domaine des humanités numériques. L'objet est de perfectionner un outil d'identification et d'indexation d'entités nommées par construction d'un dictionnaire d'alias, puis détection et étiquettage des ambiguités, dans un corpus important et structuré de textes.

Par ai2d , 5 janvier, 2021

Ethique computationelle et décision en présence d'autrui

L'éthique computationelle s'intéresse à la modélisation de différents principes éthiques et ce travail s'inscrit dans un cadre déclaratif d'évaluations d'actions organisé selon différents modèles. Le cadre actuel s'intéresse à la prise de décision d'un agent isolé dans un cadre déterministe. L'objectif de ce projet est d'explorer les ramifications de la présence d'autres acteurs sur les prises de décisions éthiques et sur les notions relatives (telles que les questions de responsabilités).