Projets

Les propositions de projets de M1. Vous devrez faire votre choix (en contactant directement les encadrants) pour le 26 Janvier.
Attention les projets s'affichent sur plusieurs pages!

Par Olivier Spanjaard , 12 janvier, 2024

Mastermind (https://fr.wikipedia.org/wiki/Mastermind) est un jeu de déduction classique, édité pour la première fois en 1972. De par la simplicité de ses règles, ce jeu a fait l'objet de nombreux travaux par des chercheurs dans différents domaines des mathématiques discrètes et de l'informatique (chercheurs en algorithmique, en optimisation combinatoire, en intelligence artificielle), afin de développer des stratégies pour trouver le code en un nombre minimum de coups.

Par Nicolas Maudet , 6 janvier, 2024

Le problème d'agrégation d'ordres de préférences est très commun et utile dans de nombreux domaines. La méthode de Kemeny (qui minimise les désaccors sur les paires mal rangées) est une des approches les plus classiques, mais elle est difficile à calculer. Plusieurs méthodes sont connues pour donner des approximations du classement de Kemeny (par exemple la règle de Borda, la règle de Spearman).

Par Nicolas Maudet , 6 janvier, 2024

Le jeu l'ile interdite est un jeu coopératif relativement simple (https://boardgamegeek.com/boardgame/65244/forbidden-island) qui demande à une équipe de joueurs de collaborer pour récupérer des trésors et s'échapper d'une ile sous la menace de la montée des eaux. Il peut se jouer de 2 à 4 joueurs. L'objectif de ce projet est :
* de proposer une interface permettant de jouer entre joueurs humains

Par Olivier Sigaud , 6 janvier, 2024

Les foundational models, d’énormes réseaux de neurones entraînés sur des bases de données gigantesques, promettent d’améliorer très significativement la capacité de l’IA à résoudre des problèmes très variés comme la compréhension du langage naturel ou la commande de robots pour accomplir des tâches indiquées verbalement. Un certain nombre de ces modèles déjà entraînés sont disponibles en open source et ne demandent qu’à être testés, comme Octo et Voltron.

Par Olivier Sigaud , 6 janvier, 2024

Augmented Random Search (ARS) est un algorithme de type évolutionnaire très simple qui s’avère très performant pour optimiser une politique. Par ailleurs, BBRL est une librairie développée par l’encadrant destinée à faciliter le codage d’algorithmes d’apprentissage par renforcement.

L’objectif de ce projet est de développer ARS au sein de la librairie BBRL, puis de comparer sa performance à celle d’autres algorithmes disponibles comme la cross-entropy method (CEM) ou divers algorithmes d’apprentissage par renforcement.

Par Olivier Sigaud , 2 janvier, 2024

L’algorithme Temporal Difference Model Predictive Control (TD-MPC) propose des avancées intéressantes vis-à-vis de l’état de l’art en apprentissage par renforcement. Il s’agit d’un algorithme Model-based, ce qui lui permet d’apprendre avec peu d’échantillons d’apprentissage, et il combine les méthodes de différences temporelles de l’apprentissage par renforcement et des méthodes de recherche de séquence optimales d’action, ce qui le rend très performant.

Par Cedric Herpson , 12 janvier, 2023

Collaboration avec le service de mobilité internationale de la faculté des sciences de Sorbonne-Université.
L'objectif est de proposer un algorithme d’appariement entre les candidatures d’environ 200 étudiants à la mobilité internationale et environ 40 établissements cibles afin de diviser par au moins 2 le temps de travail actuellement nécessaire pour trouver un appariement satisfaisant.