Projets

Les propositions de projets de M1. Vous devrez faire votre choix (en contactant directement les encadrants) pour le 26 Janvier.
Attention les projets s'afficent sur plusieurs pages!

Comparaison de méthodes évolutionnaires et d’apprentissage par renforcement sur des benchmarks de contrôle classique

Les méthodes évolutionnaires et les méthodes d’apprentissage par renforcement constituent deux alternatives pour résoudre des problème de recherche d’une politique optimale sur des problèmes où les actions sont continues. L’objet de ce projet est de se livrer à une comparaison systématique des propriétés de ces deux approches dans des environnements classiques de faible dimension tels que CartPole, Pendulum, Mountain Car et éventuellement des labyrinthes classiques tels que Deceptive Maze ou Simple Maze.

Etude de l’apprentissage par renforcement profond sur Pendulum

Les algorithmes d’apprentissage par renforcement profond à actions continues sont souvent appliqués en simulation à des problèmes de contrôle de grande taille tels que les benchmarks MuJoCo où il faut contrôler un “demi-guépard” (HalfCheetah), un serpent nageur (Swimmer), une “araignée” à 4 pattes (Ant) ou un humanoïde plus ou moins complet (Hopper, Walker, Humanoid)...

Interface web pour systèmes de recommandation en optimisation combinatoire multi-critères

Le but de ce projet est le développement d'une interface web permettant d'illustrer
le principe de l'élicitation incrémentale pour l'aide à la décision en optimisation
combinatoire multi-critères.
Prenons l'exemple suivant : vous souhaitez visiter un ensemble de villes en Asie
durant un temps limité. Vous voulez trouver un ordre de visite minimisant les
temps de trajet et le prix, tout en maximisant le confort et la beauté des paysages
parcourus. Étant donné la présence de plusieurs critères à optimiser, plusieurs solutions

Dynamiques multiagents tri-partites pour l'allocation de ressources

On s'intéresse dans ce projet à l'étude de dynamiques multiagents dans le cadre d'allocation de ressources. En particulier, on étudiera comment des échanges tri-partites, ie. impliquant 3 agents, peuvent mener à des allocations de bonnes propriétés théoriques (allocations populaires, c'est-à-dire qu'il n'existe pas de majorité d'agents préférant une autre allocation). Il est connu que ces dynamiques peuvent exhiber des comportements non-trviaux (cycles en particulier).

Vol autonome sur drone en simulation

Ce projet s'inscrit dans le cadre d'une collaboration entre l’IRD et l’équipe Système Multi-Agents du LIP6. L'objectif est d'évaluer, à l'aide d'un drone partiellement autonome les dépôts d'ordures et les écosystèmes agro-pastoraux sur le littoral Sénégalais.

Les résultats doivent permettre d'améliorer le pilotage des actions de protection de l'environnement et des éco-systèmes agro-pastoraux par la réalisation d'un état des lieux et l'identification des zones ou concentrer les efforts.

Ordonnancement de tâches malléables avec des contraintes topologiques

Les besoins en puissance de calcul ont augmenté de manière significative ces dernières années. Cette puissance de calcul s'accompagne par une consommation énergétique de plus en plus grande. Afin de faire face à cette situation, la taille des plateformes de calcul haute performance a considérablement augmentée. La conception d'algorithmes de placement de tâches plus efficaces est désormais une priorité dans le domaine du calcul haute performance.

Représentation et positionnement relatif à partir d'informations visuelle.

Objectif : Permettre à un Thymio associé à un Raspberry-Pi doté uniquement d'une caméra de reconstruire très grossièrement sont environnement au sein d'un moteur java 3D (JME3) et de se localiser.

L'hypothèse est que la représentation d'une entité dans l'espace ne se restreint pas à la capture d'une information externe, mais que le système projette également un modèle de ce qu'il s'attend à percevoir comme grille de lecture. L’idée est de pouvoir accélérer le traitement et ne plus analyser "bêtement" chaque pixel de l'image captée comme en SLAM.

Analyse et vérification en-ligne de protocoles multi-agents

De par la nature distribuée des protocoles multi-agents, leurs concepteurs rencontrent fréquemment des difficultés à s’assurer de la bonne mise en œuvre d’un protocole donné, même si son comportement théorique est bien défini. En effet, si un protocole de communication faisant intervenir 2 agents est relativement aisé à implémenter sans erreur, la situation devient plus complexe lorsque plusieurs dizaines d’agents échangent par le biais d’un même protocole, ou que plusieurs protocoles s’exécutent simultanément.

Pages

User login