Les propositions de projets de M1. Vous devrez faire votre choix (en contactant directement les encadrants) pour le 26 Janvier.
Attention les projets s'affichent sur plusieurs pages!
Les algorithmes d'apprentissage par renforcement, en particulier profonds, font l'objet d'un compromis entre biais et variance qui joue un rôle important dans leur performance. Comme illustré dans mon cours en ligne et des ouvrages récents, les méthodes de Monte Carlo souffrent surtout de variance tandis que les méthodes dites "de bootstrap" qui utilisent un critique souffrent surtout de biais.
Nous disposons d'un essaim de 100 robots Kilobots de petites tailles. Chaque robot fait environ 2 cm de diamètre et peut communiquer avec ses voisins immédiats via infrarouge. Ces robots sont faciles à utiliser car on peut les programmer directement, et tous ensemble, via un émetteur infrarouge placé au dessus d'une arène.
L'objet considéré dans ce projet est un robot roulant représentant un véhicule terrestre intelligent sur lequel s'appuiera un acteur humain pour mener à bien ses missions. Le fonctionnement du robot est développé sous la forme d'un agent logiciel dont l'originalité est son processus de planification contextuelle tirant parti de l'exécution réelle des actions pour définir des plans d'exécution optimaux.
Les problèmes d'ordonnancement, où l'on cherche à affecter à une tâche une date de début et une date de fin dans le temps, sont des problèmes très utilisés et très étudiés depuis des décennies. Une problématique très récente consiste à étudier ces problèmes dans le cas où plusieurs utilisateurs partagent des tâches communes à ordonnancer, et ont chacun leur opinion sur l'ordonnancement souhaité.
Nous nous intéressons aux problèmes de l’allocation de tâches dans des groupes d’agents coopératifs (par exemple une équipe de robots mobiles devant exécuter des tâches en différents lieux d’un environnement). Afin de permettre une plus grande autonomie des agents et une meilleure robustesse du système, nous souhaitons que les agents soient capables de se répartir les tâches de manière distribuée, c’est-à-dire sans avoir recours à une entité centrale décidant de l’allocation pour tout le monde.
Objectif : Permettre à un Thymio associé à un Raspberry-Pi doté uniquement d'une caméra de reconstruire très grossièrement sont environnement au sein d'un moteur java 3D (JME3) et de se localiser.
Le « Blob » est un organisme unicellulaire qui possède des propriétés du monde animal, du monde végétal et des champignons et a démontré sa capacité à résoudre efficacement des problèmes de routage complexes. Différents travaux [5,6] se sont inspiré de son comportement pour améliorer les protocoles de routage de l'information dans les réseaux.
Le classement par approbation repose sur le principe suivant:
un ensemble d'options sont évaluées de manière publique (par ex. scores, notes, etc.) selon plusieurs critères, et le problème est de classer ces options dans des catégories ordonnées (par ex. simplement "accepté", "refusé", pour faire simple).