Études et implémentations de modèles d'apprentissage par renforcement pour les jeux stochastiques de grande taille

Les jeux stochastiques sont une généralisation des modèles de jeux statiques qui permettent de représenter un grand nombre de situations : en économie, en sécurité des réseaux, en partage de ressources ou encore en modélisation de systèmes multi agents. En effet, ils permettent de modéliser finement les interactions entre les agents (les joueurs) au cours du temps dans un environnement qui évolue aléatoirement. Ce type de jeu se déroule en plusieurs étapes durant lesquelles l'état du système varie suivant les actions des agents et de l'environnement probabiliste.

Nous nous plaçons dans des contextes dans lesquels la totalité de l'espace de l'état du système est difficilement explorable et nous nous intéressons aux méthodes de résolutions basées sur des techniques d'apprentissages par renforcement. Le but de ce projet vise à adapter les techniques de factorisation ou d'agrégation développés pour les processus de décision markoviens de grande taille au cadre des jeux stochastiques.

Lieu: 
LIP6
Encadrant: 
Emmanuel Hyon
Co-Encadrant: 
Pierre-Henri Wuillemin
Référent Universitaire: 
n/a
Fichier Descriptif: 
Attribué: 
No
Année: 
2 019

User login