Apprentissage par renforcement profond : analyse détaillée de SVPG
By Olivier Sigaud on Thu, 2021-11-25 08:56Résumé :
L'algorithme Stein Variational Policy Gradient (SVPG) est un algorithme à mi-chemin entre des approches évolutionnaires et des algorithmes d’apprentissage par renforcement. Un code en python est disponible sur github. L’objectif de ce projet est de prendre en main ce code et d’analyser de façon détaillée diverses propriétés de cet algorithme, notamment par des comparaisons avec les algorithmes proches.
Sujet développé :