Apprentissage par renforcement profond pour la robotique
By Olivier Sigaud on Fri, 2015-11-06 16:01Contexte :
AgeNts Distribues, Robotique, Recherche Opérationnelle, Interaction, DEcision
La responsable des stages est Safia Kedad-Sidhoum.
La durée des stages est de 5 mois minimum et 6 mois maximum. Les soutenances auront lieu cette année en Septembre.
Propositions de stages de M2.
Contexte :
Les modèles graphiques probabilistes (PGM, Probabilistic Graphical Models) sont particulièrement utilisés dans les domaines du diagnostic automatique, de la sûreté de fonctionnement et de la maîtrise des risques. Pour ces applications, les réseaux bayésiens (BN, Bayesian Networks) sont parmi les PGM les plus populaires, car ils offrent un cadre efficace pour la représentation des connaissances et le raisonnement probabiliste.
Voir description détaillée dans le document pdf joint.
La durabilité et la protection de l'environnement sont des sujets importants pour les entreprises industrielles qui reçoivent de plus en plus de pression pour réduire leurs émissions de CO2 et leur consommation de ressources naturelles.
Voir description détaillée dans le document pdf joint.
Voir descriptif détaillé.
Voir descriptif détaillé.
Voir descriptif détaillé.
Ce sujet de stage concerne l’affectation de bande passante à des terminaux d’utilisateurs dans un réseau mobile constitué de petites cellules. L’objectif est de permettre à ces terminaux d’apprendre au cours du temps la bande passante à demander dans chaque cellule de connexion qu’il traverse, en fonction de leur qualité de service requise et de la charge de la cellule. L’approche d’apprentissage considérée ici est l’apprentissage par renforcement, bien adaptée à un contexte dynamique et distribué.