Systèmes Multi-Agents

Context-aware adaptive swarm robotics

Le contexte de ce stage est celui de la robotique en essaim adaptive. Il s'agit de concevoir et déployer des algorithmes d'apprentissage distribués permettant à un ensemble de robots de résoudre une tâche collectivement (p.ex. transport collectif d'objets, exploration de l'environnement, recherche et récupération de ressources). Dans ce cadre, deux types de contraintes apparaissent principalement: (1) l'environnement de déploiement des robots est inconnu au préalable et (2) les capacités de communication et de calcul des robots sont limitées.

Thématiques: 
Robotique
Systèmes Multi-Agents

Ordinal power indices

What is the common point between the affectation of students to universities (in particular, in
France, the Parcoursup algorithm), the influence of someone in a social network (like Twitter), the
responsibility of a formula in the inconsistency of a belief base, the impact and synergy of some criteria
in a multi-criteria decision making situation? In all these situations we are confronting with a set of
objects/persons on which we have information on the results of some coalitions/groups, and where it is

Thématiques: 
Aide à la Décision
Systèmes Multi-Agents

From images to social interactions understanding

The aim of this internship is to analyze group interaction and their evolution over time. We will rely on existing data (images and videos) of group interaction that have been annotated at different levels (activity, speaking, laughing, non-verbal behavior). We will first make use of the database MatchNMingle (Raman&Hung,19).

Thématiques: 
Robotique
Systèmes Multi-Agents

Ethical issues in multi-objective reinforcement learning

Markov Decision Processes (MDPs) and reinforcement learning (RL) are two very successful paradigms adopted in artificial intelligence for designing autonomous agents capable of dealing with sequential decision problems under uncertainty. The decision problem is formalized as a tuple with S the set of system states, A the set of possible actions, T the transition function and R the reward function. The transition function represents the non-deterministic dynamic of the system and gives the probability for the system to move from a state s to a state s’ when an action a is taken.

Thématiques: 
Aide à la Décision
Systèmes Multi-Agents

Apprentissage et représentation des connaissances pour l’autonomie à long terme

Ces travaux s’inscrivent dans le cadre de recherches sur l’autonomie à long terme (mois, années) d’une entité artificielle.
Concevoir des mécanismes non-déportés à même de doter une entité artificielle non-connectée d’un tel niveau d’autonomie nécessite de se poser la question de la représentation et de la mise à jours des connaissances - par nature multimodales - manipulées.

Après avoir identifié les principales approches existantes pour l’apprentissage et la représentation de connaissances dans un contexte multimodal, vous analyserez celles-ci sous l’angle de l’autonomie à long-terme d’un système déconnecté, et de l’approche développementale. Fort de cette analyse, vous proposerez une architecture apprentissage-représentation-exploitation adaptée à l’autonomie à long terme.

Thématiques: 
Robotique
Systèmes Multi-Agents

Popular exchanges in fair resource allocation

Fair division is a fundamental problem raised in many real word problems such as multi-robot task allocation, allocation of schools, courses
or rooms to students, division of goods ininheritance or divorce settlement… A multi agent fair division problem consists in dividing a set of resources among a set of agents while respecting a fairness notion.
Various fairness notions have been proposed and studied in economics and computer science.

Thématiques: 
Systèmes Multi-Agents

Pages

User login