L’objectif de ce projet est d’explorer l’utilisation d’un modèle génératif local et donc minimaliste pour le contrôle stratégique d’un ou plusieurs agents dans le but de réaliser différentes taches : Exploration d’un environnement inconnu et chasse d’un adversaire.
Travail a réaliser :
- Familiarisation avec les SMA et prise en main de l’architecture du projet Dedale [3]
- Identification des LLM susceptibles de pouvoir respecter les contraintes techniques et opérationnelles [2,3,4,5,6]
- Choix du ou des LLM retenus, interfaçage avec Dedale, définition des expérimentation et mise en œuvre de la boucle perception-décision-action pour les taches d’exploration et chasse.
- Dans le cas mono-agent
- Dans le cas multi-agent mono LLM
- Dans le cas multi-agent mono LLM mais multi-instances (une instance de LLM par agent)
- dans le cas multi-agent multi LLM
- Livraison du code et de la documentation technique et fonctionnelle associée.
- En fonction de l'avancée du travail, exploration pour une tache de collecte puis exploration au delà de l'inférence par l'intégration progressive des connaissances acquises durant la réalisation des différentes tâches.
[1] https://dedale.gitlab.io/
[2] https://huggingface.co/models
[3] https://arxiv.org/abs/2501.06322
[4] https://arxiv.org/html/2412.11761v2
[5] https://huggingface.co/blog/AlexDuo/llm-unity-ai-commander
[6] https://hal.science/hal-05146426/document