Une approche multi-agent pour le filtrage de contenus

Contexte OLFEO

Olfeo est éditeur de logiciel, expert de la sécurité web et du filtrage de contenus depuis 15 ans. Notre solution de sécurité web apporte des réponses au-delà des seuls aspects fonctionnels et techniques en intégrant également la conformité légale & culturelle ainsi que le facteur Humain pour créer un environnement de confiance pour les utilisateurs sur le Web. Notre passerelle de sécurité web garantit la conformité légale, en respectant le droit pénal, civil, du travail ainsi que les données personnelles. Grâce à notre base d’URL qualifiée et contextualisée pour le pays cible, nous offrons une proximité culturelle. Notre solution redonne par ailleurs davantage de contrôle sur la sécurité des flux Web et permet de prendre en compte le facteur humain en échangeant directement avec l’utilisateur final. Nous accompagnons ainsi les utilisateurs pour faire évoluer leurs pratiques et les responsabiliser dans leurs usages. Notre solution a aujourd’hui été adoptée par 2000 clients, représentant plus de 3 millions d’utilisateurs. Afin d’actualiser en permanence sa base d’URL, notre service de classification associe quotidiennement des sites internet à des catégories grâce à un moteur de pré-analyse et à la validation finale d’un agent humain. La pré-analyse consiste à détecter des expressions-clés détectées répertoriées par des experts du contenu web associées à un poids et à une catégorie pour proposer une ou des catégories candidates pour le classement de l’URL...

L’enjeu fondamental dans le développement de ce service est l’amélioration de son efficacité tant en pertinence qu’en volume de traitement. Les améliorations recherchées reposent d’un côté, sur la mise à jour en continu du poids et de la catégorie associés à chacune des expressions qui constituent la base donnés pour la pré-analyse et, de l’autre, la capacité d’enrichir ladite base grâce à l’apprentissage automatique et l’analyse ontologique des pages, objets d’étude.

Objectif

Ce stage se place ainsi dans le cadre de l'apprentissage artificiel et de la décision. Il s’agit dans un premier temps d’étudier les approches d’extraction de connaissances à partir de données (algorithmes d’apprentissage) ainsi que les travaux sur la classification consensuelle. En effet, différents travaux ont souligné l'intérêt de combiner plusieurs classifieurs et d'utiliser une agrégation des résultats pour arriver à prendre une bonne décision. Mais cette agrégation reste toujours un problème ouvert et la construction d'une méthode fondée sur un consensus semble très prometteuse.

L’objectif est de développer un système basé sur les systèmes multi-agents où les agents, dotés chacun d'un classifieur, interagissent et se coordonnent afin de converger vers un consensus. Pour cela, ce projet vise à élaborer une approche de classification consensuelle

en s'appuyant sur des algorithme de consensus (voir par exemple les protocoles de consensus de Paxos).

Pour réaliser ce stage, il est nécessaire de suivre les étapes suivantes :

- Comprendre et formalisation le problème.
- Analyser les différentes données afin de définir les attributs, les domaines de variation de ces attributs ainsi que les éventuelles corrélations entre eux. Le but de cette étape est de découvrir les premiers schémas apparents pour émettre des hypothèses sur les modèles cachés.
- Étudier les algorithmes d’apprentissage afin d’en choisir les plus pertinents, et préparer les données.
- Interpréter les résultats d’apprentissage. Il s'agit d'évaluer ensuite les résultats obtenus en fonction des critères élaborés en coopération avec les experts pour faire apparaître les manques et les étapes négligées.
- Étudier les algorithmes de consensus et choisir d’un algorithme pertinent.
- Application de cet algorithme pour combiner les différentes algorithmes d’apprentissage choisis.

Lieu: 
OLFEO - Paris 75001 et LIP6
Encadrant: 
Zahia Guessoum
Co-Encadrant: 
Michel Cavalier
Référent Universitaire: 
Zahia Guessoum
Attribué: 
No
Année: 
2 019
Deprecated: 
No

User login