Résumé du séminaire du 12 Mai 2004


Philippe LUCIDARME - Apprentissage et adaptation pour des ensembles de robots/agents coopérants.

Cet exposé se place à l'interface de trois domaines: la robotique, les systèmes multi agents et l'apprentissage.

La présentation sera composée de deux parties:

Une premième partie dédiée à l'apprentissage de contrôleurs de bas niveaux (évitement d'obstacles, suivi de cibles, etc.) pour des ensembles de robots mobiles. Trois algorithmes d'apprentissage seront présentés puis comparés:

  • une méthode évolutionniste distribuée,
  • optimisation des poids d'un réseau de neurones par recuit simulé,
  • apprentissage par renforcement (Q-Learning) et réseaux de neurones.
  • L'ensemble de ses travaux a été expérimenté en simulation et sur une plateforme de cinq robots mobiles qui sera présentée.

    La seconde partie concerne des travaux qui sont actuellement menés au sein du JRL (Joint Robotics Laboratory à Tsukuba au Japon) sur l'apprentissage dédié aux robots humanoïdes. Ces travaux se focalisent sur une tâche de saisie d'objet. La plate-forme humanoïde HRP2 sera brièvement décrite, puis une méthode de contrôle des architectures redondantes sera présentée. Cette méthode, basée sur une approche multi-agents, associe un agent à chaque actionneur, offrant une grande robustesse vis-à-vis des pannes et du bruit. Seuls les résultats de simulation seront présentés, les expérimentations sur le robot humanoïde n'ayant pas encore débutées.