fr | en
Laboratoire Angevin de Recherche en Ingénierie des Systèmes

Séparés par des virgules

Soutenance de thèse de Monsieur Jérémy CHOPIN9h30 | POLYTECH ANGERS | AMPHI E | 62, avenue Notre-Dame du Lac 49000 ANGERS

Sujet : Apprentissage Profond et Connaissances Structurelles pour l'analyse d'Images.

Directeur de thèse : Monsieur Jean-Baptiste FASQUEL

Résumé

La segmentation sémantique d’images est une tâche clé en vision par ordinateur pour de multiples applications. Dans ce contexte, l’apprentissage profond a permis de faire des progrès remarquables, mais conduit parfois des erreurs grossières et requiert beaucoup de données représentatives pour l’entraînement. Dans ce contexte, nos travaux s’intéressent à l’apport d’informations structurelles de “haut-niveau”, qui correspondent aux relations entre les différentes régions d’une scène, et qui peuvent être aisément extraites à partir de quelques images annotées ou formulées par un expert (e.g. connaissance anatomique comme “le coeur est entre le poumon” pour l’analyse d’images médicales). Nous avons conçu une méthode, intégrant ces informations en sortie d’un réseau de neurones profond, au moyen d’un appariement inexact de graphes formulé comme un problème d’affectation quadratique (QAP) en deux étapes. Pour faire face au caractère combinatoire du QAP, nous intégrons également une méthode d’appariement séquentiel des noeuds selon un ordre appris par apprentissage par renforcement. Cette méthode est évaluée sur deux bases de données publiques (reconnaissance de visage et imagerie cérébrale) et avec différentes architectures de réseaux de neurones. Les résultats montrent que l’on peut augmenter significativement les performances de l’apprentissage profond, notamment lorsque peu de données d’entraînement sont disponibles.

Scroll