Labélisation des sillons basée sur des réseaux neuronaux


Reconnaissance automatique (étiquetage de graphe) à l'aide d'un modèle

Description

Attention: dans BrainVISA version 4.1 et suivantes, de nouveaux modèles de reconnaissance (2011) sont disponibles; ils suivent la même nomenclature et base d'apprentissage que les modèles SPAM, mais diffèrent légèrement des plus anciens (2000-2001). Les nouveaux modèles sont utilisés par défaut, mais les anciens sont toujours disponibles.



Cette brique donne automatiquement un nom à chaque pli élémentaire extrait par la brique Ana Compute Cortical Fold Arg. La liste des noms utilisés (sillons standards, racines sulcales ou modèle dissident) est à choisir en fonction de l'application. Un exemple de résultat :


La méthode de reconnaissance repose sur une congrégation d'experts virtuels locaux, chaque expert étant responsable d'un détail anatomique. Ces experts ont été entrainés sur une base de cerveaux dont les sillons ont été préalablement étiquetés à la main par un spécialiste (si vous souhaitez obtenir une description anatomique qui vous est propre, ils vous suffit de réaliser votre propre étiquetage sur une base de cerveaux suffisamment conséquente, et une nouvelle congrégation d'experts pourra être entrainée...).

La reconnaissance des sillons repose sur la recherche de l'étiquetage qui correspond à un accord maximum au sein de l'assemblée d'experts. Ces experts sont de petits réseaux de neurones appelés perceptrons multicouches. Il en existe deux types. Le premier type correspond aux experts en charge de la forme d'un sillon, le second aux experts en charge de la forme formée par deux sillons voisins. De la sorte, la reconnaissance d'un sillon donné dépend de l'avis de plusieurs experts: celui en charge de sa forme propre + ceux en charge de ses rapports avec le voisinage. Il s'agit d'une approche contextuelle qui peut conduire à un résultat correct même si certains experts se trompent. On peut noter certaines analogies avec les modèles biologiques de la vision: un expert peut-être vu comme une colonne corticale, l'assemblée des experts est dotée d'une organisation cortico-topique...


Les formes doivent être traduites avant d'être présentées à un expert. Cette traduction correspond à un codage fondé sur des paramètres morphométriques variés (taille, orientation, profondeur, nombre de composantes connexes...):


L'entrainement d'un expert consiste à lui présenter alternativement des exemples corrects et incorrects de la forme dont il est en charge. On lui apprend petit à petit à fournir la réponse adéquate (0 pour les bons exemples, 1 pour les mauvais). Il doit ensuite être capable de généraliser cette réponse à de nouvelles formes issues d'autres cerveaux. Une seconde base d'apprentissage de cerveaux également étiquetés manuellement sert à stopper le processus avant que l'expert ne commence à apprendre par coeur les exemples de la première base. C'est ce test d'arrêt qui permet une généralisation correcte:



Les courbes ci-dessus donnent quelques exemples de l'évolution de l'erreur moyenne de deux experts au cours de l'aprentissage. Lorsque la forme du sillon est suffisamment simple, comme dans le cas du sillon Central, l'aprentissage est rapide et la généralisation parfaite. Lorsque la forme est plus variable, comme dans le cas du sillon précentral intermédiaire. La généralisation ne fonctionne pas dans tous les cas, et on assiste au bout d'un moment à un début de suraprentissage qui nous conduit à stopper le processus.

A la fin de l'apprentissage, la fiabilité des experts est évaluée sur une la seconde base. Certains expert s'avèrent moins fiables que les autres, simplement parce que la forme dont ils sont en charge n'est pas suffisamment spécifique pour être reconnue. Le poid d'un expert durant la reconnaissance proprement dite est pondéré en fonction de cette fiabilité.

La recherche du consensus maximum au sein de la congrégation d'expert est difficile. Il s'agit de minimiser la somme pondérée des différents avis. Malheureusement, le paysage qui correspond à cette somme est doté de nombreux minimas locaux sans intérêt. Pour réussir à trouver un chemin menant à la vallée profonde qui contient la solution recherchée, nous utilisons une approche inspirée de la cristallographie. Le modèle sous-jacent à l'assemblée d'experts locaux est en effet inspiré de la physique des verres de spins. La minimisation est conduite à partir d'une technique appelée recuit simulé. Elle correspond à une réalité dans le monde des verres: pour obtenir des cristaux avec peu de défauts, il faut d'abord les chauffer puis les refroidir très lentement. C'est ce qui permet au verre de trouver un état d'énergie très faible, correspondant à l'absence de défauts. L'agitation liée à la température lui permet de franchir les petites barrières de potentiel qui entourent les minima locaux correspondant à des défauts. Au fur à mesure que la température baisse, il est de plus en plus difficile de sortir de ces cul-de-sac.
Si on revient à l'idée d'un paysage de montagne, on peut imaginer un promeneur perdu dans le brouillard qui cherche à retourner à la station située dans la vallée la plus profonde. S'il se contente de descendre la pente où il se trouve, il va vite se retrouver bloqué au fond d'une combe. Dans la réalité, pendant un certain temps, il sortira des petits vallons en espérant en trouver un autre plus profond à coté donnant sur la station. Mais, petit à petit, la fatigue le gagnant, il ne sera plus capable de remonter les parois les plus abruptes. Il finira par se trouver bloqué au fond d'une vallée profonde. S'il a de la chance, il s'agira de la station...

L'évolution de l'énergie correspondant à notre modèle pendant le recuit simulé est la suivante:



Pendant un certain temps, la température est élévée et l'étiquetage évolue de manière quasi-aléatoire. Puis apparait une transition correspondant pratiquement à l'identification des grands sillons. L'énergie chute rapidement. Enfin, une propagation plus lente aux sillons de moindre importance amène au fond de la vallée. Comme le montre l'analogie du promeneur, le recuit simulé est une approche stochastique qui peut parfois échouer. Il est donc prudent de réaliser plusieurs tirages et de choisir celui qui est arrivé le plus bas. Nous avons vérifié à de nombreuses reprises que cette heuristique maximisait l'adéquation avec une identification manuelle. Voici un exemple où 10 recuits différents ont été réalisés sur le même cerveau :

Accord avec l'expert humain en fonction de l'énergie finale :


En fait, comme on ne connait pas actuellement la solution idéale au problème de l'identification des sillons, il n'est guère possible d'espérer un accord parfait entre l'expert humain et notre système. Il n'est donc pas nécessaire de faire énormément de tirages pour obtenir une solution raisonnable à tous les coups...

Pour finir, il est intéressant, pour comprendre notre approche, de faire un parallèle avec la méthode concurrente qui consiste à déformer une image modèle dont les sillons ont été identifiés. Dans ce dernier cas, seules les intensités guident les déformations, ce qui conduit parfois à apparier des sillons différents. En fait, la méthode fondée sur des déformations est trop couteuse pour permettre une minimisation de type recuit simulé. On peut donc interpréter des erreurs d'appariement entre sillons comme un blocage dans une vallée pas suffisamment profonde. Notre approche qui travaille à un niveau plus élévé de représentation des formes permet de résoudre ces problèmes. Le modèle n'est plus une image mais une structure probabiliste de type graphe. Les déformations sont remplacées par un étiquetage, ce qui revient à apparier le graphe modèle avec le graphe représentant le nouveau cerveau.



La notion de graphe aléatoire:


Pour plus d'information :
A Markovian random field based random graph modelling the human cortical topography, J.-F. Mangin, J. Régis, I. Bloch, V. Frouin, Y. Samson, and J. Lopez-Krahe In CVRMed, Nice, LNCS-905, Springer-Verlag, pages 177--183, 1995.

Automatic recognition of cortical sulci using a congregation of neural networks. D. Rivière, J.-F. Mangin, D. Papadopoulos, J.-M. Martinez, V. Frouin, and J. Régis. In MICCAI, Pittsburgh, LNCS-1935, Springer Verlag, pages 40-49, 2000 (to appear in Medical Image Analysis)

Pour une approche combinant reconnaissance des sillons et déformations non rigides développée avec le projet Epidaure de l'INRIA:
Multisubject non-rigid registration of brain MRI using intensity and geometric features. P. Cachier, J.-F. Mangin, X. Pennec, D. Rivière, D. Papadopoulos-Orfanos, J. Régis, and N. Ayache. In MICCAI, Utrecht, The Netherlands, LNCS-2208, Springer Verlag, pages 734--742, 2002.

Paramètres

data_graph: Graphe de données ( entrée )

Données à étiqueter
model: Model graph ( entrée )
Graphe modèle (connaissance)
output_graph: Labelled Cortical folds graph ( sortie )
Graphe de sortie (étiqueté)
model_hint: Choice ( input )
energy_plot_file: siRelax Fold Energy ( sortie )
rate: Réel ( input )
stopRate: Réel ( input )
niterBelowStopProp: Entier ( input )
forbid_unknown_label: Booléen ( input )

Informations techniques

Toolbox : Morphologist

Niveau d'utilisateur : 0

Identifiant : recognition

Nom de fichier : brainvisa/toolboxes/morphologist/processes/Sulci/Recognition/recognition.py

Supported file formats :

data_graph :
Graph and data
model :
Graph and data
output_graph :
Graph and data
energy_plot_file :
siRelax Fold Energy