www.linternaute.com Science
L'Internaute > Science  > Dossier Technologie > L'ordinateur, le chaos et la complexité
Précédent

Reconnaître forme et sens : l'image

Suivant 
"Saisir" informatiquement une image, c'est y reconnaître des formes - lignes, cercles, textes - et leurs proportions afin de la distinguer ou la rapprocher d'une autre image. La branche de l'intelligence artificielle qui correspond à cette capacité est baptisée Computer Vision
La capacité d'un programme informatique à "saisir" une image (en isoler les caractéristiques et pourquoi pas la "comprendre" en analysant celles-ci) est un branche de l'intelligence artificielle baptisée par les anglo-saxons Computer vision ou parfois, dans une optique plus appliquée, Machine vision.

Elle repose sur un ensemble de techniques et de procédures, les premières tirant profit de théorèmes mathématiques à l'exemple d'une part de la méthode bayesienne (que l'on retrouve également dans d'autres domaines de l'informatique comme le filtrage de pourriel), d'autre part de la transformée de Hough.

Distinguer des ensembles de cercles et de lignes
La méthode bayesienne correspond à une démarche d'acquisition de connaissances (apprentissage) utilisant la loi énoncé par Thomas Bayes (vers 1702-1761) : on associe des probabilités à des éléments que l'on cherche à reconnaître (qu'il s'agisse de formes ou de mots caractéristiques des pourriels), mais ces probabilités sont inférées à partir "d'éléments de connaissance" déjà acquis, ce qui les distinguent de probabilités calculées sans connaissance antérieure.

Prenons un exemple : deux images sont composées à la fois de cercles et de lignes, mais la première comporte trois fois plus de cercles que de lignes tandis que la seconde comporte autant de cercles et de lignes.

La tâche assignée à l'ordinateur est de distinguer l'image 1 de l'image 2, sachant leurs propriétés différentes. Il procédera donc, algorithmiquement partant, en extrayant une forme : a priori, il y autant de chances que cette forme, quelle qu'elle soit, émane de l'image 1 ou de l'image 2. Mais une fois cette forme reconnue (disons que c'est un cercle), la probabilité qu'elle émane de l'image 1 (celle qui comporte plus de cercles) augmente.

Le théorème de Bayes nous donne le résultat exact : de 0,5 (1 chance sur 2), la probabilité est passée à 0,6. C'est donc ce dernier chiffre, et non le premier, qui est associé à l'élément. Et ainsi de suite, ce qui permettra finalement de distinguer de manière certaine les deux images.

Déterminer les formes par l'analogue des courbes de niveau
La transformée de Hough intervient plus directement dans la phase d'extraction : elle repose sur l'idée qu'en chaque point d'une image, une infinité de lignes "de potentiel" (pensez aux courbes de niveau sur une carte IGN) peuvent passer, chacune avec une orientation qui lui est propre au point concerné, et qu'il est possible de décrire (là intervient la transformation) une sélection de ces lignes de potentiels (celles qui, a priori, passent par le plus grand nombre possible de points de l'image) par une courbe sinusoïdale, propre à chaque point.

La comparaison de ces courbes (plus aisée grâce à leur nouvelle représentation) permet de valider quelles sont les lignes qui effectivement, passent par le plus grand nombre de points de l'image, et donc de déterminer les formes.
Précédent   Suivant 
Magazine Science
Envoyer | Imprimer
Haut de page
Votre avis sur cette publicité
L'Internaute