Systèmes de vision inspirés de la vue humaine


Selon un article publié le 21 février 2007 dans Technology Review, un groupe de neuroscientifiques du MIT a développé un modèle informatique qui imite le système de vision humaine pour détecter et reconnaître avec précision des objets tels que des voitures et des motos, dans une rue animée. Selon Thomas Serre, neuroscientifique au MIT, ces types de systèmes de vision pourraient bientôt être utilisés dans des systèmes de surveillance ou dans des capteurs intelligents qui alertent les conducteurs de la présence de piétons ou d'autres objets.

Pendant des années, les chercheurs ont essayé d'imiter les systèmes de vision biologique, en raison de leur perfection. Mais apprendre à un ordinateur à classer des objets s'est avéré plus compliqué qu'il n'y paraissait au premier abord, dit Serre, qui a travaillé avec Tomaso Poggio. Premièrement, pour reconnaître un type d'objet spécifique, l'ordinateur a besoin d'un modèle ou d'une représentation informatique spécifique de cet objet spécifique, ce qui permet à l'ordinateur de distinguer, par exemple, une voiture des objets qui ne sont pas des voitures. Cependant, le modèle doit être suffisamment flexible pour accueillir tous les types de voitures à différents angles et positions et dans différentes conditions d'éclairage.

La meilleure façon d'y parvenir est de former un algorithme d'apprentissage avec une série d'images pour extraire les caractéristiques qu'elles ont en commun. Serre et Poggio pensent que le système de vision humain suit une approche similaire, mais qu'il dépend d'une hiérarchie de couches successives dans le cortex visuel. Les premières couches de la croûte détecteraient ainsi les caractéristiques les plus simples d'un objet et les dernières combineraient ces informations pour former notre perception de l'objet dans son ensemble.

Pour tester leur théorie, Serre et Poggio ont travaillé avec Stanley Bileschi du MIT et Lior Wolf de l'Université de Tel Aviv, en Israël, pour créer un modèle informatique avec 10 millions d'unités de calcul, conçu pour se comporter comme des groupes de neurones. du cortex visuel. Comme dans le cortex visuel, les unités sont divisées en couches.

Premièrement, les unités les plus simples extraient des caractéristiques rudimentaires de la scène (par exemple, des profils orientés) en analysant de très petits groupes de pixels. Les unités les plus complexes analysent ensuite de plus grandes parties de l'image et reconnaissent les caractéristiques liées à la taille ou à la position des objets. A chaque couche successive, des caractéristiques de plus en plus complexes sont extraites, comme la distance entre deux parties d'un objet ou les différents angles d'orientation de ces parties. Cela vous permet de reconnaître le même objet sous différents angles.

Lorsqu'ils ont testé le système, leurs résultats étaient très bons, étant en mesure de rivaliser avec les meilleurs systèmes du marché. De plus, en raison de sa capacité d'apprentissage, plus vous analysez d'images, plus vos résultats sont précis.
Pour le moment, le système n'a été conçu que pour analyser des images statiques. Cependant, selon Serre, le processus est similaire à celui du système de vision humaine, où une partie du système traite des formes et une autre du mouvement. L'équipe travaille actuellement sur l'intégration d'un système parallèle qui fonctionne avec des vidéos.

Source: Revue technologique


Vidéo: Vincent Mignerot: Anticiper leffondrement? EN DIRECT


Article Précédent

Longleat: safari et aventure

Article Suivant

Comarca de Huelva et Comarca de la Sierra