Un Manto qui révèle les formes

L’outil logiciel Manto a été développé pour permettre la reconnaissance d’objets dont les caractéristiques visuelles ne sont pas strictement définies. La classification d’objets aux caractéristiques de forme, de couleur ou de texture présentant un fort degré de variabilité, est un problème complexe de vision industrielle. Pour la plupart, les systèmes actuels se trouvent dans l’incapacité de classer de tels objets, que l’on rencontre pourtant dans une grande variété d’industries : l’agroalimentaire ou l’industrie du bois, pour n’en citer que deux. L’outil logiciel Manto a été développé dans l’intention de combler ce manque, et de permettre la reconnaissance d’objets dont les caractéristiques visuelles ne sont pas strictement définies. Manto est un composant de la librairie de traitement d’images Common Vision Blox, développée par le groupe Stemmer Imaging (regroupant notamment Stemmer Imaging en Allemagne, Firstsight en Angleterre ou Imasys en France). Il met en œuvre des techniques, baptisées « Support Vector Machines », issues de la recherche dans le domaine de l’intelligence artificielle et de la théorie de l’apprentissage statistique. Il s’agit de développements approfondis des réseaux de neurones, déjà utilisés dans un grand nombre d’applications autres que le traitement d’images. Comme le souligne Martin Kersting, Vice-Président de l’Ingénierie chez Stemmer Imaging : « Manto encapsule la puissance des algorithmes Support Vector Machines, convertis en fonctions simples d’utilisation et accompagnées d’un programme d’apprentissage intuitif. Le travail de l’utilisateur se résume alors à fournir une variété suffisamment grande d’exemples d’apprentissage ». Manto recherche automatiquement les différences caractéristiques entre les objets. Il peut même, si nécessaire, utiliser les informations de couleurs en plus des informations de texture et de géométrie, comme élément de distinction supplémentaire des différentes catégories d’exemples. Une efficacité testée Lorsque l’on évoque le problème de la reconnaissance de formes, l’un des champs d’applications qui vient immédiatement à l’esprit est celui de la reconnaissance d’écriture manuscrite. Chaque caractère peut prendre une infinité de formes différentes, en fonction de l’auteur, mais également de l’instrument d’écriture ou encore du type d’encre utilisé. L’efficacité de Manto a pu être vérifiée dans ce domaine grâce à la base de donnée du MNIST, accessible publiquement et maintenue par le département de recherche d’AT&T Labs, aux Etats-Unis. Les développeurs du MNIST utilisent cette base de donnée pour évaluer l’efficacité des algorithmes et des systèmes de classification. Celle-ci contient un ensemble de 60 000 chiffres manuscrits, utilisés comme exemples d’apprentissage, ainsi qu’un ensemble de 10 000 autres chiffres manuscrits, utilisés comme exemples de test. Pour rendre la tâche encore plus difficile, les auteurs des différents ensembles de caractères utilisés pour l’apprentissage et les tests sont tous différents. « Avec un taux de reconnaissance de 99.35%, la version finale de Manto s’est montrée d’une efficacité redoutable. Un résultat d’autant plus probant qu’à la différence des autres systèmes évalués, Manto n’a pas nécessité que l’ensemble d’apprentissage soit élargit de façon artificielle par le biais de rotations ou d’agrandissements des jeux de caractères », souligne Martin Kersting. En tout en pour tout, 11 minutes ont été nécessaires à Manto pour apprendre l’ensemble des 60 000 exemples. La reconnaissance ultérieure des chiffres n’a nécessité quant à elle pas plus de 1 ms de traitement par caractère, pour un système basé sur un processeur AMD Athlon 500 Mhz. Bien sûr, Manto est également capable de reconnaître des caractères typographiques, tels que ceux, plus fréquemment rencontrés dans l’industrie, imprimés en reliefs sur des composants en métal ou moulés. Ceux-ci peuvent présenter une qualité variable, notamment en termes de profondeur ou de lisibilité, et constituer un véritable challenge pour les systèmes de vision actuels. « Avec un système d’éclairage approprié, il devient même envisageable de lire des caractères sur des surfaces difficiles, telles que celles de métaux fortement réfléchissants », souligne Martin Kersting. Manto a également délivré des résultats intéressants lors de tests réalisés dans le domaine de l’inspection de surface. Le taux d’erreur lors de la reconnaissance de différents types de bois et de papier s’est avéré inférieur à 0.05%. Dans ce domaine, les applications envisageables de Manto incluent les systèmes chargés de la classification de la qualité des produits fabriqués sur rouleaux, tels que le papier, le métal ou la fibre synthétique. Cela pourrait, par exemple, offrir la possibilité aux fabricants de proposer différents niveaux de qualité, à des prix adaptés… …mais pas de miracle. Bien sûr, Manto est bien trop sophistiqué pour des applications simples de reconnaissance de contours ou de formes identiques. Le principal champ d’application de Manto entre donc dans le cadre de la réalisation de tâches de classification d’objets ne possèdent pas toujours la même apparence. Un petite sélection d’applications supplémentaires envisageables inclut la recherche de formes ou de motifs au sein de bases de données et d’archives vidéos, le tri et l’inspection qualité de produits agroalimentaires, ou encore l’analyse et la classification préliminaire d’images Rayon X ou MRI. Soulignons toutefois que malgré la puissance des algorithmes mis en œuvre par Manto, celui-ci ne peut pas réaliser de miracle. La clé du succès repose avant tout sur un apprentissage méticuleux et aussi exhaustif que possible.