ViBe: donner sens et signification à l’image

Article
Par · 25/01/2013

ViBe (acronyme de Visual Background Extraction) est un algorithme de segmentation vidéo qui permet de détecter des arrière-plans et d’extraire des mouvements d’objets ou faits signifiants captés dans des séquences vidéo. Il devient ainsi possible d’“interpréter” automatiquement des images, qui plus est en temps réel grâce aux performances de l’algorithme. Cela en fait donc un outil particulièrement précieux pour de la vidéosurveillance (entre autres finalités).

ViBe est aussi le nom de la spin-off qui veut transposer ce projet de recherche en solution(s) commerciale(s). Elle sera bientôt hébergée à l’incubateur WSL (site de Liège).

Pascal Vancoppenolle (ViBe): “Un projet issu d’un développement universitaire représente, en soi, une claire valeur ajoutée dans la mesure où les universités ne s’amusent pas à réinventer la roue. Si ces projets peuvent trouver de bons porteur de projet, le déclic [commercial] se manquera pas de se produire.”

Le développement de ViBe est l’oeuvre du professeur Marc Van Droogenbroeck de l’ULg (Laboratoire Telecommunications & Imaging de l’Institut Montefiore) et d’Olivier Barnich, ancien chercheur à l’ULg, aujourd’hui membre de l’équipe R&D d’EVS.

L’algorithme se prévaut d’être beaucoup plus efficace que les solutions commerciales existant actuellement sur le marché.

“ViBe a la capacité de traiter plusieurs milliers d’images/seconde, en temps réel”, déclare Pascal Vancoppenolle, directeur de la jeune pousse. “La méthodologie mise au point n’a plus rien à voir avec les solutions existantes. A l’ULg, les développeurs ont en effet adopté un point de vue différent pour gérer l’analyse de mouvement. Le résultat obtenu n’est pas une simple amélioration mais une performance d’un tout autre ordre de grandeur. ViBe est au moins plusieurs centaine de fois plus rapide que les algorithmes existants, tout en préservant la qualité et la précision d’analyse.”

Analyse temps réel

“La masse d’images qui doivent être analysées, pour l’une ou l’autre raison, ne cesse d’augmenter. Ces productions et les besoins d’analyse posent des défis croissants en termes d’espace de stockage et de puissance de processeurs. Les algorithmes d’analyse d’image basés sur la détection de mouvement ne suffisent pas à la tâche. Nombre d’entre eux sont un mélange de méthodes gaussiennes, paramétriques et autres, et sont loin de répondre aux besoins actuels. Nombreux sont aussi ceux qui perdent de leur efficacité et précision à mesure que la vitesse des mouvements captés augmentent. ViBe, par contre, peut traiter potentiellement plusieurs milliers d’images/seconde, en préservant la qualité d’analyse.”

Marc Van Droogenbroeck (ULg): “Notre méthode est plus performante que des méthodes modernes récentes, tant en termes de vitesse de traitement que de taux de détection.”

L’efficacité de l’algorithme développé à l’ULg tient à plusieurs techniques. Parmi les différenciateurs, l’inclusion d’éléments stochastiques dans le modèle; une technique basée sur le pixel (la détection de mouvement [lisez: changement] s’effectue au niveau de chaque pixel en particulier); le principe de la cohérence spatiale (un pixel ayant une influence- spatiale et temporelle- sur ses voisins); un référencement riche de chaque pixel; la préservation en mémoire des anciens modèles traités afin d’améliorer la performance; ou encore l’initialisation instantanée de l’arrière-plan, qui permet des traitements comparatifs dès la deuxième image d’une séquence vidéo. “ViBe ne procède pas par mises à jour systématiques et constantes, épargnant ainsi de la puissance processeur, de même que de l’autonomie système, chose importante pour les systèmes embarqués.”

Voici ce qu’en disaient Olivier Barnich et Marc Van Droogenbroeck dans un document scientifique publié en 2011: “Pour chaque pixel, la technique [utilisée pour ViBe] enregistre plusieurs valeurs collectées précédemment au même endroit [de l’image] ou à proximité. Le système compare alors cet ensemble de valeurs avec la valeur actuelle du pixel afin de déterminer si ce pixel fait partie de l’arrière-plan et adapte le modèle en choisissant au hasard les valeurs de l’ancien modèle d’arrière-plan à substituer. Cette méthode se distingue de celles basées sur la conviction classique selon laquelle les valeurs les plus anciennes  devraient être remplacées en premier lieu. Lorsque l’on détermine que le pixel fait partie intégrante de l’arrière-plan, sa valeur est propagée dans le modèle d’arrière-plan ou à un pixel voisin. […] des mesures d’efficacité démontrent que notre méthode est plus performante que des méthodes modernes récentes, tant en termes de vitesse de traitement que de taux de détection.”

De multiples débouchés

Le marché de l’image est en plein boom. Toute solution efficace de détection et d’analyse de mouvement a potentiellement, devant elle, une panoplie de secteurs d’implémentation désireux d’extraire des informations pertinentes de ces flux d’images. Aux yeux de Pascal Vancoppenolle, l’exploitation de l’algorithme ViBe peut concerner tout aussi bien le monde médical, pour le traitement temps réel d’images complexes, que l’industrie manufacturière et ses contrôles visuels sur les lignes de production (contrôle de qualité, optimisation de processus…) ou encore le grand public, avec son appétit gargantuesque d’images (smart phones, tablettes…). Les débouchés potentiels sont légion: interfaces visuelles, jeux vidéo, aide à la revalidation physique, coaching sportif…

La vidéosurveillance, elle-même applicable à une flopée de secteurs et contextes, est évidemment une mine d’opportunités. Les caméras de surveillance se multiplient, produisant des masses de données visuelles qui ne sont pas analysées de suite, qu’on stocke sans pouvoir en faire bon usage. Et le phénomène ne fait que s’accentuer à mesure que les caméras deviennent de plus en plus rapides.

“A quoi sert de stocker des milliards de gigaoctets si on ne sait pas où regarder, où chercher?”, s’interroge Pascal Vancoppenolle. “Ce qui est intéressant, c’est de pouvoir dire immédiatement “là, il y a quelque chose de significatif”. De pouvoir déterminer sur quel mouvement on ajoute de la valeur. Une valeur ou une pertinence qui diffère selon les contextes…”

On pourrait encore citer d’autres débouchés prometteurs tels que la sécurité des bâtiments, la défense (drones “intelligents”), ou encore l’équipement automobile (avec la multiplication de caméras embarquées, aux multiples finalités- surveillance d’endormissement, de fanchissement de bande de circulation…). “Plus on multiplie les caméras, plus la charge de traitement devient indigeste pour les processeurs”, souligne Pascal Vancoppenolle. “Qui plus est, en automobile, la vitesse de traitement de l’image est primordiale. Et va grandissant à mesure qu’on roule plus vite.” L’interprétation temps réel de l’image, d’un fait de conduite, est une question de sécurité. De chaque instant. Imagine-t-on un traitement différé, ne serait-ce que d’une seconde en cas de collision imminente?

Des recherches ainsi que des implémentations de ViBe dans le cadre de projets académiques ont d’ores et déjà démontrer son intérêt. Parmi les contextes dans lesquels il a été été utilisé et testé, citons ici deux exemples qui ont fait l’objet de publications scientifiques: la détection d’objets flottant à la surface d’une mer agitée (ces “objets” pouvant être, selon les cas, des débris, mines flottantes, personnes en détresse…) et la détection d’objets immergés (utilisation pour la recherche biologique ou géologique).

Prochaines étapes

Fin décembre 2012, ViBe était sélectionné par WSL comme l’un des 12 nouveaux projets qu’il a décidé d’incuber et d’accompagner.

Pascal Vancoppenolle, pour sa part, est encore une recrue récente. Il se présente à la fois comme un business angel et comme un coach. “J’étais à la recherche d’une société dans laquelle investir mais également dans laquelle m’impliquer activement et qui porterait en elle une dimension internationale.”

Le début de sa mission se situe en août 2012. “Mon premier rôle a été de découvrir les potentiels de la société, de participer à la rédaction du business plan, avec identification des marchés et clients potentiels.” Aujourd’hui, il occupe le poste de directeur de la jeune structure. Pour ce qui est de l’agenda des prochains mois, ViBe se donne pour objectif de “démontrer la supériorité de ViBE dans des applications bien spécifiques.”

Une autre priorité est de rechercher du financement afin de recruter et de constituer une équipe. Nous sommes à la recherche d’un CTO, qui soit spécialisé en computer vision, d’ingénieurs pour le développement du produit, d’ingénieurs pouvant supporter les projets des clients, et de commerciaux.” Le Prof. Van Droogenbroeck, lui, demeurera à l’ULg et officiera en tant que Chief Scientific Officer, continuant de servir de “moteur au projet.”

“Depuis septembre 2012, nous avons noué une vingtaine de contacts intéressants avec des clients potentiels. Mais pour que nous puissions aller plus loin [dans la concrétisation des contacts], ces clients potentiels attendent de nous que nous disposions d’une équipe de support apte à les aider à intégrer l’algorithme dans leurs solutions.” D’où le caractère fondamental de la levée de fonds espérée, qui permettra de recruter 4 ingénieurs support.

Sa future clientèle, ViBe l’imagine essentiellement du côté des fabricants de processeurs (puces dédiées embedded vision) et des fabricants d’appareils (appareils photos, caméras…). Sans oublier les concepteurs de logiciels, qui pourraient intégrer le code ViBe dans leurs logiciels.

Les fonds que ViBe espère réunir serviront à poursuivre le développement de la solution, afin de suppléer l’équipe universitaire. Son hébergement au WSL (sur le site liégeois) lui permettra de développer et étayer son plan d’activités. Et ViBe s’est également tournée vers le CETIC afin de valider le fonctionnement de l’algorithme et pour lui confier la mission de “comprendre la chaîne de valeur monétaire” qu’elle pourrait tirer de sa solution technologique.

La jeune spin-off est actuellement à la recherche de capitaux, espérant lever 500.000 euros auprès d’investisseurs privés, autant du côté d’invests publiques. Une demande d’avance récupérable a également été introduite auprès de la Région wallonne pour un montant d’un million d’euros.