Tapptic en croisade “fact checking”

Hors-cadre
Par · 02/03/2017

Sur initiative de Damine Vossen, l’un de ses collaborateurs, l’agence Tapptic a lancé un projet visant à développer une solution d’intelligence artificielle qui permettrait de repérer et de mettre les lecteurs en garde contre les “faits alternatifs” et autres histoires montées de toutes pièces par des trolls, de mauvais plaisants ou encore des sources peu recommandables. Des “infos” qui naissent et se nourrissent souvent sur les réseaux sociaux mais qui débordent plus ou moins largement via des supports plus classiques.

Formé à l’école de journalisme de l’ULB, Damien Vossen se sent plus particulièrement intéressé, voire concerné, par ce phénomène “post-vérité” et par les multiples et inquiétantes dérives et menaces qu’il implique.

L’approche qu’il compte développer consiste à se baser sur l’analyse et le décrytage des mégadonnées (“big data”) pour en extraire des éléments significatifs et révélateurs. “Il est possible, sur base des url, de collecter des éléments d’information dans le corps des textes ou dans ce qui fait sa particularité – auteur, source, date de publication, titre… – et de le faire analyser par la machine. Ce n’est pas facile parce qu’il y a pas mal de “bruit” (publicité, diversité des éléments textuels…) mais il existe d’ores et déjà divers dispositifs basés sur l’intelligence artificielle qui permettent de décortiquer ces éléments.

Les initiatives de décryptage/désenfumage se multiplient…

Il faut ensuite “apprendre” à la machine ce qu’est un article “crédible”. Pour cela, il est nécessaire de s’appuyer sur une base de données qui comprenne à la fois des articles “sérieux” et fiables et d’autres qui le sont moins ou beaucoup moins. Voire même d’un troisième groupe d’articles qui sont ambigus ou au sujet desquels on peut émettre des doutes quant à leur véracité.”

D’autres mécanismes devront être mis en oeuvre pour décomposer et analyser les sources d’info. “Une optimisation sera nécessaire. Nous devrons procéder par tests itératifs afin d’améliorer l’algorithme, retirer ou au contraire ajouter des paramètres [permettant de discerner le vrai du faux]…”.

Opération repérage

L’une des principales difficultés consistera à définir, en amont, ces critères et paramètres de crédibilité. Comment vérifier, par exemple, que l’auteur annoncé est bien celui qui a rédigé l’article? Ou comment déterminer si cet auteur est fiable, crédible, “sérieux”? Un premier mécanisme de vérification, à cet égard, est selon Damien Vossen, de faire vérifier systématiquement son profil sur LinkedIn. Un premier pas mais loin d’être suffisant…

Source: Farce or Fiction

La définition des paramètres-clé sera confiée à des data scientists mais aussi à des professionnels de l’écriture. Une petite dizaine, préliminaires, ont pour l’instant été identifiés, “certains assez bruts, d’autres plus raffinés”.

C’est pour constituer une liste nettement plus efficace et performante que Tapptic se tourne vers des pros et espère notamment pouvoir s’appuyer sur des journalistes. “Nous avons besoin d’une vraie connaissance journalistique pour évaluer les sources, pour façonner les algorithmes, pour choisir des paramètres plus riches…”

De même, la société tente actuellement de convaincre des groupes de presse de lui ouvrir leurs historiques d’articles.

Damien Vossen (Tapptic): “Ce que nous attendons des médias, c’est à la fois un apport d’expertise métier et une ouverture de leurs bases de données afin de pouvoir labelliser et définir des catégories d’articles, selon divers degrés de fiabilité”.

Il faudra aussi financer ce projet qui, au stade actuel, en est encore au stade du (petit) prototype et du proof of concept. Des moyens financiers d’autant plus important que Tapptic voudrait aller vite dans la concrétisation de son fact checker. C’est que les élections présidentielles françaises sont à nos portes et la menace d’une déstabilisation à la manière de ce qui s’est produit aux Etats-Unis plane sur l’élection…

Mais nul doute (malheureusement) qu’une solution de ce genre s’avère encore utile, à l’avenir, dans d’autres circonstances. A terme, Tapptic imagine déjà intégrer les algorithmes développés au sein-même des navigateurs. Par exemple, pour procéder à du fact checking automatique sur Facebook…