Open data: secteur public cherche éclaireurs pour terra incognita

Hors-cadre
Par · 13/04/2016

Quel regard les porteurs de projets qui se sont lancés dans l’open data jettent-ils sur leurs (premiers) rapports avec les organes publics qu’ils ont tenté de convaincre de leur ouvrir leurs données? Quelles furent les embûches sur le chemin? Comment le qualifier – de parcours à une allure Echternach, de promenade de santé, de chemin de Compostelle, de calvaire? Et quel message veulent-ils aujourd’hui faire passer aux acteurs publics?

Nous avons interrogé deux de ces jeunes pousses. D’une part, NextRide, née ProchainBus, qui a convaincu les TEC d’un partenariat. De l’autre, Crossnode, qui vient de négocier avec le Forem.

Des préliminaires difficiles

Quels furent les écueils et résistances que vous avez rencontrés? Et ces résistances étaient-elles objectivement justifiées ou le résultat d’une mauvaise perception, de craintes non fondées, de lacunes réelles de la part des organismes concernés?

Les premières démarches des deux sociétés contactées ont été ardues, notamment parce qu’elles abordaient un domaine pour le moins mal connu – et mal compris – de la part de leurs interlocuteurs.

NextRide, née sous le patronyme de ProchainBus, a vu le jour pour offrir, via une appli, un service d’informations aux usagers des bus du TEC (le service, depuis, a été étendu à ceux de la Stib). Pour ne pas tomber dans l’illégalité et opérer dans un mode plus confortable que le “scraping” (récupération “sauvage” de fichiers via Internet), la jeune pousse a tendu la main à l’opérateur wallon. Mais ce ne fut pas forcément du “love at first sight”.

Opérateur historique et jeune premier ont dû apprendre à dialoguer, à se faire confiance, à définir leurs intérêts respectifs.

“Au début”, se rappelle Thomas Hermine, fondateur de NextRide, “Il y a clairement eu une crainte à cause d’une très grande méconnaissance technique de la part des décideurs.”

Et pas seulement de la part des TEC mais aussi, d’une manière générale, dans l’esprit de la plupart des observateurs et acteurs publics… “Les termes “open data” et “big data” sont souvent confondus. Il y a, par exemple, eu des questions parlementaires à Bruxelles lorsque la Stib à annoncé sa politique open data (data sharing)… les parlementaires confondaient avec [les données de la carte] Mobib et pensaient que des données personnelles allaient être libérées…”

On retrouve ce constat de méconnaissance dans la bouche d’Anis Haboubi, co-fondateur et patron de CrossNode, société liégeoise qui développe notamment des applications et solutions M2M/Internet des Objets, et qui vient de passer un accord avec le Forem (voir en fin d’article).

Anis Haboubi (CrossNode): “La première résistance rencontrée est venue du fait que la majorité des responsables contactés ne savaient pas définir l’open data.”

“En entamant les démarches, il y a de cela deux ans, nous pensions qu’ils seraient désireux qu’on utilise leurs données afin d’enrichir l’expérience utilisateur des citoyens belges.” Douce illusion…

“La plupart de nos interlocuteurs étaient persuadés que des données qui étaient dites publiques étaient leur propriété et qu’ils devaient pouvoir les monétiser ou, en tout cas, avoir un contrôle total sur l’utilisation de ces données. Par extension, ils ne voyaient ni l’intérêt, ni l’utilité de partager ces données avec les citoyens ou les développeurs intéressés.”

Autre obstacle, plus classique, que NextRide a dû surmonter lors de ses négociations avec les TEC: la méfiance vis-à-vis d’une jeune structure. “Au début, nous avons rencontré une très forte résistance du TEC qui craignait que NextRide [qui s’appelait encore ProchainBus à l’époque] ne soit pas assez “solide” pour un partenariat. Que l’on ne soit par exemple pas en mesure de mettre les horaires systématiquement à jour…”

Qu’attendent les start-ups?

Quelles demandes les start-ups adressent-elles aux organismes publics (recommandations, conseils…) pour qu’ils puissent répondre favorablement à vos sollicitations en matière d’open data?

Thomas Hermine (NextRide): “Les opérateurs se “couvrent” en faisant un type d’open data qui ne risque pas de porter préjudice à leur applis puisqu’ils gardent l’exclusivité du temps réel.”

NextRide: “Dans notre secteur, le manque le plus criant est évident. Il s’agit du temps réel, autrement dit, la position des véhicules et les adaptations des temps d’attente. Dans le cas de la STIB, de la SNCB et de De Lijn, ce temps réel est disponible pour eux, mais pas pour les acteurs tiers – ce qui rend Google Maps assez inutile pour la SNCB, par exemple, puisque ni les retards ni les voies ne sont disponibles en horaires statiques.

Ces opérateurs se “couvrent” en fait en faisant un type d’open data qui ne risque pas de porter préjudice à leur applis puisqu’ils gardent l’exclusivité du temps réel.”

Lourdeur et réticence persistent donc de la part des opérateurs – même si, en leur sein, divers responsables, à commencer par ceux chargés des solutions “interactives” destinées aux usagers, tentent d’inverser la vapeur…

Le fait de se réserver l’exclusivité des avantages du temps réel est-il une bataille d’arrière-garde, une erreur stratégique (en ne saisissant pas des opportunités que des partenaires pourraient procurer)?

Thomas Hermine estime que, dans le cas des TEC, il serait pour le moins utile, voire plus que nécessaire, d’évoluer. “Les bus sont équipés depuis plus d’un an de puces GPS qui remontent la position en temps réel mais… cette donnée n’est pas utilisée en externe.” Mais elle n’est pas non plus exploitée par des supports made-in-TEC, par exemple via InfoTEC, ou sur les poteaux installés aux arrêts…

“Le TEC est donc un des derniers opérateurs européens à ne pas disposer de temps réel et à ne pas pouvoir fournir d’information sur les retards, alors qu’ils ont tout pour le faire… C’est déplorable, surtout compte tenu du niveau assez important de retards sur certaines lignes….”

Mesures utiles

Quels sont les mécanismes, les procédures à mettre en oeuvre par les organismes publics pour se préparer et évoluer dans le sens des open data? Comment peut-on démystifier l’open data?

Thomas Hermine, de NextRide: “Ces deux questions se rejoignent selon moi: il faut un vrai accompagnement des porteurs de projets, d’un point de vue technique. Les données sont parfois dans des formats informatiques très complexes. Il faudrait de la documentation, un point de contact pour les questions, un forum d’entraide…

Bref, un accompagnateur qui connaisse très bien les données ainsi que la réalité de terrain de chaque producteur de données. On peut par exemple très bien comprendre le GTFS [Ndlr: General Transit Feed Specification, format de données fréquemment utilisé pour la publication d’informations relatives aux transports en commun], qui est assez bien documenté par Google, mais ne pas comprendre pourquoi tel bus semble faire demi-tour sur son parcours à tel endroit à tel heure et pas le suivant…”

Anis Haboubi, de CrossNode, met pour sa part l’accent sur la nécessité de conscientiser, d’“évangéliser” et de mobiliser les responsables politiques.

“Nous constatons une difficulté à sensibiliser le monde politique car il s’agit ici d’une logique, d’une dynamique totalement inconnue, en rupture totale avec tout ce que connaissent les pouvoirs publics et les administrations. En 2 ans, nous avons pu contacter et conscientiser peu de responsables politiques qui portaient un réel intérêt à ces différentes problématiques…”

Que préconise-t-il?

“Afin d’essayer d’éclairer nos décideurs politiques, nous nous devons d’expliquer que la mise en place d’un portail unique n’est pas la première pierre à l’édifice. Il faut impérativement une API fédérale afin de permettre une libération les données publiques!

Anis Haboubi (CrossNode): “La mise en place d’un portail unique n’est pas la première pierre à l’édifice. Il faut impérativement une API fédérale afin de permettre une libération les données publiques.”

Il serait grand temps que les décideurs comprennent que les enjeux du numérique passeront essentiellement par la bonne connaissance et l’utilisation efficace d’une API fédérant et mutualisant un outil pour toutes les institutions. Cela permettrait d’accueillir un grand nombre de données. de standardiser les données ouvertes et d’autoriser une accessibilité universelle (et sécurisée) des données ouvertes par l’Etat.

La grande force d’une API est de fournir un service qui permet, en temps réel, de mettre à jour sa base de données ainsi que de la délivrer aux utilisateurs qui l’utilisent et qui s’y connectent.”

“Les interfaces de programmation (API) permettent à nos systèmes techniques de discuter entre eux, aux données et aux programmes de se croiser, de s’alimenter, de se féconder les uns les autres… Cette technologie va permettre de réinventer la relation entre nos institutions et les citoyens. On va pouvoir recréer un vrai lien social avec celui-ci. Les business models sont en train de changer et nous nous dirigeons vers une économie basée sur les API.”

Des portails open data. Mais encore…?

Les développeurs, entreprises, voire simples citoyens qui désirent accéder et réutiliser les données publiques peuvent en principe aller piocher les fichiers qui les intéressent sur les différents portails open data développés par diverses instances – fédérales, régionales voire municipales (Bruxelles, Gand, Anvers ont en effet créé leur propre portail open data).

Toutefois, ces plates-formes posent divers problèmes. Outre le fait que le nombre de jeux de données disponibles soit encore, somme toute, limité – même si la liste s’allonge régulièrement -, ces data sets ne sont pas forcément réexploitables comme tels. En cause, les formats de publication et mise à disposition ou la teneur (“qualité”) des données qu’on y trouve.

“L’Etat ou les entités fédérées ont un mal fou à “imposer” à leurs propres institutions de délivrer ces données sur ces plates-formes et faire en sorte qu’elles soient exploitables par tout développeur”, constate Anis Haboubi.

“Malgré les infrastructures mises en place, dont nous saluons quand même l’initiative, la plupart des développeurs ont du mal à s’y retrouver. Nous avons l’habitude de partager des données, de travailler de façon collaborative avec des gens qui peuvent habiter de l’autre côté de la planète. Pour cela, la communauté des développeurs a réussi à se munir d’outils et, surtout, de normes afin de communiquer entre eux.

Dans le cas de ces plates-formes, c’est tout l’inverse. On se retrouve dans un marché aux puces de la donnée où il faut encore faire un travail de nettoyage, voire même de tri sur l’ensemble des plates-formes à notre disposition.

L’enjeu ne se trouve pas dans la quantité de données mais dans sa structure! Encore trop peu de données sont dans des formats standards comme le JSON ou XML qui, je tiens à le rappeler, sont les standards qui sont les plus appréciés par les développeurs.”

NextRide, elle aussi, a achoppé sur un problème de qualité ou de réutilisabilité des données du TEC. “Dans notre cas, il s’agissait par exemple d’arrêts de bus présents plusieurs fois avec des graphies différentes, de lignes mal nommées, de déviations de très longue durée (plus d’un an) non encodées…”

L’accord passé à ce jour avec le Forem porte sur le développement d’une appli permettant d’accéder aux offres d’emploi du site officiel. Un début. En attendant, peut-être, d’autres initiatives orientées open data? Le Forem, à cet égard, est encore en mode réflexion… Pour l’heure donc, Crossnode développera une appli pour rendre plus souple la consultation des offres d’emploi. “Mettre en place un cadre partenarial a pris du temps”, souligne Anis Haboubi, “mais nous avons finalement convaincu le Forem de développer avec nous la première application donnant accès à l’ensemble des offres d’emploi en temps réel afin de répondre à la demande de plus de 40.000 utilisateurs visitant tout les mois le site du Forem et de faciliter l’expérience utilisateur de notre génération, très demandeuse de ce type d’application.” [ Retour au texte ]