Technofutur TIC: la “science de la donnée” à l’oeuvre sur des données aériennes et ferroviaires

Pratique
Par · 12/02/2020

Pour la deuxième année consécutive, les responsables de l’Aéroport de Charleroi – départements IT, finance, marketing, maintenance – se sont tournés vers Technofutur TIC et ses formations big data technical consultant (formation destinée aux demandeurs d’emploi et aux personnes en reconversion professionnelle) pour un petit exercice, grandeur nature, d’exploitation analytique et prédictive de certains jeux de données de l’aéroport.

Cette année, un autre grand opérateur logistique – Infrabel – a, certes encore timidement, prêté certains de ses jeux de données aux apprenants du centre de compétences afin qu’ils se forment et découvrent dans ces données des idées et pistes d’amélioration du service. Ou tout au moins de détection et explication des causes de soucis.

Le cadre? La formation qualifiante en analyse de données (“big data technical consultant”) du programme “Data Academy” de Technofutur TIC.

La cohorte? 15 stagiaires. La durée de la formation? Trois mois et demi de programme, dont 18 jours de travail pratique sur les jeux de données mis à disposition. 

Qu’en est-il ressorti?

La thématique globale que l’Aéroport de Charleroi avait demandé aux stagiaires d’explorer était celle de la gestion des parkings de l’aéroport: qui sont les usagers? quel sont les taux et les types d’utilisation? quelles sont des pistes d’amélioration?

Des données sous-exploitées

Depuis février 2019, après avoir mis le doigt sur ce qui était une faiblesse en termes d’efficacité et de satisfaction client, l’aéroport a repris à son compte la gestion de ses parkings. Mais encore fallait-il extirper des données qui dormaient dans les bases les informations signifiantes faisant le bilan de la situation et identifiant les points d’action et d’amélioration.

Arrivé voici deux ans au poste de directeur informatique, Thomas Fercot s’est vite rendu compte que les masses de données collectées (entrées et sorties des parkings, paiements etc.) étaient en friche. L’aéroport ne s’adonnait pas à la BI (business intelligence) et ne disposait de personne, en interne, pour s’y atteler. C’est à ce moment-là qu’il s’est tourné pour la première fois vers Technofutur TIC et son programme “Data Academy”.

Comme toutes les personnes qui passent par le programme de formation qualifiante “big data analyst” de Technofutur TIC, Solange Nissolle était chercheuse d’emploi, avec un bagage professionnel déjà à son actif. Dans son cas, le monde de la publicité. Mais déjà avec une certaine “pratique” de l’exploitation de données puisqu’elle avait dans ses attributions, dans l’agence de publicité qui l’employait, l’analyse des données commerciales. Désireuse de réorienter sa carrière, de changer de domaine et de remettre ses compétences à niveau, elle a intégré le programme de Technofutur TIC.

D’abord timidement, ne mettant sur la table que des interrogations et des thèmes mais fort peu de données. Malgré tout, l’exercice réalisé par les stagiaires a su le convaincre de l’utilité de progresser dans la voie de l’analytique. Jusqu’à engager l’une des stagiaires – Solange Nissolle – qui, depuis un an, officie comme data analyst au sein d’une équipe qui est en passe de grossir, atteignant désormais une dizaine de personnes. (voir encadré ci-contre)

“Le programme de formation de Technofutur TIC a été concluant pour nous en 2019 et les résultats de la nouvelle session, avec travail des stagiaires sur nos données concrètes, avec un use case précis, sont, cette année encore, encourageants”, indique Thomas Fercot. Pour deux raisons…

D’une part, de possibles profils intéressants à recruter. “Nous avons parfois des difficultés à recruter. Nous explorons donc plusieurs possibilités. L’un des intérêts de ce programme est le fait que les apprenants sont des personnes qui ont déjà travaillé, qui ont donc déjà un background professionnel.”

D’autre part, même s’il ne devait pas y avoir de recrutement, le mode “hackathon” a permis “d’avoir de nombreux échanges avec les apprenants. On a ainsi pu ouvrir de nouvelles pistes pour l’analyse des données.”

Dissection des données

Pour Thomas Fercot, l’analyse des données de parking peut déboucher sur une multitude d’enseignements, dans une grande variété de domaines: analyse de rentabilité, marketing ciblé, évolution vers de la maintenance préventive, test et validation du déploiement de nouvelles fonctionnalités et solutions pour les usagers…

En voici quelques exemples.

L’analyse granulaire des données (volumes, périodicité, modalités de paiement, nombre comparé de passages à telle ou telle barrière, dans tel ou tel parking, durée d’occupation par type de parking, en fonction de la période de l’année, etc.) permet de dégager des profils d’utilisation révélateurs.

Cela permet a minima d’évaluer si la capacité est suffisante. L’analyse des taux d’occupation, par type de parking (express, courte durée, longue durée…), par période de l’année, voire même en comparant avec les données météorologiques, peut permettre d’identifier des parkings sous- ou sur-utilisés. Et pourquoi…

“Cela nous permettra de lancer des actions de promotion, par exemple pour doper l’utilisation en proposant des réductions de prix sur l’un ou l’autre parking”. Cela impliquera notamment une intégration avec l’appli mobile que propose l’aéroport (un développement de la start-up AirWafi, qui a émergé du programme d’accélération MoveUp de Digital Attraxion).

Les promos pourront être décidées en temps réel mais aussi être planifiées plus en amont, via analyse des tendances saisonnières et analyse prédictive.

Une intégration entre l’appli mobile et les données de fréquentation du parking peut également permettre d’anticiper des périodes de pointe, du moins pour les voyageurs qui réservent à l’avance. “Ils doivent en effet donner le numéro de leur vol. Cela permet alors d’analyser de manière plus granulaire le lien de cause à effet entre la fréquentation et la durée d’utilisation des parkings, d’une part, et les destinations des voyageurs, de l’autre.”

L’étude des temps d’arrivée au parking par rapport à l’heure de départ des avions (quand la corrélation peut donc être faite) a une autre – double – utilité. “En couplant ces données à celles de géolocalisation via utilisation du WiFi [déployé par Telenet], on peut mieux comprendre les temps passés à l’aéroport – parking, zone d’enregistrement, zone commerciale, porte d’embarquement…”, souligne Thomas Fercot.

“Cela ouvre la voie à des notifications dynamiques potentiellement intéressantes, par exemple pour la fréquentation des boutiques. Autre aspect des choses, en fluidifiant le parcours du passager, nous diminuons aussi son niveau de stress. Ce qui n’est pas anodin pour un voyage en avion…”

Au-delà de la “convivialité”

L’analyse des taux de passage à chaque barrière peut éventuellement révéler que l’une d’elles est mal positionnée. Ou, si l’une d’elles est davantage utilisée, si son plan de maintenance peut être adapté. “Selon les taux d’utilisation d’une barrière, par période de l’année ou de la semaine, on peut déterminer si on peut la mettre hors service pendant un ou deux jours, pour des raisons de maintenance, sans gêner les passagers.”

Egalement en termes d’aide à la maintenance technique, les chiffres de fréquentation des bornes de paiement permet de mieux planifier leur réapprovisionnement en cash – pour les personnes qui paient encore en monnaie sonnante et trébuchante.

L’analyse comparée des modalités de paiement utilisées (aux barrières, aux caisses automatiques, par carte ou en cash) par les usagers peut permettre de vérifier si le lancement d’une nouvelle solution a un effet positif et est bien adopté par les usagers. Par exemple, la surpression progressive des tickets papier, habituellement délivrés par les barrières d’entrée. L’aéroport a commencé à équiper ses différents parkings de caméras à potentiel de reconnaissance de plaque minéralogique. Plus besoin, donc, de ticket, le système identifiant automatiquement l’usager et “réconciliant” son arrivée, le paiement effectué à la borne et sa sortie.

Autre exemple, toujours pour les modes de paiement: le lancement d’un paiement via mobile (que l’aéroport devrait proposer dès que son prestataire aura intégré cette fonctionnalité…). Là aussi, l’analyse comparée des “comportements” des usagers permettra à l’aéroport de déterminer ce qu’il peut ou non privilégier ou si un déploiement (applicatif ou logistique) a été effectué en pure perte.

Ce que les stagiaires on concocté pour BSCA…

Huit des 15 apprenants de la cohorte 2019 de Technofutur TIC ont donc planché pendant 18 jours sur les jeux de données de l’aéroport en s’attachant à déterminer les taux et modes d’utilisation des différents parkings, le type de “comportement” des usagers (durée d’utilisation, temps de passage, types de paiement…).

Les données ont été triturées et transposées en graphes, tableaux comparatifs. Elles ont été filtrées selon divers paramètres et filtres d’analyse.

Plusieurs “produits” en ont émergé. Des tableaux thématiques, organisés par KPI. Un tableau générique récapitulatif. Une application Web, avec potentiel de visualisation (réalisée avec Power BI – même si l’aéroport aurait sans doute préféré du Qlik…). Une simulation en mode carte de chaleur (heat map) et visualisation prédictive, via application d’algorithmes.

Cinq algorithmes ont été testés par les apprenants “afin de déterminer celui qui conviendrait le mieux”. La technique avec laquelle ils ont finalement travaillé est celle des fo^rets d’arbres décisionnels (random forest). Avec un certain succès (même si le mécanisme est sans doute insuffisant): “Le taux d’erreur en prédiction d’affluence, par plage de 6 heures, en fonction de la planification des vols, est de 11%”.

Pour affiner l’exercice, des jeux de données manquaient, ont souligné les apprenants. Par exemple, le délai réel entre temps d’arrivée au parking et décollage de l’avion (il faudrait pour cela réconcilier chaque passager avec son vol), ou encore le taux de remplissage réel des avions. 

Mais comme le soulignait Thomas Fercot, “les résultats sont encourageants”. Exemple de scénario qu’il imagine: “arriver à prédire les revenus de l’exploitation des parkings sur base des durées d’occupation, en fonction des destinations, de la saison… Déterminer ou prédire combien d’usagers vont rester plus de trois ou cinq jours. Pour cela, il faudrait évidemment effectuer la relation avec chaque passager.” D’où l’intérêt de tout ce qui est réservation en-ligne et… suppression des paiements en cash. Dans ce dernier registre toutefois, l’aéroport promet de continuer à laisser le choix aux voyageurs…

Un premier test pour Infrabel

Pour Infrabel, l’exercice du “hackathon” (mise à disposition de ses données pour permettre aux apprenants de les utiliser avec une finalité réelle pendant trois semaines) était une première. Et la société y est allée “prudemment”, ne fournissant que des jeux partiels. Manquaient par exemple à l’appel les horaires réels (seuls les horaires théoriques décidés parfois plusieurs mois en amont en ont été fournis).

Ces jeux incomplets ou insuffisants n’ont donc pas réellement permis aux 7 stagiaires qui s’y sont attelés de tirer des conclusions suffisamment pertinentes. Notamment aussi parce que la connaissance du métier d’Infrabel et de la réalité de terrain (trains réaffectés en dernière minute à d’autres itinéraires, notamment) étaient lacunaires.

Quoi qu’il en soit, les apprenants ont pu développer des analyses sur des données concrètes pour investiguer deux questions: l’impact des incidents sur la ponctualité tout au long du parcours d’un train et l’efficacité opérationnelle du réseau.

 

Un stagiaire: “Nous avons découvert la chaîne de valeur des données. La formation et le hackathon nous ont donné une claire vision des différents outils de cette chaîne. Nous avons également compris combien la dimension business qui est la finalité de cette chaîne doit en fait être placée en début de chaîne dans la mesure où elle nous impose la logique de traitement des données.”

 

Même si, comme le soulignait l’un des stagiaires, les analyses et simulations ont donc été entravées et si le temps a manqué pour imaginer d’autres dimensions d’analyse et appliquer d’autres filtres aux données, les deux parties – Infrabel et Technofutur TIC – semblent vouloir reproduire l’expérience.

Du côté d’Infrabel, on salue le fait que les enseignements tirés, en peu de temps, par les apprenants rejoignent leurs propres analyses. Et le représentant de la société dit être “ouvert à des opportunités de stage.”

Ce sur quoi Yvan Huque, directeur de Technofutur TIC, enchaîne en invitant la société à “prolonger le travail déjà fait [en impliquant donc potentiellement les stagiaires] pour faire émerger quelque chose de plus structuré et de plus significatif.”

Cet appel du pied ne s’adresse d’ailleurs pas uniquement à Infrabel. “Pour une entreprise, quelle qu’elle soit, ce type d’exercice confié à des apprenants est l’occasion à la fois de découvrir ce qu’on peut faire de leurs données et de découvrir des talents. Technofutur TIC applique ainsi le principe de l’idéation pour les entreprises.

Et pour les apprenants, c’est un exercice pédagogique réaliste, avec travail sur un cas réel et dans un contexte proche de la réalité, avec des contraintes de temps pour la réalisation d’un projet et l’obligation de veiller à la qualité professionnelle des résultats.”