CluePoints: le prédictif et le cognitif en ligne de mire

Depuis quelques années déjà, la société CluePoints connaît une croissance soutenue. Spécialisée dans l’analyse statistique et, de plus en plus, algorithmique (automatisée) de données à finalité médicale (validation de la qualité et intégrité de données d’essais cliniques), elle poursuit aujourd’hui son petit bonhomme de chemin à un rythme soutenu.

Un rythme que n’a pas démenti, loin de là, la crise sanitaire puisque CluePoints a par exemple joué un rôle non négligeable dans le sprint que fut la mise sur le marché du vaccin anti-covid19 de Pfizer BioNTech (un de ses clients historiques).

Mission anti-fraude, anti-aberration

La validité des essais cliniques, la pertinence des résultats qu’ils génèrent, sont à l’évidence d’une importance considérable dans le processus de certification, d’homologation et de mise sur le marché de nouveaux médicaments, molécules, solutions thérapeutiques, dispositifs médicaux…

L’idée qui est à la base de la société CluePoints, née dans l’esprit de Marc Buyse, qui allait devenir l’un de ses co-fondateurs (voir encadré en fin d’article), est que l’analyse des données biostatistiques permet de déterminer la validité des essais cliniques, de détecter des anomalies, des résultats tronqués, voire même des fraudes. L’analyse statistique pouvait ainsi se mettre au service de ceux que l’on appelle les “investigateurs” d’essais cliniques, à savoir les professionnels de santé chargés de surveiller leur réalisation et de vérifier leurs résultats.

François Torche (CluePoints): “Le point de départ de CluePoints est une approche de type Data Quality Assessment. C’est le principe du “boiling the ocean” pour voir ce qui en ressort…”

Les outils statistiques mis au point (Data Quality Assessment) permettent ainsi depuis des années de comparer toutes les données générées et collectées auprès des centres de test, de faire émerger des incohérences ou des anomalies qui, potentiellement, peuvent pointer vers des problèmes de matériel utilisé, d’erreurs dans l’encodage initial des données, de procédures non respectées, voire carrément de fraudes (voir encadré ci-dessous).

“Gonfler” les chiffres ou faire dire aux résultats ce que les données objectives n’indiquent pas peut aisément devenir un sport et un levier très rémunérateur (vu les enjeux de mise sur le marché), poussant certains centres CRO voire même certains investigateurs (payés selon le nombre de patients recrutés) à la faute…

Des essais cliniques pas toujours vertueux

La manière d’influer sur les résultats d’essais cliniques peut potentiellement se décliner à l’infini. Voici quelques exemples que CluePoints, avec ses outils analytiques, a permis de mettre au jour.
▻ Des résultats fournis par plusieurs investigateurs étaient trop similaires pour ne pas être suspects. En cause: des patients qui avaient été enregistrés et participaient aux essais organisés par plusieurs CRO !
▻ Des relevés de température (par exemple, suite à l’injection d’un vaccin en cours d’homologation) qui paraissent anormaux. L’explication? Un lot de thermomètres envoyés en Espagne avaient mal été calibrés au départ.
▻ Dans le cadre d’un autre essai impliquant l’encodage quotidien, par les patients, de données “RWE” (vie réelle) — ressenti, niveau d’anxiété — dans l’application sur smartphone, l’outil de CluePoint a permis de détecter un phénomène étrange: “dans un site CRO, tous les encodages intervenaient bizarrement en rafales, à 18h, 18h01, 18h02 etc… Après vérification, on s’est aperçu que les patients n’avaient jamais reçu le smartphone et que l’encodage était réalisé par… l’infirmière”. Encodage parfaitement factice…

Le principe, en soi, est simple: comparer jeux de données et résultats (traitement de données cliniques tels que signes vitaux, valeurs de labo, rythme cardiaque ou respiratoire, etc.) que ce soit par rapport à l’historique ou par confrontation entre jeux de données de plusieurs CRO et investigateurs et y relever des anomalies ou des états et différences suspects.

“La détection des anomalies se fait sur base de l’identification et du suivi de patterns, afin d’identifier des problèmes de nature systémique”, précise François Torche, directeur général et co-fondateur de la société.

Le recours à des outils statistiques et algorithmiques a permis de réduire sensiblement la durée de certaines phases d’essais cliniques.

“Par le passé, pour vérifier l’encodage des données, les sociétés pharmaceutiques devaient typiquement dépêcher sur le terrain des personnes toutes les six ou huit semaines pendant un an. On peut estimer que 30% du coût d’un essai de phase 3 [pour approbation par les autorités compétentes ; phase qui se chiffre en dizaines voire centaines de millions d’euros pour une grosse étude] est accaparé par l’envoi de personnes sur sites. En réduisant ces coûts de 30 ou de 50% et en renforçant l’efficacité de l’exercice d’analyse, nos solutions procurent un avantage substantiel aux sociétés pharmaceutiques”.

Un catalogue en élargissement constant

Au fil de ses dix années d’existence, CluePoints a progressivement étendu et diversifié son offre de solutions. A l’outil de Data Quality Assessment initial sont ainsi venu s’ajouter:

L’homme et la machine

“Le système ne sait pas ce qu’il compare”, déclare François Torche. Pour le système, tout compte fait, ce ne sont que des chiffres. Raison pour laquelle l’intervention humaine est toujours nécessaire “pour analyser, identifier les zones où il y a potentiellement un problème…”
Exemple d’anomalie qui pourrait être détectée et pointée par le système, dans le cadre d’un essai clinique, mais qui suppose qu’un analyste “creuse” et explique l’anomalie: un essai clinique impliquant de surveiller l’évolution du poids des patients dans le temps, pour vérifier l’effet d’un traitement. “Si, entre les visites 1 à 5, le poids des patients demeure systématiquement identique, ce manque de variabilité ou une trop grande stabilité peut tout simplement trahir le fait que le poids na pas été suivi” et que le responsable du CRO a grossièrement simplifié le travail…

– un outil d’évaluation de risque (identification des problèmes potentiels, en amont d’une étude clinique)
– un outil de type tableau de bord permettant de visualiser et d’assurer le suivi de différents indicateurs de risque, sur toute la durée d’une étude clinique
– une fonctionnalité de type examen médical (avec fiche par patient), à l’usage des médecins des sociétés pharmaceutiques.

La société a par ailleurs développé une série de connecteurs permettant de collecter des données à différentes sources. S’y ajoutent encore une solution de vérification de fuite ou de violation de données (data breach) ainsi qu’une solution de visualisation de données. “Pendant des années, nous nous sommes contentés de recourir à des bibliothèques open source pour générer des graphiques que les clients pouvaient consulter. Depuis environ trois ans, nous utilisons un véritable outil de business intelligence pour créer nos propres rapports. L’idée est de basculer ce potentiel sur la plate-forme cloud afin que les clients puissent y générer leurs rapports.” Ce qui impliquera potentiellement un changement d’outil BI.

Dans l’évolution des outils CluePoints, l’intelligence artificielle joue un rôle croissant. Notamment en raison de la croissance exponentielle de la masse de données à analyser. Explosion due à la fois à la multiplication des essais cliniques et à la marée de données que génèrent de nouveaux dispositifs (capteurs en tous genres, applis sur smartphones…).

“Depuis 2020”, indique François Torche, “l’apprentissage automatique et l’apprentissage profond [machine learning, deep learning] interviennent davantage pour amener de la connaissance et pour passer en mode prédictif. Par exemple, de la prédiction de risque d’anomalie.

Au fil du temps, CluePoints a ainsi évolué d’un mode services à celui de plate-forme logicielle SaaS pour aujourd’hui passer à la “génération de connaissances, de telle sorte à pouvoir anticiper des problèmes que l’on pourrait rencontrer lors d’un essai clinique.”

Anticiper ne veut pas dire que CluePoints, en amont, orienterait par exemple la manière dont les données seront collectées lors d’un essai clinique ou dicterait certaines pistes à l’algorithme.

“L’apport de la connaissance servira plutôt à anticiper des écueils ou des difficultés. Par exemple, sur base de l’historique, on sait que tel essai, à réaliser pour tel client pharma, auprès de telle cohorte de patients, risque de ne pas être compris par les patients. Par exemple parce qu’ils risquent de ne pas comprendre la question telle qu’elle est formulée.”

Du séquentiel au parallèle

Jusqu’en 2014, CluePoints a opéré comme une société de services, recourant à ses outils statistiques et algorithmiques pour produire des rapports pour le compte de ses clients. En 2014, un important repositionnement est intervenu puisque la société se muait en éditeur, choisissant la voie du SaaS (software as a service), permettant à ses clients d’utiliser ses outils dans le cloud (infrastructure choisie jusqu’ici: Microsoft Azure, mais avec la possibilité d’y ajouter Amazon en 2023).

Traditionnellement, la solution logicielle de CluePoints a bénéficié de nouvelles versions tous les trois ou six mois. Un rythme de mise à jour et d’ajout de fonctionnalités qui est en train de changer.

Aujourd’hui, le catalogue SaaS de CluePoints comporte une demi-douzaine de solutions logicielles différentes, indépendantes (dans leur finalité fonctionnelle) les unes des autres.

En plus de l’augmentation du nombre de produits à faire évoluer en parallèle, un autre défi auquel doit faire face la société est celui de la croissance de la taille de son équipe de développement. Une équipe qui est, pour sa majeure part, basée à Louvain-la-Neuve (près de 80 personnes) mais qui inclut également deux équipes d’une dizaine de personnes situées en Pologne et en Ukraine (voir encadré ci-contre).

Petite explication par rapport à cette “externalisation” de certains développements à des prestataires polonais et ukrainien: “A une certaine époque, nous ne parvenions plus à trouver certains profils – des développeurs en Python par exemple mais aussi des spécialistes en test – en Belgique. La motivation ne fut donc pas financière”, indique François Torche.
Le manque de profils en Belgique n’a pas forcément disparu (surtout en back-office) mais CluePoints réussit par contre aujourd’hui à attirer des profils étrangers (espagnols, turcs…) pour venir travailler sur son site principal de Louvain-la-Neuve.
Ses besoins en profils demeurent par ailleurs variés: front-office, back-office, IA et apprentissage automatique (machine learning), analystes, biostatisticiens, spécialistes des tests, spécialistes en sécurité (en ce compris, pour le déploiement cloud)…

CluePoints a décidé d’en modifier l’organisation, constituant des “squads”. Ces “brigades” ou “escouades” travaillent, chacune, “de manière la plus autonome possible” sur une partie de l’application. Les membres de ces squads sont basés aussi bien en Belgique qu’en Pologne ou en Ukraine, le fil rouge n’étant pas la localisation géographique mais la complémentarité des profils.

Pour assurer l’évolution fonctionnelle de la plate-forme applicative, il n’est désormais plus possible de procéder à des mises à jour exhaustives tous les trois ou six mois. La société est donc passée à un mode de développement par prototypage. “Nous ne pouvons nous permettre que nos clients doivent attendre 18 mois pour bénéficier d’une nouvelle version majeure. On procède donc par expérimentations, en revoyant et faisant évoluer des parties importantes de la plate-forme”, explique Philippe Thiran, vice-président de CluePoints en charge de l’ingénierie.

Les squads travaillent en parallèle, en mode prototypage rapide, selon le principe du développement agile, afin de fournir rapidement des MVP à un panel de quelque dix grands clients, qui testent, valident les nouveaux potentiels avant leur mise en production.

Il ajoute que, pour assurer une gestion et un fonctionnement optimal de ces équipes, une attention toute spéciale est accordée au processus d’intégration de nouvelles recrues, aux méthodes de travail ainsi qu’à la manière de faire “monter rapidement les collaborateurs en puissance au travers d’une politique active de séniorité”.

CluePoints en quelques faits et chiffres

Les origines

CluePoints a été créée en 2012 et est une émanation d’Iddi (International Drug Development Institute), société spécialisée dans les services d’analyse de données cliniques. Basée à Ottignies (Brabant wallon), Iddi est en effet ce qu’on appelle une CRO, une société de recherche contractuelle, prestant des services pour des sociétés pharmaceutiques et acteurs de la recherche médicale dans le cadre de leurs études cliniques.

Dans le courant des années 90, dans le cadre du Plan Marshall, Iddi avait bénéficié d’une subvention de la Région wallonne à l’auteur de 1,5 million d’euros. L’objectif était double:
– obtenir la validation scientifique et commerciale de la théorie de Marc Buyse, fondateur et directeur scientifique d’Iddi et qui allait être l’un des co-fondateurs de CluePoints. Théorie qui consistait à identifier des erreurs ou des fraudes dans les résultats d’études cliniques par le biais d’une analyse biostatistique)
– développer un logiciel de détection d’erreurs dans les bases de données cliniques.

François Torche (CluePoints): “Evoluer vers la génération de connaissances, de telle sorte à pouvoir anticiper des problèmes que l’on pourrait rencontrer lors d’un essai clinique.”

Les effectifs

En 2016, CluePoints n’employait encore que 30 personnes. En début d’année, elles étaient déjà 180 (dont environ 100 développeurs – majoritairement basés en Belgique, mais avec deux équipes d’une dizaine de personnes en Pologne et… en Ukraine (jusqu’ici, les développeurs ukrainiens poursuivent leur travail en dépit de la guerre – certains ont été déplacés vers Lviv, à l’ouest…).
François Torche, directeur général de la société, imagine que les effectifs de la société pourraient être de l’ordre de 400 à 500 d’ici 2025.

Le chiffre d’affaires

Très forte progression du chiffre d’affaires ces dernières années (de l’ordre de 30% par an). Il était encore de 800.000 euros en 2016. Année-charnière puisqu’un premier gros contrat avec Pfizer faisait alors bondir le chiffre à 1,5 million. Résultats récents: 14,5 millions en 2020 ; 17 millions en 2021 ; “sans doute 23 ou 24 millions” cette année. Et l’ambition d’atteindre la barre des 50 millions en 2025.
Outre Pfizer, d’autres grosses pointures pharma figurent parmi ses clients. Deux noms que CluePoints est habilitée à citer: Sanofi et Parexel.

Environ 60% du chiffre d’affaires est réalisé aux Etats-Unis. L’Europe, elle, représente 30% du total (essentiellement via les marchés français et suisse qui comptent davantage de sociétés pharmaceutiques). 5% vient du Japon.

La Chine ne fait pas encore partie du tableau mais la société est consciente du potentiel que représente ce marché. Notamment en raison de la qualité déficiente des études cliniques qui y sont conduites. Un partenariat avec un CRO chinois est en cours de négociation.

Financement

Après la subvention régionale initiale, CluePoints a bénéficié d’apports financiers venant de divers investisseurs institutionnels. A savoir: la SRIW, NivelInvest et le fonds bruxellois Theodorus (ULB).

A l’automne 2020, le fonds d’investissement américain Summit Partners entrait au capital de la société.

Regional-IT Toute l'information sur les startups et les TICs en région Wallonie-Bruxelles

Thèmes