L’enjeu des données “FAIR”: entre objectivité et raison garder

Hors-cadre
Par · 08/07/2022

Lutte contre les défis climatiques et environnementaux. Transition numérique, écologique, durable et servicielle des territoires. Progrès et efficience en santé. Autant d’exemples de domaines où, de plus en plus, se fait entendre une petite musique: pour y parvenir, pour développer de nouvelles solutions, il faut des données pour nourrir les chercheurs, les développements, les algorithmes. Et ces données, souvent, existent mais ne sont pas fournies par ceux qui les détiennent ou qui peuvent les créer. Qu’il s’agisse des pouvoirs publics ou des citoyens.

Lors du récent Health Tech Summit organisé par Agoria, Nick Marly, conseiller auprès du ministre de la santé Frank Vandenbroucke, rappelait par exemple l’intérêt qu’il y a pour la recherche mais aussi pour les entreprises, grandes ou petites, grands groupes pharmaceutiques comme start-ups, à disposer de données. L’“utilisation secondaire” des données de santé – celles de chacun et chacune d’entre nous – est évidemment un sujet “touchy”. Mais, soulignait-il, “nous avons besoin de données. Et il y a encore de la réticence du côté des professionnels qui ne sont d’accord de partager que certaines données. Il faut trouver le bon équilibre. C’est là une question qu’il faut résoudre d’ici deux ou trois ans. Si on y parvient, on aura réalisé un grand progrès…”

Les données, cette source indispensable de savoir pour mieux comprendre et résoudre les problèmes… “Nous sommes dans une économie d’API. Il faut des données pour créer des tableaux de bord afin que de nouveaux services [en santé] puissent voir le jour. Par exemple, dans le registre de l’aide à la décision médicale…”

 

Nick Marly (cabinet du ministre de la santé Frank Vandenbroucke): “Les principes FAIR doivent également être pratiqués dans le domaine des soins de santé.”

 

Le fait est que ces données sont peu mises à disposition ou partagées. Dans certains cas, dans certains secteurs, c’est par manque de prise de conscience de leur existence ou de leur possible existence. Un constat – et un reproche – que l’on entend souvent dans la sphère des pouvoirs locaux et des smart cities.

Dans d’autres cas, c’est par réticence, parfois d’ailleurs pleinement justifiée. Le secteur de la santé et le sujet des données médicales personnelles en sont un exemple. L’enjeu? L’activation mais aussi le balisage des conditions d’“utilisation secondaire” des données de santé. A des fins de recherche et innovation, de conduite pertinente d’une politique de santé publique, de production de modèles prédictifs, d’outils de surveillance de qualité des données…

C’est d’ailleurs là un point sur lequel le gouvernement fédéral semble vouloir faire bouger les choses. 

Lors de la même conférence Agoria, Nick Marly évoquait par exemple la nécessité de prévoir des “incitants” pour les professionnels de santé afin qu’ils partagent davantage les données de santé qu’ils récoltent et gèrent. Des données qui, bien entendu, devront être “garanties de qualité et utilisables”. Ce qui l’amenait à déclarer qu’en matière de soins de santé également, les principes FAIR doivent s’appliquer.

FAIR, c’est l’acronyme anglais de (données) “findable, accessible, interoperable, reusable”. Et là, le bât blesse. En ce compris dans le monde de la recherche. 

Dans un blog récent, Belnet, opérateur du réseau d’accès Internet pour les secteurs public, de la recherche et de l’enseignement, mettait l’accent sur les “malentendus” qui subsistent en la matière.

Des “malentendus” à combattre

Parmi les mythes, préjugés et perceptions plus ou moins erronées, on pourrait par exemple citer le degré de confidentialité des données, leur intérêt réel pour des (ré-)utilisateurs potentiels, la notion de préservation de “pouvoir” en ne partageant pas, la crainte de voir les données exploitées par des acteurs indésirables…

Belnet, en tant que relais belge de l’EOSC (European Open Science Cloud), initiative européenne pour la science ouverte et les données FAIR, veut contribuer à déconstruire ces mythes et “malentendus”. Pour ce faire, il renvoie vers des fiches d’information réalisées par le réseau danois de recherche et d’éducation DeiC (Danish e-Infrastructure Cooperation) – et publiées sous licence CC-BY-SA 4.0… donc réutilisables.

 

Parmi les mythes: données FAIR = open data. “On pense souvent que les données FAIR sont toujours des données ouvertes. Ce n’est pas le cas: les données FAIR peuvent être “fermées” sans aucun problème et, par exemple, être protégées par des brevets ou des lois sur la confidentialité. Le principe “aussi ouvert que possible, mais aussi fermé que nécessaire” est donc d’application.” Source: DeiC.

Quelques exemples…

Données non partageables ou réutilisables parce que confidentielles et/ou personnelles. Contre-argument proposé: “Les données FAIR ne sont pas forcément des données ouvertes et peuvent demeurer privées. Mais l’information au sujet (ou dérivées) de ces données devrait être partagée.”

Pas le temps de partager et/ou de rendre les données accessibles. Contre-argument: “Rendre les données FAIR est un processus graduel, où l’on progresse étape par étape. Pour en arriver à un stade où ce sera devenu une bonne pratique dans votre domaine de recherche.”

Pour un chercheur, ce qui importe avant tout, c’est d’être cité, publié et de maximiser les facteurs d’impact. Contre-argument: “Les données FAIR permettent d’améliorer l’impact de vos publications et de faire en sorte que vous receviez tout le crédit qui vous est dû.”

Je suis un chercheur, pas un gestionnaire de données. Contre-argument: “FAIR est un concept qui met en application les principes de comportement scientifique vertueux: honnêteté, transparence et responsabilité.”

Bien entendu, la décision de rendre des données accessibles, partageables, réutilisables ne peut faire l’économie d’une évaluation rigoureuse, contextualisée, encadrée. Il ne faudrait en effet pas tomber dans un excès de FAIRness

Lien vers les publications FAIR du réseau DeiC. Sur le site du DeiC, on trouve également des exemples concrets d’utilisation de données FAIR dans différents domaines.