“Data rescue”: les bonnes volontés s’uniront-elles?

Pratique
Par · 30/01/2017

Pendant les jours qui ont précédé l’entrée en fonctions de Donald Trump, la communauté californienne des chercheurs et des programmeurs/hacktivistes s’est mobilisée pour une action d’un genre un peu spécial: sauver des fichiers, contenus de sites Internet et bases de données publiques (fédérales) cruciales pour la gestion de l’environnement avant que les climato-sceptiques de la nouvelle administration américaine ne puisse commencer leur travail de sape et de déconstruction. Pour ne pas dire de destruction massive.

On sait, depuis lors, que leurs craintes n’étaient pas infondées puisque l’une des premières mesures prises par le nouveau Big Boss, sans même attendre que son équipe ministérielle puisse être à l’oeuvre, fut de faire disparaître du site de la Maison Blanche les pages consacrées au changement climatique, avant de signer des décrets ne tenant aucun compte de paramètres environnementaux (tel l’oléoduc Dakota Access).

Mais qu’ont donc fait ces chercheurs, responsables académiques et programmeurs? Ils ont organisé ce qu’on appelle un “volunteer data rescue event”.

Ils ont procédé à un gigantesque exercice de “scraping”, de récupération de données gouvernementales (open data). Exemples de fichiers et de pages Web qui ont été copiées: les pages Internet que le Département de l’Energie avait dédiées aux initiatives d’énergie solaire, des jeux de données de cette même administration de l’énergie qui comparent sources d’énergie fossile et d’énergie renouvelable, ou encore des résultats de recherche sur les piles à combustibles du National Renewable Energy Laboratory.

Pas moins de 150 sites Internet ont été identifiés comme étant potentiellement la cible de “menaces” de la nouvelle Administration et considérés comme des ressources essentielles pour les chercheurs.

“It’s typical of incoming administrations to take down some of their predecessor’s (Web)pages, but scrubbing all mentions of climate change is a clear indication of the Trump administration’s position on climate science.”

La mission de sauvetage devrait se poursuivre puisque les initiateurs sont bien décidés à “scanner les sites Internet gouvernementaux pendant les 100 premiers jours de la nouvelle Administration, afin de les comparer aux versions archivées pré-Trump en vue de dépister les changements.” Et ils communiqueront les résultats afin d’informer le public sur les changements opérés.

Ils craignent en effet que ce qui s’est passé avec le site Internet officiel de la Maison Blanche ne soit qu’un début et que d’autres systèmes ne soient “nettoyés”. Notamment la gigantesque base de données que l’Agence pour la protection de l’environnement a constitué pour surveiller la qualité de l’air. Raison de leur inquiétude, le nouveau directeur nommé par Trump à la tête de cette Agence: Scott Pruitt, climato-sceptique, défenseur de l’industrie pétrolière, qui, par le passé, a intenté des actions en justice contre cette même Agence dans l’espoir de faire annuler certaines réglementations environnementales…

Les participants à ce vaste effort de sauvetage numérique n’étaient pas n’importe qui. Voyez plutôt: des programmeurs, des spécialistes “data” de start-ups, des consultants, des étudiants en informatique, des professeurs d’universités (californiennes ou venus d’autres Etats), des scientifiques, des écologistes, des océanographes, des directeurs de laboratoire…

Données cherchent refuge

Ces masses de données ont été transvasées vers des sites, infocentres et serveurs sensés être hors de portée de l’administration américaine. Certains de ces sites, toutefois, sont sur le territoire américain – ce qui, légalement, laisse la possibilité aux autorités d’en imposer l’accès (voir une procédure d’effacement). Sans parler d’un hacking d’Etat…

Mais, pour plus de sécurité, ces maquisards des temps modernes ont pris soin de se tourner vers des infrastructures étrangères. Canadiennes et européennes, notamment.

Parmi les destinations-refuge: datarefuge.org et Page Freezer.

Et si d’autres opérateurs, neutres et/ou publics, s’engageaient? S’ils y voyaient une bonne raison d’agir – les uns, pour contribuer à sauvegarder l’humanité – car c’est bien de cela qu’il s’agit au final, bien au-delà de la sauvegarde des données ; les autres, par opportunité, pour permettre aux chercheurs de travailler sur des données aussi massives que précieuses pour leurs travaux, pour peupler ou donner une certaine masse critique aux infrastructures big data qui se montent de-ci de-là et qui, en Europe, plus que jamais, devront répondre à des contraintes de sécurisation des données.

Nous ne désignons personne en particulier mais chacun a certainement à l’esprit l’un ou l’autre acteur “droit dans ses bottes” et “bien de chez nous” qui pourrait se saisir de cette opportunité…