Le supercalculateur Zenobe passera la main d’ici un an

Article
Par · 17/06/2020

L’une des “racks” du supercalculateur “Zenobe” du Cenaero.

D’ici un peu plus d’un an, le supercalculateur Tier-1 “Zenobe” qu’opère le Cenaero (centre de recherche en aéronatuique) à Gosselies et qui dessert les communautés académiques et industrielles belges francophones prendra sa retraite. Après sept ans d’activités et quelques mises à jour (pour le doper et l’aligner sur les technologies), il était en effet arrivé en “fin de vie”, dépassé par l’évolution de ces technologies mais aussi et sans doute surtout par les besoins de ses utilisateurs.

Voici déjà plus de deux ans que le dossier de son renouvellement ou de son extension était sur la table, en attente d’une décision gouvernementale. Celle-ci a finalement été entérinée et chiffrée ces dernières semaines: un budget de 10 millions d’euros est alloué pour le “post-Zenobe”. Un budget qui couvrira à la fois l’achat du nouveau super-système et l’aménagement des lieux appelés à l’héberger.

Jusqu’ici Zenobe avait élu domicile dans un container installé sur le terrain occupé par le Cenaero à Gosselies. Son successeur sera hébergé dans le bâtiment A6K-E6K, le centre de formation et d’entreprise dédié aux sciences de l’ingénieur, situé au coeur de Charleroi, à proximité immédiate de la gare de Charleroi-Sud.

Un successeur survitaminé

Le profil technique précis du futur super-calculateur de Belgique francophone n’est pas encore connu. Le cahier des charges doit en effet encore être défini. “Nous sommes actuellement en phase de réflexion et de mise à jour des specs que nous avions imaginées voici déjà environ deux ans”, explique Philippe Geuzaine, directeur du Cenaero. “Il est en effet nécessaire d’adapter le scénario en fonction de l’évolution qu’ont connue et que laissent présager les dernières technologies. Des contacts pris avec les différents fournisseurs potentiels se dégagera le profil définitif.”

Une chose est sûre néanmoins: le futur super-calculateur inclura une bonne dose de GPU et d’accélérateurs de calcul afin de faire face aux exigences nouvelles. En ce compris les contraintes de projets et calculs IA (intelligence artificielle).

“Les mondes du HPC [High Performance Computing] et de l’IA se rapprochent fortement et finiront par se confondre. L’ambition avec ce futur supercalculateur est de répondre aux besoins et contraintes de ces deux communautés qui, à terme, n’en formeront plus qu’une seule.”

 

Philippe Geuzaine (Cenaero): “Le potentiel du futur supercalculateur sera nettement accéléré par rapport à l’infrastructure actuelle. En termes de puissance de crête, les CPU continueront d’assurer la majorité de la puissance en Flops. Le reste reposera sur des GPU.”

 

Zenobe ayant fait son temps, les responsables du Cenaero, se faisant la voix des utilisateurs finaux de la structure de calcul, ont milité pour décrocher un financement qui soit suffisant pour financer un système qui demeure pertinent et puisse résister à l’usure (technologique) du temps. “Plutôt que de procéder par extension ou renouvellement partiel, il fallait absolument se doter d’un système homogène, permettant aux demandes lourdes et complexes en calculs d’utiliser la totalité de la machine. Chose qui est plus difficile à réaliser avec le Zenobe actuel, compte tenu du fait qu’il se compose de deux types de noeuds.”

Cela ne veut pas dire pour autant que l’infrastructure et le potentiel technologique de la plate-forme de supercalcul local soient gelés pour le long terme. Il serait par exemple tout-à-fait possible, aux yeux de Philippe Geuzaine, d’opérer avec ce supercalculateur “homogène et stable” et de lui “apporter, d’ici trois ans par exemple, de petits compléments, éventuellement via des acquisitions au niveau de la couche Tier-2”, à savoir l’“étage” des gros serveurs du CECI, le Consortium des Equipements pour le Calcul Intensif qui réunit les universités francophones (UCLouvain, ULB, ULiège, UMons, UNamur).

“A ce niveau Tier-2, de nouveaux investissements pourraient être faits pour mettre en place une technologie qu’il serait intéressant de déployer.

Cela permettrait de déployer une approche autorisant un accès prospectif aux technologies qui commencent à émerger. Les utilisateurs les plus en pointe pourraient ainsi continuer à utiliser et à faire évoluer leurs outils et applications”, servant en quelque sorte de bêta-testeurs au bénéfice de l’ensemble de la communauté et de l’évolution future au niveau Tier-1.

Certaines de ces communautés, par exemple celle de la recherche en sciences des matériaux,  serviront donc de tête de pont et de garde avancée pour la maîtrise des nouvelles architectures. “L’avantage d’une communauté telle celle des sciences des matériaux est d’utiliser des logiciels open source qui peuvent donc s’appuyer sur une vaste communauté de développeurs, qui ont les ressources pour porter rapidement les outils vers les nouvelles infrastructures GPU. Une fois que l’outil est porté, ces communautés peuvent basculer applications et projets sur les nouvelles architectures.”

Bulle d’oxygène pour chercheurs et industriels

Si les caractéristiques précises du futur supercalculateur Tier-1 ne sont donc pas encore connues, voici néanmoins une petite indication sur la puissance que devrait déployer la “super-bécane” du Cenaero: une puissance effective minimale qui, selon les évaluations actuelles, devrait être de 2,3 pétaflops [assurée majoritairement par des CPU mais avec une grosse présence de GPU] et une volumétrie de stockage de minimum 5 pebi-byte (soit l’équivalent de 5,65 pétaoctets). Avec connectivité externe (voir plus loin) en 10 Gbps.

Qui pourra profiter de toute cette puissance? Aux termes de la convention qui a été définie depuis déjà quelques années, la clé de répartition actuelle des cycles-système octroie une part assez significative du potentiel au monde de la recherche académique: “les communautés de recherche consomment plus de 60% des cycles-système, poussant certaines années à 70 ou 75%”, indique Philippe Geuzaine. 

 

Cabinet de Willy Borsus: “La simulation à haute performance est devenue un outil fondamental pour la compétitivité et la capacité d’innovation de nos entreprises, industrielles et de services, et centres de recherche. Outre le besoin pour la communauté académique de disposer d’un outil performant dans le domaine de la simulation numérique, la demande industrielle est elle aussi importante dans des domaines tels que l’aéronautique, le verre, le biomédical. La demande se fait également sentir du côté des PME faisant de la consultante avancée ou encore de grandes entreprises étrangères.”

 

Les finalités applicatives et industrielles (au sens large, incluant donc aussi entreprises et PME) semblent donc devoir se “contenter” de 40% mais ce serait oublier qu’une “importante partie des recherches académiques concernent elles-mêmes des applications industrielles. Les besoins de l’industrie sont donc déjà fortement rencontrés aujourd’hui et le seront encore tout autant, sinon plus, demain…”

Si besoin est, la gouvernance et la répartition seront “ajustées”. Chose qui s’est déjà produit par le passé: “en fonction des besoins, nous avons ajusté la cible. Le but, tout compte fait, est de faire en sorte que la machine soit utilisée au maximum.

Depuis 2015, nous avons appliqué le principe du “fair share”, sur base annuelle. Quand une catégorie d’utilisateurs a atteint ou dépassé le taux qui lui est octroyé pour l’année, il n’est plus considéré comme prioritaire.

Ce schéma a été aménagé en étroite concertation avec les responsables du CECI. La coopération sera encore renforcée avec l’arrivée de la nouvelle machine.”

L’agenda

Le cahier des charges pour l’acquisition du super-calculateur devrait être publié à l’été. Avec entrée en service prévue fin du premier semestre 2021.

Zenobe, pour sa part, continuera d’opérer jusqu’à cette date et de fonctionner en parallèle, “sans doute pendant trois mois, afin de permettre une migration ordonnée de tous les utilisateurs”, souligne Philippe Geuzaine.

Précisions ici que la Belgique (niveau fédéral et les trois Régions) s’est engagée à investir à hauteur de 15 millions d’euros, minimum, dans l’édification de ce maillon de l’infrastructure pan-européenne. La Wallonie y contribuera à hauteur de 5 millions, Bruxelles de 2, la Flandre de 3 et le fédéral de 5.
Le super-ordinateur pre-exascale EuroHPC situé en Finlande aura droit au patronyme de “LUMI” et atteindra une puissance minimale de 150 péta-Flops (l’objectif visé par la Commission européenne est de… 250 Pflops).
D’autres super-calculateurs pre-exascale seront basés en Italie (“Leonardo”) et Espagne (“Mare Nostrum-V”).

L’entrée en phase opérationnelle du successeur de Zenobe coïncidera dès lors plus ou moins à l’activation de son “supra”-cousin européen, le Tier-0 hébergé en Finlande et qui constitue l’un des maillons de l’initiative EuroHPC (High Performance Computing). 

“Notre super-calculateur Tier-1 fait le lien entre les systèmes plus locaux (Tier-2), ceux du CECI notamment, et les super-calculateurs pre-exascale Tier-0 de classe mondiale que l’Europe déploie dans le cadre du programme EuroHPC”, rappelle Philippe Geuzaine.

“L’ambition de l’Europe est que ces futurs Tier-0 se hissent dans le top 5, ou en tout cas dans le top 10, des supercalculateurs de la planète.

La Belgique, et la Fédération Wallonie-Bruxelles en particulier, peut être fière d’avoir saisi cette opportunité européenne en s’insérant dans le consortium finlandais [où l’on retrouve également les Suisses].”

Pourquoi l’A6K?

“C’est un lieu qui s’est quasiment imposé de lui-même il y a environ un an. Compte tenu de l’écosystème qui s’est constitué à l’A6K-E6K [alliant acteurs de la recherche, de l’industrie et de la formation] ainsi que dans cette partie de la ville de Charleroi, le site a clairement émergé comme le lieu à choisir. Il combine de nombreux atouts et nous permet, en raison de nos propres activités à l’A6K, d’installer nos bureaux à proximité immédiate du calculateur.”

Reste évidemment à aménager les lieux en conséquence, afin qu’ils accueillent le supercalculateur avec l’efficacité environnementale et la sécurité nécessaire (les coûts sont couverts par le budget libéré par la Région). Une partie de l’aménagement sera effectué par le Cenaero, le futur fournisseur du supercalculateur intervenant sans doute dans la mise en oeuvre.

Charleroi-Transinne, même combat

Certains avaient un temps espéré voir le supercalculateur du Cenaero déménager vers des terres nettement plus éloignées que son lieu actuel d’hébergement. Notamment fans le cadre de l’édification d’une structure CGS (Collaborative Ground Segment) pour l’exploitation des données d’imagerie satellite européennes. 

Ce grand déménagement vers Transinne (ou un lieu plus proche du sud de la botte belge) n’aura donc pas lieu mais le futur supercalculateur carolo n’en devrait pas moins jouer un rôle majeur, en tant que ressource à distance, pour le traitement de ces images.

Connecter le post-Zenobe à l’infrastructure et aux équipes du Galaxia ne devrait guère poser de problème, le bâtiment de l’A6G-E6K étant à quelques mètres de la gare de Charleroi-Sud et donc des fibres optiques qui bordent le rail.

“A minima, nous disposerons de connexions à 10 Gbps”, indique Philippe Geuzaine. “Si cela s’avère insuffisant, nous verrons comment augmenter cette capacité. Le méga-cloud qu’envisage le programme EuroHPC pourrait opérer en 400 Gbps. Reste à voir si et comment cela pourrait se concrétiser…”.

Par ailleurs, ajoute Philippen Geuzaine, “l’ambition est de mettre en oeuvre un schéma d’interconnexion directe pour le stockage, permettant aux chercheurs et utilisateurs industriels de bénéficier d’une intégration totale en termes de stockage entre l’infrastructure Tier-1 et celle Tier-2 du CECI.”