Fédération Wallonie-Bruxelles: un superordinateur Tier-1 d’ici fin 2012

Article
Par · 03/06/2012

Un superordinateur “Tier-1”, développant une puissance approchant les 200 téraflops, pourrait être exploité par les universités, centres de recherche et entreprises wallonnes d’ici la fin 2012. Site d’accueil: le Cenaero, à Gosselies. Un cahier de charges est en phase de finalisation en vue de renforcer le supercalculateur Bull aujourd’hui en place.

A l’image de la Flandre où le consortium VSC (Vlaams Supercomputer Centrum) prépare actuellement une infrastructure Tier-1 pour les besoins des universités et hautes écoles (v. ci-dessous), la Fédération Wallonie-Bruxelles investit elle aussi dans l’implantation d’un superordinateur “Tier 1” devant bénéficier à la fois aux chercheurs universitaires, aux centres de recherche agréés (pour leurs projets de simulation numérique) et aux entreprises. Ces dernières pourront donc emprunter de la puissance de calcul au nouveau Tier-1 pour le développement de produits ou services innovants.

Un grand frère pour Zénobe

Le superordinateur sera hébergé au Cenaero à Gosselies. Il sera soit le voisin du supercalculateur déjà installé, soit une extension de ce dernier.

Cenaero: “Nous sommes donc considérés comme de bons élèves parmi les centres de compétences maîtrisant les architectures hyper-parallèles.”

La décision sur l’option à suivre n’a pas encore été prise. Le Cenaero, en tout cas, dit militer pour une extension du système Bull actuel, dans la mesure où cela permettrait de mutualiser au maximum la plate-forme (unique) au bénéfice de ses divers utilisateurs. Et d’ajouter: “nous sommes dans un scénario d’extension, convaincus que la consolidation apporte plus d’opportunités que les inconvénients techniques qu’elle implique.”

Pour mémoire, le superordinateur aujourd’hui installé, baptisé Zenobe (en mémoire de Zénobe Gramme), est un système Bull qui compte 3.240 processeurs et développe une puissance de 40 Téraflops. Il est logé dans un container (technologie mobull; un container de ce type peut héberger jusqu’à 15 racks de 19” répartis en 5 rangées de 3 racks, chacune de ces dernières développant une puissance de 40 kW).

La configuration existante sera d’ailleurs bientôt complétée par quelques nœuds spécifiques, dédiés notamment “à des calculs demandant une capacité mémoire importante.” Petits détails techniques de la configuration actuelle pour les ‘techies’ parmi vous: 270 nœuds Bull B500, de type lame, logés dans 15 châssis Bullx Blade; noeuds composés de deux processeurs Intel 6-coeurs Xeon (Westmere-EP) x5675 cadencés à 3,06 GHz, disposant généralement d’une RAM de 24 Go (18 ont droit à 48 Go); système d’interconnexion Infiniband Mellanox QDR (40 Gbps) non bloquant; le tout s’appuyant sur un stockage de masse faisant cohabiter des systèmes NetApp, IBM et LSI.

L’extension Tier-1 devrait compter quelque 6.000 processeurs, de quoi porter le maillage à environ 10.000 processeurs et la puissance de crête totale à quelque 200 téraflops (impossible d’être plus précis dans l’état actuel des choses). Une puissance que plusieurs types d’utilisateurs pourront donc exploiter. La majeure partie des ressources calcul seront dédiées à des projets de recherche fondamentale, essentiellement portés par les universités. Le reste se partagera entre des projets de recherche appliquée, “typiquement par les centres de recherche agréés dont Cenaero”, et des projets industriels. La clé de répartition n’est pas pré-déterminée.

Peu d’industriels exploiteront sans doute du multi-coeur hyper-massif. Beaucoup feront plutôt de la “volumétrie”, c’est-à-dire une consommation intense de temps-machine mais, pour la plupart d’entre eux, sur des structures de modestement parallèles (du 64 coeurs est déjà du haut de gamme pour nombre d’industriels).

“Le Tier 1 n’en demeure pas moins important, notamment pour permettre aux utilisateurs des milieux académiques de se faire la main, de progresser dans leur expertise et de se tourner utilement vers l’industrie”, souligne Philippe Geuzaine, research & technology manager.

Un agenda serré

Le cahier de charges, qui pourrait être publié dès la fin juillet, est actuellement en cours de rédaction. Sa teneur exacte n’est donc pas encore finalisée et validée. Seule indication que donne à ce sujet Cenaero : “il est vraisemblable que nous suivions une approche similaire à celle de marchés précédents dans lesquels nous cherchions une puissance maximum à budget donné”, déclare Serge Bogaerts, research & technology manager. “Il semble établi cependant que nous serons sur la technologie Sandy Bridge d’Intel ou la correspondante chez AMD. La question de savoir si une technologie d’accélération (type GPU, par exemple) sera requise ou non reste encore à valider.”

Par comparaison, le superordinateur Tier-1 dont est en train de se doter le consortium flamand VSC comptera 8.448 coeurs. Fourni par HP et installé à l’université de Gand, il s’appuie sur des coeurs Intel Sandy Bridge, interconnectés via un réseau double FDR InfiniBand (débit de 14 Gbps) et devrait atteindre une puissance théorique optimale de 170 téraflops.

Cenaero espère pouvoir respecter un agenda assez serré: “si nous suivons le planning ambitieux que nous nous sommes donnés, le cahier des charges sortira au plus tard fin juillet, les offres seront attendues pour fin août et la décision prise fin septembre. Nous espérons de la sorte nous fournir l’extension encore avant la fin de l’année.” Pour une mise en exploitation également prévue avant la fin 2012.

Investissement: 4,4 millions d’euros en 3 ans, financé par la Région wallonne.

Le chaînon qui manquait

Le superordinateur Tier 1 du Cenaero est l’un des maillons du réseau HPC (high performance computing) qui se met en oeuvre en vertu du programme pan-européen PRACE (Partnership for Advanced Computing in Europe), initié voici plusieurs années en vue de permettre aux chercheurs européens d’accéder à une infrastructure de superordinateurs (Tier 1 et Tier 0) gérée comme une seule et même entité. Le maillage imaginé devrait compter environ cinq centres Tier 0, connectés à des centres nationaux ou régionaux Tier 1.

Le futur superordinateur de Gosselies s’inscrira donc dans ce registre, servant de plate-forme intermédiaire et, par la même occasion, de chaînon manquant entre les systèmes installés par exemple dans les universités (Tier 2) et l’échelon des mastodontes du calcul que sont les systèmes de Tier 0 et que seuls quelques pays ou organismes stratégiques peuvent s’autoriser. Ces architectures Tier 0 intègrent souvent des dizaines de milliers de processeurs, développent des puissances se chiffrant souvent en pétaflops et sont réservées à des applications et projets hyper-pointus. L’un des grands défis, à la fois pour les concepteurs de programmes et pour les chercheurs ou développeurs qui les exploitent, est de paralléliser les applications (pour leur permettre de tourner sur ces maillages massifs de processeurs) et de préserver les taux de performances en parallélisation.

En la matière, le Cenaero, spécialiste de la simulation numérique pour des secteurs tels l’aéronautique, est coutumier des programmes tournant simultanément sur plusieurs milliers de “coeurs”. “Nous avons l’expérience d’architectures hyper-parallèles. Nous faisons du 16.000 coeurs en garantissant un taux d’efficacité de 90%”, déclare Philippe Geuzaine, research & technology manager. “Si on veut pouvoir faire le lien entre les infrastructures HPC (high performance computing) locales et le Tier 0, il faut au moins avoir fait ses preuves et maîtriser l’exploitation de calculs simultanés sur 8.000 coeurs. Nous sommes donc considérés comme de bons élèves.