Face à face avec Hunter : le superordinateur allemand épicé par AMD

hunter
oplus_1048576

Hunter est l’un des nouveaux fleurons du paysage européen des superordinateurs. Lors d’une rencontre avec Hunter, nous mettons à contribution tant nos oreilles que nos yeux.

Se promener dans une université nous fait repenser avec nostalgie à notre propre époque étudiante. En tant que novices de première année, nous nous trompons déjà de bâtiment à l’arrivée. Les voitures de course exposées attirent l’attention, mais ce n’est pas pour cela que nous avons voyagé jusqu’à Stuttgart.

Le Höchstleistungsrechenzentrum, que nous appellerons désormais HLRS, ressemble de l’extérieur à un bâtiment universitaire ordinaire. À l’arrivée, peu de choses laissent supposer qu’il s’agit du centre national de superordinateurs d’Allemagne. Le HLRS abrite Hunter, qui a été mis en service au début de cette année.

Voitures rapides

Avant d’être autorisés à entrer dans le centre de données, après avoir été accueillis avec des collations allemandes salées et sucrées, on nous demande d’abord de prendre place dans un amphithéâtre. Instinctivement, nous nous asseyons au troisième rang pour éviter les questions difficiles du professeur, bien que cette fois-ci, ce soit le monde à l’envers. Michael Resch, qui peut placer le triple titre de professeur-docteur-ingénieur devant son nom, présente Hunter.

Hunter atteint une vitesse de calcul maximale de 48,1 PFlop/s, ce qui est deux fois plus rapide que son prédécesseur Hawk. « Le pic ne m’intéresse pas vraiment. Pour moi, c’est comme jeter une voiture d’un avion et mesurer à quelle vitesse elle tombe. C’est intéressant à savoir, mais peu utile en pratique. Nous avons 800 utilisateurs qui veulent simplement la meilleure solution ».

hunter
Hunter est opérationnel depuis le début de cette année.

« Les benchmarks se vendent bien, après tout », admet Utz-Uwe Haus, qui est assis à la table en tant que responsable des centres de recherche HPC de HPE. HPE peut se considérer comme l’entrepreneur de Hunter. « La vitesse est un facteur moteur, mais pas le seul pour être compétitif. Pour rester dans le thème automobile : donner à tout le monde la voiture la plus rapide ne résout pas les problèmes de circulation. Il faut investir dans un écosystème complet ».

Sur Instinct

Hunter est autant une vitrine pour HPE que pour AMD. Le fabricant de puces est représenté par le Directeur Architecte Solutions Jörg Roskowetz. AMD domine les classements des superordinateurs depuis plusieurs années. C’est une reconnaissance importante pour l’entreprise, qui doit toujours faire face à ses rivaux Intel et Nvidia. « Les leaders de l’industrie utilisent nos puces serveur », se vante Roskowetz.

lire aussi

AMD veut faire tomber le roi de l’IA Nvidia de son trône

L’arme secrète de Hunter réside dans les centaines de processeurs Instinct MI300A qui ont été insérés dans l’armoire informatique. « Le marché du HPC s’oriente dans une nouvelle direction, où le poids lourd se déplace du CPU vers le GPU. Cela nécessite de nouvelles architectures », déclare Resch.

N’appelez pas l’Instinct MI300A simplement un GPU. AMD préfère utiliser l’abréviation APU, pour accelerator processing unit. En effet, la puce contient non seulement des cœurs GPU, mais aussi des cœurs CPU Zen 4 connus des processeurs Epyc d’AMD.

Roskowetz : « L’avantage est que le CPU et le GPU ont accès à la même mémoire. Cela économise beaucoup de calculs et donc de l’énergie. Par heure, les centres de données d’IA consomment presque autant d’énergie que toute l’Allemagne. Les puces ne sont qu’une partie du puzzle. Si un composant fait défaut, les autres suivent ».

Roskowetz renvoie la balle à son partenaire HPE. L’architecture HPE Cray EX4000, conçue pour les superordinateurs, combine puissance de calcul, stockage et réseau en un seul package. « Il y a beaucoup de discussions aujourd’hui autour des ‘usines géantes d’IA‘. À l’avenir, elles pourront contenir jusqu’à des centaines de milliers de GPU. Cela semble beaucoup, mais l’écosystème est prêt ».

Ventilateurs bourdonnants

Il est enfin temps de commencer la visite. L’entrée dans un centre de données s’accompagne des protocoles de sécurité nécessaires. Bastian Köller, qui veille sur Hunter, demande surtout de ne rien toucher. « Ce que vous cassez est à vos frais. Si vous êtes enceinte ou portez un stimulateur cardiaque, l’entrée est à vos risques et périls ».

Deux choses frappent immédiatement en entrant dans la salle informatique. Elle semble remarquablement vide. L’ordinateur Hunter est caché au fond, à gauche nous voyons un établi et à droite des armoires de serveurs et de stockage supplémentaires. La deuxième chose qu’on ne peut pas manquer est le bourdonnement fort et incessant de la ventilation : comme si un avion était prêt à décoller. Nous avons pitié de notre guide qui mène une bataille inégale pour que sa voix surpasse les ventilateurs.

Un superordinateur comme Hunter ne ressemble pas du tout à un PC classique. La rangée d’armoires fera plutôt penser à un profane au vestiaire d’une salle de sport ou d’une piscine. Le guide ouvre une armoire au hasard. Dans chaque ‘casier’, les CPU et APU tournent 24 heures sur 24. L’équipement réseau qui relie tout est à l’arrière.

Le son dans la pièce est beaucoup plus agréable lorsque nous nous approchons de Hunter. Le système utilise un refroidissement liquide direct : une technique qui fait circuler un liquide à travers les serveurs au lieu de souffler de l’air. Plus agréable pour les serveurs, mais surtout pour l’ouïe.

Le guide nous emmène ensuite vers la partie stockage. C’est ici que le stockage à long terme des données est assuré. « Le stockage sur le système lui-même est uniquement destiné aux données en cours d’utilisation. Pour un stockage plus long, la bande offre toujours une alternative sûre et efficace, même si cela peut sembler désuet », dit le guide en sortant un rouleau de bande. « Sur un seul rouleau, nous pouvons stocker jusqu’à environ 6 To pendant plusieurs années ».

bande
Pour le stockage à long terme, la bande offre toujours une solution efficace.

Au restaurant

L’intention sous-jacente de la visite est surtout de montrer à quoi sert Hunter. HLRS ouvre le système à d’autres organisations qui n’ont pas leur propre superordinateur. Dennis Dickmann, CTO de l’entreprise d’IA Seedbox, et Tom Schneider, Directeur Général R de TRUMPF, fabricant de machines laser, sont invités en tant que clients. « Nous avons longtemps cherché le bon partenaire, jusqu’à ce que nous découvrions qu’il vivait à côté de chez nous », dit Schneider.

Le fait que HLRS, en tant qu’institut de recherche, ‘vende’ de la capacité de calcul soulève des questions critiques parmi la presse présente. Rensch pare : « Le prix que nous demandons est ce qu’il nous coûte pour offrir ce service, pas un euro de plus. Construire son propre superordinateur coûte des millions d’euros. Quand vous allez au restaurant, vous ne voulez pas non plus acheter tout le restaurant ? »

« Nous offrons aux organisations la flexibilité et le contrôle pour allumer ou éteindre notre système quand elles le souhaitent. Mais contrairement aux fournisseurs commerciaux, nous ne pouvons pas nous permettre de garantir une continuité permanente. Le client doit l’accepter », poursuit-il.

Visite de ville en 3D

HLRS est bien sûr aussi un utilisateur quotidien de l’ordinateur Hunter. Pour le démontrer, on nous conduit vers la Cave 3D : un véritable terrain de jeu pour l’amateur de réalité virtuelle. Le bourdonnement de la salle informatique peut s’estomper tranquillement, car maintenant ce sont les yeux qui sont mis à contribution. Pourquoi il y a une batterie dans la pièce reste un mystère.

Nous mettons des lunettes 3D sur notre nez et soudain nous voyons une copie virtuelle de Stuttgart. La simulation survole les sites touristiques connus comme la Fernsehturm et la Schlossplatz. Il y a bien une utilité sociale derrière cela. « Nous mettons les modèles à disposition pour, entre autres, l’urbanisme et la recherche sur l’impact du changement climatique sur l’aménagement du territoire », dit un employé qui agite avec enthousiasme son pointeur virtuel.

laboratoire 3D
Le laboratoire 3D est un terrain de jeu pour les amateurs de réalité virtuelle.

« Les jumeaux numériques sont développés en combinant des images prises par des drones, tout comme Google Earth. Parfois, nous faisons aussi appel à un partenaire externe pour les images ». Puis il est temps d’« atterrir ».

« Cette image semble désordonnée maintenant, mais avec une modélisation manuelle, nous pouvons ajouter plus de détails ». Une pression sur le bouton virtuel et soudain, c’est comme si nous marchions dans les rues de Stuttgart. « Plus il y a de détails, plus la puissance de calcul requise est importante », nous rappelle l’employé pourquoi un superordinateur tourne un étage plus haut.

Après cette première démonstration, nous sentons déjà nos yeux s’alourdir, mais ce n’est pas fini. De Stuttgart, nous passons à la région viticole le long de la rivière Neckar et de la Forêt-Noire, tandis qu’un collègue prend le relais virtuel. « En simulant les conditions météorologiques, nous pouvons prédire si ce sera une bonne récolte de vin ». Parfois, un jumeau numérique sert à établir la paix. « Une nouvelle turbine hydraulique dans la Forêt-Noire a suscité beaucoup de protestations. De cette manière, l’impact a été rendu tangible pour le public et les experts ».

Européen, mais pas souverain

HLRS se prépare pleinement pour l’avenir. Le chantier que nous voyons en arrivant sur le parking deviendra un jour un tout nouveau centre de données. Hunter ne déménagera pas. Non seulement parce que déplacer un superordinateur n’est pas évident, mais aussi parce que l’université veut avoir un successeur prêt d’ici la prochaine décennie. « Herder » doit franchir la frontière symbolique de l’exascale.

HPE se chargera à nouveau de la construction, mais Resch ne veut pas révéler qui fournira les puces. « Les négociations sont en cours. Nous n’avons peut-être pas les connaissances sur la façon de construire un tel système, mais nous savons très bien ce que nous voulons, aujourd’hui et dans cinq ans. Commander des superordinateurs est un art. Pour trouver le bon partenaire, vous devez savoir ce qui est possible, mais surtout ce qui est impossible ».

Avec Hunter et bientôt Herder, le HLRS joue un rôle stratégique important pour l’Union européenne. Resch est sceptique quant à la souveraineté. « Les politiciens agitent des millions pour développer leurs propres puces et superordinateurs, mais fournir effectivement cet argent est souvent une autre histoire. Si la meilleure solution vient d’Europe, nous la prendrons, mais l’UE ne peut pas nous y obliger ».

lire aussi

L’UE vend du vent avec sa stratégie de souveraineté numérique

« La souveraineté ne signifie pas que vous devez tout faire vous-même. Connaissez-vous un pays qui soit complètement souverain ? Le meilleur exemple que je puisse imaginer est la Chine, et leurs puces ne nous ont pas encore renversés. Le terme est historiquement né du débat sur les armes nucléaires. Nous sommes des chercheurs et nous refusons de compromettre la qualité de la recherche pour des intérêts politiques ».