Nvidia refroidit ses puces Blackwell en chauffant l’eau des piscines

Selon Lenovo, l’eau chaude est la solution idéale pour refroidir les serveurs. Avec quelques innovations astucieuses, le fabricant vise à généraliser le refroidissement par eau. Le calcul intensif (HPC) et l’IA sont les premières catégories concernées, mais à terme, tout le monde peut en bénéficier. La clé : une solution adaptée aux centres de données existants.

Le refroidissement par air des serveurs plafonne. C’est ce qu’affirme Scott Tease, vice-président de WW High-Performance Computing et AI Intelligence chez Lenovo, dans un entretien avec ITdaily lors du salon Tech World à Bellevue. « Toute énergie injectée dans un serveur le quitte en produisant de la chaleur », explique-t-il.

« Si votre serveur consomme 10 kilowatts d’énergie, il faut éliminer 10 kilowatts de chaleur », poursuit-il. « Cela se fait généralement par climatisation, mais si vous voulez vous débarrasser de 10 kW, il vous faut environ 4 kW de refroidissement. »

Pour dissiper 10 kW de chaleur, il faut environ 4 kW de refroidissement.

Scott Tease, vice-président de WW High-Performance Computing et AI Intelligence, Lenovo

Cette technique n’est pas efficace, mais elle marche. « Même les serveurs HPC d’une consommation de 25 kW peuvent être refroidis par air », admet Tease. Lenovo elle-même propose de telles solutions et les présente à Tech World. Les serveurs HPC refroidis par air sont toutefois énormes et pèsent lourd. Le poids des radiateurs joue un rôle important à cet égard.

Aujourd’hui, il est encore possible de refroidir les serveurs AI avec de l’air, mais les énormes radiateurs occupent beaucoup de place. De plus, les serveurs sont extrêmement lourds, un rack doit donc être placé sur une surface solide.

Le plafond du refroidissement par air

Les serveurs devenant de plus en plus puissants, l’option du refroidissement par air sera dépassée. » On ne peut tout simplement pas refroidir 100 kW par air », explique Tease. La solution : le refroidissement par eau.

Il est impossible de refroidir 100 kW par air.

Scott Tease, vice-président de WW High-Performance Computing et AI Intelligence, Lenovo

Et Lenovo n’est pas le seul à faire ce constat. « Dell et HP construisent également des solutions puissantes », explique Tease. « Mais leurs racks sont énormes. Ils mesurent 2,5 mètres de profondeur, ne passent pas par une porte et ne rentrent pas dans un ascenseur, et les clients doivent renforcer le sol de leur centre de données pour les installer. »

Le problème de l’accessibilité

Il faut donc refroidir les serveurs puissants d’une manière plus accessible. » Nos serveurs refroidis par eau sont également un peu plus larges et plus hauts qu’un serveur rack standard », explique Tease. Autrement dit, ils ne rentrent pas non plus dans un rack standard.

« Nous avons demandé à l’équipe d’ingénieurs de relever ce défi », poursuit-il. » Comment peut-on encore intégrer ces serveurs surdimensionnés dans un rack standard de 19 pouces ? » À Tech World, Lenovo présente la solution à ce problème.

Le châssis N1380 de Lenovo se loge dans un rack de 19 pouces et accueille des serveurs refroidis par eau et installés verticalement.

Le fabricant présente le châssis N1380. Ce grand boîtier permet aux clients de ranger verticalement des serveurs HPC. Le châssis N1380 héberge les serveurs verticalement et tient lui-même dans un rack classique de 19 pouces. Le châssis est également équipé d’unités de distribution d’énergie (PDU). Un rack peut accueillir trois boîtiers N1380. Lenovo ouvre ainsi la porte à des racks d’une capacité de plus de 100 kW, sans avoir besoin de modifier radicalement le centre de données.

L’eau chaude

Le système de refroidissement liquide Neptune fonctionne avec de l’eau non refroidie à température ambiante. « L’eau qui entre dans le serveur peut avoir une température de 45 °C », explique Tease. La température de l’eau à la sortie est d’environ 55 °C. Tease : « De cette manière, nous n’avons pas besoin de refroidir l’eau elle-même ».

Avec ces tolérances de température, le système de refroidissement liquide Neptune de sixième génération est en principe capable de rafraîchir la plupart des centres de données en Europe et aux États-Unis, sans traitement spécial de l’eau au préalable.

Lenovo peut offrir cette technologie assez unique grâce à des années de recherche. Ces recherches ont en fait débuté à l’époque d’IBM et sont basées sur les connaissances acquises dans le secteur des ordinateurs centraux. « Les premières solutions conçues aux alentours de 2010 montrent que Neptune est toujours basé sur ce principe aujourd’hui », explique Tease. « De grands tubes, un minimum de connecteurs, un faible débit et une faible pression : la solution suit toujours les mêmes principes. »

Lenovo développe Neptune entièrement en interne, en veillant à ce que l’eau dissipe la chaleur directement à partir de la puce pour une efficacité maximale. Ce serveur est équipé de deux superpuces Nvidia Blackwell, sur chacune desquelles les complexes GPU et CPU sont directement refroidis.

Lenovo développe ses serveurs refroidis par eau entièrement en interne, en commençant par la carte mère. Pour Tease, c’est la clé de l’efficacité, qui permet à son tour le refroidissement par eau chaude.

Le chauffage de la piscine

Bien entendu, les utilisateurs devront connecter le système de refroidissement par eau, mais Tease estime que cela ne pose pas de problème majeur. Lenovo a déjà beaucoup d’expérience dans l’intégration du refroidissement par eau dans les centres de données de ses clients, initialement conçus pour le refroidissement par air.

Tease espère que les clients utiliseront la chaleur résiduelle à l’avenir, par exemple pour chauffer des bâtiments. Cette idée n’est pas seulement théorique : dans son usine de Hongrie, Lenovo chauffe déjà des salles de réunion avec l’eau chaude de ses serveurs d’essai Neptune.

« Il suffit de connecter les tuyaux d’eau de Neptune aux tuyaux et de pomper l’eau vers un autre endroit », explique-t-il. « Pensez à une université, par exemple, où l’eau chaude du centre de données peut réchauffer l’eau de la piscine via un échangeur de chaleur. L’eau chaude n’est donc plus un déchet, mais peut être recyclée à des fins d’économie d’énergie. »

Faible PUE

L’intégration du refroidissement par eau lui-même permet déjà de réaliser de nombreuses économies. » Tout commence par les ventilateurs », explique Tease. « Les ventilateurs sont responsables de 10 à 15 % de la consommation d’énergie des serveurs refroidis par air. Il faut beaucoup d’énergie pour déplacer l’air ».

Les serveurs refroidis par Neptune n’ont plus besoin de ventilateurs et, comme le refroidissement par eau élimine toute la chaleur résiduelle des serveurs, le centre de données n’a pas non plus besoin d’être climatisé.

« Nous contribuons ainsi à économiser une grande quantité d’énergie », explique Tease. « Un centre de données refroidi par air a généralement une efficacité d’utilisation de l’énergie (PUE) de 1,4 ou 1,6, ce qui signifie que 40 à 60 % de l’énergie n’est pas utilisée pour les serveurs, mais pour le refroidissement. Avec Neptune, le PUE tombe en dessous de 1,1. Un PUE de 1,07 est facilement réalisable. »

Autrement dit, le refroidissement par eau permet d’économiser jusqu’à 40 % d’énergie par rapport aux mêmes charges de travail supportées par un refroidissement par air.

L’IA a accéléré l’intérêt pour le refroidissement par eau.

Scott Tease, vice-président de WW High-Performance Computing et AI Intelligence, Lenovo

« Nous avons initialement développé la technologie pour les clients HPC », explique Tease. « Mais c’est l’IA qui en sera le plus grand bénéficiaire. L’IA a vraiment accéléré l’intérêt pour le refroidissement par eau. »

Pour les entreprises aussi ?

Les chiffres que Tease vous propose semblent intéressants en dehors des charges de travail liées à l’IA et au HPC. Les serveurs plus classiques peuvent également bénéficier du refroidissement par eau. Un PUE plus faible signifie un impact environnemental plus faible et un coût d’exploitation plus bas.

« En fait, il y a plus d’intérêt que jamais », reconnaît Tease, « mais il n’est pas encore aussi fort en dehors du HPC et de l’IA ». Avec les objectifs de durabilité et les objectifs ESG, il y a plus de facteurs de motivation que jamais pour adopter le refroidissement par eau, mais nous ne voyons pas encore un grand essor dans le segment des entreprises. Pas encore, mais cela viendra. »

Un serveur sexy

À Tech World, Lenovo présente le tout nouveau SC777 : un serveur IA refroidi par eau Neptune et équipé de deux superpuces Nvidia GB200 Blackwell. Le PDG Yuanqing Yan présente le serveur avec le directeur de Nvidia, Jensen Huang, sur la scène. « Comme c’est merveilleux ! », a déclaré Huang lors de la présentation. « Pour un ingénieur, cet appareil est sexy. »

Pour un ingénieur, cet appareil est sexy.

Jensen Huang, PDG de Nvidia
Jensen Huang, PDG de Nvidia, trouve le Lenovo SC777 refroidi par eau « sexy ».

« Ce SC777 consomme 15 fois plus d’énergie que les premiers nœuds que nous avons refroidis avec Neptune il y a une quinzaine d’années », ajoute Tease. « Cela semble beaucoup, mais chaque SC777 est environ mille fois plus performant que les serveurs de l’époque. Les appareils consomment plus, mais les performances par watt se sont améliorées de manière exponentielle. »

Relativement accessible

Neptune et le châssis N1380 rendent le SC777 relativement accessible. Les clients peuvent avoir accès aux racks classiques de serveurs IA, dans un centre de données classique, grâce à Neptune. Bien sûr, cela ne veut pas dire que tout le monde peut tout à coup installer des serveurs Blackwell IA. Et puis, il y a la question du prix de ces trucs.

Tease : « Pendant longtemps, le facteur limitant le déploiement d’une puissance de calcul suffisante était le budget et le nombre de cœurs de calcul. Aujourd’hui, c’est en fait la puissance disponible. » Lenovo ne peut pas injecter plus de puissance dans le réseau. Les solutions Neptune accessibles devraient toutefois garantir que l’énergie disponible pour une organisation soit autant que possible affectée au matériel informatique et non au refroidissement.

Recette secrète

Tease est convaincu que c’est la raison pour laquelle Neptune donne un avantage à Lenovo. « D’autres fabricants peuvent probablement copier notre solution, s’ils le veulent vraiment », soupçonne-t-il. « Mais cela ne signifie pas qu’ils ont notre expérience en matière de conversion des centres de données classiques au refroidissement par eau. Cette expérience est notre recette secrète. »

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.