Nvidia présente Rubin CPX : un nouveau type d’accélérateur pour l’inférence complexe

Michaël Aussems

Avec Rubin CPX, Nvidia dévoile un nouveau GPU, conçu sur mesure pour les tâches d’inférence où un contexte important et donc le traitement de nombreux tokens sont essentiels.

Nvidia présente Rubin CPX. Selon le fabricant lui-même, il s’agit d’une nouvelle classe de GPU. La puce est développée sur mesure pour les tâches d’inférence où un contexte étendu est important.

Le contexte fait référence au nombre de paramètres pertinents pour une tâche d’inférence (la génération d’une réponse d’IA). Les charges de travail complexes telles que la génération de vidéos nécessitent un contexte important et le traitement rapide d’énormes quantités de tokens (fragments de données d’IA). La génération d’une heure de vidéo qualitative coûte par exemple un million de tokens. Avec Rubin CPX, Nvidia met sur le marché une puce spécialisée dans ce type d’inférence avec des exigences de contexte massives.

La puce fournit jusqu’à 30 pétaflops de puissance de calcul d’IA, bien que Nvidia calcule avec son propre type de données NVFP4, ce qui rend ce chiffre plutôt arbitraire. La puce dispose de 128 Go de mémoire GDDR7 à bord. Nvidia ne choisit pas HBM car GDDR7 est plus rentable et suffisant pour l’inférence.

Plateforme totale

Nvidia combine la puce Rubin CPX avec des CPU Vera et des GPU Rubin dans la plateforme Nvidia Vera Rubin NVL144 CPX. Il s’agit d’une solution intégrée offrant huit exaflops de calcul d’IA (NVFP4 propre à Nvidia). L’accélérateur est compatible avec la pile logicielle d’IA propre à Nvidia.

Nvidia vise les grands clients (et un chiffre d’affaires élevé) avec cette solution. L’entreprise souligne que chaque investissement de cent millions de dollars dans les systèmes Rubin CPX peut générer cinq milliards de dollars de revenus basés sur les tokens. Ce calcul quelque peu arbitraire montre bien l’échelle que Nvidia a en tête. Nvidia Rubin CPX devrait être effectivement disponible sur le marché fin 2026.

en avant

Comment continuer à utiliser Windows 10 gratuitement et en toute sécurité après le 14 octobre

.logiciel
08.10.'25
5 min

récemment dans centre de données

La Chine fait couler un centre de données au fond de la mer

.centre de données
30.10.'25
3 min

Nvidia lance BlueField-4-DPU

.centre de données
29.10.'25
2 min

Info partenaire

Durable, intelligent et puissant : le modèle pour l’AI Factory belge

.centre de données
29.10.'25
6 min

plus centre de données

sol

« * » indique les champs nécessaires

table ronde

NIS2 2025

.sécurité
06.10.'25
5 min

Cloud 2025

.cloud
07.07.'25
5 min

plus de tables rondes

événements

Digital Identity & Trust Conference

05/11/2025
Mechelen

Nutanix NEXT on tour

25/11/2025

SAS Innovate on tour 2025

31/07/2025

plus d'events

Itdaily - Nvidia présente Rubin CPX : un nouveau type d’accélérateur pour l’inférence complexe

Plateforme totale