Nvidia annonce la disponibilité du DGX Spark : un mini-ordinateur de 1,2 kilogramme qui fournit un pétaflop de puissance de calcul pour l’IA.
Nvidia met officiellement le DGX Spark en rayon. Jensen Huang a personnellement livré l’un des premiers modèles à Elon Musk et SpaceX. Avec le DGX Spark, Nvidia veut mettre la puissance d’un supercalculateur dans la paume de votre main. La mini-station de travail est équipée d’une puce Grace Blackwell personnalisée pour fournir jusqu’à 1 pétaflop de puissance de calcul d’IA locale.
Le DGX Spark est à peu près aussi grand qu’un papier origami plié et aussi épais que la couverture d’un livre, écrit Nvidia. Mais ne sous-estimez pas cette petite station de travail de 1,2 kilogramme. Au cœur de l’ordinateur se trouve une puce GB10 « rétrécie ». La puce se compose de deux matrices connectées entre elles via NVLink. Nvidia a développé la puce en collaboration avec MediaTek.
1 pétaflop
Le GB10 peut ainsi fournir jusqu’à 1 pétaflop de puissance de calcul pour les charges de travail d’IA, ce qui est suffisant pour traiter des modèles allant jusqu’à 200 milliards de paramètres. Le CPU et le GPU sont alimentés par une mémoire LPDDR5x partagée pour le réglage fin et l’inférence locaux. Ceux qui ont la chance d’avoir deux ordinateurs DGX Spark peuvent les connecter entre eux grâce à la carte réseau ConnectX intégrée afin de doubler les capacités.

Le Nvidia DGX Spark coûtera environ 3 000 dollars. La station de travail ne s’adresse donc pas au grand public, mais aux data scientists, aux chercheurs et aux ingénieurs en robotique qui recherchent une solution rentable pour exécuter des charges de travail d’IA lourdes. Pour les cartes graphiques les plus avancées de Nvidia, vous serez rapidement amené à dépenser le double.
Les partenaires fidèles de Nvidia, tels que Lenovo, HP, Dell et Gigabyte, lanceront leurs propres systèmes Spark plus tard cette semaine. Nvidia a une version DGX Station encore plus puissante en préparation. Elle sera équipée d’une puce GB300 qui peut fournir jusqu’à 20 pétaflops de puissance de calcul d’IA.
