Itdaily - Nvidia lance le modèle Nemotron 3 Super pour les agents dIA

Nvidia lance le modèle Nemotron 3 Super pour les agents dIA

Nvidia lance le modèle Nemotron 3 Super pour les agents dIA
Source : Nvidia

Nvidia a lancé Nemotron 3 Super, un modèle dIA ouvert doté de 120 milliards de paramètres et dune fenêtre de contexte dun million de tokens.

Avec Nemotron 3 Super, Nvidia souhaite répondre à la demande croissante de modèles d’IA puissants pouvant être utilisés pour des systèmes agentiques avancés. Le modèle se concentre sur les applications multi-agents et est conçu pour une automatisation à grande échelle, une efficacité accrue et une précision dans les flux de travail complexes. Grâce à sa nature ouverte, les organisations peuvent librement déployer, adapter et optimiser le modèle pour leurs propres applications.

Innovations en matière darchitecture et de performances

Nemotron 3 Super utilise une architecture hybride de mélange dexperts (MoE) où seulement douze milliards des cent vingt milliards de paramètres sont actifs lors de linférence. Cela permet dobtenir un débit jusquà cinq fois plus élevé et une précision jusquà deux fois supérieure par rapport aux modèles précédents. Les couches Mamba assurent une efficacité quadruple en termes de mémoire et de puissance de calcul, tandis que les couches transformer permettent un raisonnement avancé.

De plus, Nvidia introduit la technique Latent MoE, qui permet dactiver quatre experts simultanément sans coût supplémentaire. Grâce à la prédiction multi-token, le modèle peut prédire plusieurs mots à la fois, ce qui se traduit par une inférence trois fois plus rapide. Sur la plateforme Blackwell, le modèle fonctionne en précision NVFP4, ce qui réduit la consommation de mémoire et accélère linférence jusquà quatre fois par rapport au FP8, sans perte de précision.

Applications et disponibilité

Des entreprises telles que Perplexity, CodeRabbit et Greptile intègrent Nemotron 3 Super dans leurs agents dIA pour des tâches telles que la recherche, le développement de logiciels et lanalyse scientifique. Des acteurs industriels comme Palantir et Siemens appliquent le modèle pour lautomatisation dans des secteurs tels que les télécoms, la cybersécurité et la conception de puces.

Le modèle est disponible immédiatement pour les entreprises et les développeurs via diverses plateformes cloud telles que la propre plateforme de Nvidia, Perplexity, OpenRouter, Hugging Face. Des partenaires comme Dell et HPE le proposent également. Les fournisseurs de cloud tels que Google Cloud, Oracle Cloud et bientôt Amazon Web Services et Microsoft Azure prennent également en charge le modèle.