IBM étend sa famille de modèles Granite 4.0 avec de nouveaux modèles de langage plus petits appelés Granite 4.0 Nano.
IBM annonce le lancement de Granite 4.0 Nano. Ces nouveaux modèles de langage plus petits font partie des modèles
Quatre nouveaux modèles Nano
La série Granite 4.0 Nano comprend quatre modèles de langage : deux modèles à architecture hybride et deux versions de transformateurs traditionnels. Les variantes hybrides sont Granite 4.0 H 1B (avec environ 1,5 milliard de paramètres) et Granite 4.0 H 350M (avec environ 350 millions de paramètres).
Ces modèles utilisent une architecture basée sur un SSM hybride. En outre, des alternatives classiques de type transformateur sont disponibles avec une taille de paramètres similaire, destinées à assurer la compatibilité avec les frameworks existants où le support des architectures hybrides est encore limité.
lire aussi
IBM lance Granite 4.0 : modèles de langage hybrides avec certification ISO
Les modèles sont optimisés pour une utilisation dans des environnements de périphérie et sur des appareils, où la puissance de calcul et la mémoire sont souvent limitées. IBM vise ainsi les développeurs qui ont besoin de modèles efficaces sans compromettre la fonctionnalité.
Licence Apache 2.0 et certification
Comme les modèles Granite 4.0 précédents, ces variantes Nano sont également publiées sous licence Apache 2.0. Elles sont compatibles avec les runtimes AI populaires tels que vLLM, llama.cpp et MLX. Les modèles ont été entraînés avec plus de 15 billions de tokens et utilisent les mêmes méthodologies d’entraînement que les modèles Granite plus grands.
Tous les modèles Granite 4.0 Nano portent la certification ISO 42001 pour une gestion responsable des modèles. IBM souligne ainsi l’importance de la transparence et du développement responsable dans son offre d’IA.
Par rapport à d’autres petits modèles de langage de Google, Alibaba et LiquidAI, entre autres, les modèles Granite 4.0 Nano montrent, selon IBM, de fortes performances sur les benchmarks de connaissances générales, de mathématiques, de programmation et de sécurité. Ils obtiennent également de meilleurs résultats que des modèles similaires de leur catégorie de poids pour des tâches importantes dans les flux de travail orientés agent, telles que le suivi d’instructions et les appels d’outils.
Plus d’informations et de détails techniques sont disponibles via Hugging Face, où les modèles peuvent être consultés librement. IBM prévoit d’autres extensions au sein de la famille Granite 4.0 à l’avenir.
