Itdaily - Google présente Gemma 4 : Gemini 3 sur matériel local

Google présente Gemma 4 : Gemini 3 sur matériel local

Google présente Gemma 4 : Gemini 3 sur matériel local

Les modèles Gemma 4 permettent de faire fonctionner Gemini 3 sur son propre matériel. Google passe à un nouveau modèle de licence entièrement ouvert.

C’est via un blog que Google lance la toute dernière version du modèle Gemma. Cette version de Gemini est mise à disposition par Google pour une exécution sur matériel propre, plutôt que dans le cloud. Gemma 4 succède à Gemma 3 et repose sur Gemini 3.

La quatrième génération se décline en quatre variantes : Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) et 31B Dense. Le chiffre dans le nom fait référence au nombre de paramètres. Selon Google, chacune offre une « intelligence élevée par paramètre ». Les modèles Gemma obtiendraient de meilleurs scores aux benchmarks que des modèles contenant vingt fois plus de paramètres.

Exécuter Gemini localement

Gemma 4 diffère des modèles Gemini classiques car les utilisateurs peuvent les faire fonctionner sur leur propre matériel. Google se félicite du fait que les générations précédentes ont déjà été téléchargées 400 millions de fois. La notion de matériel propre est très large : les variantes 26B MoE et 31B Dense comptent 26 milliards et 31 milliards de paramètres. Pour faire tourner ces modèles, vous devez toujours posséder un GPU Nvidia H100 ou plus puissant.

Les modèles sont toutefois conçus pour offrir une grande efficacité et une faible latence. La variante 26B ne sollicite par défaut que 3 milliards de paramètres pour l’inférence, ce qui permet d’obtenir une vitesse de « tokens par seconde » plus élevée. La version 31B est censée offrir les performances et la précision les plus hautes. Gemma 4 prend en charge jusqu’à 140 langues et des fenêtres de contexte allant jusqu’à 128 tokens. C’est toutefois nettement moins que la version cloud, qui peut traiter jusqu’à 1 million de tokens.

Les deux autres versions de Gemma 4 sont beaucoup plus légères avec deux milliards et quatre milliards de paramètres. Ces modèles peuvent fonctionner sur un smartphone doté de composants puissants. Google utilise les modèles Gemma comme base pour Gemini Nano : une version de Gemini adaptée aux smartphones Pixel de l’entreprise. Le modèle Gemini Nano devrait également recevoir une mise à jour prochainement, a confirmé Google à Ars Technica.

Licence ouverte

Avec Gemma 4, Google modifie également sa structure de licence. Bien que Google ait toujours promu Gemma comme une alternative « ouverte » au modèle fermé Gemini, l’entreprise imposait ses propres licences aux développeurs. Ces licences soumettaient les développeurs à des conditions restrictives que Google pouvait en outre modifier unilatéralement. Les modèles Gemma 4 sont disponibles via une licence Apache 2.0.