Itdaily - Google présente Nano Banana 2 Lite et Gemini Omni Flash : « génération d’images en quatre secondes »

Google présente Nano Banana 2 Lite et Gemini Omni Flash : « génération d’images en quatre secondes »

Gemini Omni Flash
Source : Google

Google ajoute deux nouveaux modèles pour les créateurs au sein de la plateforme Gemini Enterprise Agent. Selon l’entreprise, ces modèles visent une génération d’images de meilleure qualité et plus rapide, à des prix inférieurs.

Google ajoute deux nouveaux modèles à sa plateforme Gemini Enterprise Agent : Nano Banana 2 Lite et Gemini Omni Flash. Nano Banana 2 Lite est principalement axé sur la vitesse. Selon Google, le modèle peut générer des images en seulement quatre secondes, par rapport à Nano Banana Pro et Nano Banana 2, qui promettaient déjà des vitesses élevées. Gemini Omni Flash, en revanche, se concentre sur la génération vidéo et audio haut de gamme. Les modèles prennent également en charge les données de contenu CP2A et les filigranes SynthID pour garantir l’authenticité.

Nano Banana 2 Lite

Selon Google, le nouveau modèle Nano Banana 2 Lite est « le modèle de génération et d’édition d’images le plus rapide et le plus rentable de la famille de modèles Nano Banana ». Ainsi, selon l’entreprise, Nano Banana 2 Lite peut générer une image en quatre secondes. De plus, il est possible de générer et d’itérer des concepts de design en quelques secondes.

Le modèle préserve l’identité des personnages à travers plusieurs générations rapides, ce qui est notamment utile pour les outils de storyboard ou les essais virtuels dans l’e-commerce. En outre, le modèle peut restituer du texte lisible directement dans les générations rapides, ce qui simplifie le développement de variantes publicitaires locales.

Gemini Omni Flash

Par ailleurs, Google introduit Gemini Omni Flash, un modèle permettant aux utilisateurs d’intégrer la génération et le montage vidéo directement dans leurs propres applications. Le modèle permet de changer de personnage, de rééclairer des scènes ou d’ajuster les angles de caméra via le langage naturel, tout en préservant les pistes audio et vidéo d’origine.

De plus, Gemini Omni Flash combine du texte, des images et de la vidéo en entrée, génère de l’audio natif avec chaque sortie vidéo et maintient la cohérence des personnages, des objets et du style. Gemini Omni Flash est disponible en version préliminaire publique.