Google introduit lors de l’I/O une nouvelle version de son générateur d’images Imagen 4, qui devrait offrir « plus de détails » et une « meilleure typographie ».
Imagen 4 « combine vitesse et précision pour créer des images stupéfiantes », selon Eli Collins, VP produit chez Google Deepmind, dans un billet de blog. Cette quatrième génération de générateur d’images, successeur d’Imagen 3, serait en outre plus performante en matière d’orthographe et de typographie. Imagen 4 est désormais disponible dans l’application Gemini, Whisk, Vertex AI et dans Slides, Vids, Docs et « davantage dans Workspace ».
Détails et typographie
Selon l’entreprise, le dernier modèle crée « des images stupéfiantes » avec une « clarté remarquable dans les détails fins ». Google le démontre à l’aide de quelques images d’exemple, comme la baleine ci-dessous.

De plus, Imagen 4 peut créer des images dans différents rapports d’aspect et à une résolution allant jusqu’à 2K, ce qui est encore plus adapté pour les impressions ou les présentations. Par ailleurs, Google affirme que le modèle est « considérablement plus performant en matière d’orthographe et de typographie ». Cela signifie qu’Imagen 4 peut créer beaucoup plus facilement des cartes de vœux, des affiches ou même des bandes dessinées, sans orthographe ou typographie étrange.
Imagen 4 est disponible dès aujourd’hui dans l’application Gemini, Whisk, Vertex AI et dans Slides, Vids, Docs et d’autres applications de Workspace. En outre, Google prévoit de lancer « prochainement » une variante rapide d’Imagen 4 qui serait jusqu’à 10 fois plus rapide qu’Imagen 3.