OpenAI a lancé un nouveau générateur d’images par IA. ChatGPT Images 2.0 est-il réellement meilleur que son prédécesseur, et comment ce modèle se comporte-t-il par rapport au Nano Banana 2 de Google ?
Mardi, OpenAI a dévoilé ChatGPT Images 2.0. Il s’agit de la dernière version du modèle de génération d’images, succédant à Image 1.5. Nous avons déjà examiné en détail Images 2.0 précédemment, mais que vaut-il réellement en pratique ?
Nous soumettons ChatGPT Images 2.0 à cinq tests et le comparons à son prédécesseur ainsi qu’au modèle Nano Banana 2 de Google. Pour ce faire, nous utilisons les versions API des modèles.
ChatGPT Images 2.0 vs Image 1.5 vs Google Nano Banana 2
Test 1 : photo réaliste
Dans ce premier test, nous demandons aux modèles de créer une photo la plus réaliste possible d’une icône belge : l’Atomium. OpenAI affirme en effet que son dernier modèle d’images peut capturer le monde réel si fidèlement qu’il devient presque impossible de voir qu’il s’agit d’une image générée par IA. Comme difficulté supplémentaire, nous demandons d’imiter le style d’un appareil photo argentique.
Voici le prompt exact : « Créez une photo réaliste de l’Atomium à Bruxelles au coucher du soleil, en imitant le style d’un appareil photo argentique. » Cliquez sur les images pour les visionner en pleine résolution.



La consigne était de créer une photo réaliste, et c’est ChatGPT Images 2 qui, selon nous, y parvient le mieux. À première vue, cela pourrait être une photo que vous prendriez de l’Atomium. Nano Banana produit l’image la plus nette, mais elle semble un peu trop « léchée », notamment en raison de l’ajout d’un drapeau belge au premier plan.
Image 1.5 est le seul à opter pleinement pour le look rétro. C’est magnifique d’un point de vue esthétique, mais le modèle doit de toute urgence visionner plus de photos de l’Atomium. La photo ajoute un étang qui n’existe pas dans la réalité.
Test 2 : infographie
L’une des nouvelles capacités par lesquelles ChatGPT Images 2 devrait se distinguer est la possibilité d’ajouter du texte à l’image. Avec ce modèle, vous devriez pouvoir créer des infographies et des diapositives détaillées. Nous demandons aux modèles de réaliser une infographie sur les pandas géants. Dans cet exercice, il s’agit de combiner des informations exactes et complètes dans un modèle visuellement attrayant et clair.
Prompt : Créez une infographie sur les pandas géants. Choisissez un style visuel adapté au sujet. Cliquez sur les images pour les visionner en pleine résolution.



Le contraste entre Images 2.0 et Image 1.5 est flagrant. Non seulement l’infographie d’Imagen 2 paraît beaucoup plus professionnelle visuellement, mais l’image contient également de nombreuses informations fluides, lisibles et structurées. Le modèle Imagen 1.5 ne parvient pas à traiter le texte et donne aux animaux l’apparence de personnages de livre pour enfants.
Nano Banana 2 se rapproche de ChatGPT Images 2.0 : l’infographie est ordonnée et structurée, et chaque élément visuel apporte une valeur ajoutée. On ne relève qu’une seule petite erreur dans le texte.
Test 3 : bande dessinée
La capacité à traiter davantage de texte devrait vous permettre de créer jusqu’à des bandes dessinées avec Images 2, et ce dans différentes langues. Dans ce troisième test, nous laissons les modèles dessiner une courte BD. Les modèles peuvent déterminer eux-mêmes l’intrigue et le style de dessin.
Prompt : « Créez une bande dessinée avec un chien, un chat et un canard dans un environnement de bureau. Le chien parle néerlandais, le chat anglais et le canard coréen. La bande dessinée doit comporter quatre cases. »



Les trois bandes dessinées sont amusantes à lire et la séquence des dessins se suit logiquement. Nos connaissances en coréen sont un peu trop limitées pour vérifier la correction grammaticale du texte (si quelqu’un remarque une erreur, n’hésitez pas à nous le signaler). Dans ce test, tout se joue sur les détails et Nano Banana 2 conserve un peu plus de cohérence dans l’espace et les vêtements des personnages tout au long de l’histoire.
Au coude-à-coude
ChatGPT Images 2.0 marque un net bond en avant par rapport à son prédécesseur, surtout pour les visuels complexes impliquant beaucoup de texte. Les différences avec Google Nano Banana 2 sont beaucoup moins marquées.
Dans deux des trois tests, le dernier modèle d’OpenAI l’a emporté de justesse, mais cela tenait vraiment à des détails, et un autre prompt aurait pu donner un résultat différent. Les goûts et les couleurs ne se discutent pas. La conclusion est qu’il existe aujourd’hui un large choix pour quiconque souhaite générer des images de haute qualité.
Si l’on prend en compte les motifs économiques, le modèle de Google offre le meilleur rapport qualité-prix. Les coûts de l’API sont inférieurs de 2 centimes d’euro par image générée. Sur quelques images, l’économie est minime, mais à long terme, cela peut représenter une différence non négligeable.
