Microsoft présente son premier modèle de génération d’images propriétaire MAI-Image-1

Microsoft présente son premier modèle de génération d’images propriétaire MAI-Image-1
Source : Microsoft

Microsoft introduit avec MAI-Image-1 son premier modèle texte-vers-image entièrement développé en interne. Le modèle se classe dans le top dix lors de ses débuts sur la plateforme de référence indépendante LMArena.

Microsoft dispose avec MAI-Image-1 d’un nouveau modèle texte-vers-image. Le modèle a été conçu pour générer des images moins génériques et offrir plus de diversité visuelle que de nombreuses alternatives existantes. Selon Microsoft, une attention particulière a été accordée à une sélection rigoureuse des données d’entraînement et à un processus d’évaluation basé sur des scénarios créatifs réalistes. Le modèle sera intégré notamment dans Copilot et Bing Image Creator, mais se trouve encore en phase de test.

Scènes photoréalistes

Le modèle excellerait particulièrement dans la génération de scènes photoréalistes, telles que les paysages naturels, les reflets, les effets d’éclairage et les paysages. Comparé aux modèles plus volumineux, MAI-Image-1 est selon Microsoft plus rapide à utiliser, sans compromettre la qualité. Cela permet aux utilisateurs de visualiser plus rapidement leurs idées et de les traiter plus facilement avec d’autres outils.

Intégration des services Microsoft

MAI-Image-1 fera prochainement son apparition dans les produits Microsoft existants tels que Copilot et Bing Image Creator. Le modèle peut déjà être testé via la plateforme LMArena, où il a conquis une place dans le top dix des modèles texte-vers-image lors de son lancement. Microsoft souhaite recueillir des commentaires sur les performances et la sécurité du modèle via ce canal.

Avec ce lancement, Microsoft franchit une nouvelle étape dans sa stratégie de développement de davantage de modèles d’IA propriétaires, après avoir déjà annoncé deux autres modèles précédemment. MAI-Image-1 doit notamment contribuer à des expériences plus créatives et interactives au sein de l’écosystème d’IA existant de l’entreprise.