DeepSeek lance un modèle d’IA pour la génération d’images qui surpasserait les performances de DALL-E

Logo DeepSeek smartphone

La startup chinoise DeepSeek lance également un nouveau modèle d’IA pour la génération d’images : Janus-Pro-7B.

DeepSeek a récemment lancé son modèle d’IA DeepSeek R1 qui est censé égaler les performances du modèle o1 d’OpenAI. Aujourd’hui, la startup chinoise spécialisée dans l’IA annonce un nouveau modèle d’IA pour la génération d’images : Janus-Pro-7B. Selon DeepSeek, ce modèle surpasse les performances de modèles similaires tels que DALL-E 3 d’OpenAI et Stability AI’s Stable Diffusion. Le modèle est disponible en deux variantes : avec 1,5 et 7 milliards de paramètres. Pour une version de démonstration du modèle open-source, les utilisateurs peuvent visiter le site HuggingFace.

Janus Pro 7B

Le modèle Janus-Pro-7B fonctionne de la même manière que les autres modèles de génération d’images. Sur la base d’un texte, le modèle produit une image. Selon DeepSeek, le modèle offre également des capacités d’analyse d’image. Les utilisateurs peuvent ainsi ajouter une légende à l’image ou demander au modèle ce qu’il voit dans l’image.

lire aussi

Le modèle d’IA DeepSeek est-il conforme aux restrictions américaines en matière d’exportation ?

DeepSeek a utilisé un « nouveau cadre autorégressif qui unifie la compréhension et la génération multimodales », selon l’entreprise. DeepSeek affirme également que le modèle Janus est plus performant que les modèles existants, notamment DALL-E 3 d’OpenAI et Stability AI’s Stable Diffusion. Janus-Pro-7B est un modèle open-source gratuit. Vous pouvez trouver une démo du modèle d’IA sur HuggingFace.