Muse Spark est le tout dernier modèle d’IA multimodale de Meta, censé constituer une première étape vers une « superintelligence personnelle ».
Meta introduit Muse Spark, un nouveau modèle d’IA qui combine l’entrée multimodale, le raisonnement et les flux de travail basés sur des agents dans un système unique. Le modèle est disponible via meta.ai et marque, selon l’entreprise, une première étape vers ce qu’elle appelle la « superintelligence personnelle ».
IA multimodale avec agents et outils
Muse Spark est conçu pour traiter simultanément du texte, des images et des outils. Le modèle peut raisonner sur des entrées visuelles, utiliser des outils externes et faire collaborer plusieurs agents d’IA en même temps. Grâce au nouveau « Contemplating mode », différents agents sont déployés simultanément pour résoudre des problèmes complexes. Cela devrait permettre d’obtenir de meilleures performances sans latence excessive.
Selon Meta, le modèle obtient de bons résultats lors des tests de référence pour le raisonnement et les tâches scientifiques, mais des efforts restent nécessaires pour les flux de travail longs et complexes ainsi que pour le codage.
Axé sur les applications personnelles
Meta positionne Muse Spark comme un assistant proche de l’utilisateur. Le modèle peut, par exemple, aider pour des questions de santé, analyser des problèmes visuels ou créer des applications interactives telles que de petites applications web ou des jeux.
Pour les fonctionnalités liées à la santé, Meta a collaboré avec plus de 1 000 médecins afin d’améliorer la qualité des réponses. L’entreprise souhaite ainsi offrir des perspectives plus fiables et plus contextuelles.
Nouvelle pile technologique d’IA
L’entreprise a retravaillé l’intégralité de sa pile d’IA, de l’entraînement à l’infrastructure, afin de pouvoir monter en charge plus efficacement. Selon Meta, le modèle peut atteindre des performances comparables avec nettement moins de puissance de calcul que les systèmes précédents.
En outre, l’apprentissage par renforcement et le raisonnement au moment du test (test-time reasoning) jouent un rôle plus important, le modèle apprenant à réfléchir plus efficacement et à utiliser moins de jetons sans perdre en précision. Meta souligne que Muse Spark a fait l’objet de tests de sécurité approfondis, notamment sur des thèmes sensibles tels que la biologie et la cybersécurité. Le modèle ne présenterait aucune capacité autonome dangereuse et reste dans des limites sûres selon les évaluations internes.
