Anthropic a mis à jour Claude Sonnet vers la version 4.6. Celle-ci disposerait de meilleures capacités de codage et de planification.
Anthropic a mis à jour son modèle Claude Sonnet vers la version 4.6. Les principales améliorations sont de meilleures performances de codage, des capacités de raisonnement renforcées et une interaction informatique améliorée.
Obtient de meilleurs résultats qu’Opus 4.6
Selon l’annonce d’Anthropic, Sonnet 4.6 est plus performant dans l’analyse financière et les flux de travail de bureau via des agents IA que le modèle Opus 4.6, plus coûteux. Dans deux des treize catégories de référence, Sonnet obtient même un score plus élevé qu’Opus. Dans d’autres tests, des modèles tels que Gemini 3 Pro et GPT-5.2 dominent, ce qui indique à quel point le domaine est compétitif.
En matière d’utilisation informatique, Sonnet 4.6 a obtenu des résultats nettement supérieurs à ceux des versions précédentes. Sur le benchmark OSWorld-Verified, le modèle a obtenu 72,5 points, contre 28,0 pour Sonnet 3.7 l’année dernière. L’écart avec les performances humaines subsiste, mais les progrès sont là.
Stabilité émotionnelle
Anthropic affirme que les améliorations n’entraînent pas d’augmentation du risque d’abus. Lors de l’utilisation de l’interface graphique, Sonnet 4.6 serait parfois moins prudent que son prédécesseur, avec un comportement parfois excessivement complaisant ou, au contraire, refusant trop rapidement. La « stabilité émotionnelle » dont fait preuve le modèle est également frappante. Lors de tests, Sonnet 4.6 a même exprimé des inquiétudes quant à sa propre fugacité. Ironiquement, c’est justifié, car avec le cycle de sortie rapide adopté par Anthropic, ce n’est probablement qu’une question de mois avant que la version 4.6 ne laisse place à un successeur.
Par défaut, Sonnet 4.6 fonctionne avec une fenêtre de contexte de 200 000 tokens. Pour certains clients sélectionnés, il existe une option bêta allant jusqu’à 1 million de tokens. Pour les utilisateurs des forfaits Free et Pro, Sonnet 4.6 est désormais le modèle par défaut au sein de claude.ai.
