L’OpenAI est confrontée à une pénurie de GPU lors du lancement de la GPT-4.5

entreprise chatgpt

L’OpenAI a présenté ses plans pour la GPT-4.5, mais se heurte à une pénurie de GPU.

Le lancement de GPT-4.5 était prévu depuis un certain temps, mais le PDG d’OpenAI, Sam Altman, a déclaré que le déploiement se ferait par étapes, au fur et à mesure que l’entreprise « manquera de GPU ». Les abonnés à ChatGPT Pro y auront accès en premier, suivis par les utilisateurs Plus la semaine prochaine.

Le modèle d’IA le plus cher à ce jour

GPT-4.5, sous le nom d’Orion, est le modèle le plus important et le plus coûteux d’OpenAI à ce jour. Il nécessite une énorme puissance de calcul : M. Altman parle chez X de « dizaines de milliers de GPU supplémentaires » nécessaires pour permettre un accès plus large. Le coût n’est pas négligeable : 75 dollars par million de tokens d’entrée (environ 750 000 mots) et 150 dollars par million de tokens de sortie. Les prix sont beaucoup plus élevés que ceux de GPT-4o, jusqu’à 30 fois et 15 fois plus élevés. GPT-4o coûte respectivement 2,50 $ et 10 $ pour le même nombre de jetons. OpenAI n’est même pas sûre que GPT-4.5 soit viable à long terme dans le cadre de son offre d’API.

Mieux, mais pas révolutionnaire

GPT-4.5 surpasse GPT-4o sur des compétences telles que les questions factuelles(SimpleQA) et les tâches créatives, mais est à la traîne sur les questions mathématiques et de raisonnement. Des modèles comme DeepSeek R1 et Claude 3.7 Sonnet obtiennent de meilleurs résultats dans ce domaine. Néanmoins, OpenAI affirme dans un livre blanc que GPT-4.5 est « plus chaleureux, plus naturel et meilleur dans la compréhension des intentions » que les modèles précédents.

Le plus grand défi de l’OpenAI est que les avantages de la formation traditionnelle à l’IA diminuent. L’industrie se concentre de plus en plus sur les modèles de raisonnement, qui résolvent les problèmes étape par étape plutôt que de se contenter de prédire.