Selon Intel, Microsoft voudrait bientôt exécuter localement certaines parties de Copilot sur votre PC. Mais, les exigences minimales pour ce faire sont plus élevées que ce qu’Intel peut actuellement offrir.
Bientôt, Microsoft prévoit exécuter son Copilot IA partiellement localement. C’est ce que confirme Intel à Tom’s Hardware pendant l’« AI summit ». Microsoft Copilot est un assistant génératif basé sur le même modèle GPT que ChatGPT d’OpenAI. Copilot vous aide dans toutes sortes de tâches quotidiennes, telles que la recherche d’actions dans les e-mails ou la préparation de PowerPoints. Pour l’instant, cependant, toutes les requêtes adressées à Copilot doivent passer par le cloud, car la puissance de traitement nécessaire à l’inférence n’est disponible qu’à cet endroit.
Inférence locale
Il faut du temps, de la capacité de réseau et de la puissance de calcul dans le centre de données. De plus, des données potentiellement confidentielles sont transférées, et les clients sont parfois sceptiques à cet égard. La solution consiste à exécuter Copilot localement, au moins pour les tâches un peu plus légères. C’est possible, tant que le matériel local dispose d’une puissance de calcul suffisante pour traiter efficacement de telles tâches d’inférence.
Intel donne même un chiffre : Microsoft veut 40 TOPS de puissance de calcul NPU. Ce même chiffre avait déjà été avancé par Trendforce et nous l’avons également vu passer sur des diapositives de HP. Curieusement, Microsoft lui-même choisit de rester vague à ce sujet pour le moment et ne confirmera pas ou ne niera pas les 40 TOPS à la rédaction. Heureusement, on a Intel pour cette tâche.
Un minimum pour l’avenir
40 TOPS (« Tera Operations per Second ») indique la puissance d’IA dans un NPU. Pour le moment, aucun ordinateur équipé d’un simple processeur ne dispose de suffisamment de TOPS. Les NPU intégrées aux processeurs Intel et AMD ont un maximum de dix et seize TOPS, respectivement. Autrement dit, Copilot ne peut pas fonctionner localement sur la génération actuelle de PC IA selon les chiffres de Microsoft, qui ont été confirmés par tout le monde, sauf Microsoft.
Intel espère atteindre la limite minimale des performances de Copilot avec la prochaine génération de puces avant la fin de l’année. AMD aussi sait sans doute très bien quelles sont les exigences et il serait étonnant si les nouvelles puces Ryzen n’atteignent pas la limite minimale.
Les projets de Microsoft montrent la voie que prend l’IA. Le plan est de rendre le Copilot omniprésent, à l’aide d’un matériel local. En réalité, Intel essaie de vendre à Nvidia et AMD : aujourd’hui, seuls les ordinateurs équipés d’un GPU discret sont livrés avec les TOPS nécessaires.