Windows ML offre aux développeurs une nouvelle plateforme d’exécution pour le traitement local des modèles d’IA sur les appareils Windows 11.
Microsoft lance Windows ML. Il s’agit d’une nouvelle plateforme d’exécution axée sur l’inférence d’IA locale et un déploiement simplifié des modèles sur les appareils Windows 11. Cette technologie fait partie de Windows AI Foundry et est conçue pour permettre au code d’utiliser de manière optimale le matériel client disponible, tel que les CPU, GPU et NPU. Cela est particulièrement pertinent, étant donné que le NPU léger dans les ordinateurs Windows 11 d’aujourd’hui n’a que peu de tâches à accomplir.
Une plateforme unique pour tout le matériel
Windows ML prend en charge une large gamme de matériel Windows, allant des ordinateurs portables d’entrée de gamme et des PC Copilot+ aux systèmes de stations de travail vraiment puissants conçus pour l’IA. Les développeurs peuvent exécuter des modèles sur le matériel le plus approprié pour leur charge de travail. Par exemple, un NPU est efficace pour le traitement économe en énergie des charges de travail d’IA légères et optimisées. Les GPU offrent plus de puissance de calcul, tandis que les CPU assurent flexibilité et large compatibilité.
La plateforme est basée sur ONNX Runtime (ORT) et utilise les API ORT existantes. Grâce à ce choix, les développeurs peuvent utiliser les modèles et les flux de travail existants sans avoir à tout reconstruire.

Le système optimise les charges de travail en fonction des puces présentes via des Execution Providers (EP), développés en collaboration avec des partenaires matériels tels qu’AMD, Intel, NVIDIA et Qualcomm. Cela leur évite d’avoir à créer des versions séparées pour différentes configurations matérielles.
Couche API
Windows ML fournit une couche API unifiée à deux niveaux : une couche ML de haut niveau avec des outils pour la gestion du runtime et une couche inférieure qui donne un accès direct aux API ONNX Runtime. Cela permet à la fois une intégration simple et un contrôle détaillé.
L’AI Toolkit pour Visual Studio Code aide les développeurs avec la conversion de modèles, l’optimisation, la quantification et le profilage. Windows ML prend en charge la compilation de modèles préalable sur l’appareil (AOT), permettant aux applications de démarrer plus rapidement et de fonctionner plus efficacement.
Selon Microsoft, les modèles sur Windows ML fonctionnent jusqu’à 20 % mieux que sur d’autres formats de modèles. De plus, la plateforme assure la compatibilité entre les différentes versions de Windows.
Étape importante
L’introduction de Windows ML est une étape importante vers le déploiement de l’IA sur les ordinateurs portables. Bien que les fabricants d’ordinateurs portables, y compris Microsoft, parlent de PC IA depuis plus d’un an, il n’y a pas encore beaucoup d’applications basées sur l’IA disponibles. Ce runtime facilitera certainement l’utilisation efficace du NPU intégré, en plus des autres composants présents.
Windows ML est maintenant disponible en préversion publique pour tous les appareils Windows 11 dans le monde. Les développeurs peuvent commencer immédiatement via Microsoft Learn et l’AI Dev Gallery.