Une équipe d’agents IA construit (presque) de manière autonome un compilateur C (presque) parfaitement fonctionnel

Une équipe d’agents IA construit (presque) de manière autonome un compilateur C (presque) parfaitement fonctionnel

Des chercheurs d’Anthropic ont, à titre d’expérience, fait construire par seize agents IA un compilateur C fonctionnel, sans supervision humaine étendue.

Une équipe de seize agents IA a développé de manière autonome un compilateur C complet capable de gérer de grands projets logiciels, y compris le noyau Linux. L’expérience vise à démontrer ce dont le développement logiciel autonome avec l’IA est désormais capable, mais révèle en même temps des limites et des risques clairs.

Compilateur fonctionnel

L’expérience a été menée chez Anthropic, avec des agents IA utilisant Claude Opus 4.6. Plusieurs instances de Claude ont reçu pour instruction de travailler en parallèle sur le même projet logiciel. Les agents ont reçu une mission et ont continué à travailler de manière autonome, sans qu’un humain ne les corrige constamment.

À titre de démonstration de stress test avancée, Anthropic a demandé à des agents d’écrire un compilateur C en Rust, entièrement à partir de zéro. Ce compilateur compte finalement environ 100 000 lignes de code et peut compiler Linux 6.9 pour différentes plateformes matérielles, dont x86, ARM et RISC-V.

lire aussi

Claude Opus 4.6 détecte 500 vulnérabilités dans les logiciels open source

L’ensemble du processus a duré deux semaines, a nécessité près de 2 000 sessions d’IA distinctes et a coûté environ 20 000 dollars en puissance de calcul. Anthropic affirme qu’une équipe équivalente de programmeurs humains aurait besoin de plusieurs mois pour une mission similaire.

Défi

Selon Anthropic, le plus grand défi n’était pas d’écrire le code lui-même, mais de concevoir l’environnement autour de l’IA. De bons tests se sont avérés cruciaux. Si les tests étaient peu clairs ou incomplets, les agents résolvaient le mauvais problème. Le travail en parallèle nécessitait également une structure supplémentaire, afin que les agents ne se contredisent pas constamment.

Le résultat est fonctionnel, mais pas parfait. Le compilateur n’est pas un remplaçant à part entière des outils existants et produit un code moins efficace. Certaines parties, comme la logique de démarrage spécifique, nécessitent encore l’aide de compilateurs classiques.

(Pas de) confiance aveugle

L’expérience montre que les systèmes d’IA peuvent effectuer des tâches complexes de manière autonome. Selon Anthropic, cela ouvre de nouvelles possibilités pour le développement de logiciels, en particulier pour les projets importants et de longue durée. En même temps, l’expérience est un avertissement contre une confiance trop aveugle. Les logiciels que personne n’a entièrement vérifiés peuvent contenir des erreurs qui ne sont révélées que plus tard.

Selon le spécialiste américain de l’IA, les équipes d’agents autonomes montrent surtout où se situe la prochaine étape : non pas écrire du code plus rapidement, mais construire des systèmes qui peuvent s’améliorer de manière contrôlée.