Seize agents d'IA Claude travaillant ensemble ont créé un nouveau compilateur C.
-
Anthropic a mené une expérience ambitieuse consistant à faire développer un compilateur C par 16 agents IA du modèle Claude Opus 4.6, avec une supervision humaine limitée. En deux semaines, près de 2 000 sessions et pour environ 20 000 $ de coûts d’API, les agents ont produit un compilateur en Rust de 100 000 lignes capable de compiler un noyau Linux amorçable sur plusieurs architectures et de réussir la majorité des tests standards, ainsi que de compiler des projets majeurs comme PostgreSQL ou Doom.
Cependant, cette réussite doit être fortement nuancée. Le projet s’appuie sur un problème particulièrement adapté à l’IA (spécifications anciennes, tests existants, compilateurs de référence) et le compilateur obtenu reste inférieur à GCC en performance et en robustesse, avec de nombreuses limitations techniques. À mesure que le code s’est complexifié, les agents ont perdu en cohérence, révélant un plafond pratique autour de 100 000 lignes pour le codage agentiel autonome.
L’aspect « autonome » est également relativisé : une part considérable du travail a été humaine, notamment dans la conception de l’infrastructure, des tests, des pipelines d’intégration continue et des mécanismes de retour d’information adaptés aux faiblesses des modèles. Le coût annoncé n’inclut ni l’entraînement du modèle ni les décennies de travail humain ayant rendu les tests possibles.
En définitive, l’expérience démontre une avancée réelle et inédite dans la programmation multi-agents, tout en mettant en lumière ses limites actuelles et les risques liés au déploiement de code que personne ne comprend entièrement.
Réussir une compilation, c’est déjà très bien, mais même sans erreur et sans optimisation du code, on peut facilement produire un truc qui rame, genre galère) et qui est gourmand en ressources. Un bon compilateur, ça n’a pas de prix.