Claude Mythos surpasse GPT-5.5 en cybersécurité

4 min de lecture · The Decoder · Matthias Bastian · 16 mai 2026 IA générative 8/10 Élevé

Une étude de Carnegie Mellon révèle que Claude Mythos excelle dans l'exploitation de vulnérabilités du moteur V8, avec un score moyen de 9.90/16 contre 5.51 pour GPT-5.5. Le coût est cependant 12 fois plus élevé pour Mythos (36 428$ contre 3 075$).

« "the model works like a 'fairly competent browser / JS engine security researcher.'" » — The Decoder

Que faut-il retenir ?

Claude Mythos atteint le niveau maximal (T1) sur 21 des 41 vulnérabilités testées.
GPT-5.5 n'atteint le niveau T1 que sur 2 vulnérabilités.
En mode autonome, Mythos obtient 9.55 points contre 4.30 pour GPT-5.5.
Le test complet a coûté 36 428$ pour Mythos contre 3 075$ pour GPT-5.5.

Pourquoi cette nouvelle compte-t-elle ?

Ces résultats montrent que les IA génératives peuvent désormais exploiter des vulnérabilités complexes de manière autonome, ce qui pose des questions cruciales pour la cybersécurité. Les professionnels doivent anticiper cette nouvelle menace tout en évaluant le rapport coût/efficacité des différents modèles.

36 428$ pour le test complet de Claude Mythos

💬 Seunghyun Lee, Co-auteur d'ExploitBench et chercheur en sécurité

Public concerné : développeurs, entreprises

Quelles sont les implications pour la sécurité des navigateurs ?

Les IA comme Claude Mythos peuvent désormais exploiter des vulnérabilités complexes de V8 de manière autonome. Cela nécessite une vigilance accrue et des mises à jour fréquentes des moteurs JavaScript pour contrer ces nouvelles capacités offensives.

Voir l'article original → Lire en français

🔧 Outils mentionnés

Claude

← Retour aux actualités

Accueil

Outils

Annuaire

Apprendre