Claude Mythos surpasse GPT-5.5 en cybersécurité
Une étude de Carnegie Mellon révèle que Claude Mythos excelle dans l'exploitation de vulnérabilités du moteur V8, avec un score moyen de 9.90/16 contre 5.51 pour GPT-5.5. Le coût est cependant 12 fois plus élevé pour Mythos (36 428$ contre 3 075$).
« "the model works like a 'fairly competent browser / JS engine security researcher.'" » — The Decoder
Que faut-il retenir ?
- Claude Mythos atteint le niveau maximal (T1) sur 21 des 41 vulnérabilités testées.
- GPT-5.5 n'atteint le niveau T1 que sur 2 vulnérabilités.
- En mode autonome, Mythos obtient 9.55 points contre 4.30 pour GPT-5.5.
- Le test complet a coûté 36 428$ pour Mythos contre 3 075$ pour GPT-5.5.
Pourquoi cette nouvelle compte-t-elle ?
Ces résultats montrent que les IA génératives peuvent désormais exploiter des vulnérabilités complexes de manière autonome, ce qui pose des questions cruciales pour la cybersécurité. Les professionnels doivent anticiper cette nouvelle menace tout en évaluant le rapport coût/efficacité des différents modèles.
36 428$ pour le test complet de Claude Mythos
💬 Seunghyun Lee, Co-auteur d'ExploitBench et chercheur en sécurité
Public concerné : développeurs, entreprises
Quelles sont les implications pour la sécurité des navigateurs ?
Les IA comme Claude Mythos peuvent désormais exploiter des vulnérabilités complexes de V8 de manière autonome. Cela nécessite une vigilance accrue et des mises à jour fréquentes des moteurs JavaScript pour contrer ces nouvelles capacités offensives.
Commentaires (0)
💡 Aucun lien externe ni code HTML accepté. Soyez respectueux. Les commentaires sont modérés avant publication.
Aucun commentaire pour le moment. Soyez le premier !