Trinity-Large-Thinking : le modèle open-source qui défie Claude Opus

5 min de lecture · The Decoder · Jonathan Kemper · 12 avr. 2026 IA générative 9/10 Élevé

Arcee AI a investi la moitié de son capital-risque (20M$) pour développer Trinity-Large-Thinking, un modèle open-source de raisonnement de 400B paramètres rivalisant avec Claude Opus. Spécialisé dans les tâches d'agents, il atteint 88 sur Tau2-Airline mais accuse un retard en raisonnement général (76.3 vs 89.2 pour Opus).

Que faut-il retenir ?

Trinity-Large-Thinking utilise 400 milliards de paramètres mais seulement 13 milliards actifs par token grâce à une architecture mixture-of-experts (4 experts actifs parmi 256).
Le modèle a été entraîné sur 2048 GPU Nvidia B300 pendant 33 jours pour un coût de 20 millions de dollars.
Performances clés : 91.9 sur PinchBench (vs 93.3 pour Claude Opus 4.6) et 0.976 au test Needle-in-a-Haystack avec un contexte de 512K tokens.
La méthode SMEBU a résolu l'effondrement des experts lors de l'entraînement, stabilisant le processus sur 17 trillions de tokens.

Pourquoi cette nouvelle compte-t-elle ?

Ce modèle open-source concurrence directement Claude Opus dans les tâches d'agents autonomes, un marché en pleine expansion. Son architecture optimisée (13B paramètres actifs/400B) et sa licence Apache 2.0 en font une alternative viable pour les entreprises cherchant à éviter les solutions propriétaires. Les performances en planification multi-étapes (96.3 sur AIME25) ouvrent des possibilités concrètes pour l'automatisation complexe.

Public concerné : développeurs, entreprises

Comment Trinity-Large-Thinking réduit-il ses coûts de calcul malgré ses 400 milliards de paramètres ?

Grâce à son architecture mixture-of-experts : seulement 4 sous-réseaux (13 milliards de paramètres) sont activés par token, réduisant la puissance nécessaire tout en conservant la capacité globale du modèle.

Voir l'article original → Lire en français

🔧 Outils mentionnés

Claude

← Retour aux actualités

Accueil

Outils

Annuaire

Apprendre