Stable Audio 3.0 : l'IA générative musicale évolue
Stability AI dévoile Stable Audio 3.0, une nouvelle génération de modèles audio génératifs avec des pistes jusqu'à 6 minutes. Trois modèles sont disponibles en open weights, tandis que le plus puissant (2,7 milliards de paramètres) est réservé aux entreprises. Les données d'entraînement sont sous licence.
« Stable Audio 3.0 Small SFX and Stable Audio 3.0 Small each pack 459 million parameters and produce tracks up to two minutes long in 0.44 seconds of inference time on an H200 GPU. » — The Decoder
Que faut-il retenir ?
- Stable Audio 3.0 Small SFX et Small ont 459 millions de paramètres et génèrent des pistes de 2 minutes en 0,44 seconde.
- Stable Audio 3.0 Medium compte 1,4 milliard de paramètres et produit des pistes jusqu'à 6:20 minutes en 1,31 seconde.
- Stable Audio 3.0 Large (2,7 milliards de paramètres) est réservé aux entreprises via API ou licence.
- Les modèles Small et Medium sont disponibles en open weights sur Hugging Face.
Pourquoi cette nouvelle compte-t-elle ?
Stable Audio 3.0 représente une avancée significative pour l'industrie musicale et des effets sonores, offrant des pistes plus longues et des modèles ouverts. La licence commerciale gratuite jusqu'à 1 million de dollars de revenus facilite l'adoption par les petites entreprises. L'accent sur les données sous licence répond aux préoccupations juridiques actuelles.
2,7 milliards de paramètres pour Stable Audio 3.0 Large
Public concerné : entreprises, développeurs
Quelles sont les différences entre les modèles Stable Audio 3.0 ?
Stable Audio 3.0 Small (459M paramètres) génère des pistes de 2 minutes, Medium (1,4B) jusqu'à 6:20 minutes, et Large (2,7B) est réservé aux entreprises. Small et Medium sont en open weights, Large via API/licence.
Commentaires (0)
💡 Aucun lien externe ni code HTML accepté. Soyez respectueux. Les commentaires sont modérés avant publication.
Aucun commentaire pour le moment. Soyez le premier !