Présentation de Stable Audio Open – Un modèle Open Source pour les échantillons audio et la conception sonore
Présentation de Stable Audio Open – Un modèle Open Source pour les échantillons audio et la conception sonore


Communiqué de Stability AI:
Points clés à retenir:
Stable Audio Open est un modèle texte-audio open source permettant de générer jusqu’à 47 secondes d’échantillons et d’effets sonores.
Les utilisateurs peuvent créer des rythmes de batterie, des riffs d’instruments, des sons ambiants, des foley et des éléments de production.
Le modèle permet des variations audio et le transfert de style d’échantillons audio.
Nous sommes ravis d’annoncer Stable Audio Open, un modèle open source optimisé pour générer de courts échantillons audio, des effets sonores et des éléments de production à l’aide d’invites textuelles. Cette version marque une étape clé dans la mesure où nous ouvrons davantage de parties de nos capacités audio génératives pour donner plus de pouvoir aux concepteurs sonores, aux musiciens et aux communautés créatives.
Qu’est-ce que Stable Audio Open ?
Stable Audio Open permet à chacun de générer jusqu’à 47 secondes de données audio de haute qualité à partir d’une simple invite de texte. Sa formation spécialisée le rend idéal pour créer des rythmes de batterie, des riffs d’instruments, des sons ambiants, des enregistrements de bruitage et d’autres échantillons audio pour la production musicale et la conception sonore.
L’un des principaux avantages de cette version open source est que les utilisateurs peuvent affiner le modèle à partir de leurs propres données audio personnalisées. Par exemple, un batteur pourrait affiner les réglages à partir d’échantillons de ses propres enregistrements de batterie pour générer de nouveaux rythmes.
En quoi est-ce différent de l’audio stable ?
Notre produit commercial Stable Audio produit des pistes complètes de haute qualité avec une structure musicale cohérente d’une durée maximale de trois minutes, ainsi que des capacités avancées telles que la génération audio-audio et des compositions musicales cohérentes en plusieurs parties.
Stable Audio Open, quant à lui, est spécialisé dans les échantillons audio, les effets sonores et les éléments de production. S’il peut générer de courts extraits musicaux, il n’est pas optimisé pour des chansons complètes, des mélodies ou des voix. Ce modèle ouvert donne un aperçu de l’IA générative pour la conception sonore tout en privilégiant le développement responsable aux côtés des communautés créatives.
Le nouveau modèle a été formé à partir de données audio provenant de Freesound et de Free Music Archive. Cela nous a permis de créer un modèle audio ouvert tout en respectant les droits des créateurs.
Commencer
Les poids du modèle Stable Audio Open sont disponibles sur Huggingface. Nous encourageons les concepteurs sonores, les musiciens, les développeurs et les passionnés d’audio à télécharger le modèle, à explorer ses capacités et à fournir des commentaires.
Bien qu’il s’agisse d’une avancée passionnante, ce n’est encore qu’un début pour des capacités de génération audio ouvertes et responsables. Nous sommes impatients de poursuivre nos recherches et de donner la priorité au développement, en collaboration avec les communautés créatives. Que l’exploration ouverte de l’audio IA commence !









