Présentation de la Stable Diffusion 3.5

Présentation de la Stable Diffusion 3.5

23 octobre 2024 • 08:55
PARTAGER
Futur-IA: Présentation de la Stable Diffusion 3.5

Communiqué de Stability AI:

Points clés à retenir :

  • Aujourd’hui, nous présentons Stable Diffusion 3.5. Cette version ouverte comprend plusieurs variantes de modèles, notamment Stable Diffusion 3.5 Large et Stable Diffusion 3.5 Large Turbo. De plus, Stable Diffusion 3.5 Medium sortira le 29 octobre.
  • Ces modèles sont hautement personnalisables en fonction de leur taille, fonctionnent sur du matériel grand public et sont gratuits pour une utilisation commerciale et non commerciale sous la licence communautaire permissive Stability AI.
  • Vous pouvez télécharger Stable Diffusion 3.5 Large et Stable Diffusion 3.5 Large Turbo à partir de Hugging Face et le code d’inférence sur GitHub maintenant.

Aujourd’hui, nous lançons Stable Diffusion 3.5, nos modèles les plus puissants à ce jour. Cette version ouverte comprend plusieurs variantes personnalisables, exécutées sur du matériel grand public et disponibles pour une utilisation sous la licence communautaire permissive Stability AI. Vous pouvez télécharger les modèles Stable Diffusion 3.5 Large et Stable Diffusion 3.5 Large Turbo à partir de Hugging Faceet le code d’inférence sur GitHub maintenant.

En juin, nous avons sorti Stable Diffusion 3 Medium, la première version ouverte de la série Stable Diffusion 3. Cette version n’a pas pleinement répondu à nos standards ni aux attentes de nos communautés. Après avoir écouté les précieux commentaires de la communauté, au lieu d’une solution miracle, nous avons pris le temps de développer davantage une version qui fait progresser notre mission de transformation des médias visuels.

Stable Diffusion 3.5 reflète notre engagement à donner aux constructeurs et aux créateurs des outils largement accessibles, de pointe et gratuits pour la plupart des cas d’utilisation. Nous encourageons la distribution et la monétisation du travail sur l’ensemble du pipeline, qu’il s’agisse de réglages fins, de LoRA, d’optimisations, d’applications ou d’illustrations.

Ce qui est publié

Stable Diffusion 3.5 propose une variété de modèles développés pour répondre aux besoins des chercheurs scientifiques, des amateurs, des startups et des entreprises :

  • Diffusion stable 3,5 grande: Avec 8 milliards de paramètres, avec une qualité supérieure et une adhésion rapide, ce modèle de base est le plus puissant de la famille Stable Diffusion. Ce modèle est idéal pour les cas d’utilisation professionnelle avec une résolution de 1 mégapixel.
  • Diffusion Stable 3.5 Grand Turbo : Une version distillée de Stable Diffusion 3.5 Large génère des images de haute qualité avec une adhérence rapide exceptionnelle en seulement 4 étapes, ce qui la rend considérablement plus rapide que Stable Diffusion 3.5 Large.
  • Stable Diffusion 3.5 Medium (sortie le 29 octobre) : avec 2,5 milliards de paramètres, avec une architecture MMDiT-X et des méthodes de formation améliorées, ce modèle est conçu pour fonctionner « prêt à l’emploi » sur du matériel grand public, établissant un équilibre entre qualité et facilité de personnalisation. Il est capable de générer des images d’une résolution comprise entre 0,25 et 2 mégapixels.

Développement des modèles

Lors du développement des modèles, nous avons donné la priorité à la personnalisation afin d’offrir une base flexible sur laquelle s’appuyer. Pour y parvenir, nous avons intégré la normalisation des touches de requête dans les blocs de transformateur, stabilisant ainsi le processus de formation du modèle et simplifiant les réglages et le développement ultérieurs.

Pour soutenir ce niveau de flexibilité en aval, nous avons dû faire certains compromis. Une plus grande variation dans les résultats de la même invite avec différentes graines peut se produire, ce qui est intentionnel car cela permet de préserver une base de connaissances plus large et des styles diversifiés dans les modèles de base. Cependant, des invites manquant de spécificité peuvent entraîner une incertitude accrue dans le résultat et le niveau esthétique peut varier.

Pour le modèle Medium en particulier, nous avons apporté plusieurs ajustements à l’architecture et aux protocoles de formation pour améliorer la qualité, la cohérence et les capacités de génération multi-résolution.

Là où les modèles excellent

La version Stable Diffusion 3.5 excelle dans les domaines suivants, ce qui en fait l’un des modèles d’image les plus personnalisables et les plus accessibles du marché, tout en conservant des performances de haut niveau en termes d’adhésion rapide et de qualité d’image :

  • Personnalisation : ajustez facilement le modèle pour répondre à vos besoins créatifs spécifiques ou créez des applications basées sur des flux de travail personnalisés.
  • Performances efficaces : optimisé pour fonctionner sur du matériel grand public standard sans exigences lourdes, en particulier les modèles Stable Diffusion 3.5 Medium et Stable Diffusion 3.5 Large Turbo.
  • Diverses sorties : crée des images représentatives du monde, et non d’un seul type de personne, avec des tons de peau et des caractéristiques différents, sans avoir besoin de nombreuses invites.
  • Styles polyvalents : Capable de générer un large éventail de styles et d’esthétiques comme la 3D, la photographie, la peinture, le dessin au trait et pratiquement tous les styles visuels imaginables.

De plus, notre analyse montre que Diffusion stable 3,5 grande domine le marché en termes d’adhésion rapide et rivalise avec des modèles beaucoup plus grands en termes de qualité d’image.

Diffusion Stable 3.5 Grand Turbo offre des temps d’inférence parmi les plus rapides pour sa taille, tout en restant très compétitif en termes de qualité d’image et d’adhésion rapide, même par rapport aux modèles non distillés de taille similaire

Stable Diffusion 3.5 Medium surpasse les autres modèles de taille moyenne, offrant un équilibre entre adhérence rapide et qualité d’image, ce qui en fait un premier choix pour des performances efficaces et de haute qualité.

La licence Stability AI Community en un coup d’œil

Nous sommes heureux de publier ce modèle sous notre licence communautaire permissive. Voici les éléments clés de la licence :

  • Gratuit pour un usage non commercial : les individus et les organisations peuvent utiliser le modèle gratuitement pour un usage non commercial, y compris pour la recherche scientifique.
  • Gratuit pour un usage commercial (jusqu’à 1 million de dollars de revenus annuels) : les startups, les petites et moyennes entreprises et les créateurs peuvent utiliser le modèle à des fins commerciales sans frais, à condition que leur chiffre d’affaires annuel total soit inférieur à 1 million de dollars.
  • Propriété des résultats : conservez la propriété des médias générés sans implications restrictives en matière de licence.

Pour les organisations dont le chiffre d’affaires annuel est supérieur à 1 million de dollars, veuillez nous contacter ici pour vous renseigner sur une licence d’entreprise.

Notre engagement envers la sécurité

Nous croyons en des pratiques d’IA sûres et responsables et prenons des mesures délibérées pour garantir que l’intégrité commence dès les premières étapes du développement. Cela signifie que nous avons pris et continuons de prendre des mesures raisonnables pour empêcher l’utilisation abusive de Stable Diffusion 3.5 par de mauvais acteurs. Pour plus d’informations sur notre approche en matière de sécurité, veuillez visiter notre page Sécurité stable.

PARTAGER

PARTAGER

NEWSLETTER: Recevez le meilleur de l'actu IA!

Suivez nous sur les réseaux sociaux

Outils en avant


              Vidnoz AI

Catégorie:  Vidéo

Vidnoz AI est un outil générateur de vidéos qui permet aux équipes, aux entreprises et aux utilisateurs de créer des vidéos d'IA attrayantes rapidement et à moindre coût. En éliminant le besoin de caméras, d'acteurs et de studios, Vidnoz AI permet d'économiser du temps et de l'argent. Les utilisateurs ont déclaré avoir économisé jusqu'à 80[...]


WP Dev AI

Catégorie:  Developer Tools,Outils pour développeurs

WP Dev AI permet aux utilisateurs de créer sans effort des fonctionnalités personnalisées pour les sites Web WordPress grâce au code généré par l'IA, éliminant ainsi le besoin de développeurs coûteux. Avec des instructions claires et des extraits de code accessibles à tout moment, les utilisateurs peuvent améliorer efficacement leurs sites WordPress sans expertise technique.[...]

Leonardo AI

Catégorie:  Générateur d'images,Image Generator

Libérez votre créativité avec la puissance de Leonardo Ai. Ce logiciel vous permet de créer des ressources visuelles de haute qualité pour vos projets avec une qualité, une rapidité et une cohérence de style inégalées. Il vous permet de cultiver l'originalité, offre une maîtrise simplifiée et dynamise l'innovation, ce qui en fait un outil essentiel pour diverses[...]


              Suno.ai

Catégorie:  Musique

Suno.ai est un logiciel révolutionnaire qui permet à quiconque, des chanteurs de douche aux artistes professionnels, de créer de la musique sans avoir besoin d'instruments de musique. Avec juste votre imagination, vous pouvez créer vos propres chansons sans effort. Suno.ai propose une approche unique et passionnante de la création musicale, la rendant accessible à tous.[...]

Articles populaires

Tags