OpenAI dévoile sCM, un nouveau modèle qui génère des médias vidéo 50 fois plus rapidement

OpenAI dévoile sCM, un nouveau modèle qui génère des médias vidéo 50 fois plus rapidement

30 octobre 2024 • 08:50
PARTAGER
OpenAI sCM
Futur-IA: OpenAI dévoile sCM, un nouveau modèle qui génère des médias vidéo 50 fois plus rapidement

Deux experts de l’équipe OpenAI ont développé un nouveau type de modèle de cohérence en temps continu (sCM) qui, selon eux, peut générer des médias vidéo 50 fois plus rapidement que les modèles actuellement utilisés. Cheng Lu et Yang Song ont publié un papier décrivant leur nouveau modèle sur le serveur de préimpression arXiv. Ils ont également posté un document d’introduction sur le site Internet de l’entreprise.

Dans les méthodes d’apprentissage automatique par lesquelles les applications d’IA sont formées, les modèles de diffusion, parfois appelés modèles probabilistes de diffusion ou modèles génératifs basés sur des scores, sont un type de modèle génératif variable.

De tels modèles comportent généralement trois éléments principaux : des processus directs et inverses et une procédure d’échantillonnage. Ces modèles constituent la base de la génération de produits visuels tels que des vidéos ou des images fixes, bien qu’ils aient également été utilisés avec d’autres applications, comme la génération audio.

Comme pour les autres modèles d’apprentissage automatique, les modèles de diffusion fonctionnent en échantillonnant de grandes quantités de données. La plupart de ces modèles exécutent des centaines d’étapes pour générer un produit final, c’est pourquoi la plupart d’entre eux prennent quelques instants pour effectuer leurs tâches.

À l’opposé, Lu et Song ont développé un modèle qui réalise tout son travail en seulement deux étapes. Selon eux, cette réduction des étapes a considérablement réduit le temps nécessaire à leur modèle pour générer une vidéo, sans aucune perte de qualité.

Le nouveau modèle utilise plus de 1,5 milliard de paramètres et peut produire un exemple de vidéo en une fraction de seconde sur une machine dotée d’un seul GPU A100. C’est environ 50 fois plus rapide que les modèles actuellement utilisés.

Les chercheurs notent que leur nouveau modèle nécessite beaucoup moins de puissance de calcul que les autres modèles, ce qui constitue également un problème persistant avec les applications d’IA en général, car leur utilisation monte en flèche. Ils notent également que leur nouvelle approche a déjà fait l’objet d’une analyse comparative pour comparer leurs résultats avec d’autres modèles, à la fois ceux actuellement utilisés et ceux en cours de développement par d’autres équipes. Ils suggèrent que leur modèle devrait permettre des applications d’IA générative en temps réel dans un avenir proche.

Plus d’informations : Cheng Lu et al, Simplifier, stabiliser et mettre à l’échelle les modèles de cohérence en temps continu, arXiv (2024). DOI : 10.48550/arxiv.2410.11081

Informations sur la revue : arXiv

Tags:
PARTAGER

PARTAGER

NEWSLETTER: Recevez le meilleur de l'actu IA!

Suivez nous sur les réseaux sociaux

Outils en avant


Vidnoz AI

Catégorie:  Vidéo

Vidnoz AI est un outil générateur de vidéos qui permet aux équipes, aux entreprises et aux utilisateurs de créer des vidéos d'IA attrayantes rapidement et à moindre coût. En éliminant le besoin de caméras, d'acteurs et de studios, Vidnoz AI permet d'économiser du temps et de l'argent. Les utilisateurs ont déclaré avoir économisé jusqu'à 80[...]


WP Dev AI

Catégorie:  Developer Tools,Outils pour développeurs

WP Dev AI permet aux utilisateurs de créer sans effort des fonctionnalités personnalisées pour les sites Web WordPress grâce au code généré par l'IA, éliminant ainsi le besoin de développeurs coûteux. Avec des instructions claires et des extraits de code accessibles à tout moment, les utilisateurs peuvent améliorer efficacement leurs sites WordPress sans expertise technique.[...]

Leonardo AI

Catégorie:  Générateur d'images,Image Generator

Libérez votre créativité avec la puissance de Leonardo Ai. Ce logiciel vous permet de créer des ressources visuelles de haute qualité pour vos projets avec une qualité, une rapidité et une cohérence de style inégalées. Il vous permet de cultiver l'originalité, offre une maîtrise simplifiée et dynamise l'innovation, ce qui en fait un outil essentiel pour diverses[...]


Suno.ai

Catégorie:  Musique

Suno.ai est un logiciel révolutionnaire qui permet à quiconque, des chanteurs de douche aux artistes professionnels, de créer de la musique sans avoir besoin d'instruments de musique. Avec juste votre imagination, vous pouvez créer vos propres chansons sans effort. Suno.ai propose une approche unique et passionnante de la création musicale, la rendant accessible à tous.[...]

Articles populaires

Tags