Le générateur de vidéos IA de Runway s’est formé sur des milliers de vidéos YouTube récupérées
Le générateur de vidéos IA de Runway s’est formé sur des milliers de vidéos YouTube récupérées


Runway a formé son générateur de texte en vidéo IA sur des milliers de vidéos YouTube et de films piratés, selon un rapport de 404 Media. Les informations obtenues par le média incluent des liens vers des chaînes YouTube appartenant à de grandes sociétés de divertissement, telles que Netflix, Disney, Nintendo et Rockstar Games, ainsi qu’à des créateurs comme MKBHD, Linus Tech Tips et Sam Kolder.
Il existe également des liens vers des chaînes appartenant à des médias d’information comme The New Yorker, Reuters… « Les chaînes de cette feuille de calcul étaient le fruit d’un effort collectif visant à trouver des vidéos de bonne qualité pour construire le modèle », explique un ancien employé de Runway à 404 Media. « Ces données ont ensuite été utilisées comme données d’entrée par un robot d’exploration Web massif qui a téléchargé toutes les vidéos de toutes ces chaînes, en utilisant des proxys pour éviter d’être bloqué par Google. »
Runway est une startup d’IA qui a a reçu des millions de dollars de financement de la société mère de Google, Alphabet, et de Nvidia. Elle a créé des outils impressionnants qui permettent aux utilisateurs de créer des vidéos d’IA réalistes ainsi que des vidéos qui capturent un type d’animation particulier. Le dernier outil de Runway, Génération 3 Alpha lancé en juin, peut « créer des vidéos dans n’importe quel style imaginable ». Comme d’autres modèles d’IA, Gen-3 Alpha doit assimiler une grande variété de contenus lors de son entraînement.
En plus des chaînes YouTube, 404 Media a également découvert que l’ensemble de données de Runway contient des liens vers des sites de piratage comme KissCartoon, qui vous permet de regarder des anime et d’autres contenus animés gratuitement. On ne sait toujours pas si Runway a utilisé toutes les vidéos de cette feuille de calcul pour entraîner son modèle Gen-3 Alpha. En juin, le cofondateur de Runway, Anastasis Germanidis, a déclaré que la société utilise des « ensembles de données internes organisés » pour former ses modèles, mais il n’a pas fourni plus de détails.
Runway n’est pas la seule entreprise d’IA dont les données d’entraînement d’IA ont été liées à YouTube. Plus tôt cette année, la directrice technique d’OpenAI, Mira Murati, a déclaré qu’elle « n’était pas sûre » que le générateur de texte en vidéo de l’entreprise, Sora, ait été entraîné sur YouTube. Parallèlement, un rapport récent de Proof News et Wired a révélé qu’Anthropic, Apple, Nvidia et Salesforce ont entraîné leurs modèles d’IA sur plus de 170 000 vidéos YouTube.






