Pourquoi l'IA a besoin d'un nouveau type de réseau de superordinateurs — l'OpenAI Podcast Ep. 18
Pourquoi l'IA a besoin d'un nouveau type de réseau de superordinateurs — l'OpenAI Podcast Ep. 18

Auteur: OpenAI – Durée: 00:37:39
Former des modèles de pointe n'est pas aussi simple que d'ajouter davantage de GPU : un petit problème et toute la danse coordonnée s'effondre. Mark Handley et Greg Steinbrecher d'OpenAI expliquent comment une nouvelle conception de réseau de supercalculateurs, utilisée pour entraîner certains des derniers modèles de l'entreprise, maintient l'ensemble du système en mouvement, même avec un nombre record de GPU. Ils décomposent Multipath Reliable Connection, un nouveau protocole OpenAI développé avec AMD, Broadcom, Intel, Microsoft et Nvidia, et pourquoi ils le mettent à la disposition de l'ensemble du secteur. Chapitres 00:00 Introduction 00:39 Les chemins de Greg et Mark vers OpenAI 04:34 Pourquoi la formation de l'IA stresse les réseaux différemment 10:05 Goulots d'étranglement, échecs et coût de l'attente 15:19 Comment fonctionne une connexion fiable à trajets multiples 18:59 Un protocole pour contourner les échecs 25:05 Pourquoi OpenAI fait de MRC un standard ouvert 35:09 L'IA pourrait-elle migrer vers l'espace ?
Traduit en français à partir de cette source






