Servir des modèles d'IA à grande échelle avec vLLM

Servir des modèles d'IA à grande échelle avec vLLM

13 novembre 2025 • 01:21
PARTAGER
Futur-IA: Servir des modèles d'IA à grande échelle avec vLLM



Auteur: Google Cloud Tech  –  Durée: 00:03:08

Libérez tout le potentiel de vos modèles d’IA en les servant à grande échelle avec vLLM. Cette vidéo aborde des problèmes courants tels que l'inefficacité de la mémoire, la latence élevée sous charge et les modèles de grande taille, montrant comment vLLM maximise le débit de votre matériel existant. Découvrez les fonctionnalités innovantes de vLLM telles que PagedAttention, Prefix Caching, le service multi-hôtes et le service désagrégé, et découvrez comment il s'intègre de manière transparente aux GPU et TPU de Google Cloud pour une inférence d'IA flexible et hautes performances. Chapitres : 0:00 – Introduction : Le défi de la mise à l'échelle de l'IA 0:25 – 3 problèmes courants 1:01 – Solution : vLLM pour un service performant 1:13 – Fonctionnalité vLLM : PagedAttention 1:30 – Fonctionnalité vLLM : mise en cache des préfixes 1:46 – Fonctionnalité vLLM : serveur multi-hôtes et désagrégé 2:07 – Prise en charge de vLLM sur Google Cloud (GPU et TPU) 2:29 – Paramètres réglables de vLLM 2:46 – Ressources de conclusion : Bienvenue dans vLLM → https://goo.gle/49zlRZN
Inférence TPU GitHub → https://goo.gle/3JUkBpn

Abonnez-vous à Google Cloud Tech → https://goo.gle/GoogleCloudTech

#GoogleCloud #vLLM #AIInfrastructure Intervenants : Don McCasland Produits mentionnés : infrastructure d'IA, unités de traitement tensoriel, GPU cloud

Traduit en français à partir de cette source

Tags:
PARTAGER

PARTAGER

NEWSLETTER: Recevez le meilleur de l'actu IA!

Suivez nous sur les réseaux sociaux

Outils en avant


              Vidnoz AI

Catégorie:  Vidéo

Vidnoz AI est un outil générateur de vidéos qui permet aux équipes, aux entreprises et aux utilisateurs de créer des vidéos d'IA attrayantes rapidement et à moindre coût. En éliminant le besoin de caméras, d'acteurs et de studios, Vidnoz AI permet d'économiser du temps et de l'argent. Les utilisateurs ont déclaré avoir économisé jusqu'à 80[...]


WP Dev AI

Catégorie:  Developer Tools,Outils pour développeurs

WP Dev AI permet aux utilisateurs de créer sans effort des fonctionnalités personnalisées pour les sites Web WordPress grâce au code généré par l'IA, éliminant ainsi le besoin de développeurs coûteux. Avec des instructions claires et des extraits de code accessibles à tout moment, les utilisateurs peuvent améliorer efficacement leurs sites WordPress sans expertise technique.[...]

Leonardo AI

Catégorie:  Générateur d'images,Image Generator

Libérez votre créativité avec la puissance de Leonardo Ai. Ce logiciel vous permet de créer des ressources visuelles de haute qualité pour vos projets avec une qualité, une rapidité et une cohérence de style inégalées. Il vous permet de cultiver l'originalité, offre une maîtrise simplifiée et dynamise l'innovation, ce qui en fait un outil essentiel pour diverses[...]


              Suno.ai

Catégorie:  Musique

Suno.ai est un logiciel révolutionnaire qui permet à quiconque, des chanteurs de douche aux artistes professionnels, de créer de la musique sans avoir besoin d'instruments de musique. Avec juste votre imagination, vous pouvez créer vos propres chansons sans effort. Suno.ai propose une approche unique et passionnante de la création musicale, la rendant accessible à tous.[...]

Articles populaires

Tags