Cet agent IA fonctionne sur les GPU Cloud Run + NVIDIA
Cet agent IA fonctionne sur les GPU Cloud Run + NVIDIA

Auteur: Google Cloud Tech – Durée: 00:07:45
Code source de l'agent de santé intelligent → https://goo.gle/4nJsFax
Vous êtes-vous déjà demandé comment créer une véritable application d'agent IA sur un GPU NVIDIA sans serveur ? Dans cette vidéo, Martin Omander (Google) s'assoit avec Jay Rodge (NVIDIA) pour découvrir une configuration complète. Jay présente un agent de santé intelligent qui s'exécute sur Cloud Run avec un GPU NVIDIA L4. Regardez le duo plonger directement dans le code et l’architecture. Découvrez comment Martin et Jay exécutent des modèles open source comme Gemma avec Ollama sur Cloud Run, utilisent LangGraph pour créer un flux de travail multi-agents (RAG + outils), expliquent l'architecture permettant de diviser une application en une interface CPU (avec Gradio), présentent un backend GPU et expliquent pourquoi un développeur hébergerait son propre modèle plutôt que d'appeler une API gérée. Chapitres : 0:00 – Introduction 0:40 – Démo de l'application de santé intelligente 2:25 – Comment l'application a été construite 5:00 – Code pour multi-agent 5:33 – LangGraph vs ADK 5:50 – Hébergement d'un LLM vs appel de l'API Gemini 6:40 – Expérience du développeur 7:06 – Conclusion Regardez plus d'expéditions sans serveur → https://goo.gle/ServerlessExpeditions
🔔 Abonnez-vous à Google Cloud Tech → https://goo.gle/GoogleCloudTech
#GoogleCloud #CloudRun #Serverless Intervenants : Martin Omander, Jay Rodge Produits mentionnés : Cloud Run, kit de développement d'agents
Traduit en français à partir de cette source






