Nous introduisons trois modèles audio dans l'API
Nous introduisons trois modèles audio dans l'API

Auteur: OpenAI – Durée: 00:04:04
Nous introduisons trois modèles audio dans l'API qui débloquent une nouvelle classe d'applications vocales pour les développeurs. Grâce à ces modèles, les développeurs peuvent créer des expériences vocales plus naturelles, répondre plus intelligemment et agir en temps réel : • GPT‑Realtime‑2, notre premier modèle vocal avec un raisonnement de classe GPT‑5 qui peut gérer des demandes plus difficiles et faire avancer la conversation naturellement. • GPT‑Realtime‑Translate, un nouveau modèle de traduction en direct qui traduit la parole de plus de 70 langues d'entrée vers 13 langues de sortie tout en suivant le rythme de l'orateur. • GPT‑Realtime‑Whisper, une nouvelle synthèse vocale en streaming qui transcrit la parole en direct pendant que l'orateur parle.
Traduit en français à partir de cette source






