HEUX HEUR: Renforcement final
HEUX HEUR: Renforcement final

Auteur: OpenAI – Durée: 00:59:48
Le réinstallation du réglage fin (RFT) vous permet d'améliorer la façon dont les modèles raisonnent en s'entraînant avec les élèves au lieu de grands ensembles de données étiquetés. Cette heure de construction vous montre comment configurer des tâches, concevoir des fonctions de notation et exécuter des boucles d'entraînement efficaces avec seulement quelques centaines d'exemples. Prashant Mital and Théophile Sautory (AI appliqué): – Intro à RFT: optimisation, options de réglage fin, avantages RFT – Configuration des tâches: invites, élèves et données de formation et de validation – Démo en direct: construction et exécution RFT pour une tâche de classification – RFFhttps://accordance.com/)
– Q&R en direct 👉 Suivez le déménagement du code: https://github.com/openai/build-hours
👉 RFT Cookbook: https://cookbook.openai.com/examples/reinforcement_fine_tuning
👉 Guide de cas d'utilisation RFT: https://platform.openai.com/docs/guides/rft-usecases
👉 Inscrivez-vous aux prochaines heures de construction en direct: https://webinar.openai.com/buildhours
Traduit en français à partir de cette source






