Affinement du renforcement – 12 jours d’OpenAI : jour 2
Affinement du renforcement – 12 jours d’OpenAI : jour 2
7 décembre 2024 • 01:02

Auteur: OpenAI – Durée: 00:20:36
Regardez Justin Reese et les membres de l’équipe OpenAI présenter et faire une démonstration du réglage fin du renforcement.
Si vous êtes intéressé par le programme de recherche sur la mise au point des renforcements, visitez https://openai.com/form/rft-research-program/
Intervenants (de gauche à droite) : Mark Chen, John Allard, Julie Wang, Justin Reese (Berkeley Lab)






