OpenAI lance o1, son premier modèle doté de capacités de « raisonnement »
OpenAI lance o1, son premier modèle doté de capacités de « raisonnement »


OpenAI a récemment publié un nouveau modèle révolutionnaire appelé o1, premier d’une série prévue de modèles de « raisonnement ». Ce modèle promet de répondre à des questions complexes plus rapidement qu’un humain, en plus d’être plus précis et sophistiqué que ses prédécesseurs. Cette innovation est lancée en même temps qu’une version allégée et moins coûteuse, o1-mini.
Un pas de plus vers l’intelligence artificielle de type humain
Pour OpenAI, le modèle o1 représente un jalon important dans son objectif à long terme : atteindre une intelligence artificielle comparable à celle des humains. Plus concrètement, o1 se distingue par ses performances dans la résolution de problèmes complexes et l’écriture de code. Toutefois, malgré ses capacités accrues, il est plus coûteux et plus lent à utiliser que GPT-4o, la version précédente.
OpenAI qualifie d’ailleurs cette version d’o1-preview, indiquant qu’elle est encore dans une phase expérimentale. Les utilisateurs de ChatGPT Plus et Team peuvent dès maintenant y accéder, tandis que les utilisateurs Enterprise et Edu y auront accès prochainement. OpenAI prévoit également d’offrir o1-mini aux utilisateurs gratuits, bien qu’aucune date officielle n’ait été annoncée.
Tarifs pour les développeurs
Pour les développeurs, l’accès à l’API d’o1-preview est onéreux :
- 15 $ par million de jetons d’entrée
- 60 $ par million de jetons de sortie
En comparaison, GPT-4o est bien plus abordable avec des coûts respectifs de 5 $ et 15 $ par million de jetons. Malgré ces prix élevés, OpenAI parie sur les capacités avancées d’o1 pour convaincre les développeurs.
Un modèle formé différemment pour plus de précision
Selon Jerry Tworek, responsable de la recherche chez OpenAI, la formation d’o1 est fondamentalement différente de celle de ses prédécesseurs. OpenAI a utilisé un nouvel algorithme d’optimisation et un ensemble de données spécifiquement conçu pour entraîner ce modèle. Contrairement aux modèles précédents, o1 n’a pas seulement appris à imiter des modèles issus de ses données d’entraînement, mais à résoudre les problèmes de manière autonome.
Ceci est rendu possible grâce à une technique appelée apprentissage par renforcement, dans laquelle le modèle apprend par le biais de récompenses et de pénalités. En utilisant une chaîne de pensée similaire à celle des humains, o1 décompose les problèmes étape par étape, offrant ainsi des solutions plus précises.
Un modèle qui hallucine moins
Tworek affirme qu’avec cette nouvelle méthode d’entraînement, o1 « hallucine moins », mais il reconnaît que le problème persiste. En dépit de cette amélioration, OpenAI admet ne pas encore avoir résolu entièrement le problème des hallucinations, ces réponses erronées générées par le modèle.
Des performances remarquables dans des domaines complexes
Ce qui distingue principalement o1 de GPT-4o, c’est sa capacité à résoudre des problèmes complexes dans des domaines tels que le codage et les mathématiques. Le modèle est également capable d’expliquer son raisonnement, un atout non négligeable. Bob McGrew, directeur de la recherche chez OpenAI, rapporte que le modèle a obtenu 83% de réussite lors d’un test de qualification pour l’Olympiade internationale de mathématiques, alors que GPT-4o n’avait résolu que 13% des problèmes.
De nouveaux horizons pour la recherche
Dans le cadre de concours de programmation Codeforces, o1 a atteint le 89e percentile des participants, ce qui témoigne de ses capacités impressionnantes. OpenAI prévoit que les futures mises à jour du modèle lui permettront de fonctionner à un niveau comparable à celui des étudiants en doctorat dans des domaines comme la physique, la chimie et la biologie.
Des limites encore présentes
Malgré ses capacités avancées, o1 n’égale pas GPT-4o dans certains domaines, comme la connaissance factuelle. Il ne peut ni naviguer sur le Web, ni traiter des fichiers ou des images, ce qui en fait un outil moins polyvalent dans certains cas. Cependant, OpenAI souligne qu’o1 représente une nouvelle classe de capacités et marque un tournant dans le développement de l’IA.
Vers une nouvelle génération d’agents autonomes
OpenAI voit en o1 une étape vers des systèmes autonomes capables de raisonner et d’agir de manière indépendante. Bien que les modèles actuels se contentent de prédire des séquences de mots basées sur des données, OpenAI travaille sur des capacités de raisonnement qui pourraient ouvrir la voie à des avancées majeures dans des domaines comme la médecine et l’ingénierie.
Comme le souligne McGrew, « le raisonnement est une nouvelle modalité pour les modèles d’IA, essentielle pour atteindre des niveaux d’intelligence semblables à ceux des humains ».

Franck Ribiere
Basé en France entre Aix-en-Provence et Marseille, Franck est un informaticien passionné par l'intelligence artificielle, avec une expertise en développement logiciel web. Toujours à l'affût des dernières avancées, il s'efforce de proposer les infos les + pertinentes.









