OpenAI: Nouveaux modèles d’intégration et mises à jour de l’API

OpenAI: Nouveaux modèles d’intégration et mises à jour de l’API

25 janvier 2024 • 13:21
PARTAGER
Futur-IA: OpenAI: Nouveaux modèles d’intégration et mises à jour de l’API

Communiqué d’OpenAI:

Nous lançons de nouveaux modèles, réduisons les prix de GPT-3.5 Turbo et introduisons de nouvelles façons permettant aux développeurs de gérer les clés API et de comprendre l’utilisation de l’API.

Les nouveaux modèles comprennent :

  • Deux nouveaux modèles d’intégration
  • Un modèle d’aperçu GPT-4 Turbo mis à jour
  • Un modèle Turbo GPT-3.5 mis à jour
  • Un modèle de modération de texte mis à jour

Par défaut, les données envoyées à l’API OpenAI ne seront pas utilisées pour entraîner ou améliorer les modèles OpenAI.

Nouveaux modèles d’intégration à des prix inférieurs

Nous introduisons deux nouveaux modèles d’intégration : un modèle text-embedding-3-small plus petit et très efficace, et un modèle text-embedding-3-large plus grand et plus puissant.

Une intégration est une séquence de nombres qui représente les concepts contenus dans un contenu tel que le langage naturel ou le code. Les intégrations permettent aux modèles d’apprentissage automatique et à d’autres algorithmes de comprendre facilement les relations entre le contenu et d’effectuer des tâches telles que le clustering ou la récupération. Ils alimentent des applications telles que la récupération de connaissances dans ChatGPT et l’API Assistants, ainsi que de nombreux outils de développement de génération augmentée de récupération (RAG).

Un nouveau modèle d’intégration de petit texte

text-embedding-3-small est notre nouveau modèle d’intégration très efficace et offre une mise à niveau significative par rapport à son prédécesseur, le modèle text-embedding-ada-002 sorti en décembre 2022.

Des performances plus fortes. En comparant text-embedding-ada-002 à text-embedding-3-small, le score moyen sur un benchmark couramment utilisé pour la récupération multilingue (MIRACLE) est passé de 31,4 % à 44,0 %, tandis que le score moyen sur un critère de référence couramment utilisé pour les tâches d’anglais (MTEB) est passé de 61,0 % à 62,3 %.

Prix ​​réduit. text-embedding-3-small est également nettement plus efficace que notre modèle text-embedding-ada-002 de la génération précédente. Le prix de text-embedding-3-small a donc été réduit de 5 fois par rapport à text-embedding-ada-002, passant d’un prix pour 1 000 jetons de 0,0001 $ à 0,00002 $.

Nous ne déprécions pas text-embedding-ada-002. Ainsi, même si nous recommandons le modèle le plus récent, les clients sont invités à continuer à utiliser le modèle de la génération précédente.

Un nouveau modèle d’intégration de texte volumineux : text-embedding-3-large

text-embedding-3-large est notre nouveau modèle d’intégration plus grand de nouvelle génération et crée des intégrations avec jusqu’à 3072 dimensions.

Des performances plus fortes. text-embedding-3-large est notre nouveau modèle le plus performant. En comparant text-embedding-ada-002 à text-embedding-3-large : sur MIRACL, le score moyen est passé de 31,4 % à 54,9 %, tandis que sur MTEB, le score moyen est passé de 61,0 % à 64,6 %.

text-embedding-3-large sera au prix de 0,00013 $/1 000 jetons.

Vous pouvez en savoir plus sur l’utilisation des nouveaux modèles d’intégrations dans notre guide des intégrations.

Prise en charge native du raccourcissement des intégrations

L’utilisation d’intégrations plus grandes, par exemple leur stockage dans un magasin de vecteurs pour récupération, coûte généralement plus cher et consomme plus de calcul, de mémoire et de stockage que l’utilisation d’intégrations plus petites.

Nos deux nouveaux modèles d’intégration ont été formés avec une technique qui permet aux développeurs de faire un compromis entre les performances et le coût d’utilisation des intégrations. Plus précisément, les développeurs peuvent raccourcir les intégrations (c’est-à-dire supprimer certains nombres à la fin de la séquence) sans que l’intégration perde ses propriétés de représentation de concept en passant le paramètre API dimensions. Par exemple, sur le benchmark MTEB, une intégration text-embedding-3-large peut être raccourcie à une taille de 256 tout en surpassant une intégration text-embedding-ada-002 non raccourcie avec une taille de 1536.

Cela permet une utilisation très flexible. Par exemple, lors de l’utilisation d’un magasin de données vectorielles qui ne prend en charge que les intégrations jusqu’à 1 024 dimensions de long, les développeurs peuvent désormais toujours utiliser notre meilleur modèle d’intégration text-embedding-3-large et spécifier une valeur de 1 024 pour le paramètre API de dimensions, ce qui raccourcira l’intégration à partir de 3072 dimensions, échangeant une certaine précision en échange d’une taille de vecteur plus petite.

Autres nouveaux modèles et prix réduits

Modèle GPT-3.5 Turbo mis à jour et prix réduit

La semaine prochaine, nous présenterons un nouveau modèle GPT-3.5 Turbo, gpt-3.5-turbo-0125, et pour la troisième fois au cours de l’année écoulée, nous diminuerons les prix du GPT-3.5 Turbo pour aider nos clients à évoluer. Les prix d’entrée pour le nouveau modèle sont réduits de 50 % à 0,0005 $/1 000 jetons et les prix de sortie sont réduits de 25 % à 0,0015 $/1 000 jetons. Ce modèle bénéficiera également de diverses améliorations, notamment une plus grande précision dans la réponse dans les formats demandés et un correctif pour un bug qui provoquait un problème d’encodage de texte pour les appels de fonctions dans une langue autre que l’anglais.

Les clients utilisant l’alias de modèle gpt-3.5-turbo épinglé seront automatiquement mis à niveau de gpt-3.5-turbo-0613 vers gpt-3.5-turbo-0125 deux semaines après le lancement de ce modèle.

Aperçu GPT-4 Turbo mis à jour

Plus de 70 % des demandes des clients de l’API GPT-4 sont passées à GPT-4 Turbo depuis sa sortie, car les développeurs profitent de sa limite de connaissances mise à jour, de ses fenêtres contextuelles plus grandes de 128 000 et de ses prix plus bas.

Aujourd’hui, nous publions un modèle d’aperçu GPT-4 Turbo mis à jour, gpt-4-0125-preview. Ce modèle accomplit des tâches telles que la génération de code de manière plus approfondie que le modèle d’aperçu précédent et vise à réduire les cas de « paresse » où le modèle n’accomplit pas une tâche. Le nouveau modèle inclut également le correctif du bug affectant les générations UTF-8 non anglaises.

Pour ceux qui souhaitent être automatiquement mis à niveau vers les nouvelles versions d’aperçu GPT-4 Turbo, nous introduisons également un nouvel alias de nom de modèle gpt-4-turbo-preview, qui pointera toujours vers notre dernier modèle d’aperçu GPT-4 Turbo.

Nous prévoyons de lancer GPT-4 Turbo avec Vision en disponibilité générale dans les mois à venir.

Modèle de modération mis à jour

L’API de modération gratuite permet aux développeurs d’identifier les textes potentiellement dangereux. Dans le cadre de notre travail continu en matière de sécurité, nous publions text-moderation-007, notre modèle de modération le plus robuste à ce jour. Les alias text-moderation-latest et text-moderation-stable ont été mis à jour pour y pointer. Vous pouvez en savoir plus sur la création de systèmes d’IA sûrs grâce à notre guide des meilleures pratiques en matière de sécurité.

De nouvelles façons de comprendre l’utilisation des API et de gérer les clés API

Nous lançons deux améliorations de la plateforme pour donner aux développeurs plus de visibilité sur leur utilisation et un meilleur contrôle sur les clés API.

Premièrement, les développeurs peuvent désormais attribuer des autorisations aux clés API à partir de la page Clés API. Par exemple, une clé peut se voir attribuer un accès en lecture seule pour alimenter un tableau de bord de suivi interne, ou être restreinte pour accéder uniquement à certains points de terminaison.

Deuxièmement, le tableau de bord d’utilisation et la fonction d’exportation d’utilisation exposent désormais les métriques au niveau de la clé API après avoir activé le suivi. Cela simplifie la visualisation de l’utilisation au niveau de la fonctionnalité, de l’équipe, du produit ou du projet, simplement en ayant des clés API distinctes pour chacun.

Dans les mois à venir, nous prévoyons d’améliorer encore la capacité des développeurs à visualiser leur utilisation de l’API et à gérer les clés API, en particulier dans les grandes organisations.

Pour les dernières mises à jour sur les API d’OpenAI, suivez-nous sur X à @OpenAIDevs.

Source

Tags:
PARTAGER

PARTAGER

NEWSLETTER: Recevez le meilleur de l'actu IA!

Suivez nous sur les réseaux sociaux

Outils en avant


              Vidnoz AI

Catégorie:  Vidéo

Vidnoz AI est un outil générateur de vidéos qui permet aux équipes, aux entreprises et aux utilisateurs de créer des vidéos d'IA attrayantes rapidement et à moindre coût. En éliminant le besoin de caméras, d'acteurs et de studios, Vidnoz AI permet d'économiser du temps et de l'argent. Les utilisateurs ont déclaré avoir économisé jusqu'à 80[...]


WP Dev AI

Catégorie:  Developer Tools,Outils pour développeurs

WP Dev AI permet aux utilisateurs de créer sans effort des fonctionnalités personnalisées pour les sites Web WordPress grâce au code généré par l'IA, éliminant ainsi le besoin de développeurs coûteux. Avec des instructions claires et des extraits de code accessibles à tout moment, les utilisateurs peuvent améliorer efficacement leurs sites WordPress sans expertise technique.[...]

Leonardo AI

Catégorie:  Générateur d'images,Image Generator

Libérez votre créativité avec la puissance de Leonardo Ai. Ce logiciel vous permet de créer des ressources visuelles de haute qualité pour vos projets avec une qualité, une rapidité et une cohérence de style inégalées. Il vous permet de cultiver l'originalité, offre une maîtrise simplifiée et dynamise l'innovation, ce qui en fait un outil essentiel pour diverses[...]


              Suno.ai

Catégorie:  Musique

Suno.ai est un logiciel révolutionnaire qui permet à quiconque, des chanteurs de douche aux artistes professionnels, de créer de la musique sans avoir besoin d'instruments de musique. Avec juste votre imagination, vous pouvez créer vos propres chansons sans effort. Suno.ai propose une approche unique et passionnante de la création musicale, la rendant accessible à tous.[...]

Articles populaires

Tags