IBM lance sa nouvelle génération de modèles LLM Granite 3.0
IBM lance sa nouvelle génération de modèles LLM Granite 3.0


IBM continue de redéfinir le paysage de l’intelligence artificielle avec le lancement de sa dernière génération de modèles Granite lors de la conférence annuelle TechXchange. Cette avancée s’inscrit dans sa démarche d’innovation continue et d’expansion de son portefeuille open source, publié sous la licence permissive Apache 2.0.
Granite 3.0 : Une offre variée et performante
La famille de modèles Granite 3.0 se compose de plusieurs variantes adaptées à divers cas d’utilisation, notamment :
- Quatre versions de LLM à usage général
- Deux modèles axés sur la sécurité
- Quatre modèles de type MoE, optimisés pour une inférence efficace et une latence réduite
- Un modèle Granite Time Series, spécialement conçu pour les séries temporelles
Les versions denses de 2B et 8B paramètres ont été rigoureusement entraînées sur 12 mille milliards de jetons. De leur côté, les modèles MoE de 1B et 3B ont utilisé 10 mille milliards de jetons, avec respectivement 400M et 800M de paramètres activés.
S’adapter à tous les besoins de l’entreprise
IBM présente les modèles Granite 3.0 comme des outils clés pour l’IA d’entreprise, offrant une performance optimale pour des tâches variées telles que :
- RAG (Retrieval-Augmented Generation)
- Classification
- Synthèse
- Extraction d’entités
- Utilisation d’outils intégrés
Ces versions compactes facilitent le fine-tuning avec des données spécifiques aux entreprises et s’intègrent harmonieusement dans divers environnements de travail. Les modèles MoE, étant plus légers, sont parfaitement adaptés aux applications nécessitant une faible latence et pouvant être déployés sur des infrastructures CPU.
Économie et efficacité des modèles
En combinant un petit modèle Granite avec des données d’entreprise via la technique InstructLab, IBM permet aux entreprises d’atteindre des performances spécifiques à des tâches à un coût réduit, estimé entre 3x et 23x moins coûteux que les grands modèles « frontier ». Ceci représente une avancée significative pour les organisations cherchant à optimiser leurs investissements en intelligence artificielle.
Propriété intellectuelle et partenariats
IBM ne s’arrête pas là. Pour renforcer la confiance des clients dans l’utilisation de leurs données avec les modèles Granite, la firme propose une indemnité de propriété intellectuelle sur watsonx.ai. Ce mécanisme incite les entreprises à partager leurs données pour l’entraînement des modèles.
Performance et précision de Granite 3.0
En matière de performance, le modèle Granite 3.0 8B Instruct surpasse d’autres modèles open source comparables, tels que Llama 3.1-8B de Meta et Mistral-7B de Mistral AI, selon le classement OpenLLM Leaderboard de Hugging Face. Sur le benchmark de sécurité AttaQ, également développé par IBM, Granite 3.0 8B se classe en tête.
Modèles Granite Time Series : Une évolution notable
IBM a également leurs modèles Granite Time Series, ayant été pré-entraînés sur trois fois plus de données. Ces modèles affichent des performances supérieures même par rapport à ceux dix fois plus grands proposés par des concurrents tels qu’Alibaba et Google.
Accessibilité et intégration sur les plateformes
Les modèles Granite 3.0 sont désormais disponibles au téléchargement sur Hugging Face, tout en étant intégrés dans l’écosystème de partenaires technologiques tels qu’AWS, Docker, Domo, Qualcomm, Salesforce et SAP. Les variantes Instruct et Guardian des LLM Granite 3.0 (2B et 8B) sont accessibles à des fins commerciales sur la plateforme watsonx d’IBM.
Avancées futures et résolution de problèmes
Dans un avenir proche, IBM prévoit d’ajouter le support pour une fenêtre de contexte de 128K, ainsi que des capacités de compréhension de documents multimodaux pour ses modèles 3.0. Parallèlement, l’entreprise innove en développant des agents IA autonomes, incluant des capacités de raisonnement avancé et de résolution de problèmes en plusieurs étapes, avec des mises à jour prévues en 2025.
Avec Granite 3.0, IBM affirme sa position de leader en fournissant des solutions d’intelligence artificielle qui allient performance, coût efficace et adaptabilité aux besoins spécifiques des entreprises. La concertation entre innovation technologique et partenariat stratégique s’annonce prometteuse pour l’avenir de l’IA.

Franck Ribiere
Basé en France entre Aix-en-Provence et Marseille, Franck est un informaticien passionné par l'intelligence artificielle, avec une expertise en développement logiciel web. Toujours à l'affût des dernières avancées, il s'efforce de proposer les infos les + pertinentes.






