Google inaugure « l’ère Gémeaux » avec les progrès de l’IA
Google inaugure « l’ère Gémeaux » avec les progrès de l’IA


Google a dévoilé une série de mises à jour de ses offres d’IA, notamment l’introduction de Gemini 1.5 Flash, des améliorations de Gemini 1.5 Pro et des progrès sur le projet Astra, sa vision de l’avenir des assistants d’IA.
Gemini 1.5 Flash est un nouvel ajout à la famille de modèles de Google, conçu pour être plus rapide et plus efficace pour servir à grande échelle. Bien que plus léger que le 1.5 Pro, il conserve la capacité de raisonnement multimodal sur de grandes quantités d’informations et présente une longue fenêtre contextuelle révolutionnaire d’un million de jetons.
« 1.5 Flash excelle dans la synthèse, les applications de chat, le sous-titrage d’images et de vidéos, l’extraction de données à partir de longs documents et tableaux, et bien plus encore », a expliqué Demis Hassabis, PDG de Google DeepMind. « C’est parce qu’il a été formé par 1.5 Pro via un processus appelé » distillation « , dans lequel les connaissances et compétences les plus essentielles d’un modèle plus grand sont transférées vers un modèle plus petit et plus efficace. »
Pendant ce temps, Google a considérablement amélioré les capacités de son modèle Gemini 1.5 Pro, étendant sa fenêtre contextuelle à deux millions de jetons, un chiffre révolutionnaire. Des améliorations ont été apportées à ses capacités de génération de code, de raisonnement logique, de conversation à plusieurs tours et de compréhension audio et image.
La société a également intégré Gemini 1.5 Pro dans les produits Google, notamment les applications Gemini Advanced et Workspace. De plus, Gemini Nano comprend désormais les entrées multimodales, s’étendant au-delà du texte uniquement pour inclure des images.
Google a annoncé sa prochaine génération de modèles ouverts, Gemma 2, conçus pour offrir des performances et une efficacité révolutionnaires. La famille Gemma s’agrandit également avec PaliGemma, le premier modèle de langage de vision de la société inspiré de PaLI-3.
Enfin, Google a partagé les progrès du projet Astra (agent réactif avancé pour la visualisation et la parole), sa vision de l’avenir des assistants IA. La société a développé des agents prototypes capables de traiter les informations plus rapidement, de mieux comprendre le contexte et de répondre rapidement aux conversations.
« Nous avons toujours voulu créer un agent universel qui soit utile au quotidien. Le projet Astra montre une compréhension multimodale et des capacités de conversation en temps réel », a expliqué Sundar Pichai, PDG de Google.
« Avec une technologie comme celle-ci, il est facile d’imaginer un avenir dans lequel les gens pourraient avoir un assistant expert en IA à leurs côtés, via un téléphone ou des lunettes. »
Google affirme que certaines de ces fonctionnalités seront intégrées à ses produits plus tard cette année. Les développeurs peuvent trouver toutes les annonces liées à Gemini dont ils ont besoin ici.






