Modifiez vos images avec facilité grâce à l’outil d’IA d’Apple!

9 février 2024 • 07:59

Apple a récemment dévoilé un nouveau modèle qui permet aux utilisateurs de modifier des photos simplement en utilisant des instructions textuelles, sans avoir à utiliser de logiciel de retouche photo. Ce modèle, appelé MGIE (MLLM-Guided Image Editing), a été développé en collaboration avec l’Université de Californie à Santa Barbara. Il est capable de recadrer, redimensionner, retourner et ajouter des filtres aux images en répondant à des commandes textuelles.

Le MGIE peut être utilisé pour des tâches simples telles que recadrer une image, mais aussi pour des tâches plus complexes comme modifier des objets spécifiques dans une photo. Il combine deux utilisations différentes de modèles de langage multimodal : interpréter les instructions des utilisateurs et « imaginer » la retouche demandée. Par exemple, demander à rendre le ciel plus bleu sur une photo revient à augmenter la luminosité de la partie ciel de l’image.

Lors de l’édition d’une photo avec le MGIE, les utilisateurs n’ont qu’à saisir ce qu’ils souhaitent modifier sur l’image. Par exemple, demander à rendre une pizza au pepperoni « plus saine » ajoutera des garnitures de légumes. De même, demander à ajouter plus de contraste à une photo de tigres dans le Sahara permettra de simuler plus de lumière et de rendre l’image plus lumineuse.

Ce nouveau modèle de retouche photo promet de simplifier grandement le processus de modification d’images pour les utilisateurs, en leur permettant de communiquer leurs désirs de manière simple et naturelle.

« Au lieu de conseils brefs mais ambigus, MGIE dérive une intention visuelle explicite et conduit à une retouche d’image raisonnable. Nous menons des études approfondies sur divers aspects de l’édition et démontrons que notre MGIE améliore efficacement les performances tout en maintenant une efficacité compétitive. Nous pensons également que le cadre guidé par MLLM peut contribuer aux futures recherches sur la vision et le langage », ont déclaré les chercheurs dans l’article.

Apple a rendu MGIE disponible via GitHub en téléchargement, mais a également publié une démo Web sur Hugging Face Spaces. La société n’a pas précisé quels étaient ses projets pour le modèle au-delà de la recherche.

Certaines plates-formes de génération d’images, comme DALL-E 3 d’OpenAI, peuvent effectuer des tâches simples de retouche photo sur les images qu’elles créent via la saisie de texte. Le créateur de Photoshop Adobe, vers lequel la plupart des gens se tournent pour l’édition d’images, possède également son propre modèle d’édition d’IA. Son modèle Firefly AI alimente le remplissage génératif, qui ajoute des arrière-plans générés aux photos.

Apple n’a pas été un acteur majeur dans le domaine de l’IA générative, contrairement à Microsoft, Meta ou Google, mais le PDG d’Apple, Tim Cook, a déclaré que la société souhaitait ajouter davantage de fonctionnalités d’IA à ses appareils cette année. En décembre, les chercheurs d’Apple ont publié un framework d’apprentissage automatique open source appelé MLX pour faciliter la formation de modèles d’IA sur les puces Apple Silicon.

Tags: Apple

PARTAGER

Suivez nous sur les réseaux sociaux

Outils en avant

Catégorie: Vidéo

Vidnoz AI

Vidnoz AI est un outil générateur de vidéos qui permet aux équipes, aux entreprises et aux utilisateurs de créer des vidéos d'IA attrayantes rapidement et à moindre coût. En éliminant le besoin de caméras, d'acteurs et de studios, Vidnoz AI permet d'économiser du temps et de l'argent. Les utilisateurs ont déclaré avoir économisé jusqu'à 80[...]

Catégorie: Developer Tools,Outils pour développeurs

WP Dev AI

WP Dev AI permet aux utilisateurs de créer sans effort des fonctionnalités personnalisées pour les sites Web WordPress grâce au code généré par l'IA, éliminant ainsi le besoin de développeurs coûteux. Avec des instructions claires et des extraits de code accessibles à tout moment, les utilisateurs peuvent améliorer efficacement leurs sites WordPress sans expertise technique.[...]

Catégorie: Générateur d'images,Image Generator

Leonardo.ai

Libérez votre créativité avec la puissance de Leonardo Ai. Ce logiciel vous permet de créer des ressources visuelles de haute qualité pour vos projets avec une qualité, une rapidité et une cohérence de style inégalées. Il vous permet de cultiver l'originalité, offre une maîtrise simplifiée et dynamise l'innovation, ce qui en fait un outil essentiel pour diverses[...]

Catégorie: Musique

Suno.ai

Suno.ai est un logiciel révolutionnaire qui permet à quiconque, des chanteurs de douche aux artistes professionnels, de créer de la musique sans avoir besoin d'instruments de musique. Avec juste votre imagination, vous pouvez créer vos propres chansons sans effort. Suno.ai propose une approche unique et passionnante de la création musicale, la rendant accessible à tous.[...]

Soumettre votre outil IASoumettre votre outil IA

Articles populaires

Tags

Modifiez vos images avec facilité grâce à l’outil d’IA d’Apple!

Modifiez vos images avec facilité grâce à l’outil d’IA d’Apple!

PARTAGER

NEWSLETTER: Recevez le meilleur de l'actu IA!

Suivez nous sur les réseaux sociaux

Outils en avant

Vidnoz AI

WP Dev AI

Leonardo.ai

Suno.ai

Liens utiles

Suivez nous sur les réseaux sociaux