Google vient de franchir un nouveau cap dans la retouche numérique. Présenté le 26 août, son modèle Gemini 2.5 Flash Image, surnommé en interne Nano Banana, s’impose comme un outil pensé pour rendre la création et l’édition d’images plus intuitives que jamais. Avec une simple phrase, il devient possible d’effacer une personne, de transformer un décor ou de fusionner plusieurs photos en une scène réaliste, sans passer par les réglages complexes des logiciels traditionnels.
Ce lancement marque une étape importante pour Google, longtemps considéré en retrait face à ses concurrents dans le domaine de la génération visuelle. L’entreprise met désormais en avant un atout majeur : la capacité de conserver le même visage ou le même objet d’une image à l’autre, un défi qui posait problème à la plupart des modèles concurrents. Concrètement, cela signifie qu’un personnage peut être inséré dans différents décors tout en gardant la même apparence, ou qu’un produit peut être décliné sous plusieurs angles avec une cohérence visuelle parfaite.
Le modèle, développé par Google DeepMind, s’était déjà fait remarquer avant son annonce officielle. Déployé discrètement sous le nom nano-banana sur la plateforme d’évaluation LMArena, il avait rapidement pris la tête des classements dans les catégories Image Edit et Text-to-Image, devançant même certains modèles bien établis comme 4o Image Generation. Sa force réside dans sa capacité à exécuter des retouches sophistiquées sans détériorer la qualité visuelle et sans donner l’impression d’une image artificielle.
Parmi les usages concrets, l’utilisateur peut par exemple insérer un canapé dans une pièce vide, changer la couleur des murs, modifier la tenue d’une personne ou encore combiner plusieurs photos pour inventer une nouvelle scène. Toutes ces opérations se font via un simple prompt, rendant la création beaucoup plus fluide. Google insiste toutefois sur la nécessité d’encadrer ces usages : chaque image intègre désormais un watermark « AI » visible, ainsi qu’un filigrane numérique invisible baptisé SynthID, afin de signaler clairement leur origine artificielle.
Le modèle est en cours de déploiement mondial. Il est accessible via l’application Gemini, Google AI Studio, l’API Gemini et Vertex AI, aussi bien pour les utilisateurs gratuits que pour les abonnés, bien que certaines restrictions puissent s’appliquer. Cette démocratisation confirme une tendance forte : l’édition avancée par intelligence artificielle s’installe dans le quotidien, redéfinissant les pratiques créatives et accentuant la concurrence pour des logiciels emblématiques comme Photoshop.

