Anúncio

O Google DeepMind anunciou na última semana a integração do Gemini 2.5 Flash Image, seu modelo de edição de imagens com IA de última geração, ao aplicativo Gemini. A ferramenta permite transformar radicalmente fotos com comandos de texto, manter consistência de personagens em diferentes cenários e fundir múltiplas imagens de forma realista. Com custo de US$ 0,039 por imagem gerada, a inovação promete democratizar edições complexas, mas especialistas alertam para riscos de desinformação e impactos em setores profissionais .

O Gemini 2.5 Flash Image, apelidado internamente de “nano-banana“, representa um salto tecnológico em comparação a modelos anteriores. Diferente de geradores de imagem convencionais, como DALL-E ou Midjourney, o foco é na manipulação de imagens existentes com preservação de elementos-chave como expressões faciais, texturas e iluminação. Entre suas capacidades destacam-se:
–  Edições baseadas em prompt: Usuários podem remover objetos, alterar fundos, modificar estilos de roupa ou até adicionar elementos complexos como “um cachorro usando chapéu de festa em Marte” com resultados coerentes .
–  Consistência de personagens: Criação de sequências narrativas com o mesmo personagem em cenários distintos, útil para storytellers e marcas .
–  Fusão multi-imagem: Combinação de elementos de fotos diferentes, como aplicar a textura de uma flor em um par de botas ou inserir produtos em ambientes personalizados .

A ferramenta está integrada ao ecossistema Google via API, Google AI Studio e Vertex AI para empresas, com planos de expansão para 45 idiomas . Seu lançamento ocorre em um contexto de crescimento agressivo do mercado de IA criativa, onde concorrentes como Adobe Photoshop (com Generative Fill) e Luminar Neo disputam espaço .

Especialistas em tecnologia questionam o impacto disruptivo em profissões criativas. Para Harry Guinness, da Zapier, “editores de IA são mais úteis que geradores de imagens, mas ainda carecem de controle fino para usos profissionais” . Já o Washington Post destaca preocupações éticas: a facilidade para criar conteúdo realista pode ampliar fraudes e desinformação, especialmente em períodos eleitorais . O Google incluiu watermark digital SynthID para identificar imagens geradas por IA, mas sua eficácia contra manipulações mal-intencionadas ainda não foi comprovada .

O lançamento do Gemini 2.5 Flash Image consolida a IA como ferramenta massiva de transformação digital, mas seus desdobramentos exigirão ajustes legais e éticos. Setores como fotografia, publicidade e design enfrentarão pressão para adaptar-se à produção ultrarrápida e de baixo custo, enquanto legisladores precisarão discutir regras para autenticidade de mídia. O próximo passo do Google será integrar a tecnologia ao Google Photos e expandir recursos de vídeo, como demonstrado anteriormente com o Veo 3 . Para usuários, a era da edição acessível chegou; para a sociedade, os desafios da hiperrealidade artificial apenas começaram.

Anúncio