A OpenAI anunciou uma nova versão do seu modelo de geração de imagens integrado ao ChatGPT, reforçando a disputa direta com o Google no mercado de inteligência artificial generativa (GenAI). Batizado de GPT Image 1.5, o modelo chega com foco em melhor interpretação de comandos, maior controle de edição e desempenho significativamente mais rápido, em […]
A OpenAI anunciou uma nova versão do seu modelo de geração de imagens integrado ao ChatGPT, reforçando a disputa direta com o Google no mercado de inteligência artificial generativa (GenAI). Batizado de GPT Image 1.5, o modelo chega com foco em melhor interpretação de comandos, maior controle de edição e desempenho significativamente mais rápido, em um momento em que imagens e vídeos deixam de ser apenas experimentais e passam a ganhar uso mais consistente em fluxos profissionais.
Segundo o TechCrunch, disponível para todos os usuários do ChatGPT e via API, o GPT Image 1.5 amplia as capacidades do modelo anterior, lançado em abril. A atualização ocorre semanas após a OpenAI antecipar o lançamento do GPT-5.2, movimento visto como uma resposta à crescente tração dos modelos Gemini, do Google, que vêm se destacando em rankings públicos de desempenho.
O novo modelo de imagens surge em um contexto de competição intensa. Nos últimos meses, ferramentas visuais ganharam protagonismo como parte da estratégia das big techs para ampliar a adoção da IA no dia a dia de criadores, desenvolvedores e empresas. Nesse cenário, a OpenAI busca reduzir uma das principais limitações relatadas por usuários: a dificuldade de fazer ajustes pontuais em uma imagem sem que o sistema altere completamente o resultado original.
Leia também: MP do Redata entra na reta final e setor pressiona Congresso por aprovação ainda em 2025
Entre os avanços apresentados, o GPT Image 1.5 oferece controles mais granulares de pós-edição, permitindo manter elementos como identidade facial, iluminação, composição e paleta de cores ao longo de múltiplas iterações. A proposta é facilitar ajustes específicos, como mudanças sutis de expressão ou temperatura de luz, sem comprometer a coerência visual, um desafio recorrente em modelos generativos.
Outro destaque é o ganho de desempenho. Segundo a empresa, a geração de imagens pode ser até quatro vezes mais rápida em comparação com a versão anterior, o que amplia a viabilidade do uso em contextos de produção e não apenas de experimentação. A OpenAI também posiciona o modelo como mais alinhado a instruções detalhadas, reduzindo interpretações excessivamente criativas quando o usuário busca precisão.
Além do modelo em si, a experiência de uso no ChatGPT passa por mudanças. A geração de imagens agora conta com um ponto de entrada dedicado na interface, descrito como um espaço mais próximo de um estúdio criativo. A navegação inclui telas específicas para visualização e edição, além de sugestões baseadas em tendências e filtros predefinidos, com o objetivo de apoiar tanto a criação quanto a inspiração.
Essa evolução faz parte de um plano mais amplo da OpenAI de tornar a interação com o ChatGPT cada vez mais visual. A empresa também sinalizou que resultados de busca dentro da plataforma devem incorporar mais elementos gráficos, sempre acompanhados de fontes, para apoiar tarefas práticas como conversão de medidas, consultas rápidas ou acompanhamento de informações esportivas.
O lançamento do GPT Image 1.5 ocorre em paralelo à intensificação da rivalidade com o Google. Mesmo após a chegada do GPT-5.2, modelos do Gemini seguem ocupando posições de destaque em benchmarks públicos, o que mantém a pressão sobre a OpenAI para acelerar seu roadmap. A antecipação do novo gerador de imagens, inicialmente prevista para o início de 2026, indica uma estratégia mais agressiva para recuperar protagonismo.
Com ferramentas visuais mais maduras, a disputa entre as plataformas deixa de se concentrar apenas em texto e passa a envolver experiências multimodais mais completas. Para usuários corporativos e criadores de conteúdo, a promessa é de maior previsibilidade nos resultados e menor retrabalho ao longo do processo criativo, à medida que a IA se aproxima de fluxos profissionais mais exigentes.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!