OpenAI lança novo modelo de geração de imagens para brigar com o Google (Nano Banana Pro)

OpenAI lança novo modelo de geração de imagens para brigar com o Google (Nano Banana Pro)

A OpenAI anunciou hoje o GPT Image 1.5, nova versão do seu modelo de inteligência artificial focado em geração de imagens. Disponível para todos os usuários do ChatGPT e pela sua API 1 oficial, ele chega para competir diretamente com o Nano Banana Pro, do Google.

Segundo a empresa comandada por Sam Altman, a novidade se sai melhor na hora de seguir instruções, o que deverá aprimorar sua performance ao gerar várias iterações de uma mesma imagem.

Apresentamos o ChatGPT Images, desenvolvido com nosso novo modelo de geração de imagens.

— Seguimento de instruções mais rigoroso
— Edição precisa
— Preservação de detalhes
— 4 vezes mais rápido do que antes

Disponível hoje no ChatGPT para todos os usuários e na API como GPT Image 1.5.

Isso significa que usuários poderão pedir para a IA fazer ajustes pontuais nas imagens (como em rostos de pessoas, na iluminação ou na composição) sem que o ChatGPT Images as reinterprete por completo, permitindo resultados mais consistentes a cada prompt.

Capaz de gerar imagens até 4x mais rápido, o novo modelo também se dá melhor com textos, layouts e outros elementos gráficos — coisas que costumam ser um ponto fraco desse tipo de tecnologia.

Juntas, essas melhorias significam que o ChatGPT pode funcionar como um estúdio criativo no seu bolso, capaz tanto de edições práticas quanto de reimaginação expressiva.

Ainda segundo a OpenAI, o ChatGPT Images ganhou um espaço dedicado na forma de uma barra lateral tanto no app do chatbot quanto na web. Nela, é possível encontrar coisas como sugestões de prompts e templates, facilitando a experimentação.

Apesar desses avanços, o GPT Image 1.5 ainda apresenta limitações, como uma certa dificuldade na hora de lidar com textos em idiomas que não sejam o inglês. Além disso, ele também pode apresentar um fotorrealismo excessivo mesmo em imagens estilizadas, o que pode ser um tanto incômodo na hora de entrar em uma trend (como aquela famosa do Studio Ghibli).

Outras novidades

O lançamento do GPT Image 1.5 vem apenas um dia após a OpenAI anunciar que expandiu a possibilidade de ramificar conversas no ChatGPT para o iOS e o Android.

Lançados em setembro na web, os Branched chats (como essas conversas se chamam em inglês), permitem que o usuário explore diferentes ideias a partir de uma conversa em comum em janelas paralelas.

Os chats ramificados agora também estão disponíveis no iOS e no Android.

É possível usar esse recurso para, por exemplo, escrever dois emails com tons completamente diferentes a partir do mesmo prompt. Depois de gerados, eles podem ser facilmente comparados pelo usuário, que pode voltar à conversa original quando quiser.

Notas de rodapé

1    Application programming interface, ou interface de programação de aplicações.