Google Gemini volta a gerar imagens de pessoas com o modelo Imagen 3

O Google anunciou o lançamento do modelo Imagen 3 no Gemini, com liberação para todos os usuários e em diversos idiomas. Apresentado no último Google I/O e lançado discretamente na plataforma AI Test Kitchen no início deste mês, o Imagen 3 chega ao Gemini com melhorias no recurso de geração de imagens pela IA da companhia.

  • Clique e siga o Canaltech no WhatsApp
  • 10 comandos legais para usar no Gemini

O diretor de produtos do Gemini, Dave Citron, destacou que “o Imagen 3 estabelece um novo padrão de qualidade de imagem” e acrescentou que a ferramenta permite “criar imagens em vários estilos — como paisagens fotorealistas, pinturas a óleo texturizadas ou cenas de animação em massinha”.

Imagens de pessoas geradas por IA

Além de atualizar o modelo para melhorar a qualidade das imagens geradas por IA, o Google também anunciou que vai reativar a opção de gerar imagens de pessoas no Gemini.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

A Big Tech foi obrigada a desativar essa opção no início do ano devido a problemas com a precisão histórica das imagens. Agora, com o Imagen 3, o Google promete proteções mais avançadas que garantem que as imagens geradas estejam em conformidade com os princípios da empresa.

No comunicado, o diretor de produtos do Gemini informa que a ferramenta não permite a geração de imagens de “indivíduos fotorealistas e identificáveis, representações de menores ou cenas excessivamente violentas ou explícitas”.

Segundo Citron, “um progresso significativo foi feito com o Imagen 3 para proporcionar uma melhor experiência ao gerar imagens de pessoas. Como em qualquer ferramenta de IA generativa, nem toda imagem criada pelo Gemini será perfeita, mas continuaremos a ouvir o feedback dos usuários para continuar melhorando”.

Imagem gerada pelo Gemini com o prompt: "Uma pintura abstrata vibrante com as palavras "Dream Big" espalhadas pela tela em cores fortes" (Imagem: Divulgação/Google)
Imagem gerada pelo Gemini com o prompt: “Uma pintura abstrata vibrante com as palavras “Dream Big” espalhadas pela tela em cores fortes” (Imagem: Divulgação/Google)

O executivo destaca ainda que a IA continuará a usar a ferramenta SynthID para aplicar marcas d’água em imagens geradas por IA.

A geração de imagens de pessoas com o Gemini chegará primeiro para usuários dos planos Gemini Advanced, Business e Enterprise nos próximos, com disponibilidade inicial apenas em inglês. O Google promete ampliar a disponibilidade desse recurso para mais pessoas e idiomas no futuro.

Veja também como usar a IA Gemini do Google e como fazer imagens com IA no Gemini.

Leia a matéria no Canaltech.

Trending no Canaltech:

  • DC destrói oficialmente um ícone histórico do Batman após 45 anos
  • 🔥 MENOR PREÇO | Galaxy S24 Ultra com 512 GB está muito barato com cupom
  • Redmi Note 14 5G é certificado e chegaria em setembro com carregamento rápido
  • Wolverine finalmente supera uma fraqueza e usa como nova habilidade
  • 🔥 TV BARATA | Samsung QLED Q60D com ótimo preço no Magalu
  • Elon Musk quer implantar chips da Neuralink em milhões de pessoas
Adicionar aos favoritos o Link permanente.