Nova IA do Google transforma texto e imagem em game interativo

As Big Tech seguem aumentando suas apostas no universo das IAs que criam “alguma coisa complexa” em questão segundos, e agora é a vez do Google subir esse sarrafo novamente. A empresa anunciou nesta semana o Genie, um novo modelo de inteligência artificial capaz de transformar diferentes tipo de comandos, como textos e imagens, em mundos interativos e jogáveis.

  • Gemini leva chatbot com IA ao Google Mensagens
  • Microsoft tentou vender Bing para Apple em 2018, diz Google

Pelo visto, a Gigante das Pesquisas não pretende deixar para baixo a concorrência, considerando que ainda não faz um mês que a companhia renomeou o Bard para Gemini e acirrou a disputa com o ChatGPT da OpenAI e com o Copilot da Microsoft.

O que é o Genie e como funciona

Revelado por um grupo de pesquisadores do Google, o Genie pode executar prompts de textos ou esboços de imagens para o novo modelo de inteligência artificial transformá-los em um universo virtual jogável.


CT no Flipboard: você já pode assinar gratuitamente as revistas Canaltech no Flipboard do iOS e Android e acompanhar todas as notícias em seu agregador de notícias favorito.

Por exemplo, você pode literalmente desenhar uma ideia em um papel, fotografar o material e fazer upload no Genie para que o modelo de inteligência artificial se encarregue de fazer sua “mágica”, sugerindo um universo com base no conteúdo e a mecânica de interatividade mais adequada para ele.

Para que isso seja possível, o Genie conta com tokenizer, tecnologia que cria uma representação segura de coisas que existem fora da internet. Essa solução é capaz de compactar vídeos em pequenos tokens, e o material é enviado para um modelo de ação para codificar as transições de quadros e transformá-las em ação. 

Por fim, o Genie conta com outro mecanismo inteligente não especificado que tem como função prever os próximos quadros com base no que o tokenizer esboçou previamente, explica o Google.

Processo de treinamento

Assim como outras IAs disponíveis no mercado, o Genie também passou por um longo período de treinamento, sendo alimentado por informações baseadas em gameplays de jogos de plataforma.

Inclusive, os resultados gerados pela ferramenta são mais próximos de um Super Mario Bros. clássico do que de um jogo em realidade virtual sofisticado, por exemplo.

Em publicação no X (antigo Twitter), o líder da equipe Google DeepMind para Genie, Tim Rocktäschel, deu detalhes sobre o processo de criação da IA.

O executivo comentou que o time de desenvolvimento usou um conjunto de dados composto por mais de 200 mil horas de vídeos de games de plataforma 2D para treinar o Genie.

Além disso, também foi revelado que a novidade do Google dispensou supervisão e usou vídeos “não rotulados”. Em outras palavras, os dados fornecidos à IA provavelmente tiveram o mínimo de triagem e ela assistiu de tudo, literalmente.

De acordo com Rocktäschel, essa “falta de babá” permitiu à tecnologia ser mais consistente por aprender controles, movimentos e ações de personagens adicionais. “Nosso modelo pode converter qualquer imagem em um mundo 2D jogável”, enfatiza o líder do Google DeepMind.

Apesar dessa liberdade toda, é inegável que existe uma preocupação quanto à ausência de moderação e se isso pode acabar ensinando conceitos repulsivos ao Genie, como ideias preconceituosas e discriminatórias (se é que a tecnologia é passível disso). Não há bola de cristal aqui, então somente o futuro dirá.

Quando chega?

Como se trata de um projeto de pesquisa, não existe qualquer previsão de lançamento do Genie para o público geral. Por ser algo experimental, inclusive, é possível que a tecnologia nem mesmo veja a luz do dia, mas quem sabe ela pode ser incorporada em outros produtos do Google, como o Gemini.

“Ressaca” do Sora

Essa nova ferramenta do Google vem logo depois de a OpenAI surpreender o mundo com a revelação do Sora, uma IA para gerar vídeos incríveis de forma praticamente instantânea. Inclusive, o Canaltech elencou dez exemplos que vão do incrível ao bizarro demonstrando o poderio da IA generativa.

Leia a matéria no Canaltech.

Trending no Canaltech:

  • Xiaomi lista os primeiros celulares que vão receber o HyperOS
  • Nova versão dos Supremos é o “time dos sonhos” dos Vingadores
  • Xiaomi lança câmera de segurança CW500 com preço baixo e proteção contra chuva
  • Modalidade Uber Adolescente será liberada em todo Brasil
  • Figurinhas animadas do WhatsApp vão ficar mais bonitas
  • Novo Xbox e o fim das mídias físicas
Adicionar aos favoritos o Link permanente.