Microsoft revela IA que faz foto de rosto “falar”

A Microsoft divulgou a criação de uma nova IA capaz de gerar vídeos de rostos falantes a partir da combinação de uma foto de retrato e um arquivo de áudio com o discurso da pessoa. A inteligência artificial recebeu o nome de VASA, mas ainda não foi disponibilizada para o público.

  • Como treinar uma inteligência artificial?
  • O que é IA generativa?

Na apresentação, a Microsoft reconhece a preocupação sobre o potencial de a ferramenta ser usada indevidamente para se passar por humanos e informa que não há previsão de de lançamento do VASA enquanto não tiver certeza que a solução poderá ser utilizada com segurança e responsabilidade.

Vídeos de rostos falantes com IA

O novo modelo de linguagem da Microsoft é capaz de transformar fotos em vídeos falantes com expressão facial, movimentação da cabeça e sincronização labial a partir de uma simples imagem e um áudio.


Siga no Instagram: acompanhe nossos bastidores, converse com nossa equipe, tire suas dúvidas e saiba em primeira mão as novidades que estão por vir no Canaltech.

Nos resultados apresentados pela companhia na página de pesquisa, os exemplos destacam a possibilidade de solicitar diferentes ângulos e posições dos rostos nos vídeos — como mudança na orientação do olhar e na escala de tamanho da cabeça em relação ao espaço de tela.

Microsoft apresenta a IA VASA (Imagem: Divulgação/Microsoft)
Microsoft apresenta a IA VASA (Imagem: Divulgação/Microsoft)

Não apenas é possível criar vídeos com bastante realismo a partir de fotos de rostos humanos, mas também produções animadas e artísticas podem ser realizadas com a ferramenta. A Microsoft exemplifica essa possibilidade com um material animado da Monalisa.

De acordo com a companhia, a IA “gera vídeos com 512 X 512 [pixels] de tamanho a 45 fps (quadros por segundo) no modo de processamento offline e suporta até 40 fps no modo de streaming online”.

Responsabilidade de uso

No comunicado de apresentação do VASA, a Microsoft publicou considerações sobre os riscos de mau uso da ferramenta e destaca as aplicações positivas que a IA pode oferecer.

“Somos contra a qualquer comportamento que crie conteúdos enganosos ou prejudiciais de pessoas reais e estamos interessados em aplicar a nossa técnica para avançar na detecção de falsificações. Atualmente, os vídeos gerados por este método ainda contêm artefatos identificáveis, e a análise numérica mostra que ainda há uma lacuna para alcançar a autenticidade dos vídeos reais”, informa a Big Tech.

No entanto, a companhia acredita que há benefícios que valem o investimento no VASA, incluindo a ajuda para pessoas com dificuldades de comunicação e apoio terapêutico aos necessitados.

Porém, enquanto as preocupações sobre os riscos não forem resolvidas, a Microsoft não vai disponibilizar a IA para o público. “Não temos planos de lançar uma demo, o produto, uma API, detalhes adicionais de implementação ou quaisquer ofertas relacionadas até que tenhamos certeza de que a tecnologia será usada de forma responsável e de acordo com os regulamentos adequados”, reforça a companhia.

Leia a matéria no Canaltech.

Trending no Canaltech:

  • WhatsApp terá atalho para salvar mensagens como notas de contatos
  • Assassin’s Creed Mirage está de graça por tempo limitado
  • Segundo buraco negro mais perto da Terra é descoberto
  • Cidade perdida achada em Tonga revoluciona a história no Pacífico
  • As 10 fotos mais curtidas na história do Instagram
  • Polícia prende suspeito de vazar dados de 220 milhões de brasileiros
Adicionar aos favoritos o Link permanente.