Microsoft Build 2024 | Novo modelo de IA da MS lê gráficos e tabelas

A Microsoft lançou um novo modelo multimodal chamado Phi-3-Vision com capacidade para realizar tarefas gerais que envolvem o raciocínio visual, como lidar com gráficos e tabelas. A IA faz parte da família de modelos de pequena escala (SLMs) da companhia, dimensionada em 4,2 bilhões de parâmetros — em comparação, o ChatGPT tem 175 bilhões de parâmetros. A novidade foi revelada nesta terça-feira (21), durante a Microsoft Build 2024.

  • Apple lança novo modelo de linguagem e avança no mundo da IA
  • Microsoft pode lançar chip próprio de IA para frear Nvidia

A família de modelos de linguagem de pequena escala Phi foi apresentada pela primeira vez no ano passado como uma solução própria da Microsoft no segmento de inteligência artificial e um “plano B” em relação às soluções licenciadas da OpenAI.

Modelos Phi da Microsoft

Apesar de contar com menos parâmetros do que as concorrentes do mercado, os modelos Phi da Microsoft apresentam bons resultados em testes de benchmark. O modelo Phi-2, lançado em dezembro, chegou a igualar a pontuação de modelos até 25x maiores “graças a inovações no dimensionamento do modelo e na curadoria de dados de treinamento”, segundo a companhia.


Feedly: assine nosso feed RSS e não perca nenhum conteúdo do Canaltech em seu agregador de notícias favorito.

O Phi-3-Vision, que chega agora em versão prévia, tem maior dimensão em relação ao Phi-2 (de 2,7 para 4,2 bilhões de parâmetros) e segue a proposta de ser um modelo otimizado para o uso em aparelhos pessoais.

De acordo com o anúncio da Big Tech de Redmond, “o modelo tem a capacidade de compreender imagens e textos e gerar respostas em texto. Por exemplo, os usuários podem fazer perguntas sobre um gráfico ou fazer perguntas abertas sobre imagens específicas”.

Microsoft lança nova IA com foco em raciocínio visual (Imagem: Turag Photography/Unsplash)
Microsoft lança nova IA com foco em raciocínio visual (Imagem: Turag Photography/Unsplash)

O foco do novo SLM está na realização de tarefas com componentes visuais, como analisar os conteúdos de tabelas, gráficos, mapas, imagens e outras representações gráficas.

Junto com a apresentação do Phi-3-Vision, a Microsoft anunciou nesta terça-feira (21) que os modelos Phi-3-mini e Phi-3-medium agora estão disponíveis no Microsoft Azure AI, como parte da oferta de modelos como serviço (MaaS). O Phi-3-small também já está disponível.

Leia a matéria no Canaltech.

Trending no Canaltech:

  • Windows XP conecta na internet e fica infestado de vírus em minutos
  • 🚨 MUITO BARATO | Compre Galaxy S23 Ultra de 256 GB com ótimo desconto
  • Descoberta sobre buracos negros confirma teoria de Einstein
  • WhatsApp vai restringir perfis que mandam muitas mensagens
  • Qual é o melhor aplicativo de mensagens depois do WhatsApp?
  • As 50 piadas mais engraçadas do Google Assistente
Adicionar aos favoritos o Link permanente.