Concorrente do ChatGPT lança IA multimodal que processa texto e imagem

A startup francesa Mistral lançou o Pixtral 12B, seu primeiro modelo de inteligência artificial multimodal. Capaz de processar tanto texto quanto imagens, o modelo conta com 12 bilhões de parâmetros e pode realizar tarefas como legendar imagens e identificar objetos em fotos.

  • Clique e siga o Canaltech no WhatsApp
  • Pesquisadores criam método para detectar alucinações de IA

Pixtral 12B foi construído com base no modelo de texto Nemo 12B, também da Mistral, e tem um tamanho aproximado de 24GB. O modelo permite respostas a perguntas baseadas em imagens de diferentes tamanhos e fontes, seja por meio de URLs ou imagens codificadas em base64.

Assim como outras IAs multimodais, como o GPT-4 da OpenAI, o Pixtral 12B pode ser usado em uma variedade de contextos, incluindo plataformas de chatbot e APIs.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

Disponibilidade do Pixtral 12B

O modelo está disponível gratuitamente para download via GitHub e Hugging Face, sob a licença Apache 2.0, o que permite seu uso e modificação sem restrições. Segundo Sophia Yang, chefe de relações com desenvolvedores da Mistral, ele será integrado em breve às plataformas da empresa, Le Chat e Le Plateforme, para testes.

Mistral apresenta seu novo modelo de IA com capacidade multimodal (Imagem: Solen Feyissa/Unsplash)
Mistral apresenta seu novo modelo de IA com capacidade multimodal (Imagem: Solen Feyissa/Unsplash)

Ainda não está claro quais dados de imagem foram usados para treinar o Pixtral 12B. Modelos de IA gerativa, como os da Mistral, são normalmente treinados com grandes quantidades de dados públicos da internet, o que levanta questões sobre direitos autorais. Recentemente, grandes empresas de IA enfrentaram processos judiciais relacionados ao uso de dados protegidos por copyright.

Leia mais sobre o debate entre treinamento de IAs e direitos autorais:

  • Autores processam Anthropic por treinar a IA Claude com livros pirateados
  • ChatGPT | OpenAI revela riscos e respostas inesperadas do GPT-4o
  • Como os dados na web são coletados para desenvolver IAs
  • Por que o X/Twitter gera imagens polêmicas que outras IAs bloqueiam?
  • Gravadoras processam IAs de música por violação de direitos autorais

O lançamento do Pixtral 12B acontece após a Mistral concluir uma rodada de financiamento de US$ 645 milhões, elevando o valor da empresa para US$ 6 bilhões. Com participação minoritária da Microsoft, a Mistral tem sido vista como a resposta europeia à OpenAI, apostando em modelos de IA abertos ao público.

Veja também: Mistral lança modelo de IA Large 2 com suporte ao português

Leia a matéria no Canaltech.

Trending no Canaltech:

  • Galaxy S25 Ultra ganha imagens com provável visual redesenhado
  • Anatel amplia 0303 para combater ligações de spam
  • iPhone 16 Pro Max X Galaxy S24 Ultra | Qual é mais potente?
  • 🚨 CUPOM EXCLUSIVO | Galaxy S24 Ultra de 256 GB com super desconto
  • Edge 50 Neo será 1º Motorola com 5 anos de atualizações do Android
  • Google One lança plano Lite com 30 GB de armazenamento no Brasil
Adicionar aos favoritos o Link permanente.