Stable Diffusion 3 Medium é a IA geradora de imagens mais avançada da Stability

A Stability AI anunciou o Stable Diffusion 3 Medium, a primeira versão aberta da nova geração do modelo de IA para gerar imagens. De acordo com a empresa, é o “modelo aberto de texto para imagem mais avançado até o momento”, com dois bilhões de parâmetros.

  • Image Playground | Tudo sobre a IA para criar imagens da Apple
  • Dona do Kwai lança IA que cria vídeos realistas estilo Sora

Os maiores destaques estão no realismo e na habilidade com tipografia. As primeiras imagens reveladas pelo SD3 Medium chamam a atenção pela quantidade de detalhes nos quais a IA normalmente tem dificuldade de acertar, como rostos e mãos, além de proporcionar resultados de alta qualidade. 

A arquitetura do Diffusion Transformer permite criar imagens com textos sem erros de digitação ou problemas na formatação das letras, enquanto o modelo é capaz de compreender prompts cada vez mais complexos para ajudar na personalização do resultado.


Canaltech no Youtube: notícias, análise de produtos, dicas, cobertura de eventos e muito mais! Assine nosso canal no YouTube, todo dia tem vídeo novo para você!

Alguns exemplos de imagens geradas com o Stable Diffusion 3 Medium (Imagem: Divulgação/Stability AI)

Performance otimizada

O modelo de dois bilhões de parâmetros é otimizado para garantir eficiência em computadores pessoais e GPUs de nível empresarial — o Stable Diffusion 3 tem modelos que podem chegar a oito bilhões de parâmetros, por exemplo, então a Stability AI pretende usar o tamanho da versão média como um padrão para conversão de texto para imagem. 

A empresa informa que o consumo de VRAM foi reduzido, o que melhora a performance da ferramenta em placas de vídeo mais limitadas. Além disso, a desenvolvedora contou com a colaboração de NVIDIA e AMD para otimizar o Stable Diffusion 3 em diferentes dispositivos, como as placas de vídeo da série RTX e APUs da AMD.

Já disponível

A Stability AI anunciou a família de modelos do Stable Diffusion 3 em fevereiro deste ano, mas ainda não era possível testá-la em diferentes ferramentas. O SD3 Medium está disponível para uso via API da Stability Platform ou pelos serviços pagos Stable Assistant e Stable Artisan.

A empresa também é responsável por outros modelos de IA generativa, como é o caso do Stable Audio, capaz de criar músicas com até três minutos de duração a partir de prompts de texto.

Leia a matéria no Canaltech.

Trending no Canaltech:

  • Clientes do C6 Bank relatam sumiço de investimentos nesta quarta (12)
  • 😱 CAIU MAIS | Compre PS5 Slim com 2 jogos em super oferta com cupom
  • Caixa da JBL sobrevive após 25 dias embaixo da lama no RS
  • Paciente usa implante de plástico transparente que mostra o cérebro
  • Dia dos Namorados | Doodle interativo do Google mistura química e amor
  • 8 IAs para criar animações
Adicionar aos favoritos o Link permanente.