GTC | NVIDIA lança GPUs Blackwell com 30x mais poderosas

Nesta segunda-feira (18), a NVIDIA lançou na GTC 2024 (Graphics Technology Conference) as novas GPU B200 para IA, inaugurando a arquitetura Blackwell. As novas GPUs trazem inovações de hardware e de tecnologias embarcadas que entregam, por GPU, 4 vezes mais desempenho em treinamento, 30 vezes mais em inferências e 25 vezes mais eficiência energética em relação aos chips Hopper H100.

  • O que é LLM? | Large Language Model
  • O que é IA generativa?

Os novos chips Blackwell são fabricados em processo de 4 nm da TSMC 4NP, adaptado para integrar dois dies Blackweel para atuarem como uma única GPU por meio de interconectores chip-para-chip (NVLINK C2C) de 10 TB/s. A grande vantagem do novo design é eliminar eventuais problemas de comportamento de programas em arquitetura desagregada de chiplets.

Novos chips Blackwell integram dois dies para atuarem como uma única GPU (Imagem: NVIDIA / Divulgação)

Inferência na escala de trilhões de parâmetros

Outra inovação dos chips Blackwell é a introdução da nova geração de Núcleos Tensor e compiladores Tensor combinando modelos TensorRT-LLM e framework NeMo Megatron. Entre outras vantagens, o resultado é uma aceleração de inferência e treinamento em tempo real na escala de 10 trilhões de parâmetros.


Canaltech no Youtube: notícias, análise de produtos, dicas, cobertura de eventos e muito mais! Assine nosso canal no YouTube, todo dia tem vídeo novo para você!

Além disso, a NVIDIA lançou a quinta geração de interconectores NVIDIA NVLink com largura de banda bidirecional de 1,8 TB/s, garantindo comunicação de altíssima velocidade entre até 576 GPUs. Com a implementação de um motor de descompressão dedicado, os chips B200 ainda oferecem ganhos significativos de desempenho em atividades de análise de dados.

Novo Superchip GB200 traz dois chips Blackwell B200 atuando como uma única GPU por meio de interconectores NVLink C2C. (Imagem: NVIDIA / Divulgação)

Servidores NVL72 com superchip

Por fim, o maior destaque da nova arquitetura de GPUs da NVIDIA fica para o superchip Grace-Blackwell GB200, evolução dos já impressionantes Grace-Hopper, implementados nos servidores NVL72. A nova geração de racks NVIDIA para IA e HPC combina 36 CPUs Amazing Grace e 72 GPUs Blackwell B200 em comunicação pela quinta geração do NVIDIA NVLink.

O resultado é um servidor com poder computacional de 720 Petaflops (PFLOPs) em treinamento de modelos LLM, 1.440 PFLOPs em inferência e capacidade para modelos de até 27 trilhões de parâmetros. A NVIDIA já conta com um portfólio vasto de empresas que vão adotar as soluções Blackwell ainda em 2024.

Servidores NVL72 trazem 36 CPUs Grace e 72 GPU Blackwell B200 em um único rack, oferecendo 720 e 1440 PetaFLOPs em desempenhos de treinamento LLM e de inferência, respectivamente. (Imagem: NVIDIA / Divulgação)

Entre as principais parcerias estão Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure e Amazon Web Services (AWS) como primeiras a atualizarem suas infraestruturas. Além disso, Cisco, Dell, Lenovo e Supermicro também vão produzir suas próprias soluções de servidores utilizando chips Blackwell e outras tecnologias NVIDIA também para 2024.

  • 🛒 Compre placa de vídeo NVIDIA GeForce RTX pelo melhor preço!
  • 🛒 Compre notebook gamer com GPU NVIDIA GeForce RTX pelo melhor preço!

Leia a matéria no Canaltech.

Trending no Canaltech:

  • Ciência define a partir de qual idade a pessoa é “velha”
  • Instagram pode aumentar limite do carrossel para 15 fotos
  • Google Play Games vai receber jogos de PC para bater de frente com Steam e Epic
  • Atriz de Harry Potter volta a provocar fãs e desdenha da Marvel: “Cresçam!”
  • Programa do IRPF 2024 já está disponível; veja como baixar
  • Pen drive na parede | Projeto artístico curioso tem adeptos no Brasil
Adicionar aos favoritos o Link permanente.