Voltar

Google Apresenta Ironwood TPU com Recorde de 1,77 PB de Memória Compartilhada

Google Apresenta Ironwood TPU com Recorde de 1,77 PB de Memória Compartilhada

Arquitetura do Ironwood TPU da Google

A Google revelou sua mais recente Unidade de Processamento de Tensor, nomeada Ironwood, como a primeira TPU construída principalmente para cargas de trabalho de inferência em massa em vez de treinamento. O chip integra dois dies de computação, cada um entregando 4.614 TFLOPs de desempenho FP8. Oito pilhas de memória HBM3e fornecem 192 GB por chip, entregando 7,3 TB/s de largura de banda. O design de dois dies permite que o sistema seja dimensionado sem lógica de cola, suportando até 9.216 chips por pod.

Memória Compartilhada Recorde

Quando totalmente montado, o pod Ironwood oferece 1,77 PB de memória HBM diretamente endereçável, estabelecendo um novo recorde mundial para supercomputadores de memória compartilhada. O grande pool de memória é vinculado por switches de circuito óptico que conectam as prateleiras, permitindo que o sistema mantenha alta largura de banda enquanto é dimensionado.

Desempenho e Eficiência

Ao longo do pod completo, a configuração atinge 42,5 exaflops de desempenho. A Google afirma uma melhoria de duas vezes no desempenho por watt em comparação com sua geração anterior, Trillium, graças à escala de tensão-frequência dinâmica e a uma solução de refrigeração líquida com placa fria que aproveita a infraestrutura de refrigeração de terceira geração da empresa.

Confiabilidade, Disponibilidade e Manutenção (RAS)

O Ironwood incorpora várias funcionalidades de confiabilidade no chip, incluindo uma raiz de confiança, funções de auto-teste e mecanismos para mitigar a corrupção silenciosa de dados. Funções de reparo de lógica melhoram o rendimento de fabricação, e o sistema pode ser reconfigurado em torno de nós com falha, restaurando cargas de trabalho de pontos de verificação.

Design Assistido por IA e SparseCore

A Google utilizou técnicas de IA para otimizar os circuitos ALU e o plano de layout do chip Ironwood. Um SparseCore de quarta geração é adicionado para acelerar embeddings e operações coletivas, visando cargas de trabalho como motores de recomendação.

Implantação e Disponibilidade

A Google começou a implantar o Ironwood em seus data centers de nuvem em larga escala, embora a TPU permaneça como uma plataforma interna não oferecida diretamente a clientes externos. O design reflete a estratégia de longo prazo da Google para construir computação de alto nível de IA em camadas de chip, interconexão e infraestrutura física.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: