A empresa Tensordyne, fundada em 2017 com o nome Recogni, relatou o chamado tape-out do acelerador AI “Napier”. O nome se refere a John Napier, considerado o inventor dos logaritmos como auxiliar de cálculo. Graças à matemática dos logaritmos, o chip Napier tem como objetivo converter em adição as muitas multiplicações necessárias ao usar modelos de IA.
Leia mais depois do anúncio
Como as adições podem ser calculadas com mais eficiência, o Tensordyne promete maior poder de computação por rack do que os atuais servidores de IA com tecnologia Nvidia GB300. Dependendo do modelo de IA, diz-se que o rack Napier entrega até 13 vezes mais tokens por segundo do que o Nvidia GB300 NVL72.
A eficiência, calculada em tokens por segundo por watt, é estimada em um fator 17 a mais.
Segundo a empresa, já possui pedidos do sistema Napier que totalizam mais de US$ 200 milhões. No entanto, a Tensordyne não anunciou exatamente quando os primeiros pods TDN72 serão enviados.
No entanto, a Nvidia quer trazer ao mercado o sistema Groq 3 LPX, otimizado especificamente para inferência, até o final de 2026. O Rubin CPX, que também foi anunciado para inferência, pode não estar na mesa agora.
Chip Napier com SRAM e HBM3E
O método de cálculo logarítmico permite que a unidade de cálculo real do Napier seja menor, de modo que caiba mais no chip e haja espaço para SRAM rápida. Cada chip está associado a 144 GB de RAM HBM3E. A Teledyne também instala uma interconexão particularmente rápida.
Leia mais depois do anúncio
Um pod TDN72 consiste em quatro compartimentos de rack estreitamente interligados, cada um com nove chips Napier. Um Tensordyne Napier Rack (TDN Rack) consiste em quatro pods TDN72, ou seja, 288 chips Napier.
A estrutura do Tensordyne Rack consiste em quatro pods TDN72, cada um com 72 processadores “Napier”.
(Imagem: Tensordyne)
O rack TDN atinge 608 PFlops, possui 42 TByte HBM3E, 78 GByte SRAM e 256 TByte RAM. Consome 120 quilowatts de energia em plena carga e requer refrigeração a ar. Interligação no rack de transferência até 275 TByte/s.
O chip Napier destina-se a processar, entre outros, formatos de dados FP16, FP8, FP4 e Int8. De acordo com Tensordyne, é adequado para modelos gerais de IA, como Kimi K2.6, DeepSeek-R1/V4 Pro, Llama3.1 405B, Mixtral 8x22B, GPT-OSS-120B e Qwen 80B.
Para efeito de comparação: a Nvidia deseja instalar um total de 256 LPUs Groq 3 no rack Groq 3 LPX, cada uma com 500 MB de SRAM. Isso resulta em 128 GB de SRAM por rack, mais 12 TB de RAM DDR5.
Cooperação com Broadcom e TSMC
A Tensordyne está sediada no Vale do Silício e com filial em Munique. Vários desenvolvedores seniores trabalharam anteriormente na Juniper Networks, que agora faz parte da HPE.
Tensordyne colaborou com a Broadcom para desenvolver o Napier. A Broadcom também desenvolve chips de IA para outras empresas, como várias gerações de TPU do Google.
(dica)



