Tensordyne presenta Napier, un acelerador de IA que apunta a competir con NVIDIA GB300 y Rubin mediante aritmética logarítmica

La empresa Tensordyne ha revelado nuevos detalles sobre Napier, un acelerador para inteligencia artificial diseñado para competir con plataformas como NVIDIA GB300 y la futura arquitectura Rubin. La propuesta apuesta por un enfoque diferente al de los GPU convencionales mediante el uso de una arquitectura propia basada en aritmética logarítmica denominada Pareto.

El chip ya ha completado la fase de tape-out y ha sido enviado a fabricación en el proceso de 3 nm de TSMC. Según la información difundida por la compañía, cada paquete tendrá un consumo de 300 W, ofrecerá hasta 2,1 PFLOPS en FP8 con datos densos e integrará 144 GB de memoria HBM3e junto con 256 MB de SRAM por chip. La arquitectura también incorpora interconexiones entre aceleradores con una latencia inferior a 1 microsegundo.

Tensordyne afirma que un rack equipado con 288 chips Napier alcanzará 608 PFLOPS, contará con 42 TB de memoria HBM3e y mantendrá un consumo total de 120 kW utilizando refrigeración por aire. De acuerdo con las simulaciones de la compañía, esta configuración podría ofrecer hasta 13 veces más tokens por segundo y 17 veces más tokens por vatio que un sistema basado en NVIDIA GB300.

La compañía sostiene que estas características permitirían reducir los costes de inferencia y la latencia en modelos de gran escala. Entre sus estimaciones figura un rendimiento superior a 1.000 tokens por segundo por usuario en modelos con varios billones de parámetros. Además, asegura que una carga de trabajo equivalente requeriría, en el ecosistema de NVIDIA, hasta nueve racks Rubin junto con un sistema Groq LPX.

Por el momento, las cifras presentadas por Tensordyne no han sido verificadas mediante pruebas independientes. La empresa basa sus resultados en simulaciones y documentación técnica, mientras que el hardware aún no ha sido evaluado en despliegues reales.

La comparación llega en un contexto en el que NVIDIA también ha anunciado avances significativos con Vera Rubin, una plataforma que promete rendimientos de varios PFLOPS en NVFP4 por GPU, un ancho de banda de memoria de 3,6 TB/s y costes de generación de tokens hasta 10 veces inferiores a los de Blackwell. A diferencia de Napier, la nueva arquitectura de NVIDIA parte de una posición ya consolidada en centros de datos, mientras que la propuesta de Tensordyne deberá demostrar sus capacidades una vez llegue al mercado.

Fuente: Tensordyne

Podría interesarte