Durante la GTC, NVIDIA presentó su último avance en chips gráficos enfocados en Inteligencia Artificial, denominado Blackwell. Este innovador chip no solo es el más grande del mundo en su categoría, sino que también logra un aumento de rendimiento cinco veces mayor que su predecesor, la GPU Hopper (NVIDIA H100).
Lo más destacado de la GPU NVIDIA Blackwell es su diseño revolucionario de múltiples chips (MCM), siendo cada chip Blackwell una combinación de dos GPU Blackwell. La plataforma que impulsa este avance incorpora dos chips Blackwell completos, junto con una CPU Arm Grace. A continuación, analicemos más detenidamente las capacidades que NVIDIA Blackwell aporta a la industria.
La mejora de rendimiento proporcionada por NVIDIA Blackwell es cinco veces mayor que la del mejor chip de IA disponible actualmente.
Con 208.000 millones de transistores, la GPU NVIDIA Blackwell supera en 128.000 millones a su predecesora, la NVIDIA Hopper. Además, integra cuatro veces más memoria dentro del propio die, lo que permite alcanzar hasta 192 GB de memoria HBM3e y un ancho de banda de 8 TB/s a través de una interfaz de 8.192 bits.
Fabricado por TSMC utilizando su tecnología de litografía de 4nm 4NP, cada GPU en el chip Blackwell está interconectada mediante una interfaz con un ancho de banda de 10 TB/s. La NVIDIA Blackwell está equipada con 20.480 CUDA Cores, utiliza chips de memoria HBM3e de 8 capas y tiene un TDP de hasta 700W, que coincide con el de las GPU NVIDIA H100 y H200.
NVIDIA Blackwell demuestra un rendimiento en IA de 20 petaFLOPS, siendo 5 veces más veloz que su predecesor, el chip NVIDIA H100. Este último es el buque insignia de la serie Hopper, diseñado específicamente para cargas de trabajo relacionadas con la IA. Dos chips Blackwell completos se emparejan con una CPU Grace para formar el superchip NVIDIA HB200.
El superchip integra una CPU con 72 núcleos Arm Neoverse V2, junto con las dos GPU Blackwell. Además, ofrece acceso a 384 GB de memoria HBM3e y está equipado con una conexión NVLink-C2C que proporciona un ancho de banda de 900 GB/s.
Comparativa de rendimiento entre el chip NVIDIA Blackwell y NVIDIA Hopper:
- 20 PFLOPS FP8 (2.5 veces más rápido que Hopper)
- 20 PFLOPS FP6 (2.5 veces más rápido que Hopper)
- 40 PFLOPS FP4 (5.0 veces más rápido que Hopper)
- 740 mil millones de parámetros (6.0 veces más rápido que Hopper)
- 34 billones de parámetros por segundo (5.0 veces más rápido que Hopper)
- 7.2 TB/s NVLINK (4.0 veces más rápido que Hopper)
El nuevo chip gráfico de NVIDIA ha sido aclamado como el más poderoso del mundo, gracias a una serie de mejoras significativas. Blackwell, como se le conoce, es impulsado por la arquitectura Transformer Engine de 2ª Generación, que ha sido mejorada con nuevas funciones de inferencia de IA en coma flotante de 4 bits. Esto permite que Blackwell admita modelos de computación más grandes y complejos, lo que representa un gran avance en el rendimiento de la inteligencia artificial.
Además, la 5ª Generación de la interconexión NVIDIA NVLink ha mejorado significativamente la comunicación entre las GPU, con un rendimiento bidireccional de hasta 1,8 TB/s por GPU. Esto garantiza una comunicación rápida y sin interrupciones entre un gran número de GPU, lo que es crucial para las aplicaciones más exigentes de inteligencia artificial.
Una característica destacada de las GPU Blackwell es su capacidad de mantenimiento preventivo basado en IA. Esto significa que la inteligencia artificial integrada en las GPU puede realizar diagnósticos y prever problemas de fiabilidad, lo que maximiza el tiempo de actividad del sistema y reduce los costos operativos. En resumen, Blackwell no solo es el chip gráfico más potente del mundo, sino que también está diseñado para ofrecer un rendimiento excepcional y una confiabilidad óptima en aplicaciones de inteligencia artificial a gran escala.
El sistema NVIDIA GB200 NVL72 es una solución de vanguardia para aplicaciones de alto rendimiento. Este sistema está compuesto por 36 superchips Grace Blackwell, cada uno equipado con 72 GPU Blackwell y 36 CPU Grace. La interconexión de estos componentes se logra a través de NVLink de quinta generación, lo que garantiza una comunicación rápida y eficiente.
Además de las potentes GPU y CPU, el sistema GB200 NVL72 también integra unidades de procesamiento de datos NVIDIA BlueField-3. Estas unidades permiten una aceleración significativa de la red en la nube, así como un almacenamiento componible, seguridad de confianza cero y una mayor flexibilidad en los cálculos de GPU en entornos de IA a gran escala.
En términos de rendimiento, el GB200 NVL72 supera con creces a las generaciones anteriores. Ofrece hasta 30 veces más rendimiento en comparación con las GPU NVIDIA H100 Tensor Core para cargas de trabajo de inferencia LLM. Además, logra reducir hasta 25 veces los costos y el consumo de energía, lo que lo convierte en una opción altamente eficiente para aplicaciones exigentes.