OpenAI ha anunciado Jalapeño, su primer acelerador diseñado específicamente para la inferencia de modelos de lenguaje de gran tamaño (LLM). Desarrollado en colaboración con Broadcom, el chip está orientado a ejecutar servicios como ChatGPT y Codex, con el objetivo de mejorar el rendimiento y reducir los costes operativos asociados a la generación de respuestas.
La compañía, que durante años ha dependido principalmente de hardware de NVIDIA, busca así ganar mayor control sobre su infraestructura y disminuir el coste por token procesado. Según OpenAI, las muestras de ingeniería ya funcionan con las frecuencias y niveles de consumo previstos para la versión final, mientras que las primeras pruebas internas muestran una mejor eficiencia energética que las soluciones líderes actuales.
El desarrollo de Jalapeño se completó en un plazo de nueve meses entre la fase conceptual y el tape-out, el momento en que un diseño queda listo para su fabricación. Los primeros despliegues están previstos para finales de 2026, con una expansión progresiva en futuras generaciones del producto.
La empresa también señaló que, junto con Qualcomm, ha iniciado una estrategia centrada en el desarrollo de silicio propio para afrontar el creciente coste de la inferencia de IA. Una reducción de estos costes permitiría acortar tiempos de espera, abaratar el acceso a APIs y mejorar la escalabilidad de servicios basados en modelos generativos.
La apuesta llega en un mercado donde varios competidores ya cuentan con hardware especializado. Google asegura que sus TPU Trillium ofrecen una eficiencia energética 67 % superior a la de TPU v5e. Por su parte, AWS promociona Trainium como una alternativa para reducir costes de entrenamiento e inferencia, mientras que Microsoft afirma que Maia 200 proporciona un rendimiento por dólar 30 % superior al de los aceleradores utilizados anteriormente en su infraestructura.
El interés por este segmento también se refleja en los resultados financieros de Broadcom. La compañía registró 10.800 millones de dólares en ingresos procedentes de semiconductores para IA durante el segundo trimestre del ejercicio fiscal 2026, lo que representa un crecimiento interanual del 143 %. Para el tercer trimestre, la empresa prevé alcanzar los 16.000 millones de dólares en esta división.
Fuente: OpenAI, Broadcom, gráficos de IA





