Presentamos KAI Inference Builder

Convierte la inferencia en una ventaja competitiva mediante la emulación, la validación y la evaluación comparativa de cargas de trabajo reales.

Prepárate para la era de la inferencia en la IA

Durante años, la estrategia de infraestructura de IA se centró en el entrenamiento. Ahora, el sector está cambiando su enfoque hacia la forma en que los modelos de IA responden a las solicitudes y consultas de los usuarios. Este proceso se conoce como «inferencia» y está cobrando un papel protagonista.

Keysight AI (KAI) Inference Builder está diseñado para esta nueva era. KAI Inference Builder, una solución de emulación y análisis orientada a la inferencia, reproduce el comportamiento del cliente y las respuestas de la IA para probar y optimizar la infraestructura de IA en condiciones de carga de trabajo realistas. Gracias a la validación completa basada en cargas de trabajo, ya no es necesario conformarse con pruebas de rendimiento genéricas o pruebas de carga.

KAI Inference Builder: Funciones principales

Comprobar el rendimiento de la inferencia de extremo a extremo

Comprueba la ruta completa de solicitud-respuesta utilizando solicitudes reales, concurrencia y transmisión de tokens. KAI Inference Builder ayuda a los equipos a detectar cuellos de botella en el equilibrio de carga, las redes y la computación, antes de que se produzcan en producción.

Averigua primero qué es lo que falla

Identifica los cuellos de botella en las capas de computación de la GPU, memoria, caché KV, almacenamiento, PCIe, RDMA y orquestación. En el modo «one-arm», KAI Inference Builder actúa como un cliente de inferencia a gran escala, dirigiendo cargas de trabajo en forma de prompts directamente a las pilas de inferencia, de modo que los equipos de redes puedan localizar los problemas más rápidamente y ajustar el rendimiento con precisión. 

Haz que la pila de inferencias hable

Introduce formas de mensajes de error reales en la pila y correlaciona la telemetría resultante para determinar qué necesita tu sistema: ya sea más memoria, una mejor programación, rutas de recuperación más sólidas o una mayor utilización de la GPU. Al medir los flujos de trabajo de inferencia de extremo a extremo, KAI Inference Builder transforma el complejo comportamiento del sistema en información clara y útil.

Compara mejor con perfiles reales

No todas las cargas de trabajo de inferencia se comportan de la misma manera. Por eso, KAI Inference Builder modela los formatos de las solicitudes y las respuestas de los modelos específicos de cada sector. Con soporte para los sectores jurídico, financiero y otros, KAI Inference Builder ayuda a los equipos a generar pruebas específicas para cada carga de trabajo, comparar arquitecturas y detectar regresiones a medida que evolucionan los modelos y los patrones de las solicitudes.

Simulación de centros de datos de IA con NVIDIA DSX Air y Keysight

Reducir los plazos de implementación y los riesgos

Los plazos de implementación de la infraestructura de IA suelen verse limitados por la disponibilidad del hardware. Por eso, KAI Inference Builder ofrece una integración llave en mano con los entornos de gemelos digitales de NVIDIA DSX Air. KAI Inference Builder emula las solicitudes y respuestas de inferencia del mundo real dentro del entorno modelado del centro de datos, lo que permite a los equipos de redes comenzar a validar y optimizar las implementaciones antes de que la infraestructura física esté completamente instalada.

Más información

Explore nuestras últimas investigaciones, informes y conocimientos sobre IA.