Esta es la página que creemos que buscaba. Ver resultados de búsqueda en su lugar:

KAI Inference Builder Validación y optimización de infraestructuras de inferencia de IA

Modelo: 952-1010

Visión general
Opciones
Accesorios
Software
Ayuda

Paquete KAI Inference Builder con 10 agentes y hasta 1000 solicitudes por segundo

El paquete KAI Inference Builder incluye 10 agentes y hasta 1000 solicitudes por segundo (suscripción de 1 año, con uso flotante en todo el mundo). El paquete cumple con la normativa TAA.

Form factor

Software
License types

Subscription
Performance Level

1000 prompts per second, 10000 simulated users

View Data Sheet

Destacados

Simula un comportamiento realista de los clientes de IA a gran escala para validar infraestructuras y pilas completas de inferencia de IA.
Selecciona diferentes indicaciones de perfiles de IA que generen puntos de presión en distintas etapas del proceso de inferencia de la IA.
Valida las infraestructuras de inferencia de IA implementadas en la nube pública o privada mediante la emulación de clientes de inferencia totalmente virtuales o basados en hardware.
Amplíe la escala hasta millones de usuarios emulados con un control preciso de las solicitudes generadas por segundo, lo que permite realizar pruebas de escala de inferencia de IA sin igual.
Obtén estadísticas detalladas de inferencia para obtener información útil sobre posibles cuellos de botella, limitaciones e ineficiencias en los distintos componentes del proceso de inferencia de IA:
- Cálculo con GPU
- Sistemas de memoria HBM / VRAM
- Caché KV y capas de almacenamiento
- Interconexiones PCIe y RDMA
- Motores de modelos y coordinadores
Correlacionar las métricas del lado del cliente con la ingesta de datos de telemetría a nivel del motor de inferencia (por ejemplo, estadísticas de VLLM) y de telemetría de la GPU a nivel del sistema (por ejemplo, datos de DCGM) en una única vista sincronizada en el tiempo:
- Indicaciones: segundo
- Usuarios simultáneos
- Tiempo hasta el primer token (TTFT): valor máximo y percentiles (por ejemplo, P50, P90, P99)
- Tiempo hasta el último token (TTLT): valor máximo y percentiles (por ejemplo, P50, P90, P99)
- Tokens por segundo (entrada / salida)
- Uso de la caché
- Tiempo de precarga y decodificación
- Uso de Tensor Core
- Estado del programador
- Consumo energético de la GPU

Servicios y asistencia

Cuidado de Keysight

Innovar rápidamente con planes de asistencia personalizados y tiempos de respuesta y resolución priorizados.

Alternativas financieras

Obtenga suscripciones predecibles basadas en arrendamiento y soluciones completas de gestión del ciclo de vida, para que pueda alcanzar sus objetivos empresariales más rápidamente.

Portal de soporte de Keysight

Disfrute de un servicio superior como suscriptor de KeysightCare y obtenga una respuesta técnica comprometida y mucho más.

Calibración

Asegúrese de que su sistema de pruebas funcione según las especificaciones y cumpla con las normas locales y globales.

Educación

Realice mediciones rápidamente con formación interna impartida por instructores y aprendizaje electrónico.

Centro de descargas de software

Descargue el software de Keysight o actualice su software a la versión más reciente.

Volver arriba

Inicie su cotización eligiendo un producto Seleccione una configuración a continuación

KAI Inference Builder Validación y optimización de infraestructuras de inferencia de IA

Paquete KAI Inference Builder con 10 agentes y hasta 1000 solicitudes por segundo

¿Listo para un presupuesto?

Destacados

Servicios y asistencia