Ecco la pagina che pensiamo volesse. Vedi invece i risultati della ricerca:

KAI Inference Builder Convalida e ottimizzazione delle infrastrutture di inferenza AI

Modello: 952-1010

Panoramica
Opzioni
Accessori
Software
Supporto

Avanti

Pacchetto KAI Inference Builder con 10 agenti e fino a 1000 richieste al secondo

Il pacchetto KAI Inference Builder include 10 agenti e fino a 1000 richieste al secondo (abbonamento di 1 anno, con licenze fluttuanti valide in tutto il mondo). Il pacchetto è conforme alla normativa TAA.

Form factor

Software
License types

Subscription
Performance Level

1000 prompts per second, 10000 simulated users

View Data Sheet

Punti salienti

Simulare un comportamento realistico dei client AI su larga scala per verificare l'intero stack e le infrastrutture di inferenza AI.
Scegli diversi prompt per i profili di IA che generano punti di pressione nelle diverse fasi della pipeline di inferenza dell'IA.
Verifica le infrastrutture di inferenza AI implementate su cloud pubblico o privato tramite l'emulazione di client di inferenza completamente virtuale o basata su hardware.
Scalabilità fino a milioni di utenti emulati con un controllo granulare sul carico di prompt generati al secondo, per test di scalabilità dell'inferenza AI senza pari.
Ottieni statistiche dettagliate sull'inferenza per acquisire informazioni utili su potenziali colli di bottiglia, limiti e inefficienze nei vari componenti della pipeline di inferenza dell'IA:
- Elaborazione su GPU
- Sistemi di memoria HBM / VRAM
- Livelli di cache e archiviazione KV
- Interconnessioni PCIe e RDMA
- Motori di modellazione e orchestratori
Correlare le metriche lato client con l'acquisizione dei dati di telemetria a livello del motore di inferenza (ad esempio, le statistiche VLLM) e dei dati di telemetria della GPU a livello di sistema (ad esempio, i dati DCGM) in un'unica vista sincronizzata nel tempo:
- I messaggi appariranno un secondo dopo
- Utenti simultanei
- Tempo trascorso fino al primo token (TTFT) — Valore massimo e percentili (ad esempio, P50, P90, P99)
- Tempo trascorso dall'ultimo token (TTLT) — Valore massimo e percentili (ad esempio, P50, P90, P99)
- Gettoni al secondo (in entrata / in uscita)
- Utilizzo della cache
- Tempo di precompilazione e decodifica
- Utilizzo dei Tensor Core
- Stato dello scheduler
- Consumo energetico della GPU

Servizi e assistenza

KeysightCare

Innova rapidamente grazie a piani di assistenza personalizzati e tempi di risposta e risoluzione prioritari.

Alternative finanziarie

Ottieni abbonamenti prevedibili basati su leasing e soluzioni complete per la gestione dell'intero ciclo di vita, in modo da raggiungere più rapidamente i tuoi obiettivi aziendali.

Portale di assistenza Keysight

Beneficia di un servizio di alto livello come abbonato KeysightCare per ottenere assistenza tecnica dedicata e molto altro ancora.

Calibrazione

Assicurati che il tuo sistema di test funzioni secondo le specifiche e soddisfi gli standard locali e globali.

Istruzione

Effettua misurazioni rapidamente grazie alla formazione interna con istruttore e all'e-learning.

Centro di download del software

Scarica il software Keysight o aggiorna il tuo software alla versione più recente.

Torna all'inizio

Iniziate il vostro preventivo scegliendo un prodotto Selezionate una configurazione qui sotto

KAI Inference Builder Convalida e ottimizzazione delle infrastrutture di inferenza AI

Pacchetto KAI Inference Builder con 10 agenti e fino a 1000 richieste al secondo

Pronto per un preventivo

Punti salienti

Servizi e assistenza