這是我們認為您想查看的頁面. 觀看搜尋結果:

KAI Inference Builder 驗證與最佳化 AI 推論基礎架構

型號： 952-1010

上一個

概述
選項
配件
軟體
支援

下一步

KAI Inference Builder 組合包，包含 10 個代理，每秒最多 1000 個提示

KAI Inference Builder 套件包含 10 個代理程式，每秒最多可處理 1000 個提示（1 年訂閱，全球浮動授權）。此套件符合 TAA 規範。

產品影像

Form factor

Software
License types

Subscription
效能等級

1000 prompts per second, 10000 simulated users

View Data Sheet

焦點訊息

大規模模擬真實的 AI 用戶端行為，以驗證整個 AI 推論基礎設施和堆疊。
選擇不同 AI 人格提示，以驅動 AI 推論管線不同階段的壓力點。
透過完全虛擬或基於硬體的推論用戶端模擬，驗證部署在公有雲或私有雲中的 AI 推論基礎設施。
擴充至數百萬個模擬使用者，並對產生的每秒提示負載進行精細控制，以實現無與倫比的 AI 推論規模測試。
取得詳細的推論統計資料，以深入了解 AI 推論管線中各個元件的潛在瓶頸、限制和效率低落之處：
- GPU 運算。
- HBM / VRAM 記憶體系統
- KV 快取和儲存層
- PCIe 和 RDMA 互連
- 模型引擎和協調器
在單一時間同步視圖中，將用戶端指標與推論引擎層級遙測資料（例如 VLLM 統計資料）以及系統層級 GPU 遙測資料（例如 DCGM 資料）進行關聯：
- 每秒提示
- 並行使用者
- 首個權杖時間 (TTFT) — 最大值和百分位數 (例如 P50、P90、P99)
- 最後權杖時間 (TTLT) — 最大值和百分位數 (例如 P50、P90、P99)
- 每秒權杖數 (輸入/輸出)
- 快取使用量
- 預填與解碼時間
- Tensor Core 使用方式
- 排程器狀態
- GPU 功耗。

服務與支援

透過精選支援方案以及優先回應與周轉時間，加速創新。

金融替代方案

取得可預測的租賃式訂閱和完整的生命週期管理解決方案，讓您更快達成業務目標。

Keysight 支援入口網站

成為 KeysightCare 訂閱者，體驗更優質的服務，獲得承諾的技術回應及更多。

確保您的測試系統符合規格要求，並符合當地與全球標準。

透過內部講師指導的訓練和線上學習，快速進行量測。

軟體下載中心

下載 Keysight 軟體，或將您的軟體更新至最新版本。

選擇產品開始報價選擇下列配置