10개 에이전트 및 초당 최대 1000개 프롬프트가 포함된 KAI 추론 빌더 번들

KAI 추론 빌더 번들에는 10개 에이전트와 초당 최대 1000개 프롬프트가 포함되어 있습니다(1년 구독, 전 세계 플로팅 라이선스). 이 번들은 TAA를 준수합니다.

제품 이미지
  • Form factor

    Software

  • License types

    Subscription

  • 성능 레벨

    1000 prompts per second, 10000 simulated users

견적 준비 완료

포함된 내용과 키사이트의 사용 가능한 업그레이드 옵션을 확인하십시오.

하이라이트

  • 실제와 같은 AI 클라이언트 동작을 대규모로 에뮬레이션하여 전체 AI 추론 인프라 및 스택을 검증합니다.
  • AI 추론 파이프라인의 다양한 단계에서 압력 지점을 유도하는 다양한 AI 페르소나 프롬프트를 선택합니다.
  • 완전 가상 또는 하드웨어 기반 추론 클라이언트 에뮬레이션을 통해 퍼블릭 클라우드 또는 프라이빗 클라우드에 배포된 AI 추론 인프라를 검증합니다.
  • 초당 생성되는 프롬프트 부하를 세밀하게 제어하여 수백만 명의 에뮬레이션된 사용자로 확장하고, 비교할 수 없는 AI 추론 스케일 테스트를 수행합니다.
  • AI 추론 파이프라인의 다양한 구성 요소에서 잠재적인 병목 현상, 한계 및 비효율성에 대한 실행 가능한 통찰력을 얻기 위해 상세한 추론 통계를 확인하십시오.
    • GPU 컴퓨팅
    • HBM/VRAM 메모리 시스템
    • KV-캐시 및 스토리지 계층
    • PCIe 및 RDMA 인터커넥트
    • 모델 엔진 및 오케스트레이터
  • 단일 시간 동기화된 뷰에서 클라이언트 측 메트릭을 추론 엔진 수준 텔레메트리(예: VLLM 통계) 및 시스템 수준 GPU 텔레메트리(예: DCGM 데이터) 수집과 상호 연관시킵니다.
    • 초당 프롬프트
    • 동시 사용자
    • 첫 토큰 시간(TTFT) — 최대값 및 백분위수(예: P50, P90, P99)
    • 마지막 토큰 시간(TTLT) — 최대값 및 백분위수(예: P50, P90, P99)
    • 초당 토큰(입력/출력)
    • 캐시 사용량
    • 사전 채우기 및 디코딩 시간
    • 텐서 코어 사용량
    • 스케줄러 상태
    • GPU 전력 사용량