무엇을 찾고 있습니까?
키사이트(Keysight) AI 데이터 센터 빌더
주요 특징
Keysight AI 데이터 센터 빌더는 다음을 수행할 수 있습니다:
- 대규모 GPU 클러스터 없이 AI 워크로드를 에뮬레이션하며, 고밀도 트래픽 부하 장비 또는 소프트웨어 엔드포인트를 활용하여 테스트 및 검증 비용을 줄입니다.
- 주요 AI 운영자 및 학계와의 협력을 통해 구축된 포괄적인 AI 워크로드 실행 추적 세트인 KAI 워크로드 라이브러리에 접근할 수 있습니다.
- 고밀도 AI 호스트 에뮬레이션을 활용해 800GE / 400GE 기능을 지원하며, AI 클러스터 행동을 정확하게 반영합니다.
- KAI Collective Benchmarks 앱을 통해 AI 네트워크 패브릭 성능을 검증하여 사용 개선을 가능하게 하고 벤치마킹을 간소화합니다.
- 네트워크가 작업 완료 시간, 성능 분리, 부하 균형 및 혼잡 제어에 미치는 영향을 평가하여 AI 학습 성능을 최적화하기 위한 AI 패브릭 테스트를 자동화합니다.
AI 네트워킹의 미래를 주도하기:키사이트( Keysight)가 Juniper를 지원하는 방법
- Keysight는 대규모 AI 가속기에서 발생하는 집단 통신 워크로드를 에뮬레이트하여 Juniper가 차세대 네트워크 패브릭을 검증할 수 있도록 돕습니다.
- 손실 없는 네트워크 패브릭의 효율성과 성능을 입증하기 위한 포괄적인 테스트 시나리오를 제공합니다.
AI 네트워킹 과제 해결
AI / ML 업계의 주요 동향 및 과제는 다음과 같습니다:
- AI 클러스터는 2026년까지 100K+ 노드를 초과할 것으로 예상됩니다.
- 데이터 교환을 기다리는 동안 최대 50%까지 유휴 상태입니다.
- AI 네트워킹의 혁신에는 새로운 측정 및 벤치마킹 도구가 필요합니다.
- Keysight는 손실 없는 패브릭 검증 실적을 갖춘 800GE / 400GE 테스트 솔루션을 제공합니다. GPU 기반 시스템을 이용한 벤치마킹과 비교하여 더 깊은 통찰력을 제공하며 AI 트래픽 에뮬레이션의 입증 가능한 충실도를 제공합니다.
AI 네트워크 설계를 가속화합니다.
DAI / ML 인프라의 미래를 정의합니다. 가능성을 열어 미래의 지형을 형성하십시오.
AI 집단 통신 작업 완료 시간을 벤치마킹합니다.
AI 워크로드의 복잡성을 극복합니다.
네트워크 성능 측정의 정밀도를 달성합니다.
더 깊은 AI 통신 통찰력에 기반하여 설계 결정을 내립니다.
유연한 가상 시나리오.
트래픽 패턴을 조정하여 패브릭 구성을 미세 조정함으로써 AI 집단 성능을 최적화합니다.
비용 효율적인 고밀도 AI 네트워크 테스트 환경.
AresONE-M 800GE 및 AresONE-S 400GE AI 트래픽 에뮬레이션으로 실험을 확장합니다.
현실적인 AI 워크로드를 실험실에서 구현해보세요.
KAI 워크로드 에뮬레이션은 대규모 GPU 클러스터를 배치하지 않고도 실제 AI 학습 행동을 재현할 수 있도록 하며, 비용을 절감하면서 현실성을 유지합니다.
워크로드 에뮬레이션의 주요 혜택들
- 400GE / 800G AresONE 트래픽 생성기 또는 COTS 서버를 사용하여 AI 워크로드를 에뮬레이션
- 실제 조건에서 병렬 처리 전략, 모델 분할 및 데이터 교환 패턴 검증
- 전체 배포 전에 AI 워크로드 요구 사항에 인프라가 적합한지 확인
- 벤치마킹 및 성능 테스트에서 고비용 AI 클러스터 의존도 감소
AI 인프라 벤치마킹을 혁신하다
- 대규모 AI 워크로드의 현실적인 에뮬레이션을 통해 AI / ML 시스템 설계를 최적화
- 집합 통신 성능에 대한 통찰을 제공
- 애플리케이션으로 제공되는 사전 패키지된 방법론을 사용하여 벤치마킹 및 검증 단순화
- 수백 개의 400GE 또는 800GE 포트를 갖춘 고밀도 AresONE 트래픽 부하 장치를 사용하여 컨버지드 이더넷 v2 (RoCEv2) 엔드포인트의 원격 직접 메모리 액세스 (RDMA) 에뮬레이션
집합적 벤치마킹을 통해 AI 인프라 검증 단순화
Keysight는 정밀도, 확장성 및 실행 가능한 인사이트를 제공하여 AI 인프라 검증 가속화. KAI Collective Benchmarks 앱과 사전 패키지화된 테스트 방법론을 사용하여 성능 평가 단순화
- 고정밀 기기를 활용하여 AI 운영자가 인프라 설계와 네트워크 성능 최적화 가능
- AresONE 트래픽 로드 어플라이언스를 사용하여 RoCEv2 엔드포인트를 에뮬레이트하고 드릴다운 기능으로 큐 페어(AI 데이터 흐름) 성능을 분석합니다.
- AresONE 하드웨어 결과와 실제 AI 시스템 메트릭스를 비교하여 RoCEv2 에뮬레이션 충실성을 검증합니다.
- AI 집합 벤치마킹을 통합함으로써, KAI 데이터 센터 빌더는 AI 운영자와 인프라 공급업체가 데이터 이동 효율성, 네트워크 혼잡, 시스템 전반의 성능에 대해 깊은 통찰력을 얻을 수 있도록 합니다.
RoCEv2 엔드포인트 에뮬레이션 및 상태 기반 검증
에뮬레이션을 넘어, RoCEv2 검증에서 선구적인 정밀성 구현.
RoCEv2 지원 (IxNetwork / AresONE-S)
IxNetwork / AresONE-S 는 데이터센터 정량화 혼잡 알림 (DCQCN) 혼잡 제어 및 우선 흐름 제어 (PFC)를 갖춘 RoCEv2 전송 프로토콜을 지원합니다. AI 클러스터에서 데이터 플레인 트래픽 관리 효과를 검증하기 위한 확장 가능하고 비용 효율적인 솔루션을 제공하며, 네트워크 패브릭 성능을 최적화합니다.
속도와 규모.
AresONE-S 는 장치당 최대 16 x 400GE 포트 용량을 제공하며, 단일 집합에서 256개 이상의 포트를 포함하는 다중 어플라이언스 구성으로 결합될 수 있습니다.각 포트는 RoCEv2 엔드포인트를 에뮬레이트하고 라인 속도 트래픽으로 수천 개의 큐 페어를 지원합니다. 이러한 규모는 실제 AI 클러스터의 네트워크 토폴로지를 재현하는 데 중요한 역할을 합니다.
트래픽 유연성
AI 워크로드 패턴의 현실성을 맞추고 소규모 설정에서 문제를 재현하기 위해 AresONE RoCEv2 기능은 첫 번째 릴리스에서 인캐스트, 부분 메시, 완전한 올투올 집합체 등 다양한 트래픽 패턴을 포함합니다. 전송 수준에서 구성 가능한 데이터 크기, 버스트 속도, 간격을 사용하여 RDMA 동사를 지원하며 DCQCN 및 PFC 속도 제어 메커니즘을 결합합니다.
Queue Pair별 DCQCN 흐름 제어
Queue Pair별 DCQCN은 명시적 혼잡 알림 (ECN) 및 속도 제어와 같은 기능을 통해 정확한 네트워크 혼잡 제어를 가능하게 하여 데이터 흐름과 네트워크 패브릭 응답성을 최적화합니다.
AI/ML 테스트 방법론에 대한 GitHub 저장소를 방문하세요.
AI 데이터센터 네트워크를 테스트하는 방법
효율적인 네트워크 설계는 데이터 이동 속도를 높이고 지연 시간을 줄이는 데 중요합니다. AI 패브릭 테스트 방법론은 AI 작업 부하에 맞춘 데이터 센터 인프라 최적화를 위 해 측정 가능한 메트릭과 일관된 테스트 프로세스를 제공합니다. 이 테스트 방법론을 따라 작업 완료 시간, 성능 격리, 부하 분산 및 혼잡 제어를 벤치마킹하세요.
현실적인 워크로드를 가진 AI/ML 클러스터를 벤치마킹하려면, GPU와 RDMA 네트워크 인터페이스 컨트롤러(NIC)를 갖춘 컴퓨팅 시스템에 대한 비용이 많이 드는 투자가 필요합니다. 적절한 벤치마킹에는 클러스터 설정, 혼잡 제어, 워크로드 알고리즘, 작업 데이터 크기, 트래픽 프로파일 및 NIC 성능과 같은 매개변수 구성이 포함됩니다.
AI 테스트 하드웨어
Keysight의 데이터 센터 로드 모듈은 업계 최초의 1G, 10G, 25G, 40G, 50G, 100G, 400G, 800G 속도를 제공하는 고밀도 고성능 Ethernet IP 테스트 솔루션을 제공합니다.
추천 리소스
관련 제품
도움이 필요하거나 질문이 있으신가요?