キーサイトAIデータセンタービルダー

KAIデータセンタービルダー

AIネットワークインフラストラクチャの設計と展開を加速

この製品をすでにお持ちですか? テクニカルサポートを訪問する

ハイライト

Keysight AIデータセンタービルダーは以下を可能にします。

  • 大型GPUクラスターを使用せずにAIワークロードをエミュレートし、高密度トラフィック負荷アプライアンスやソフトウェアエンドポイントを活用することでテストと検証コストを削減します。
  • KAIワークロードライブラリへのアクセスを提供し、主要なAIオペレーターや学術機関との提携によって構築された包括的なAIワークロード実行トレースを利用できます。
  • 高密度AIホストエミュレーションを活用し、800GE / 400GE機能をサポートしてAIクラスターの動作を正確に模倣します。
  • KAI Collective Benchmarksアプリを使用してAIネットワークファブリックの性能を検証し、効率改善を可能にするベンチマーク作業を簡略化します。
  • ネットワークがジョブ完了時間、性能の分離、負荷分散、および輻輳制御に与える影響を評価することで、AIトレーニング性能を最適化するためのAIファブリックテストを自動化します。

AIネットワーキングの未来を築く: キーサイトがJuniperを支援する方法

  • キーサイトは、大規模AIアクセラレーターからの集団通信ワークロードをエミュレートすることで、Juniperが次世代ネットワークファブリックを検証するのを支援します。
  • 損失のないネットワークファブリックの効率性と性能を示すための包括的なテストシナリオを提供します。

AIネットワーキングの課題解決

AIネットワーキングの課題解決

AI / ML業界における主要な動向と課題には以下が含まれます。

  • AIクラスターは2026年までに100K+ノードを超えることが予測されています。
  • データ交換を待つ時間が最大50%までアイドル状態になります。
  • AIネットワーキングの革新には、新しい測定とベンチマークツールが必要です。
  • ​キーサイトは、損失のないファブリック検証の実績を持つ800GE / 400GEテストソリューションを提供します。 GPUベースのシステムによるベンチマークと比較して、より深い洞察を得られ、AIトラフィックのエミュレーションの確実な忠実性を提供します。

AIネットワーク設計を加速

AI / MLインフラストラクチャの未来を定義し、可能性を解き放ち、未来の風景を形作ります。

AI集団通信のジョブ完了時間をベンチマーク。

AIワークロードの複雑さを乗り越えます。

​ネットワーク性能測定の精度を達成。

より深いAI通信の洞察に基づいて設計上の決定を行います。

柔軟な仮想シナリオ。

トラフィックパターンを調整してファブリック構成を微調整することで、AI集団性能を最適化します。

コスト効率の高い高密度AIネットワーク試験環境。

AresONE-M 800GEおよびAresONE-S 400GE AIトラフィックエミュレーションで実験をスケールアップします。

AIネットワーク設計を加速します。

現実的なAIワークロードを研究室へ

KAIワークロードエミュレーションにより、大規模なGPUクラスターを配備することなく実際のAIトレーニング行動を再現可能にし、コストを削減しながら現実性を維持します。

ワークロードエミュレーションの主な利点

  • 400GE / 800G AresONEトラフィックジェネレーターまたはCOTSサーバーを使用してAIワークロードをエミュレートします。
  • 実世界の条件下で並列化戦略、モデル分割、およびデータ交換パターンを検証します。
  • フルスケール展開前にAIワークロードの要求にインフラストラクチャが一致していることを確認します。
  • ベンチマークおよび性能テストにおいて高コストなAIクラスターへの依存を軽減します。

AIインフラストラクチャベンチマーキングを変革

Workload Emulation
キーサイトは、次の方法でAIインフラストラクチャのベンチマーキングを精度と速度で変革します。
  • 大規模なAIワークロードをリアルにエミュレートし、AI / MLシステム設計を最適化します。
  • 集合通信パフォーマンスに関する洞察を提供します。
  • アプリケーションとして提供されるパッケージ化された手法を使用して、ベンチマーキングと検証を簡素化します。
  • 数百の400GEまたは800GEポートを備えた高密度AresONEトラフィック負荷装置を使用して、収束イーサネットv2 (RoCEv2) のリモートダイレクトメモリアクセス (RDMA) エンドポイントをエミュレートします。

集合ベンチマーキングでAIインフラストラクチャの検証を簡素化

キーサイトは精度、スケーラビリティ、実用的な洞察を提供してAIインフラストラクチャの検証を加速 KAI Data Center Builderは以下を実現します。

KAI Collective Benchmarksアプリと事前パッケージ化されたテスト手法を使用したパフォーマンス評価の簡素化

  • 高精度な機器を活用してAIオペレーターがインフラ設計とネットワーク性能を最適化を可能にします。
  • AresONEトラフィックロードアプライアンスを使用してRoCEv2エンドポイントをエミュレートし、ドリルダウン機能を使用してキューペア(AIデータフロー)のパフォーマンスを分析します。
  • AresONEハードウェアの結果と実際のAIシステムのメトリクスを比較して、RoCEv2エミュレーションの忠実性を検証します。
  • AIコレクティブベンチマークを統合することで、KAI Data Center BuilderはAIオペレーターおよびインフラストラクチャベンダーがデータ移動効率、ネットワーク輻輳、システム全体のパフォーマンスに関する深い洞察を得ることを可能にします。
コレクティブベンチマーク

RoCEv2エンドポイントのエミュレーションとステートフル検証

エミュレーションを超え、RoCEv2検証における先進的精度の先駆け。

RoCEv2のサポート (IxNetwork / AresONE-S)。

IIxNetwork / AresONE-Sは、データセンター量子化輻輳通知 (DCQCN) 輻輳制御と優先フロー制御 (PFC) を備えたRoCEv2トランスポートプロトコルをサポートしています。AIクラスターにおけるデータプレーンのトラフィック管理効果を検証するためのスケーラブルで費用効果の高いソリューションを提供し、ネットワークファブリック性能を最適化します。

スピードと規模。​

 AresONE-Sは、1台あたり最大16 x 400GEポート容量を提供し、256以上のポートを備えた複数のアプライアンス構成に統合可能です。各ポートはRoCEv2エンドポイントをエミュレートし、ラインレートトラフィックで数千のキューペアをサポートします。この規模は、実際のAIクラスターのネットワークトポロジーを再現するために重要です。

トラフィックの柔軟性​

AIワークロードのパターンのリアリズムに合わせ、小規模な設定での問題を再現するために、AresONE RoCEv2の機能は、最初のリリースでインキャスト、部分メッシュ、完全なオールトゥオールコレクティブなどのさまざまなトラフィックパターンをカバーします。 トランスポートレベルでは、構成可能なデータサイズ、バースト率、間隔を持つRDMA動詞のシーケンスをサポートしており、DCQCNとPFCレート制御メカニズムが組み合わされています。

キューペアごとのDCQCNフロー制御

キューペアごとのDCQCNは、明示的な輻輳通知 (ECN) やレート制御などの機能を備えた正確なネットワーク輻輳制御を可能にし、データフローとネットワークファブリックの応答性を最適化します。

AI/MLテスト手法のGitHubリポジトリをご覧ください。

AIデータセンターネットワークをテストする方法

効率的なネットワーク設計は、データ移動の高速化と遅延の軽減にとって重要です。AIファブリックテスト方法論は、AIワークロード向けのデータセンターインフラを最適化するために、測定可能な指標を備えた一貫したテストプロセスを提供することを目的としています。このテスト方法論に従って、ジョブ完了時間、性能の分離、負荷分散、および混雑制御をベンチマークしてください。

現実的なワークロードを持つAI/MLクラスターをベンチマークするには、GPUおよびRDMAネットワークインターフェイスコントローラー(NIC)を備えたコンピューティングシステムへの高額な投資が必要です。適切なベンチマークには、クラスター設定、混雑制御、ワークロードアルゴリズム、ジョブデータサイズ、トラフィックプロファイル、NIC性能などのパラメーターの構成が含まれます。

AIテストハードウェア

キーサイトのデータセンターロードモジュールは、業界初の1G、10G、25G、40G、50G、100G、400G、800G速度を備えた高密度で高性能のEthernet IPテストソリューションを提供します。

注目のリソース

サポートが必要ですか、または質問がありますか?