Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 活用事例:RDMA/HPC/AIクラスター向け低遅延インターコネクトの最適化

April 14, 2026

最新の会社ニュース Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 活用事例:RDMA/HPC/AIクラスター向け低遅延インターコネクトの最適化

AIモデルの大規模訓練とエクサスケールHPCの時代では,ネットワークの遅延は,線形クラスタの拡張性を制限する最も重要なボトルネックとして出現しています.,についてメラノックス (NVIDIA メラノックス) 920-9B110-00FH-0D0この記事では,一般的な展開シナリオを検証します. このシナリオでは,研究機関や企業のAIラボが高性能ファブリックを設計する方法が変化しています.920-9B110-00FH-0D0RDMAを要するワークロードで 決定的な超低レイテンシーを提供します

背景と課題:AIクラスター通信壁

中規模のAI研究施設は 64ノード間での分散訓練中に GPUの休憩時間と 苦戦していました集団通信の操作を起こすネットワークアーキテクトは,1ポートあたり200Gb/sまでスケーリングできる損失のない高出力ソリューションを必要とし,マイクロ秒未満の遅延を維持する.可能な選択肢を評価した後,チームは920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR新しい脊葉トポロジーの 基本構成要素です

ソリューション&デプロイメント: InfiniBand Fabric を実装する

部署はNVIDIA メラノックス 920-9B110-00FH-0D02階層の脂肪樹構造で構成されたスイッチ.各コンピューティングノードは,HDR ConnectX-6アダプタを装備し,受動銅ケーブルを通じて葉スイッチに接続した.主要な実施ステップ:

  • RDMA over Converged Ethernet (RoCE) オルタナティブ:ハードウェアベースの混雑制御によるネイティブInfiniBandは,パケットの落下を完全に排除した.
  • アダプティブルーティング:について920-9B110-00FH-0D0 インフィニバンドスイッチ OPN ソリューション多重経路で動的負荷バランスを可能にし,ホットスポット形成を防ぐ.
  • 繊維管理サブネットマネージャー (OpenSM) を使用する920-9B110-00FH-0D0 仕様単一のファブリックで最大2000のノードをサポートすることを確認します

エンジニアは,調達前に,920-9B110-00FH-0D0 データシート既存の光学と互換性を検証する.920-9B110-00FH-0D0対応する予算については,すべての主要なHDRケーブルアセンブリを組み込み,材料の請求を簡素化しました.920-9B110-00FH-0D0価格HDR スイッチに対して競争力があると証明され,すぐに入手可能になった (920-9B110-00FH-0D0 販売中) をNVIDIAのチャネルパートナーを通じて提供しています.

結果と利益: 測定可能な業績向上

配備後のテレメトリでは 3つの主要指標で 劇的な改善が見られました

メトリック 前 (100GbE) 920-9B110-00FH-0D0 HDRの後 改善
全減速遅延 (64ノード) 340μs 78μs 77%削減
GPUの無作動時間 (通信上の費用) 38% 11% 絶対利益27%
繊維帯域幅の有効利用 62% 94% +32%

総数を超えて920-9B110-00FH-0D0 インフィニバンドスイッチ OPN組織を再設計せずに 64から256のノードにスケールできるようにしましたInfiniBandのクレジットベースのフロー制御によって提供される決定的遅延は,何百ものGPUのトレーニング一貫性を維持するために不可欠であることが証明されましたエンジニアも920-9B110-00FH-0D0リアルタイムでマイクロバーストを特定し 修復するハードウェアベースの混雑通知です

概要と展望:AIの相互接続の未来

配備は,それを検証しますNVIDIA メラノックス 920-9B110-00FH-0D0AIとHPCクラスタの基礎となる要素として機能します 損失を伴うイーサネットファブリックを損失を伴う InfiniBandに置き換えることで組織は,通信スタンドで以前無駄になったGPUコンピューティングの30%まで回収できます.新しいAIインフラストラクチャを計画する建築家にとって,920-9B110-00FH-0D0 データシート小さなDGXクラスタからスーパーコンピューティング規模での展開までのトポロジーの詳細なガイドラインを提供します.

作業負荷がより大きなモデル並列化とより高いGPU密度の方向に進化するにつれて,920-9B110-00FH-0D0 MQM8790-HS2F 200Gb/s HDR後方互換性のある設計によって,将来の400Gb/sファブリックへの明確なアップグレード路線を提供します.920-9B110-00FH-0D0価格運用効率の向上や920-9B110-00FH-0D0対応するこのInfiniBandスイッチは データ駆動組織に 測定可能な ROI を提供します