Mellanox (NVIDIA) MQM9790-NS2F InfiniBand スイッチの動作 | RDMA/HPC/AI 向けの低遅延相互接続の最適化
May 28, 2026
広範囲にわたる AI 訓練クラスターや高性能コンピューティング (HPC) センターが ネットワークの帯域幅と遅延の要件を 前例のないレベルに押し上げていくにつれて従来のEthernetソリューションは,RDMAワークロードの下での混雑制御と予測不可能な尾行遅延とますます闘っています.複数のインターコネクトオプションを評価した後,チームは,GPUをアップグレードする際にまさにこの課題に直面しました.メラノックス (NVIDIA) MQM9790-NS2Fクラスターのパフォーマンスプロフィールを根本的に変えた決定です.
背景と課題:拡張性壁
超コンピューティングセンターの既存のHDR インフィニバンドは 飽和状態で動作していました"all-reduce"や"all-to-all"のような集団通信は,ネットワークが主要なボトルネックになり GPUのイオンタイムが 計算資源とエネルギーを無駄にしましたエンジニアは,大規模な分散訓練実行中に通信オーバーヘッドのためにほぼ30%の計算サイクルが失われたと推定しました.
チームが必要だったのは スイッチでポートあたり400Gb/sネットワーク内コンピューティングの加速 既存のHDRインフラストラクチャとのバックグラッド互換性を維持しながらMQM9790-NS2F データシートそしてMQM9790-NS2F 仕様決定した.MQM9790-NS2F インフィニバンドスイッチ密度,性能,機能のバランスが理想的でした
ソリューションと展開:64ポートのNDRファブリックアップグレード
センターは4つのMQM9790-NS2F 400Gb/s NDR 64-ポート OSFPスイッチは,spine-leafトポロジーで,64のコンピューティングノードで2,048のGPUを相互接続する.各ノードは,OSFPから4x100Gb/sのスプリッターケーブルを介して接続する.サーバーごとに合計 400Gb/s の帯域幅を提供し,ケーブル管理密度を最適化します.
| 配備パラメータ | 構成 |
|---|---|
| スイッチモデル | NVIDIA メラノックス MQM9790-NS2F(4個) |
| ポート設定 | 64x OSFP,ポートあたり400Gb/s NDR |
| 総GPU | 2,048 (NVIDIA H100) |
| ネットワーク内機能 | SHARPv3,適応ルーティング,混雑制御 |
開発の鍵はMQM9790-NS2Fに対応する既存のHDRエンドポイントアダプターで動作する. The switch’s automatic speed negotiation and link-layer translation allowed a phased migration strategy — legacy nodes operate at HDR speeds while new NDR-capable servers leverage full 400Gb/s bandwidthこのセンターはまた,Sharpv3のネットワーク内アグリゲーションを利用し,LLMトレーニングで一般的に見られる大きなメッセージサイズに対して,全低トラフィックを65%以上削減しました.
類似のアップグレードを評価している方にはMQM9790-NS2F価格問い合わせやMQM9790-NS2F 販売中企業と研究顧客では,利用可能性が著しく増加しています.スイッチの競争力のある総所有コストは,64ポート密度によりスイッチ数が少ないことを考慮し,新築やリフレッシュプロジェクトの両方に魅力的な選択肢となっています..
結果と利益: 測定可能な業績向上
- 全減速遅延 (1GB メッセージ):48μsから19μsまで減少 (60%改善)
- 効率的なGPU利用:大規模な訓練では 71% から 93% に増加
- 作業の完了時間 (GPT-3 175B相当):41% 短縮しました
- ネットワークによる尾行遅延 (99パーセント数)210μsから35μs未満に切る
重要なこととしてMQM9790-NS2F インフィニバンドスイッチソリューション導入により,400Gb/sのNDRファブリックが理論上の約束を果たすことができることが示されました.混雑制御アルゴリズムと適応ルーティングの組み合わせにより,すべての通信段階において以前のHDRファブリックを悩ませていた"インカスト"崩壊パターンが排除されました.
概要&展望: エクサスケールAIの基礎
超コンピューティングセンターの成功MQM9790-NS2Fグラフグラフの数を2倍にして 4,096 に増やします.MQM9790-NS2F 400Gb/s NDR 64-ポート OSFPスイッチのテレメトリとバンド外管理機能も,予測的な混雑回避を可能にしました.ネットワークチームによる運用上のオーバーヘッド削減.
ネットワークアーキテクトやITマネージャーが次世代のファブリックを評価する際には,NVIDIA メラノックス MQM9790-NS2Fこのスイッチは成熟し,生産に実証されたソリューションです. 新しいAI研究クラスターを建設するか,既存のHPC施設をアップグレードするかに関わらず,このスイッチは低レイテンシー,現代的な並列作業負荷に必要な高帯域幅基盤.

