Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand スイッチ アプリケーションの実践

January 6, 2026

最新の会社ニュース Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand スイッチ アプリケーションの実践

背景 と 課題: 現代 コンピューティング の ネットワーク の 瓶頸

科学的発見や人工知能の 突破への競争の中で 優れた研究機関の 計算能力は 処理能力の欠如によって 抑えられていたのではなくネットワークの構造によって既存の HDR InfiniBand インフラストラクチャは 容量があるものの新しく導入されたNVIDIA DGXクラスターと従来のHPCワークロードの同期通信要求研究者らは,作業の完了時間が著しく遅れており,ネットワークの遅延と,すべての通信パターンの混雑が主要なボトルネックとなった.

MPI ベースの HPC シミュレーションにとって重要なRDMA 操作の遅延を大幅に削減すること.AIトレーニングの仕事のための非ブロックファブリックで,数百台のGPUで恒常的なパラメータ同期が必要でした.NDR 400Gb/s の速度を処理し,完全に互換性既存の生態系と連携し,完全な改修なしで費用対効果の高いアップグレードを保証する.

解決策と導入: 920-9B210-00FN-0D0ファブリックの実装

徹底的な評価の後,機関がNVIDIA メラノックス 920-9B210-00FN-0D0解決策は複数のパネルを展開することに焦点を当てました920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR高帯域幅で低レイテンシーで 全てのコンピューティング・ストレージ・ノードを繋ぐ 幹層を形成するスイッチです

展開は,バイセクショナル帯域幅を最大化し,ホップ数を最小化するためにハイブリッドの二階層脂肪樹トポロジーとして構造化された.実装の重要な側面には以下のものがある:

  • 繊維コア:脊椎層は完全に920-9B210-00FN-0D0スイッチが NDR 400Gb/s のバックボーンを供給する.
  • 無縫な統合スイッチの逆相容性を活用して,既存のHDRリーフスイッチとNICが接続され,以前の投資を保護し,NDRへのインクリメンタルノードアップグレードを可能にしました.
  • 高級管理:新しいものも含めて920-9B210-00FN-0D0 インフィニバンドスイッチ OPNNVIDIA UFM® を使って単一のガラス板の下で管理され,正確なパフォーマンステレメトリ,自動化されたファブリックプロビジョニング,迅速な故障隔離が可能になりました.
  • 検証:ITチームは 厳格に担当者に相談しました920-9B210-00FN-0D0 データシートそして仕様データセンターのケーブル範囲,電源,冷却の要件を検証し,最適なパフォーマンスを確保します

この建築は統一された920-9B210-00FN-0D0 インフィニバンドスイッチ OPN ソリューション, 機関における古典的なHPCと新しいAIワークロードを,単一の強力なネットワークで対応しています.

効果と利益: 業績と効率の計測可能な向上

導入する影響920-9B210-00FN-0D0操作の多種多様な次元にわたって 測定可能で変革的でした

メトリック 派遣 前 920-9B210-00FN-0D0 配備後
平均MPI遅延 (往復) ~0.7マイクロ秒 ~0.5マイクロ秒
AIトレーニングの仕事完了時間 (大型モデル) 5. 2 日 3.8日(27%減少)
繊維 の 使用 量 は,ピーク の 時 に すべて の 人 に 向け られ ます. 85% を 超え て 交通渋滞 を 引き起こし ます NDR 速度で 60%未満に安定
管理業務 (工場再構成) 手作業で時間がかかるプロセス UFM® 統合による自動化

HPCシミュレーション,特に複雑な流体力学を含むシミュレーションは,MPIの遅延が低く,一貫しているため,20~30%の改善が見られました.AIチームにとって RDMAが新しいファブリック上で ほぼ理論的なパフォーマンスを発揮できたことは GPUのリソースが完全に計算に飽和し ネットワークの転送を待つのではなく 停止していたことを意味しました総額を評価する際920-9B210-00FN-0D0価格研究成果の加速により,初期資本支出をはるかに上回る説得力のあるROIが得られました.

結論と展望 未来に備えられるインフラストラクチャの計画

実施を成功させたNVIDIA メラノックス 920-9B210-00FN-0D0同じような相互接続の課題に直面している組織にとって強力な青写真です先端なネットワーク構造への投資は副費ではなく 計算投資の戦略的増倍要因であることを示しています.

機関が展開していることは,920-9B210-00FN-0D0単なるスイッチ以上のものです. 融合のためのプラットフォームです. RDMA駆動のHPCとAIのワークロードを,操作を簡素化し,発見を加速するこの技術がより広く利用可能になるにつれて売る高性能クラスタリングで可能なことの新しい基準を設定します.

NDR 400Gb/s ファイブリックの固有のスケーラビリティとパフォーマンス・ヘッドルームは,将来,さらに強力なコンピューティングリソースを統合するための良好なポジションを意味しています.ほら920-9B210-00FN-0D0研究者がアルゴリズムや想像力の限界だけに 集中できるようにしました