NVIDIA Mellanox MQM8790-HS2F 技術ソリューション: RDMA/HPC/AIクラスターのための低遅延インターコネクト最適化

April 10, 2026

この技術ソリューションは,ネットワークアーキテクト,プレセールエンジニア,およびオペレーション・リーダー向けに設計されています.インフィニバンドの高性能ファブリックをNVIDIA メラノックス MQM8790-HS2FRDMAを大量に使う HPCとAIのトレーニングクラスタを対象としています.

1背景と要求の分析

現代のAI訓練と科学コンピューティングクラスタは,ネットワーク相互接続を主なパフォーマンスボトルネックとしてますます直面しています.尾の遅延,およびCPUのオフロード能力は,All-ReduceおよびAll-to-Allなどの分散型トレーニング通信パターンの要求を満たすことができません.主な要件には,以下が含まれます.微秒未満の端から端までの遅延,損失のない,落水のない輸送,GPU Direct RDMA サポート能力も数千のノードに線形的にスケールこれらの相互接続効率の課題を根本的に解決するために,専用なInfiniBandスイッチングアーキテクチャが必要です.

2ネットワーク/システムアーキテクチャの設計

このソリューションは,ブロックしない,フルバイセクショナル帯域幅を達成するために,2層のFat-Treeトポロジーを推奨しています.葉と脊柱層の両方が,MQM8790-HS2F インフィニバンドスイッチ,200Gb/sのHDR QSFP56の40ポートを提供する.例として512ノードクラスタを使用すると,設計は以下のとおりである.

葉層:各MQM8790-HS2Fは 20のコンピューティングノード (ダブルアップリンク) と8つのアップリンクを脊髄層に接続します.
脊椎層8つのMQM8790-HS2Fスイッチが脊柱平面を形成し葉と脊柱のスイッチが完全に接続できます
貯蔵・管理ネットワーク: コンピュータトラフィックに干渉を避けるために別々のInfiniBandサブネットワークまたはバンド外イーサネット.

このアーキテクチャは,任意の2つのノード間の200Gb/s帯域幅を保証し,単一の障害点がグローバルな接続に影響を与えないことを保証する複数の冗長経路を備えています.ポート密度が高いためMQM8790-HS2F 200Gb/s HDR 40ポート QSFP56必要なスイッチの数を 50% 削減し,同時期に繊維の複雑性を低下させます.

3. NVIDIA Mellanox MQM8790-HS2Fの役割と主要な特徴

についてNVIDIA メラノックス MQM8790-HS2Fこのソリューションのコア・スイッチング・ユニットとして機能し,以下の重要な役割を担っています.

損失のない切換エンジン: InfiniBand リンク層フロー制御はパケット損失をなくし,RDMA 輸送効率を保証します.
アダプティブルーティング: 多路線で動的に交通をバランスさせ,交通渋滞のホットスポットを回避し,効率的な流量を増やす.
SHARPv3 ネットワーク内コンピューティング: 減量操作をスイッチにオフロードし,オール-リデュースを2−3で加速します*.
高密度と低電力: 40 ポート 200Gb/s 業界トップのポート毎の消費電力で,TCOを削減します.

報告書によると,MQM8790-HS2F データシートそしてMQM8790-HS2F 仕様,スイッチは16Tb/sの総スイッチ容量, port-to-portの遅延が130ns未満で,24時間/24時間の生産環境のためのホットスイッチ可能な電源とファンをサポートします. さらに,デバイスは,NVIDIA ConnectX-6/7 HDR アダプターと幅広い HDR オプティカル/銅ケーブルと完全に互換性があります期限を検証するMQM8790-HS2Fに対応するエコシステムです

4展開とスケーリングの推奨事項 (典型的なトポロジー)

ソリューションを展開する際に次の手順を実行します.

サブネット管理:アクティブスタンバイサブネット管理者 (SM) を展開する.NVIDIA UFMプラットフォームは集中管理とテレメトリに推奨される.
パーティションとサービスレベル: パーティションキー (P_Key) を使用して,レンタやワークロードを隔離します.AIトレーニングトラフィックを優先するためにSL2VLマッピングを設定します.
キャベルの選択: 短距離 (≤3m) の為には受動銅ケーブル,より長い距離の為には,信号の整合性を維持するためにアクティブ光学ケーブルまたはトランシーバーを使用する.

2,000ノードを超えるより大きなクラスタでは,3レベルのFat-TreeまたはDragonfly+トポロジーを採用することができ,コア層はMQM8790-HS2F追加ユニットを購入する際には,MQM8790-HS2F価格認証されたディストリビューターから入手可能であることMQM8790-HS2F 販売中最新のファームウェアと保証が含まれています.MQM8790-HS2F インフィニバンドスイッチソリューション超コンピューティングセンターまで格好よくスケールできます

5運用,監視,トラブルシューティング,最適化

InfiniBandファブリックの有効な運用には,積極的な監視と規律的なトラブルシューティングが必要です.

監視: 使用イブネットディスカバートポロジーの検証のためパーフクエリー港口カウンターとUFMテレメトリで混雑のリアルタイム可視化
共通の問題と解決:
- リンクを振動させる: ケーブルの座席を確認し,ケーブルの診断試験を実行し,欠陥光学を交換する.
- サブネットマネージャーの失敗切り替え: SM 優先順位が正しく設定され,二次SM が有効なデータベースを持っていることを確認する.
- 不均等な適応路由: ルーティングアルゴリズムのパラメータを調整する (例えば,routing_engine=ftree について負荷の分散を可能にします.
オプティマイゼーションのヒント: 集団操作のための SHARP 集積を有効にします. 大規模なメッセージ転送のために MTU を 4096 バイトに調整します. 制御,データ,および管理トラフィックを分離するためにサービス品質を使用します.

NVIDIAサポートポータルによる定期的なファームウェアアップグレードは,セキュリティパッチとパフォーマンス向上を保証します.MQM8790-HS2F データシート詳細なパフォーマンス基準と健康な条件下での予想カウンター値について

6概要価値評価

についてNVIDIA メラノックス MQM8790-HS2FRDMA/HPC/AIクラスタ相互接続の核心課題である遅延,損失,CPUオーバーヘッド,スケーラビリティを解決する将来性のあるInfiniBandスイッチングプラットフォームを提供します.上記の2層のFat-Treeアーキテクチャを実装することで組織は,線形的なパフォーマンススケーリング,予測可能な作業完了時間,および従来のEthernetソリューションと比較してTCOを大幅に削減することができます.スイッチは200Gb/sのHDR速度を組み合わせています40ポートの密度とネットワーク内コンピューティング機能により,グリーンフィールド展開やEDR/HDRファブリックからの段階的なアップグレードに理想的な選択肢となっています.次の世代クラスタを評価するアーキテクチャチームについてMQM8790-HS2F インフィニバンドスイッチソリューション試験済みで生産可能な基準設計を提示する.