技術的解決策:RDMA/RoCEの低遅延とスループット最適化
March 13, 2026
近代データセンターは,分散型データベース,高性能コンピューティング (HPC),AIのトレーニングクラスター伝統的な TCP/IP ネットワークは CPU の大きなオーバーヘッドを課し,アプリケーションのスケーラビリティを制限し応答時間を増加させるボトルネックを作り出します.インフラを近代化したい組織のために費用のかかるアーキテクチャの改修なしに レイテンシーを削減し サーバーのスループットを増やすことです
この技術により,直接メモリからメモリへのデータ転送が可能になります.操作システムのカーネルを回避して CPU リソースを解放し,レイテンシーを最小限に抑えるネットワークインターフェースカード (NIC) がこの変革の中心です.MCX631432AN-ADABこの要求に応えるように特別に設計され,RoCE対応の繊維の堅牢な基盤を提供します.
提案されたアーキテクチャは,損失のないイーサネット環境のために設計された葉の骨組みであり,これは最適なRoCEv2パフォーマンスの前提条件です.設計は,統一されたネットワーク上でコンピューティングとストレージトラフィックを統合しています.複雑性とコストを削減するために
- 脊髄層:高容量100GbEスイッチは,すべてのリーフスイッチ間の非ブロック接続を提供し,低レイテンシー経路を任意から任意に保証します.
- 葉の層:25GbEダウンリンクを搭載したトップ・オブ・ラック (ToR) スイッチは,サーバーとストレージノードに接続する.これらのスイッチは,優先流量制御 (PFC) と明示的な混雑通知 (ECN) で構成されており,損失のないファブリックを維持します..
- サーバー層:各サーバーにはNVIDIA メラノックス MCX631432AN-ADABネットワーク結合またはストレージおよびコンピューティングトラフィックのための分離経路を可能にする.
この設計は,MCX631432AN-ADAB イーサネット アダプター カードRoCE トラフィックがパケット損失なしで流れる環境で動作します.これは高いスループットと低レイテンシーを維持するために重要です.
についてMCX631432AN-ADABConnectX-6 Lx ファミリーのメンバーとして, 25GbE 形式要素にエンタープライズグレードの機能をもたらします.MCX631432AN-ADAB イーサネット アダプター カードソリューションコンピューティングトラフィックとストレージトラフィックの両方において,サーバーCPUからネットワークタスクをオフロードする.
アダプターの主要な技術貢献には,以下のものがある.
- ハードウェアのオフロード:このカードは,輸送,封装,混雑制御を含むハードウェアにおけるRoCEプロトコルのすべての側面を処理する.これはRDMA操作がほぼゼロのCPUサイクルを消費することを保証する.
- 2つのポートの柔軟性:双重25GbEポートは,アクティブ/スタンバイ・ファールオーバーに設定したり,トラフィックタイプを分離するために使用することもできます.1つのポートはフロントエンドのEthernetトラフィックを処理し,もう1つはRoCEを使用してバックエンドのストレージトラフィックに専念しています.生産量とセキュリティを最大化します
- PCIe 3.0 x16 ホストインターフェース:25GbEポートを同時に動かすのに十分な帯域幅で,MCX631432AN-ADAB ConnectX-6 Lx デュアルポート 25GbE SFP28内部的なボトルネックがアプリケーションの性能を制限しないようにします
導入するMCX631432AN-ADABネットワークファブリックとサーバーの構成を慎重に計画する必要があります.以下のステップは,高性能クラスタの典型的な展開を概要します.
- 繊維の調製:導入前に,ネットワークスイッチをRoCEをサポートするように設定する.これは,RoCEトラフィッククラスのためのPFCを有効にし,ECNベースの混雑管理を実装することを含む.このアダプタが最適に動作するために必要な損失のない環境を作成.
- ドライバとファームウェアのインストール:最新の NVIDIA WinOF-2 ドライバ (Windows 用) や MLNX_OFED (Linux 用) をインストールして,機能を完全にサポートしてください.MCX631432AN-ADAB最適な RoCE 性能と互換性を確保するために更新されています.
- クラスタをスケールする:このアーキテクチャは,それぞれ独自の MCX631432AN-ADAB を備えたより多くのサーバーノードを追加することで水平にスケールされます.ブロックしない葉の脊髄組織は,追加されたノードが既存のノードの性能を低下させないことを保証しますより大きなデプロイでは,リンクアグリゲーショングループ (LAG) をリーフとスピンスイッチの間に使用できます.
データベースクラスタの典型的なトポロジーは,インターラック遅延を最小限にするために,プライマリサーバーとレプリカサーバを同じリーフスイッチに接続することを含む.冗長性のために2つの別々の葉スイッチに接続するために各サーバーは,そのダブルポートアダプタを使用.
導入されたら,パフォーマンスを維持するには,積極的な監視と調整が必要です.MCX631432AN-ADABこの目的のために包括的なテレメトリを 提供します
- 監視の主要指標:ポートカウンター,リンクエラー,およびRDMAトラフィック統計を監視するために, `mlxstat`と `ethtool`のようなツールを使用します. PFCの休止フレームを追跡することは不可欠です.高い数値は,ROCE性能を低下させる損失のある布を示します..
- ファームウェアとドライバの更新:更新プログラムを定期的にチェックする.新しいファームウェアには,パフォーマンス最適化やバグ修正が含まれ,遅延をさらに削減し,アップストリームスイッチとの互換性を改善することができます.
- パフォーマンスのチューニング:最も要求の高いレイテンシー要件を持つ環境では,中断の調節とバッファサイズを細かく調整することで,増幅的な利益が得られます.アダプターの柔軟性により,建築家は特定の作業量 (eHPC vs. 仮想化).
SFP28 モジュールがMCX631432AN-ADABに対応するNVIDIA対応の光学を使用することで 信頼性の高いリンクの確立とパフォーマンスを確保できます
についてMCX631432AN-ADABメラノックス (NVIDIA) から,高性能,低遅延のネットワーク構造を実装するための明確で効果的な方法を提供します.組織は,劇的に削減されたCPUオーバーヘッドと大幅に増加したサーバーのスループットの二重の利点を達成することができます. 詳細なMCX631432AN-ADABの仕様そしてMCX631432AN-ADAB データシート最も厳しい作業負荷に対応する能力を検証する.
ハードウェアの更新を評価するITマネージャーやネットワークアーキテクトにとって このソリューションがもたらすパフォーマンス向上はより効率的な貯蔵アクセスデータの需要が増加し続けているため,MCX631432AN-ADAB詳細な価格情報や 詳細な価格情報を得るため,MCX631432AN-ADAB価格NVIDIAの担当者に相談してください

