NVIDIA Mellanox MCX653106A-HDAT の動作: 低遅延 RDMA/RoCE トランスポートとサーバースループットのブレークスルーを達成

June 16, 2026

分散型ストレージ,高周波取引,AIトレーニングクラスタを含む現代のデータセンター環境では,2つの継続的な課題が残っています.ネットワークによる遅延を削減し,CPUを負担することなくサーバーのスループットを最大化クラウドインフラストラクチャの主要なプロバイダが,NVIDIA メラノックス MCX653106A-HDATコンピュータとストレージノードにサーバーアダプタを設置します

背景と課題

ソフトウェアベースのTCP/IPスタックを搭載した標準Ethernetアダプターに基づいたプロバイダの既存の25GbEインフラストラクチャは,明確な限界を示していました.NVMe over Fabrics を使ったストレージワークロードは予測不能なレイテンシーピーク (しばしば50μsを超える) を経験した.ネットワーク処理だけで消費されるコアの35%までまで CPUの高利用率で苦しんでいた.RDMAトランザクションの 10μs 未満の遅延を提供し,完全なアーキテクチャの改修を必要とせずに 200GbE トランスフットをサポートできるソリューションが必要でした.

複数の選択肢を評価した後,MCX653106A-HDAT イーサネットアダプターカード, ハードウェアオフロード RoCE (RDMA over Converged Ethernet) と既存の Cumulus Linux ベースのリーフ・スピントポロジーとのシームレスな統合を約束した.

解決策と展開方法

部署はMCX653106A-HDAT ConnectX アダプター PCIe ネットワークカード, ブロックしないファブリックを作成するためにダブルポート100GbEの構成を利用した.各コンピューティングノードは,1つのアダプタを受け取り,ストレージノードは冗長性のために2つ装備された.主要な実施ステップ:

PFC (優先流量制御) とECN (明示的な混雑通知) で RoCEv2を有効にすることで,損失のない輸送を確保する
高優先度データベースとストレージワークロードに仮想機能を専用するように SR-IOVを構成する
最新のMCX653106A-HDAT対応Ubuntu 22.04 LTS ノードにわたるドライバスタック (NVIDIA DOCA 2.5)
パケット処理経路のハードウェアベースのDPDK加速を実装する

基準としてMCX653106A-HDATデータシートチームでは,小型パケットトランザクションのための1μs未満のハードウェアレイテンシーと1秒あたり最大2億5千万パケット (MPPS) を予測しました.

結果と測定できる益

インフラストラクチャチームは50の生産ノードで4週間の試行錯誤を行った後,NVIDIA メラノックス MCX653106A-HDAT古いアダプターに対して

メトリック	25GbE アダプター	MCX653106A-HDAT (RoCE)	改善
NVMe-oF 読み込み遅延 (P99)	52 μs	6.8 μs	87%削減
CPUオーバーヘッド (ネットワークスタック)	34%	7%	27 パーセントポイント
総処理量 (サーバーあたり)	92Gbps (拘束)	198 Gbps	115%増加
小型パケットの税率 (64B)	48 Mpps	187 Mpps	~290%の利益

計算した結果,MCX653106A-HDAT イーサネットアダプタカードソリューション先ほど必要だった調整の回避方法,例えば中断結合ハックや大きすぎる受信バッファを排除した.VXLANとGeneveのハードウェアオフロードもコンテナネットワークスタックを簡素化しましたKubernetes 環境でPod-to-Podの遅延を40%削減する

費用を評価するITマネージャーにはMCX653106A-HDAT価格比較可能な200GbEソリューションと比較すると,CPUコア節約とスイッチポート使用量の削減を考慮すると,所有総コストが15~20%低くなることが示されました.MCX653106A-HDAT 販売中HPCとリアルタイム分析を含む隣接チームからの問い合わせは,次の調達サイクルのためにすでに提出されています.

概要と展望

この展開はNVIDIA メラノックス MCX653106A-HDATネットワーク処理をソフトウェアからハードウェアに RoCEオフロードを通じて移行することで,SR-IOVは,RECのRECのRECのRECのRECのRECのRECのRECのRECのRECのRECのRECのRECのRECの,GPUDirect-readyアーキテクチャは,アプリケーションロジックのためにCPUサイクルを再利用しながら,決定的なマイクロ秒スケール遅延を達成することができます.

500以上のノードに展開するにつれてまた,多利用者セキュリティのためのアダプターの内蔵インライン暗号化 (IPsec/TLS) と金融サービスワークロードのためのPTP (IEEE 1588v2) を検討している.検証されたコンフィギュレーションを求めるエンジニアは,MCX653106A-HDATの仕様この実用的なケースは1つのことを明らかにしています.MCX653106A-HDAT ConnectX アダプター PCIe ネットワークカード低レイテンシーで高速なイーサネットを次の世代のデータセンターに提供します

詳細な技術的な見直しについては,公務員に相談してくださいMCX653106A-HDATデータシートNVIDIAの地域ソリューションアーキテクトに連絡してください

NVIDIA Mellanox MCX653106A-HDAT の動作: 低遅延 RDMA/RoCE トランスポートとサーバー スループットのブレークスルーを達成