NVIDIA Mellanox MCX653105A-HDAT サーバアダプタが動作: RDMA/RoCE 低遅延輸送でスループットを増加する

March 16, 2026

最新の会社ニュース NVIDIA Mellanox MCX653105A-HDAT サーバアダプタが動作: RDMA/RoCE 低遅延輸送でスループットを増加する
背景と課題: ストレージとコンピューティングのボトルネック

金融技術企業の一大企業が 次世代のビッグデータ分析プラットフォームを 構築している間に ネットワークの I/O バトルネックに遭遇しました現存する10GbEインフラストラクチャは,リアルタイムリスク評価と高周波取引分析に必要な膨大なデータフローを処理するのに苦労しました重要なアプリケーション処理にリソースが少なくなりました. 核心的な課題は明らかでした.分散型データベースとAI駆動分析をスケールするサーバーの全容量を見直さずに レイテンシーを大幅に削減し サーバーの効率的なスループットを増やす必要がありました

カーネルネットワークスタックのオーバーヘッドが予測不能な遅延ピークを生み出しました記憶内データベースやNVMeベースのストレージクラスタのパフォーマンスに直接影響を与えるネットワーク処理をCPUからオフロードし,サーバーとストレージの間を直接高速でデータ移動できるようにするソリューションが必要でした.決定されました.迈络思 (NVIDIA メラノックス) MCX653105A-HDAT重要なコンピューティングとストレージノードを介してサーバーアダプターカード

ソリューションと展開: RDMA と RoCE 能力を解放する

部署は,MCX653105A-HDATNVIDIA Mellanox ConnectX-6ファミリーのダブルポート100Gb/sアダプターである.主な目標は,データ転送のためにCPUをバイパスするためにRDMA over Converged Ethernet (RoCE) を実装することであった.NVIDIA メラノックス MCX653105A-HDATRoCEのネイティブハードウェアサポートにより選択され,標準Ethernetファブリックで動作する際にInfiniBandの低レイテンシーメリットを提供します.既存のネットワークスイッチとの互換性を確保する.

エンジニアリングチームは,予測可能なパフォーマンスで任意の接続を可能にする,脊髄葉トポロジーでサーバーを構成しました. 成功の鍵は,MCX653105A-HDAT イーサネット アダプター カードハードウェアベースの RoCE オフロードを利用することでパケットの減少をゼロにするため,優先流量制御 (PFC) で損失のないファブリックを確立しました.効率的な RDMA 運用の重要な要件である.MCX653105A-HDAT ConnectX アダプター PCIe ネットワーク カード精密な混雑制御メカニズムは,完全な負荷下でも繊維の安定性を維持しました.

測定結果: トランスプット急増と遅延崩壊

性能向上は即座に顕著であった.アップグレードの前に,既存の10GbEインフラストラクチャは,CPU利用量が高く,サーバからサーバーのスループットを約1.2GB/sで制限していた.統合された後MCX653105A-HDATRoCEv2 を有効にすることで,クラスタは以下の成果を上げました.

メトリック 前 (10GbE/TCP) (MCX653105A-HDATで 100GbE/RoCE)
効率的な出力 (NVMe-oF) ~1.1 GB/s ~11.5 GB/s
平均遅延 (往復) ~150 μs < 5 μs
CPU利用 (ネットワーク I/O) ~30% < 5%

このスループット量の10倍増加は,同時にアプリケーションレベルの処理のためのCPUコアを解放しながら達成されました.MCX653105A-HDAT配線速度100Gb/sのパフォーマンスを達成するために,ハードウェアのオフロードが不可欠であることが判明し,分散型データベースは追加のサーバーを必要とせずに水平にスケールすることができます.詳細は公式のMCX653105A-HDATの仕様カーネルを回避し,先ほど専門的なHPCクラスターでしか見られなかったレベルに遅延を削減しました.MCX653105A-HDATデータシートPCIe パラメータを微調整し,Gen4帯域幅の最適利用を確保する.

結論 と 将来の見通し

この展開は,MCX653105A-HDAT イーサネット アダプタカードソリューション効率的なRDMA/RoCE輸送を通じてCPUのボトルネックを解決することで,MCX653105A-HDAT既存のストレージとコンピューティング投資の価値を最大化できるようにしました.この成功は,機械学習トレーニングクラスタへの展開を拡大するための道を開きました.低レイテンシー特性がある場合MCX653105A-HDATを販売する高性能インフラを評価する建築家や技術者にとって,MCX653105A-HDAT対応既存のオペレーティングシステムと管理ツールとの性質により,現代的で高速なデータセンターの構築にシームレスな選択肢になります.