NVIDIA メラノックス MCX653106A-HDAT サーバー アダプタ 動作: RDMA/RoCE 低遅延トランスポート & サーバー

April 30, 2026

最新の会社ニュース NVIDIA メラノックス MCX653106A-HDAT サーバー アダプタ 動作: RDMA/RoCE 低遅延トランスポート & サーバー

分散型ストレージや高周波取引から大規模なAIトレーニングクラスタまで 現代のデータセンター環境では,従来のTCP/IPプロトコルスタックは大きなボトルネックとなっています.カーネルネットワークのオーバーヘッド,データコピー,コンテキストスイッチングは予測不可能な遅延を導入しながら重要なCPUリソースを消費します.クラウドインフラストラクチャの主要なプロバイダがこれらの課題を克服し,NVIDIA メラノックス MCX653106A-HDATサーバー NICで,遅延とスループットの両方の劇的な改善を達成しました.

背景と課題: TCP/IPのボトルネック

プロバイダーの既存の25GbEインフラストラクチャは,標準的なTCPを実行しており,NVMe-oFストレージトラフィックとリアルタイム分析ワークロードに追いつくのに苦労していました.ストレージノードでのCPU利用率は,ネットワーク処理だけで 70%を超えることが多い.コンピューティングとストレージノード間の端から端までの遅延は50~150マイクロ秒間変動する.サービスレベルの契約に影響を与える 尾行遅延のピークを引き起こしたエンジニアリングチームは,ネットワークアーキテクチャの根本的な変化が必要だと認識しました. カーネルを回避し,エンドポイント間の直接メモリアクセスを可能にします.

解決法: RoCE で MCX653106A-HDAT を展開する

複数の選択肢を評価した後,チームはMCX653106A-HDAT イーサネット アダプター カードConnectX-6 アーキテクチャをベースにMCX653106A-HDAT ConnectX アダプター PCIe ネットワーク カードローCE (RDMA over Converged Ethernet) のネイティブハードウェアサポートを備えたダブルポート100GbE接続を提供している.導入は段階的なアプローチに従った.

  • 第"段階ストレージノード (10ノードが Ceph を実行している) の古い NIC を新しいアダプタに置き換える.
  • 第2段階NIC と トップ・オブ・ラックスイッチの両方で DCB (優先流量制御と ETS) を使って損失のない Ethernet を設定する.
  • 第3段階TCPソケットからRDMAベースの動詞とNVMe-oFをRoCE上でアプリケーショントラフィックに移行する.
  • 第4段階リアルタイム分析を処理する コンピューティングノードに展開する

エンジニアMCX653106A-HDATデータシートそしてMCX653106A-HDATの仕様既存の Mellanox スイッチファブリックと展開された Linux ディストリビューション (MLNX_OFED ドライバのUbuntu 22.04) と完全な互換性を確認しました.MCX653106A-HDAT対応NICの交換以外にはハードウェアの変更は必要ないことが証明されました

結果と利益:測定可能な変革

導入後のテストでは,すべての主要指標で実質的な改善が示されました.以下の表は,導入前の比較と導入後の比較を要約しています.

メトリック 前 (25GbE TCP) (MCX653106A-HDAT RoCE) 後に 改善
平均遅延 (P99) 120 μs 8 μs 93%削減
ストレージノード CPU (ネットワーク経路) ~65% ~12% 5.4倍削減
NVMe-oF 読み抜き (ノードあたり) 18Gb/s 96 Gb/s 5.3倍増
メッセージレート (64B パケット) 15 Mpps 215 Mpps 14.3倍増

この数値的利益に加えて,チームはいくつかの質的な利点を見出した.MCX653106A-HDAT イーサネット アダプタカードソリューションアプリケーションメモリとリモートストレージとの間の真なるゼロコピーのデータ移動が可能になり,以前はトラフィックバースト中に断続的な故障を引き起こすバッファの枯渇問題を排除しました.分析作業量についてRDMAへの移行により,作業完了時間が62%短縮され,ビジネス成果が直接改善されました.MCX653106A-HDAT価格全体の所有コストに対して,ストレージノード数の30%削減 (ノードあたりの効率が高くなるため) は9ヶ月以内に収益を上げました.MCX653106A-HDAT 販売中NVIDIA パートナーを通じても DOCA フレームワークへのアクセスを提供し,カスタムネットワーク機能の将来のプログラミングを可能にしました.

結論と展望:次世代インフラストラクチャの基盤

開発を推進するNVIDIA メラノックス MCX653106A-HDAT提供者のインフラストラクチャをTCP限定環境から,現代的なワークロードをサポートできる高性能低レイテンシーファブリックに変えました.,PCIe 4.0 インターフェースと包括的なソフトウェアエコシステムにより,今日のデータセンターの3つの重要な要求事項に対応します. 遅延を削減し,スループットを増加し,CPU効率を向上します.

建築家が類似のアップグレードを評価する際にはMCX653106A-HDAT対応スイッチ,ケーブル,オペレーティングシステムを含む部品.MCX653106A-HDATデータシート統合計画のための電力,熱,機械仕様を提供します.200GbEファブリックが標準になり,AIトレーニングクラスタがますます低い遅延を要求するにつれて,MCX653106A-HDAT イーサネット アダプター カード試用済みで生産性のあるソリューションとして準備ができています. 提供者は現在,AI推論ワークロードのためのGPU直接RDMAを含む展開を拡大しています.このアダプタを近代的なデータセンターアーキテクチャの基石として検証する.