NVIDIA Mellanox MCX653105A-HDAT サーバー アダプタ 動作: RDMA/RoCE 低遅延輸送とサーバー

June 15, 2026

最新の会社ニュース NVIDIA Mellanox MCX653105A-HDAT サーバー アダプタ 動作: RDMA/RoCE 低遅延輸送とサーバー

最新のデータ センターでは、分散ストレージ、ハイ パフォーマンス コンピューティング (HPC)、および AI トレーニング クラスターが共通のボトルネック、つまりネットワークに直面しています。従来の TCP/IP スタックは、大幅な遅延と CPU オーバーヘッドをもたらし、大規模なアプリケーションのパフォーマンスを低下させます。このケース スタディでは、中規模のクラウド プロバイダーが、NVIDIA Mellanox MCX653105A-HDATサーバー アダプターにより、RDMA/RoCE ベースの低遅延トランスポートが可能になり、サーバー スループットが大幅に向上します。

背景と課題: すべてのマイクロ秒が重要なとき

標準の TCP/IP を実行しているプロバイダーの既存の 25GbE インフラストラクチャは、新しい NVMe-over-Fabrics ストレージ バックエンドをサポートするのに苦労していました。ストレージ ノードの CPU 使用率はネットワーク処理だけで常に 70% を超え、ノード間の遅延は 50 μs 前後で推移していました。これは遅延に敏感なデータベース ワークロードには許容できません。さらに、数百のノードにスケールアップすると、ネットワークの輻輳によりテール レイテンシーのスパイクが発生し、アプリケーションの SLA に影響を及ぼしました。彼らは、ネットワークのオーバーヘッドを軽減し、マイクロ秒未満の遅延を提供し、負荷がかかっても一貫したパフォーマンスを維持できるソリューションを必要としていました。

ソリューションと展開: MCX653105A-HDAT ConnectX アダプター PCIe ネットワーク カードの紹介

いくつかのオプションを評価した後、チームは次のオプションを選択しました。MCX653105A-HDAT イーサネット アダプタ カードデュアルポート 100GbE 機能と RoCE (RDMA over Converged Ethernet) のネイティブ サポートが特徴です。のNVIDIA Mellanox MCX653105A-HDATは、次の構成で 120 のストレージ ノードとコンピューティング ノードに展開されました。

  • RoCE有効化輻輳制御のための ECN (明示的輻輳通知) および DCQCN を使用
  • NVMe-oF ターゲット オフロードストレージ I/O のためにホスト CPU をバイパスしてハードウェアに接続
  • パーティショニングストレージ トラフィックのロスレス優先フローに変換
  • テレメトリ監視アダプターの組み込みパフォーマンスカウンターを使用する

によると、MCX653105A-HDAT データシートのカードは InfiniBand と Ethernet プロトコルの両方をサポートしていますが、チームは既存の Ethernet スイッチとシームレスに統合するために RoCEv2 を選択しました。互換性は簡単で、主要なサーバー モデルはすべて互換性がありました。MCX653105A-HDAT互換、標準の PCIe スロットと更新されたファームウェアのみが必要です。導入は、アダプターのライブ マイグレーション機能を使用して、ダウンタイムなしで 2 週間かけて完了しました。

結果と利点: 目に見えるパフォーマンスの向上

その影響は即時かつ重大なものでした。次の表は、デプロイ前後の主要なメトリクスをまとめたものです。MCX653105A-HDAT イーサネット アダプタ カード ソリューション:

メトリック 以前(TCP/IP) 後 (RoCE + MCX653105A-HDAT) 改善
平均遅延 (ノード間) 52μs 1.8μs 96.5%削減
CPU 使用率 (ストレージ ノード、ネットワーク スタック) 72% 8% 89%削減
ノードあたりの実効スループット (NVMe-oF) 18Gbps 96Gbps 5.3倍増加
テールレイテンシー (99.9 パーセンタイル) 380μs 12μs 96.8%削減

これらの数字以外にも、チームはさらなる運用上の利点を指摘しました。のMCX653105A-HDATの仕様これには、ハードウェアベースの接続追跡と ASAP2 フロー オフロードが含まれており、これにより East-West トラフィックのジッターが軽減され、よりスムーズなスケーリングが可能になりました。総所有コストを評価する場合、MCX653105A-HDAT 価格CPU コアのライセンス コストの削減とノードあたりのストレージ密度の向上により、6 か月以内に正当化されました。アダプターは現在広く普及していますMCX653105A-HDAT 販売用標準チャネルを通じて、あらゆる規模の組織がこのパフォーマンスにアクセスできるようになります。

概要と展望: 次世代インフラストラクチャの基盤

この事例は、MCX653105A-HDAT ConnectX アダプター PCIe ネットワーク カードは、単に高速な NIC ではなく、真のデータ中心のコンピューティングのためのプラットフォームです。ハードウェア オフロードで RDMA と RoCE を有効にすることで、NVIDIA Mellanox MCX653105A-HDATサーバーの通信方法を変革し、従来のプロトコルのオーバーヘッドを排除し、NVMe ストレージと分散メモリ ファブリックの可能性を最大限に引き出します。

今後を見据えて、プロバイダーは、AI トレーニング ワークロード用の GPUDirect RDMA を含めるように展開を拡張するとともに、カスタム パケット処理用のアダプターのプログラマビリティ機能を検討する予定です。同様のスケーリング課題に直面している IT アーキテクトとネットワーク エンジニアにとって、MCX653105A-HDAT イーサネット アダプタ カードは、低遅延、高スループットのデータセンター ネットワーキングへの実績のある、将来に備えたパスを提供します。