NVIDIA メラノックス MCX631102AN-ADAT RDMA/RoCE ローレイテンシー・トランスポート&サーバー・スループット強化
April 27, 2026
分散ストレージ、HPC、AIトレーニングクラスターにおいて、ネットワーク遅延とCPUオーバーヘッドがサーバーパフォーマンスを制限する主なボトルネックとなっています。クラウドサービスプロバイダーは最近、NVIDIA Mellanox MCX631102AN-ADATサーバーアダプターを選択してNVMe-oFストレージバックエンドをアップグレードしました。RDMA over Converged Ethernet (RoCEv2) を展開することで、エンドツーエンドの低遅延トランスポートと大幅なサーバースループットの向上を実現しました。このケーススタディでは、アダプターが本番環境でどのように機能するかを検証します。プロバイダーの既存の25GbEインフラストラクチャは、従来のTCP/IPソフトウェアスタックを使用してストレージトラフィックを処理していました。NVMe/TCPシナリオでは、パケットカプセル化および非カプセル化のためのCPU使用率が40%を超え、ストレージ遅延が200μsを超え、アプリケーションサーバーのコンピューティング容量が大幅に低下しました。アーキテクトは、カーネルネットワークスタックをバイパスし、CPU干渉を削減し、デュアル25GbEリンクでラインレートスループットを維持できるソリューションを緊急に必要としていました。複数のオプションを評価した後、ストレージファブリックの刷新の中核ハードウェアとしてMCX631102AN-ADAT ConnectX-6 Lxデュアルポート25GbE SFP28を選択しました。
ソリューションと展開:ハードウェアオフロードによるRDMA/RoCEv2
展開では、RoCEv2ロスレスモード(ECNとPFCを使用)で動作するMCX631102AN-ADATイーサネットアダプターカードですべてのストレージ向けサーバーを置き換えました。主な展開ステップは次のとおりです。RDMAトランスポートでNVMe over Fabrics(NVMe-oF)を構成し、TCPオーバーヘッドを完全に排除する
リーフ-スパイントポロジー全体でロスレス25GbE RoCEトラフィックのためにスイッチバッファしきい値を調整する
MCX631102AN-ADATの仕様(ハードウェアタイムスタンプ、ダイナミックコネクショントランスポート(DCT)、ベクトル化受信エンジンを含む)は、50Gbpsの集約負荷でも予測可能なサブマイクロ秒遅延を保証するために完全に活用されました。測定されたパフォーマンス向上と運用上のメリットMCX631102AN-ADATベースのファブリックに移行した後、次のメトリックがキャプチャされました。
- メトリック
- 変更前(TCP/IP 25GbE)
- 変更後(RoCEv2とMCX631102AN-ADAT)
NVMe-oF読み取り遅延(P99)215μs18μs
CPU使用率(ストレージI/Oパス)
41%(シングルコア飽和)集約サーバースループット(RX+TX)
| 42Gbps(ソフトウェア制限) | 49.8Gbps(ラインレート) | 小パケット(64B)スループット |
|---|---|---|
| 8.1Mpps | 37.5Mpps(ハードウェアフロー制御) | エンジニアは、MCX631102AN-ADATイーサネットアダプターカードソリューションが、リアルタイム分析データベースに適した予測可能なテール遅延を提供したと指摘しました。さらに、解放されたCPUコアはアプリケーションワークロードに再割り当てされ、同じ物理サーバーで全体的なテナント密度が約24%増加しました。 |
| 互換性とエコシステム統合 | 展開を拡大する際、運用チームは、アダプターが既存のNVIDIA Spectrumスイッチ(ロスレスRoCEプロファイル)およびDCBX構成を備えたAristaおよびCiscoのサードパーティ製ToRスイッチと互換性があることを確認しました。調達計画のために、MCX631102AN-ADATデータシートを参照して、電力エンベロープ(典型的な約12W)と熱要件を検証しました。初期の大量問い合わせにより、MCX631102AN-ADATの価格は、同様のクラスのSmartNICと比較して競争力があり、複数の販売店が標準的なボリューム契約の下でMCX631102AN-ADATを販売していることが確認されました。 | 概要と展望 |
| 本番環境のケースは、MCX631102AN-ADATが、完全な100GbEインフラストラクチャのオーバーホールを必要とせずに、TCPバウンドストレージネットワークからRDMAアクセラレーテッドファブリックへの根本的な移行を可能にすることを明確に示しています。MCX631102AN-ADAT ConnectX-6 Lxデュアルポート25GbE SFP28設計を活用することで、組織は遅延に敏感なワークロードの効果的なスループットを倍増させ、大幅なCPUリソースを解放できます。今後、同じ展開パターンは、分散機械学習フレームワーク(RoCE上のNCCL)およびマイクロサービスベースのステートフルアプリケーションに拡張されます。25GbEアップグレードを評価しているアーキテクトにとって、NVIDIA Mellanox MCX631102AN-ADATは、高性能で低遅延のデータセンターネットワークのための、実績があり本番環境で強化されたビルディングブロックとして位置づけられます。 | ||

