NVIDIA Mellanox MCX556A-ECAT 技術ソリューション:低遅延トランスポートとサーバーのスループット最適化のための RDMA/RoCE
April 23, 2026
このテクニカルホワイトペーパーは、ネットワークアーキテクト、プリセールスエンジニア、および運用マネージャーを対象としています。これは、RDMAおよびRoCEテクノロジーを使用して、高性能、低遅延のデータセンターネットワークを構築するための体系的なフレームワークを提供する、NVIDIA Mellanox MCX556A-ECATサーバーアダプターに焦点を当てています。分散ストレージ(Ceph、Lustre)、インメモリデータベース(Redis、Aerospike)、AIトレーニングフレームワークなどの最新のデータセンターワークロードは、高スループットとサブミリ秒の遅延の両方を要求します。従来のTCP/IPスタックは、CPUのオーバーヘッド、コンテキストスイッチ、およびデータコピーを大幅に増加させ、ネットワーク速度が100Gb/s以上に達するとボトルネックになります。次世代インフラストラクチャの主な要件には、CPUオフロード(ホストプロセッサの使用率削減)、超低遅延で予測可能な遅延(特にテール遅延)、ストレージプロトコル(NVMe-oF、iSER)のロスレス転送、および既存のイーサネットインフラストラクチャとのシームレスな統合が含まれます。MCX556A-ECATは、これらの各要件に直接対応します。
推奨されるアーキテクチャは、RoCE(RDMA over Converged Ethernet)転送用に設定されたロスレスイーサネットを備えた2層のリーフ-スパイントポロジを採用しています。すべてのコンピューティングノードとストレージノードには、MCX556A-ECATイーサネットアダプターカードが装備されており、100GbE QSFP28リンクを介してリーフスイッチに接続されます。スパインスイッチはリーフライヤートラフィックを集約し、ノンブロッキングコア帯域幅を提供します。主なアーキテクチャの原則は次のとおりです。RoCEv2はRDMAをUDP/IPにカプセル化し、レイヤー3境界を越えたルーティングを可能にします。
RDMAトラフィッククラスのロスレス動作を可能にします。拡張送信選択(ETS):遅延に敏感なフローの帯域幅を保証します。
- 輻輳通知:エンドツーエンドのフロー制御にDCQCN(Data Center Quantized Congestion Notification)を使用します。
- このアーキテクチャは、ベアメタル環境と仮想化環境の両方をサポートし、SR-IOVは仮想マシンへの仮想機能の直接パススルーを提供します。3. NVIDIA Mellanox MCX556A-ECATの役割と主な機能
- MCX556A-ECAT ConnectXアダプターPCIeネットワークカードとして、このアダプターはソリューションの基盤となります。ハードウェアベースのオフロードエンジンはカーネルをバイパスし、直接メモリ間データ転送を可能にします。重要な機能は次のとおりです。機能
- メリットデュアルポート100GbE(最大200Gb/s集約)
帯域幅を大量に消費するワークロード向けの線形スループットスケーリング
サブマイクロ秒の遅延、CPUコピーゼロNVMe-oFおよびGPUDirectオフロードストレージおよびAIトレーニングパイプラインの高速化
| ハードウェアT10-DIF、IPsec、TLS | エンドツーエンドのデータ整合性とセキュリティ |
|---|---|
| SR-IOV、VirtIOアクセラレーション | 仮想化環境でのネイティブに近いパフォーマンス |
| MCX556A-ECATデータシートおよびMCX556A-ECAT仕様をレビューするチームは、アダプターがPCIe 3.0と4.0(x16)の両方をサポートしており、既存のサーバーとの後方互換性を確保しながら、次世代プラットフォームへの移行パスを提供することに注意してください。 | 4. 展開とスケーリングの推奨事項(標準トポロジ) |
| 中規模クラスター(最大200ノード)の参照展開を以下に示します。MCX556A-ECATは各サーバーのPCIeスロットにインストールされ、冗長性と帯域幅集約のためにデュアルポート接続を備えています。 | 物理トポロジ: |
| 2つのスパインスイッチ、4つのリーフスイッチ。各リーフはすべてのスパインに接続されます(フルメッシュ)。各サーバーは2つのリーフに接続されます(アクティブ-アクティブボンディング)。 | RoCE構成: |
| RoCEトラフィック専用VLAN。DSCPベースのQoSマーキング(例:RDMAの場合はDSCP 46)。優先度3でPFCを有効化。 | バッファー管理: |
ラウンドトリップ時間とリンク距離に基づいて、ポートあたりのロスレスヘッドルームバッファーを構成します。200ノードを超えるスケーリング:スーパー・スパイン・レイヤーを導入し、複数のポッドにわたるレイヤー2拡張のためにBGP-EVPNをデプロイします。認定ベンダー(例:Mellanox、FS.com)からMCX556A-ECAT互換のオプティクスとケーブルを確認してください。大規模調達のためにMCX556A-ECAT価格を評価する際は、スイッチとオプティクスとのバンドル価格を検討してください。5. 運用、監視、トラブルシューティング、最適化
パフォーマンス監視:輻輳検出:
- スイッチテレメトリ(例:Mellanox SNMP MIB)を使用して、ECNマークパケットとPFCポーズフレームを監視します。高いポーズフレームレートはバッファー圧力を示します。ファームウェアとドライバー管理:
- NVIDIA OFEDの最新バージョンに定期的に更新します。ファームウェア検証にはmstflintを使用します。一般的なトラブルシューティング:
- RDMA接続の失敗については、MTUの一貫性、VLANメンバーシップ、およびDSCPからCoSへのマッピングを確認してください。デバイスの状態を確認するには、ibdev2netdevおよびrdma link showを使用します。最適化のヒント:
- ワークロードに基づいてDCQCNパラメータ(alpha、beta、レート増加タイマー)を調整します。ストレージワークロードの場合は、完了キューの深さを増やします。AIトレーニングの場合は、GPUDirect RDMAを有効にし、メモリをピン留めします。容量計画については、MCX556A-ECATデータシートを参照して、熱および電力仕様(標準15W)を確認してください。このアダプターは、スペア在庫プログラムを含む正規販売代理店を通じて広くMCX556A-ECATが販売されています。
6. まとめと価値評価

