NVIDIA Mellanox MMA4Z00-NS データセンター光モジュール 技術ソリューション
April 8, 2026
この技術ソリューションは,ネットワークアーキテクター,プレセールエンジニア,およびオペレーションマネージャー向けに設計されています.NVIDIA メラノックス MMA4Z00-NSデータセンターの光学モジュールで,高帯域幅と限られた範囲をバランスさせる現実の世界的な課題に取り組んでいます.次のセクションでは建築設計について説明します.重要な技術,展開モデル,そして最良の運用慣行.
1プロジェクト背景と要件分析
現代のAI訓練クラスターとHPC環境は前例のない東西トラフィックを生み出します.典型的な中規模のAIポッドは,同じラック内のGPUサーバー間の800G接続を必要とする可能性があります.同時に400Gアグリゲーションリンクを別の建物やデータホールから200~300m離れたストレージアイランドに必要とする物理層の制限から生じる核の衝突:標準OM4マルチモードファイバは800G (8×100G PAM4経由) をサポートするだけで,約50~70mまで,キャンパス間の要求にはるかに短くなります.既存のマルチモードインフラストラクチャをシングルモードファイバーに置き換えることは,しばしばコストが高く,運用に障害をもたらす.
ほとんどのアーキテクトが特定した主な要件は, (a) 短距離GPU-スイッチ接続のために800G帯域幅を維持すること,(b) キャンパス間の接続のために既存のOM4ファイバーを使用して200メートル以上の範囲に拡大単一管理と診断を提供すること. 単一管理と診断は,MMA4Z00-NS双モード機能によって 4つの要件すべてに直接対応します
2ネットワーク・システム・アーキテクチャの設計
提案されたアーキテクチャは,ハイブリッド物理層設計の2階層リーフ・スピントポロジーに従っている.各ラック内では,GPUコンピューティングノードがリーフスイッチに接続される.MMA4Z00-NS 800G OSFP SR8トランシーバーOM4ファイバー (≤50m) で完全な800Gモードで.ビルAのリーフスイッチとビルBの脊柱/ストレージスイッチ (200~300m) の間のキャンパス間接続については,同じNVIDIA メラノックス MMA4Z00-NSモジュールは,MMA4Z00-NS 2x400G インフィニバンド/イーサネットこれは,MPO-16ファイバーが2つの独立した400G信号を運ぶことを可能にし,リンクごとに帯域幅を維持しながら,効率的に範囲を倍にする.
- ラック内域:800G SR8モード,最大8×100G PAM4レーン, 90ns未満の遅延.
- キャンパス間域:2×400Gブレイクアウトモードでは,各400Gチャンネルはリラックスしたモダル分散で動作し,OM4で有効範囲を200~300mに拡張します.
- 単一織物:InfiniBand (GPUクラスター用) とEthernet (ストレージ/管理用) は両方がハードウェア変更なしでサポートされている.
このアーキテクチャでは,分離した長距離モジュールや単調光ファイバー変換の必要性がなくなり,単一モジュールタイプが距離管理の両方に対応し,在庫を簡素化し,節約する.
3. NVIDIA Mellanox MMA4Z00-NSの役割と主要機能
についてMMA4Z00-NS短距離800Gと拡張2×400Gドメインの間の光学ブリッジとして機能します.MMA4Z00-NS 仕様VCSELベースの並列光学と高度なDSPは重要な機能を提供します.
- 双速,双モード操作:ハードウェア再構成なしで800G SR8と2×400Gの間のソフトウェア選択可能.
- 強化されたリンク予算:400G/チャネルで動作すると,受信機の感度が800Gモードと比較して約3dB向上し,同じOM4ファイバーでより長い範囲に直接変換されます.
- プロトコル不可知論InfiniBandとイーサネットの両方を完全にサポートし,NVIDIA Quantum-2 と Spectrum-4 スイッチで検証されています.
- 診断用テレメトリ標準OSFP管理インターフェイスによる光電源,温度,電圧,リンクマージンのリアルタイムモニタリング.
建築家にとってMMA4Z00-NS データシートこの単一モジュールは2つの異なる製品タイプ (800G SR8 + 400G FR4または双方向モジュール) を置き換えるため,資本費と運用費の両方を削減する.
4展開とスケーリングの推奨事項 (典型的なトポロジー)
典型的なトポロジー説明:2つのデータホール (AとB) は,ダークOM4マルチモードファイバーで250メートル隔たれている.ホールAには16つのGPUラックがあり,それぞれ8つのコンピューティングノードと2つのリーフスイッチがある.ハールBには ストレージ・マレイと スピーン・スイッチがありますAホール内の各ページのスイッチはMMA4Z00-NSモジュール:ポート1-8はラック内接続のために800G SR8として構成され,ポート9-12はHall Bへのキャンパス間アップリンクのために2×400Gブレイクアウトとして構成されます. 両端で同じモジュールタイプを使用します.
配備のステップ:
- ステップ1: 検証MMA4Z00-NS対応既存のスイッチの状態 (ファームウェアバージョンとOSFPケージサポート)
- ステップ2: モジュールとMPO-16トランクケーブルを物理的にインストールします. 脱出モードには極度変更は必要ありません.
- ステップ3: スイッチ CLI または管理 GUI によるポート速度とモードを設定します. 短距離ポートを800G SR8 に設定し,クロスキャンパスポートを2×400G ブレイアウトに設定します.
- 組み込み診断を使用して,光学リンク予算の検証を実行します.MMA4Z00-NS 800G OSFP SR8トランシーバーソリューションレーンあたりRx電力を供給し,FEC前 BERを設定する.
スケーリング:AIクラスタが成長するにつれて 追加モジュールが並行して追加されますMMA4Z00-NS短距離対長距離リンクの組み合わせを予測する必要はありません 導入時に任意のモジュールが両方の役割に割り当てられます
| 配備シナリオ | モジュールモード | 最大距離 (OM4) | 使用ケース |
|---|---|---|---|
| ラック内/同じ列 | 800G SR8 | 50m (プレミアムOM4で70m) | GPU から Leaf へのスイッチ |
| キャンパス間/ビル間 | 2×400G ブレイクアウト | 200~300m | 葉から脊髄へ / 保存 |
5運用,監視,トラブルシューティング,最適化
についてMMA4Z00-NS標準的なデータセンターのテレメトリスタックと統合される.主要な運用慣行には以下が含まれます:
- リンク健康モニタリングSNMPまたはRedfish経由で1レーンあたりTx/Rx光電源,バイアス電流,温度を調査する.名目Rx電力は800Gモードでは-4dBmから+2dBmの間でなければならない.2×400G モードでは -7dBm ほど低く.
- FECとBER追跡:このモジュールは,FEC前ビットエラー率を報告する. 2×400G の長いリンクでは,FEC前 BER が 1e-8 またはそれ以下である場合,健全とみなされる.
- 一般的なトラブルシューティング:校内間リンクが訓練できない場合は,両端がブレイクアウトモード (800Gではなく) に設定されていることを確認します.MMA4Z00-NS データシートMPO-16ケーブル用の極度ガイド 部分の極度タイプ (例えばB型) には特定の交配が必要である.
- オプティマイゼーションのヒント:300mに近づくリンクでは,信号対ノイズ比を改善するためにトランシーバーケージの近くでの環境温度を減らす.各10°Cの削減は,VCSELの効率を約5%向上させる.
調達とライフサイクル管理のために,チームは追跡する必要がありますMMA4Z00-NS 価格モジュールの二重モードの柔軟性により,同じスペアユニットは短距離または長距離の位置で故障したユニットを置き換えることができます.
6概要 価値評価
についてNVIDIA メラノックス MMA4Z00-NS独特の価値提案を提示します 高い帯域幅の短距離と長距離のキャンパスリンクの両方をカバーする 1 つの光学モジュールで ファイバープラントの変更を必要としません建築家やITマネージャーがMMA4Z00-NS 販売中抽出の際の重要なポイントは
- キャプエクスの削減:400Gの長距離モジュールを別々に排除し,混合距離設計で光学費を30~40%削減します.
- オペックスの簡略化:単一のSKUは 備品,統一診断,一貫したケーブルです
- 未来に備えるについてMMA4Z00-NS 800G OSFP SR8トランシーバーソリューション今日の800Gクラスターと明日の2×400Gファブリックの両方をサポートします
- 操作の柔軟性ソフトウェアで選択可能なモードでは,ハードウェア交換なしで帯域幅と距離を再バランスできます.

