ネットワーク
文:Sean Michael Kerner

米NVIDIA、Spectrum-Xでイーサネットネットワークに本腰

米NVIDIA、Spectrum-Xでイーサネットネットワークに本腰

2019年にNVIDIAが69億ドルでチップメーカーのMellanox社を買収して以来、同社はMellanoxのポートフォリオの中核であるInfinibandに重点的に取り組んできた。生成AI時代において、Infiniband は高スループットで低レイテンシのファブリックとしてますます重要になっている。

Infinibandの威力にもかかわらず、イーサネットはほとんどのデータセンターのデフォルトとして残り続けており、その実態は変わりそうにもない。NVIDIAはAIネットワークのニーズにこたえる最先端データセンターの実現に向け、Spectrum-Xイーサネット・プラットフォームを推進している。

台湾でのシリコンショー「Computex」に先駆けて行われた基調講演で 、同社の最高経営責任者(CEO)兼創設者であるJenson Huang(ジェンスン・フアン)氏は、Spectrum-Xの全貌とそれによって何が可能になるのかを詳しく説明した。

「私たちは2種類のネットワーキングがあります。一つは、世界中のスーパーコンピューティングやAIファクトリーで使用されているInfinibandで、私たちにとって信じられないほどのスピードで成長しています」と氏は述べた。「しかし、すでに長期間イーサネットのエコシステムに投資しているため、すべてのデータセンターがInfinibandを扱うことができるわけではありません。そこで私たちは、非常に難しいことですが、Infinibandの機能をイーサネットアーキテクチャに取り込みました」

AI向けイーサネットの何が問題なのか

氏は基調講演で、AIのユースケースにおける通常のイーサネットの欠点について説明した。

「イーサネットは高い平均スループットを目的として設計されました」と氏。

現代のイーサネットの基本設計により、データセンター間またインターネット間でのマルチノード通信が可能になっている。これとは対照的に、ディープラーニングやAIのユースケースでは、GPUはインターネット上の人々と通信するのではなく、主にGPU同士の間で通信していると氏は指摘した。

このようなユースケースには異なる要求があり、Spectrum-Xはこれを解決するために設計されている。

NVIDIAによると、Spectrum-XはAIワークロード向けに特化した世界初のイーサネットファブリックであり、従来のイーサネットファブリックに比べ、生成AIネットワークのパフォーマンスを1.6倍高速化することができる。このプラットフォームは、NVIDIA Spectrum XイーサネットスイッチとNVIDIA BlueField-3 SuperNICを搭載している。

Spectrum-Xのテクノロジー

Spectrum-Xアーキテクチャは、従来のイーサネットファブリックにおけるいくつかの本質的な問題に対処している。

氏によると、NVIDIAのSpectrum-Xは、パフォーマンスの大幅な向上を実現する高度なネットワークレベルのリモート・ダイレクト・メモリ・アクセス(RDMA)を統合しているという。またNVIDIAは、Spectrum-Xスイッチに強化された輻輳制御も統合している。

「スイッチは常に信じられないほど高速にテレメトリーを実行します」と氏。「GPUやNICが大量の情報を送信している場合は、ホットスポットが発生しないように、情報を減らすように指示することができます」

Adaptive routingは、NVIDIAが統合しているイーサネットのもう1つのアップデートだ。氏は次のように述べた。

イーサネットはデータパケットを順番に送受信する必要があるため、輻輳が発生する可能性がある。Adaptive routingでは、Spectrum-Xが輻輳や使用率の低いポートを検出すると、順序に関係なくデータは使用可能なポートに送信され、Bluefield NICがそれを再配置する。氏はまた、Spectrum-Xに組み込まれていたイーサネットのもう一つの中核的な機能強化として、ノイズアイソレーションを強調した。

数百万のGPUをサポートするイーサネット

基調講演で氏は、Spectrum-Xの製品の方向性について語った。

現在の製品パイプラインには、51.2Tbpsのスイッチング容量を持つSpectrum-X 800が含まれる。また、さらに容量を拡大したSpectrum-X 800 UltraとX-1600の投入も予定されているという。

x-800は数万GPU、X 800 Ultraは数十万GPU、X 1600は数百万GPUをサポートするように設計されている。

「今後の私たちのデータ処理量は、非常に驚異的なものになるでしょう」と氏は語った。

Nvidia gets serious about Ethernet networking with Spectrum-X

Sean Michael Kerner
Sean Michael Kerner

Sean Michael Kerner
Sean Michael Kerner

記事一覧へ