米NVIDIA、Spectrum-Xでイーサネットネットワークに本腰
![米NVIDIA、Spectrum-Xでイーサネットネットワークに本腰](https://www.newsme.jp/wp-content/uploads/2024/06/overture-networks-partners-vnf-based-carrier-ethernet.avif)
2019年にNVIDIAが69億ドルでチップメーカーのMellanox社を買収して以来、同社はMellanoxのポートフォリオの中核であるInfinibandに重点的に取り組んできた。生成AI時代において、Infiniband は高スループットで低レイテンシのファブリックとしてますます重要になっている。
Infinibandの威力にもかかわらず、イーサネットはほとんどのデータセンターのデフォルトとして残り続けており、その実態は変わりそうにもない。NVIDIAはAIネットワークのニーズにこたえる最先端データセンターの実現に向け、Spectrum-Xイーサネット・プラットフォームを推進している。
台湾でのシリコンショー「Computex」に先駆けて行われた基調講演で 、同社の最高経営責任者(CEO)兼創設者であるJenson Huang(ジェンスン・フアン)氏は、Spectrum-Xの全貌とそれによって何が可能になるのかを詳しく説明した。
「私たちは2種類のネットワーキングがあります。一つは、世界中のスーパーコンピューティングやAIファクトリーで使用されているInfinibandで、私たちにとって信じられないほどのスピードで成長しています」と氏は述べた。「しかし、すでに長期間イーサネットのエコシステムに投資しているため、すべてのデータセンターがInfinibandを扱うことができるわけではありません。そこで私たちは、非常に難しいことですが、Infinibandの機能をイーサネットアーキテクチャに取り込みました」
AI向けイーサネットの何が問題なのか
氏は基調講演で、AIのユースケースにおける通常のイーサネットの欠点について説明した。
「イーサネットは高い平均スループットを目的として設計されました」と氏。
現代のイーサネットの基本設計により、データセンター間またインターネット間でのマルチノード通信が可能になっている。これとは対照的に、ディープラーニングやAIのユースケースでは、GPUはインターネット上の人々と通信するのではなく、主にGPU同士の間で通信していると氏は指摘した。
このようなユースケースには異なる要求があり、Spectrum-Xはこれを解決するために設計されている。
NVIDIAによると、Spectrum-XはAIワークロード向けに特化した世界初のイーサネットファブリックであり、従来のイーサネットファブリックに比べ、生成AIネットワークのパフォーマンスを1.6倍高速化することができる。このプラットフォームは、NVIDIA Spectrum XイーサネットスイッチとNVIDIA BlueField-3 SuperNICを搭載している。
Spectrum-Xのテクノロジー
Spectrum-Xアーキテクチャは、従来のイーサネットファブリックにおけるいくつかの本質的な問題に対処している。
氏によると、NVIDIAのSpectrum-Xは、パフォーマンスの大幅な向上を実現する高度なネットワークレベルのリモート・ダイレクト・メモリ・アクセス(RDMA)を統合しているという。またNVIDIAは、Spectrum-Xスイッチに強化された輻輳制御も統合している。
「スイッチは常に信じられないほど高速にテレメトリーを実行します」と氏。「GPUやNICが大量の情報を送信している場合は、ホットスポットが発生しないように、情報を減らすように指示することができます」
Adaptive routingは、NVIDIAが統合しているイーサネットのもう1つのアップデートだ。氏は次のように述べた。
イーサネットはデータパケットを順番に送受信する必要があるため、輻輳が発生する可能性がある。Adaptive routingでは、Spectrum-Xが輻輳や使用率の低いポートを検出すると、順序に関係なくデータは使用可能なポートに送信され、Bluefield NICがそれを再配置する。氏はまた、Spectrum-Xに組み込まれていたイーサネットのもう一つの中核的な機能強化として、ノイズアイソレーションを強調した。
数百万のGPUをサポートするイーサネット
基調講演で氏は、Spectrum-Xの製品の方向性について語った。
現在の製品パイプラインには、51.2Tbpsのスイッチング容量を持つSpectrum-X 800が含まれる。また、さらに容量を拡大したSpectrum-X 800 UltraとX-1600の投入も予定されているという。
x-800は数万GPU、X 800 Ultraは数十万GPU、X 1600は数百万GPUをサポートするように設計されている。
「今後の私たちのデータ処理量は、非常に驚異的なものになるでしょう」と氏は語った。
Nvidia gets serious about Ethernet networking with Spectrum-X
![Sean Michael Kerner](https://www.newsme.jp/wp-content/uploads/2023/09/image_20230407_15.55.17.png)
![Sean Michael Kerner](https://www.newsme.jp/wp-content/uploads/2023/09/image_20230407_15.55.17.png)
JOIN NEWSME ニュースレター購読
月に1回、newsMEのトピックスをメールで配信しています!
登録解除も簡単です。ぜひお気軽にご購読ください
KCMEの革新的な技術情報を随時発信
5G・IoT・クラウド・セキュリティ・AIなどの注目領域のコンテンツをお届けします。
KCME注目の技術領域に関するテックブログを配信しています。
KCME注目の技術領域に関するテックブログを配信しています。
RELATED ARTICLE 関連記事
-
ネットワーク SDxCentral Studios Sponsored by VMware2024.07.26
RANや5Gの運用を妨げている、5つの要因
通信業界では、RANからエッジ、コアに至るまで、エン…
-
ネットワーク Dan Meyer2024.07.22
Linux Foundationが見る、通信業界に足りないもの=オープンネットワークについて
通信事業者は、すでに展開済みの高価な資産をもっとうま…
-
セキュリティ Nancy Liu2024.07.09
シスコ、産業用スイッチ/ルータにOTセキュリティ機能を搭載
米ネットワーク機器大手のシスコは、ゼロトラストネット…
-
セキュリティ Zeus Kerravala, ZK Research2024.06.19
ランサムウェア被害からの復旧=進歩と課題
ランサムウェア攻撃による大きな混乱があいかわらず発生…
HOT TAG 注目タグ
RANKING 閲覧ランキング
-
IT Emma Chervek
BroadcomのVMware買収による意外な影響=どう備えるか
-
セキュリティ Tobias Mann
米CitrixはMcAfee社、FireEye社と同じ運命を辿るのか=買収合併の後に
-
IT Dan Meyer
BroadcomがVMwareパートナープログラムの詳細を発表
-
ネットワーク Sean Michael Kerner
2023年 ITネットワークのトレンドTOP10 現時点
-
セキュリティ Nancy Liu
デル、データ侵害を確認=ハッカーが4900万件の顧客データ販売を主張
-
スイッチング技術 Tobias Mann
コパッケージドオプティクスの実用化は何年も先=専門家談
-
IT Dan Meyer
Dell、HPE、LenovoはBroadcomがVMwareの顧客の懸念を和らげるのに役立つか?
-
セキュリティ Nancy Liu
RSAカンファレンスが閉幕、AIセキュリティ関連の主な発表=パロアルト、マイクロソフト、Google、CrowdStrike、IBM
-
IT Nancy Liu
米Nutanixが好業績=米BroadcomによるVMwareの買収で
-
IT Dan Meyer
米BroadcomのCEOによる、VMware買収後100日間のハイライト