AWSとNVIDIA、生成AI開発で提携強化=開発者に新たな選択肢
25年ほど前――2000年頃のIT開発の世界では、マイクロソフトとインテルが2大巨頭だったことを覚えているだろうか。両社は今でも主要プレイヤーではあるが、今ではAmazon Web Services(AWS)とNVIDIAほど活力のある大手の組み合わせは存在しない。
クラウドネイティブ開発で両社の製品を扱うチームでは、デプロイの選択肢が増えている。月初めにAWSが開催した「re:Invent 2024」の中で、推論マイクロサービスの「NVIDIA NIM」がAWSで利用可能になったことが発表された。生成AIアプリケーションの開発でNVIDIAに最適化された推論を利用でき、待ち時間が短くなるという。
具体的には、AWSが提供する「Bedrock Marketplace」「SageMaker Jumpstart」といった主要なAIサービス全体にNVIDIA NIMが統合されている。開発者はよく使うAIモデルに対して最適化した推論サービスをデプロイできるようになり、生成AIアプリケーションを開発する際の処理を高速化し、待ち時間を減らせるようになっている。
「NVIDIA NIMは、さまざまな環境で安全かつ信頼性の高いAIモデル導入を行うための、構築済みのコンテナです。「NVIDIA Triton Inference Server」「NVIDIA TensorRT」などのAI推論エンジンを使用しており、オープンソースのモデルからカスタムビルトのモデルまで、幅広いモデルをサポートしています」。AWSのMatt Garman(マット・ガーマン)CEOが述べている。
Amazon EC2やAmazon EKS、Amazon SageMakerといったAWSサービスにNIMをデプロイすれば、AIワークロードは柔軟で拡張性のあるものになる。
広範なモデルをサポート
NIMについては現在、プレビュー提供が始まっている。その数は100を超え、対象モデルにはメタの「Llama 3」やMistral AIの「Mistral」なども含まれる。NVIDIAのアクセラレーテッドコンピューティングを搭載したAWSインスタンスに最適化され、パフォーマンスが保証されたマイクロサービスとなっている。
この類のソフトウェア開発では、時間を節約し、繰り返し作業を減らせるものであれば、何だって歓迎されるのが常だ。気の弱い人には向かない領域となっている。AWSによれば、開発チームにとっては以下が主な利点になるという。
・AI推論の高速化……生成AIアプリケーション開発時の待ち時間が減り、パフォーマンスが向上する。
・導入の簡素化……構築済み、最適化済みの推論ソリューションを簡単に利用できる。
・幅広いモデルをサポート……幅広いAIモデルと互換性がある。
・拡張性と柔軟性……さまざまなAWSサービスにデプロイできる。
・開発者の生産性が向上……AI開発の作業を合理化できる。
このほか、「re:Invent 2024」のハイライトとなったAWSとNVIDIAの協業には以下のようなものがある。
・NVIDIA DGX Cloud on AWS
……NVIDIAが「DGX Cloud on AWS」を発表した。AIモデルのトレーニングと推論のための高性能ソリューションで、NVIDIAの専門チームに直接相談することも可能となっている。早期に導入したLeonardo.aiでは、すでに同プラットフォームを利用したAI構築を進めている。
・AWSの液冷データセンターで、Blackwellを搭載したP6インスタンスを新たに提供
……AWSの次世代データセンターでは液冷技術を採用し、NVIDIA製GPU「Blackwell」を使用する予定。新たにBlackwellを搭載したAWS P6インスタンスを提供し、Amazon EC2やNVIDIA DGX Cloud、Project Ceibaを支える。
・ロボットシミュレーションのNVIDIA Isaac SimがAWSで利用可能に
……NVIDIA L40S GPUを搭載したAmazon EC2 G6eインスタンスで「Isaac Sim」を利用できるようになった。物理世界を表現した仮想環境でAI駆動ロボットのシミュレーションやテストを行うことが可能だ。Vention、Field AIといった企業が使用している。
・量子コンピューティングのNVIDIA CUDA-QがAWS Braketで利用可能に
……「NVIDIA CUDA-Q」が「AWS Braket」に統合された。複数のQPUを使用した量子・古典ハイブリッド型のアプリケーション開発を簡素化することを目指している。
・エッジAIのNVIDIA IGX、NVIDIA JetsonシリーズをAWS IoTに統合
……NVIDIAの「IGX Orin」「Jetson Orin」が「AWS IoT Greengrass」に統合された。エッジ環境でのAIモデル導入やデバイス管理を合理化することを目指している。
AWS, Nvidia grow their partnership to bolster genAI development
元『eWEEK』の編集長であり、2011年から2021年まで同誌の編集方針を率いた。16年間にわたり『eWEEK』で5,000本以上の記事を執筆し、ソフトウェア開発、データ管理、AI/ML、クラウドサービス、データセンターシステム、ストレージ、IoT、セキュリティなど、多岐にわたる分野での新世代ITのビジネス活用に関する優れた報道と分析で評価される。
2017年2月と2018年9月には、英国の調査会社Richtopiaが分析に基づいて発表した「世界で最も影響力のあるビジネスジャーナリスト250人」に選出された。また、2011年にはSalesforce創設者兼CEOのMarc Benioff氏のプロフィール記事でFolio Awardを受賞するなど、数々の全国的および地域的な賞を受賞している。
以前は、『IT Manager’s Journal』および『DevX.com』の創刊編集者、『Software Development誌』のマネージングエディターを務めた。また、『デイリーニューズ (ロサンゼルス)』のスポーツライター兼コラムニスト、『Peninsula Times Tribune』(パロアルト)の編集者兼テレビ評論家、スタンフォード大学のアシスタントスポーツ情報ディレクターとしても活躍した。1983年以来、AP通信のアシスタントとしても従事しており、現在はシリコンバレー在住。
元『eWEEK』の編集長であり、2011年から2021年まで同誌の編集方針を率いた。16年間にわたり『eWEEK』で5,000本以上の記事を執筆し、ソフトウェア開発、データ管理、AI/ML、クラウドサービス、データセンターシステム、ストレージ、IoT、セキュリティなど、多岐にわたる分野での新世代ITのビジネス活用に関する優れた報道と分析で評価される。
2017年2月と2018年9月には、英国の調査会社Richtopiaが分析に基づいて発表した「世界で最も影響力のあるビジネスジャーナリスト250人」に選出された。また、2011年にはSalesforce創設者兼CEOのMarc Benioff氏のプロフィール記事でFolio Awardを受賞するなど、数々の全国的および地域的な賞を受賞している。
以前は、『IT Manager’s Journal』および『DevX.com』の創刊編集者、『Software Development誌』のマネージングエディターを務めた。また、『デイリーニューズ (ロサンゼルス)』のスポーツライター兼コラムニスト、『Peninsula Times Tribune』(パロアルト)の編集者兼テレビ評論家、スタンフォード大学のアシスタントスポーツ情報ディレクターとしても活躍した。1983年以来、AP通信のアシスタントとしても従事しており、現在はシリコンバレー在住。
JOIN NEWSME ニュースレター購読
KCMEの革新的な技術情報を随時発信
5G・IoT・クラウド・セキュリティ・AIなどの注目領域のコンテンツをお届けします。
KCME注目の技術領域に関するテックブログを配信しています。
KCME注目の技術領域に関するテックブログを配信しています。
RELATED ARTICLE 関連記事
-
人工知能(AI) StringerAI2025.01.10
米NVIDIA、物理AI開発を加速する「Cosmos」を発表
米NVIDIAは、自律走行車やロボット工学を含む物理…
-
人工知能(AI) Dan Meyer2025.01.08
ベライゾンが「NVIDIA AI」と提携=エッジ事業、プライベート5G事業が急転するのか
NVIDIAのAI事業が堅調だ。12月17日(米国時…
-
IT Chris J. Preimesberger2024.12.25
AWSの年次イベント「re:Invent 2024」が閉幕=新ツールが多数登場
世界最大のクラウドコンピューティングソフトウェアメー…
-
人工知能(AI) StringerAI2024.12.23
RedisはAmazon Bedrockとの提携を深め、生成AIの品質を向上
データプラットフォームのRedisは、生成AIアプリ…
HOT TAG 注目タグ
RANKING 閲覧ランキング
-
IT Dan Meyer
BroadcomによるVMware製品の価格/ライセンスの変更がどうなったか
-
ネットワーク Sean Michael Kerner
2024年における10のネットワーキング技術予測
-
IT Dan Meyer
ネットワーキング業界の混迷、顧客の懸念=HPEとジュニパー、シスコをめぐって
-
IT Dan Meyer
シスコが「堅調な」滑り出し=1Q決算、AIとSplunkが後押し
-
IT Dan Meyer
BroadcomがVMwareパートナープログラムの詳細を発表
-
セキュリティ Nancy Liu
SASE市場が急成長=第1四半期、首位はZscaler
-
スイッチング技術 Tobias Mann
コパッケージドオプティクスの実用化は何年も先=専門家談
-
IT Dan Meyer
米キーサイトがVIAVIのスパイレント買収に「待った」=15億ドルを提示
-
IT Dan Meyer
米BroadcomとAT&Tの対立が一旦緩和=VMwareをめぐって
-
セキュリティ Tobias Mann
米CitrixはMcAfee社、FireEye社と同じ運命を辿るのか=買収合併の後に