人工知能(AI)
文:Chris J. Preimesberger

AWSとNVIDIA、生成AI開発で提携強化=開発者に新たな選択肢

AWSとNVIDIA、生成AI開発で提携強化=開発者に新たな選択肢

25年ほど前――2000年頃のIT開発の世界では、マイクロソフトとインテルが2大巨頭だったことを覚えているだろうか。両社は今でも主要プレイヤーではあるが、今ではAmazon Web Services(AWS)とNVIDIAほど活力のある大手の組み合わせは存在しない。

クラウドネイティブ開発で両社の製品を扱うチームでは、デプロイの選択肢が増えている。月初めにAWSが開催した「re:Invent 2024」の中で、推論マイクロサービスの「NVIDIA NIM」がAWSで利用可能になったことが発表された。生成AIアプリケーションの開発でNVIDIAに最適化された推論を利用でき、待ち時間が短くなるという。

具体的には、AWSが提供する「Bedrock Marketplace」「SageMaker Jumpstart」といった主要なAIサービス全体にNVIDIA NIMが統合されている。開発者はよく使うAIモデルに対して最適化した推論サービスをデプロイできるようになり、生成AIアプリケーションを開発する際の処理を高速化し、待ち時間を減らせるようになっている。

「NVIDIA NIMは、さまざまな環境で安全かつ信頼性の高いAIモデル導入を行うための、構築済みのコンテナです。「NVIDIA Triton Inference Server」「NVIDIA TensorRT」などのAI推論エンジンを使用しており、オープンソースのモデルからカスタムビルトのモデルまで、幅広いモデルをサポートしています」。AWSのMatt Garman(マット・ガーマン)CEOが述べている。

Amazon EC2やAmazon EKS、Amazon SageMakerといったAWSサービスにNIMをデプロイすれば、AIワークロードは柔軟で拡張性のあるものになる。

広範なモデルをサポート

NIMについては現在、プレビュー提供が始まっている。その数は100を超え、対象モデルにはメタの「Llama 3」やMistral AIの「Mistral」なども含まれる。NVIDIAのアクセラレーテッドコンピューティングを搭載したAWSインスタンスに最適化され、パフォーマンスが保証されたマイクロサービスとなっている。

この類のソフトウェア開発では、時間を節約し、繰り返し作業を減らせるものであれば、何だって歓迎されるのが常だ。気の弱い人には向かない領域となっている。AWSによれば、開発チームにとっては以下が主な利点になるという。

・AI推論の高速化……生成AIアプリケーション開発時の待ち時間が減り、パフォーマンスが向上する。
・導入の簡素化……構築済み、最適化済みの推論ソリューションを簡単に利用できる。
・幅広いモデルをサポート……幅広いAIモデルと互換性がある。
・拡張性と柔軟性……さまざまなAWSサービスにデプロイできる。
・開発者の生産性が向上……AI開発の作業を合理化できる。

このほか、「re:Invent 2024」のハイライトとなったAWSとNVIDIAの協業には以下のようなものがある。

・NVIDIA DGX Cloud on AWS
……NVIDIAが「DGX Cloud on AWS」を発表した。AIモデルのトレーニングと推論のための高性能ソリューションで、NVIDIAの専門チームに直接相談することも可能となっている。早期に導入したLeonardo.aiでは、すでに同プラットフォームを利用したAI構築を進めている。

・AWSの液冷データセンターで、Blackwellを搭載したP6インスタンスを新たに提供
……AWSの次世代データセンターでは液冷技術を採用し、NVIDIA製GPU「Blackwell」を使用する予定。新たにBlackwellを搭載したAWS P6インスタンスを提供し、Amazon EC2やNVIDIA DGX Cloud、Project Ceibaを支える。

・ロボットシミュレーションのNVIDIA Isaac SimがAWSで利用可能に
……NVIDIA L40S GPUを搭載したAmazon EC2 G6eインスタンスで「Isaac Sim」を利用できるようになった。物理世界を表現した仮想環境でAI駆動ロボットのシミュレーションやテストを行うことが可能だ。Vention、Field AIといった企業が使用している。

・量子コンピューティングのNVIDIA CUDA-QがAWS Braketで利用可能に
……「NVIDIA CUDA-Q」が「AWS Braket」に統合された。複数のQPUを使用した量子・古典ハイブリッド型のアプリケーション開発を簡素化することを目指している。

・エッジAIのNVIDIA IGX、NVIDIA JetsonシリーズをAWS IoTに統合
……NVIDIAの「IGX Orin」「Jetson Orin」が「AWS IoT Greengrass」に統合された。エッジ環境でのAIモデル導入やデバイス管理を合理化することを目指している。

AWS, Nvidia grow their partnership to bolster genAI development

Chris J. Preimesberger
Chris J. Preimesberger

元『eWEEK』の編集長であり、2011年から2021年まで同誌の編集方針を率いた。16年間にわたり『eWEEK』で5,000本以上の記事を執筆し、ソフトウェア開発、データ管理、AI/ML、クラウドサービス、データセンターシステム、ストレージ、IoT、セキュリティなど、多岐にわたる分野での新世代ITのビジネス活用に関する優れた報道と分析で評価される。

2017年2月と2018年9月には、英国の調査会社Richtopiaが分析に基づいて発表した「世界で最も影響力のあるビジネスジャーナリスト250人」に選出された。また、2011年にはSalesforce創設者兼CEOのMarc Benioff氏のプロフィール記事でFolio Awardを受賞するなど、数々の全国的および地域的な賞を受賞している。

以前は、『IT Manager’s Journal』および『DevX.com』の創刊編集者、『Software Development誌』のマネージングエディターを務めた。また、『デイリーニューズ (ロサンゼルス)』のスポーツライター兼コラムニスト、『Peninsula Times Tribune』(パロアルト)の編集者兼テレビ評論家、スタンフォード大学のアシスタントスポーツ情報ディレクターとしても活躍した。1983年以来、AP通信のアシスタントとしても従事しており、現在はシリコンバレー在住。

Chris J. Preimesberger
Chris J. Preimesberger

元『eWEEK』の編集長であり、2011年から2021年まで同誌の編集方針を率いた。16年間にわたり『eWEEK』で5,000本以上の記事を執筆し、ソフトウェア開発、データ管理、AI/ML、クラウドサービス、データセンターシステム、ストレージ、IoT、セキュリティなど、多岐にわたる分野での新世代ITのビジネス活用に関する優れた報道と分析で評価される。

2017年2月と2018年9月には、英国の調査会社Richtopiaが分析に基づいて発表した「世界で最も影響力のあるビジネスジャーナリスト250人」に選出された。また、2011年にはSalesforce創設者兼CEOのMarc Benioff氏のプロフィール記事でFolio Awardを受賞するなど、数々の全国的および地域的な賞を受賞している。

以前は、『IT Manager’s Journal』および『DevX.com』の創刊編集者、『Software Development誌』のマネージングエディターを務めた。また、『デイリーニューズ (ロサンゼルス)』のスポーツライター兼コラムニスト、『Peninsula Times Tribune』(パロアルト)の編集者兼テレビ評論家、スタンフォード大学のアシスタントスポーツ情報ディレクターとしても活躍した。1983年以来、AP通信のアシスタントとしても従事しており、現在はシリコンバレー在住。

記事一覧へ