NVIDIA AI Foundry が世界中の企業向けにカスタム Llama 3.1 生成 AI モデルを構築
・ 企業や国家は、NVIDIA AI Foundry で、Llama 3.1 405B および NVIDIA Nemotron モデルと組み合わせた独自のデータを使用して「スーパーモデル」を構築可能になりました。
・ NVIDIA AI Foundry は、キュレーション、合成データ生成、ファインチューニング、検索、ガードレール、評価にわたる包括的な生成 AI モデル サービスを提供しており、カスタム Llama 3.1 NVIDIA NIM マイクロサービスを展開し、新しい NVIDIA NeMo Retriever マイクロサービスを使用して正確な応答を実現します。
・ Accenture は新しいサービスを使用してクライアント向けにカスタム Llama 3.1 モデルを構築する最初の企業であり、Aramco、AT&T、Uber、その他の業界リーダーが新しい Llama NVIDIA NIM マイクロサービスへ初めてアクセスしています。
カリフォルニア州サンタクララ — 2024 年 7 月 23 日 — NVIDIA は本日、同日発表されたオープン利用可能なモデルの Llama 3.1 (https://ai.meta.com/blog/meta-llama-3-1/)コレクションにより、世界中の企業向けに生成 AI を強化する新しい NVIDIA AI Foundry (https://www.nvidia.com/en-us/ai/foundry/?ncid=ref-pr-188783)サービスと NVIDIA NIM™ (https://www.nvidia.com/ja-jp/ai/)推論マイクロサービスを発表しました。
NVIDIA AI Foundry により、企業や国家は、Llama 3.1 と NVIDIA のソフトウェア、コンピューティング、専門知識を使用して、ドメイン固有の業界ユースケース向けのカスタム「スーパーモデル」を作成できるようになりました。企業は、独自のデータだけでなく、Llama 3.1 405B や NVIDIA Nemotron™(https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/) Reward モデルから生成された合成データ(https://blogs.nvidia.com/blog/what-is-synthetic-data/)を使用して、これらのスーパーモデルをトレーニングすることができます。
NVIDIA AI Foundry は、世界をリードするパブリック クラウドと共同で開発された NVIDIA DGX™ Cloud AI プラットフォームを活用しており、AI の需要の変化に応じて簡単に拡張できる重要なコンピューティング リソースを企業に提供します。
この新たなサービスの提供は、企業やソブリン AI 戦略を策定している国家が、独自のビジネスや文化を反映する生成 AI アプリケーション向けに、ドメイン固有の知識を備えたカスタムの大規模言語モデルを構築するニーズに応えます。
NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は次のように述べています。「Meta のオープンに利用可能な Llama 3.1 モデルは、世界中の企業における生成 AI の導入にとって極めて重要な瞬間となります。Llama 3.1 は、あらゆる企業や業界が最先端の生成 AI アプリケーションを構築するための扉を開きます。NVIDIA AI Foundry は Llama 3.1 を全面的に統合しており、企業がカスタム Llama スーパーモデルを構築し、展開するのを支援する準備ができています」
Meta の創業者/CEO である Mark Zuckerberg 氏は次のように述べています。「新しい Llama 3.1 モデルは、オープン ソース AI にとって非常に重要なステップです。NVIDIA AI Foundry を使用すると、企業は人々が望む最先端の AI サービスを簡単に作成およびカスタマイズし、NVIDIA NIM で展開することができます。これを皆さんの手に届けられることを嬉しく思います」
プロダクション AI 向けの Llama 3.1 モデルの企業展開を強化するために、Llama 3.1 モデル用の NVIDIA NIM (https://www.nvidia.com/ja-jp/ai/)推論マイクロサービスが ai.nvidia.com (https://www.nvidia.com/ja-jp/ai/#referrer=ai-subdomain)からダウンロードできるようになりました。NIM マイクロサービスは、本番環境に Llama 3.1 モデルを展開する最も速い方法であり、NIM なしで推論を実行する場合よりも最大 2.5 倍のスループットを実現します。
企業は、Llama 3.1 NIM マイクロサービスを新しい NVIDIA NeMo Retriever NIM マイクロサービス(https://blogs.nvidia.com/blog/nemo-retriever-microservices)と組み合わせて、AI コパイロット、アシスタント、デジタル ヒューマン アバター(https://www.nvidia.com/ja-jp/use-cases/digital-humans/)向けの最先端の検索パイプラインを作成できます。
Accenture が AI Foundry で企業向けカスタム Llama スーパーモデルを開発
世界的なプロフェッショナル サービス企業である Accenture(https://newsroom.accenture.com/news/2024/accenture-pioneers-custom-llama-llm-models-with-nvidia-ai-foundry)は、自社だけでなく、文化、言語、業界を反映した生成 AI アプリケーションの展開を目指す顧客向けに、NVIDIA AI Foundry を初めて採用し、Accenture AI Refinery™ フレームワークを使用してカスタム Llama 3.1 モデルを構築しました。
Accenture の会長兼最高経営責任者 (CEO) である Julie Sweet 氏は次のように述べています。「世界の一流企業は、生成 AI があらゆる業界を変革していることを理解しており、カスタム モデルで動作するアプリケーションの展開を熱望しています。Accenture は、社内 AI アプリケーション向けに NVIDIA NIM 推論マイクロサービスと連携してきましたが、NVIDIA AI Foundry を使用することで、顧客がカスタム Llama 3.1 モデルを迅速に作成して展開し、各自のビジネス優先事項に合わせて革新的な AI アプリケーションを強化できるよう支援することができます」
NVIDIA AI Foundry は、カスタム スーパーモデルを迅速に構築するためのエンドツーエンドのサービスを提供します。NVIDIA AI Foundry は、NVIDIA のソフトウェア、インフラ、専門知識を、NVIDIA AI エコシステムのオープン コミュニティ モデル、テクノロジおよびサポートを組み合わせたものです。
NVIDIA AI Foundry を使用すると、企業は Llama 3.1 モデルと NVIDIA NeMo (https://www.nvidia.com/ja-jp/ai-data-science/products/nemo/)プラットフォームを使用してカスタム モデルを作成できます。これには、Hugging Face RewardBench (https://huggingface.co/spaces/allenai/reward-bench)で 1 位にランクされた NVIDIA Nemotron-4 340B Reward モデル (https://huggingface.co/spaces/allenai/reward-bench)が含まれます。
カスタム モデルが作成されると、企業は NVIDIA NIM 推論マイクロサービスを作成し、好みのクラウド プラットフォームとグローバル サーバー メーカーの NVIDIA-Certified Systems™(https://www.nvidia.com/ja-jp/data-center/products/certified-systems/)で好みの MLOps および AIOps プラットフォームを使用して本番環境で実行することができます。
NVIDIA AI Enterprise の専門家とグローバル システム インテグレーター パートナーは、AI Foundry の顧客と協力して、開発から展開まで、プロセス全体を加速します。
NVIDIA Nemotron が高度なモデル カスタマイズを強化
ドメイン固有のモデルを作成するために追加のトレーニング データが必要な企業は、Llama 3.1 405B と Nemotron-4 340B を併用して合成データを生成(https://developer.nvidia.com/blog/creating-synthetic-data-using-llama-3-1-405b/)し、カスタム Llama スーパーモデルを作成するときにモデルの精度を高めることができます。
独自のトレーニング データを持つ顧客は、ドメイン適応型事前トレーニング (DAPT) 用にNVIDIA NeMoを使用して Llama 3.1 モデルをカスタマイズし、モデルの精度をさらに高めることができます。
NVIDIA と Meta は、Llama 3.1 の蒸留レシピの提供でも協力しており、開発者はこれを使用して、生成 AI アプリケーション用のより小規模なカスタム Llama 3.1 モデルを構築できます。これにより、企業は AI ワークステーションやノート PC などのより広範なアクセラレーテッド インフラで Llama 搭載の AI アプリケーションを実行可能になります。
業界をリードする企業が NVIDIA と Llama で AI を強化
ヘルスケア、エネルギー、金融サービス、小売、運輸、通信の分野の企業は、すでに Llama 向けの NVIDIA NIM マイクロサービスに取り組んでいます。Llama 3.1 向けの新しい NIM マイクロサービスに最初にアクセスした企業の中には、Aramco、AT&T、および Uber があります。
16,000 基を超える NVIDIA H100 (https://www.nvidia.com/ja-jp/data-center/h100/)Tensor コア GPU でトレーニングされ、データセンター、クラウド、および NVIDIA RTX™ (https://www.nvidia.com/ja-jp/design-visualization/desktop-graphics/)GPU を搭載したワークステーションや GeForce RTX (https://www.nvidia.com/en-us/geforce/rtx/)GPU を搭載した PC 上のローカルで NVIDIA アクセラレーテッド コンピューティングとソフトウェア向けに最適化された(https://developer.nvidia.com/blog/supercharging-meta-llama-3-1-across-nvidia-platforms/) Llama 3.1 多言語 LLM コレクションは、8B、70B、および 405B のパラメータ サイズの生成 AI モデルのコレクションです。
新しい NeMo Retriever RAG マイクロサービスが精度とパフォーマンスを向上
組織は、RAG(https://blogs.nvidia.co.jp/2023/11/17/what-is-retrieval-augmented-generation/) (検索拡張生成) 用の新しい NVIDIA NeMo Retriever NIM 推論マイクロサービスを使用することで、カスタマイズされた Llama スーパーモデルと Llama NIM マイクロサービスを本番環境に展開する際の応答精度を高めることが可能になります。
Llama 3.1 405B 向け NVIDIA NIM 推論マイクロサービスと組み合わせることで、NeMo Retriever NIM マイクロサービスは、RAG パイプラインで最高のオープンおよび商用テキスト Q&A 検索精度を実現します。
Llama 3.1 および NeMo Retriever NIM の展開をサポートするエンタープライズ エコシステム
エンタープライズ、データ、インフラのプラットフォームを提供する何百もの NVIDIA NIM パートナーは、新しいマイクロサービスを AI ソリューションに統合して、500 万人を超える開発者と 19,000社のスタートアップからなる NVIDIA コミュニティ向けに生成 AI を強化できるようになりました。
Llama 3.1 NIM および NeMo Retriever NIM マイクロサービスのプロダクション サポートは、NVIDIA AI Enterprise (https://www.nvidia.com/ja-jp/data-center/products/ai-enterprise/)を通じて利用できます。NVIDIA Developer Program (https://developer.nvidia.com/join-nvidia-developer-program/)のメンバーは、まもなく NIM マイクロサービスに無料でアクセスして、好みのインフラ上で研究、開発、テストを行うことができます。
※本発表資料は米国時間 2024年 7 月 24 日に発表されたプレスリリース(https://nvidianews.nvidia.com/news/nvidia-ai-foundry-custom-llama-generative-models)の抄訳です。
NVIDIAについて
1993年の創業以来、NVIDIA(https://www.nvidia.com/ja-jp/) (NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像