NVIDIA が新しいオープン モデルとシミュレーション ライブラリでロボティクスの研究と開発を加速

ニュース概要:
-
Google DeepMind および Disney Research との共同開発により誕生し、NVIDIA Isaac Lab で利用可能になったオープンソースの Newton Physics Engine は、研究者や開発者による高性能かつ適応力に優れたロボット開発を実現します。
-
新しい NVIDIA Isaac GR00T オープン基盤モデルは、ロボットに人間のようなリーズニングをもたらし、複雑な指示を分析し、事前の知識と常識を活用してタスクを実行できるようにします。
-
新しい NVIDIA Cosmos 世界基盤モデルにより、開発者はフィジカル AI モデルの大規模なトレーニングの高速化に必要な、多様なデータを生成できます。
-
スタンフォード大学、チューリッヒ工科大学、シンガポール国立大学といった主要な大学の世界的な研究者は、ロボティクス研究を推進するために NVIDIA のアクセラレーテッド コンピューティングとソフトウェアを活用しています。
-
Agility Robotics、Boston Dynamics、Disney Research、Figure AI、Franka Robotics、Hexagon、Skild AI、Solomon、Techman Robot などの大手ロボット開発企業は、NVIDIA Isaac と Omniverse テクノロジを採用しています。
CoRL — 韓国、ソウル — 9 月 29 日 — NVIDIA は、オープンソースの Newton Physics Engine が NVIDIA Isaac™ Lab での提供を開始したことを発表しました。また、ロボット スキル向けのオープンな NVIDIA Isaac GR00T N1.6 リーズニング視覚言語アクション (VLA) モデル、および新しい AI インフラも発表しました。これらの技術を組み合わせることで、開発者や研究者には、イテレーションを加速し、テストを標準化し、トレーニングとオンロボットの推論を統合し、ロボットがシミュレーションから現実世界にスキルを安全かつ確実に転送できる、オープンで高速化されたロボティクス プラットフォームを提供します。
NVIDIA の Omniverse およびシミュレーション テクノロジ担当バイス プレジデントであるレブ レバレディアン (Rev Lebaredian) は次のように述べています。「ヒューマノイドはフィジカル AI の次なるフロンティアであり、予測不可能な世界でリーズニングし、適応し、安全に行動する能力が必要です。今回の最新のアップデートにより、開発者はロボットを研究から日常生活にもたらすための 3 つのコンピューターを手に入れました。Isaac GR00T はロボットの頭脳となり、Newton はロボットの身体をシミュレートし、NVIDIA Omniverse はトレーニング場となります」
Newton がロボティクスにおける物理シミュレーションの新たな基準を確立
ロボットはシミュレーション環境でより高速かつ安全に学習しますが、複雑な関節、バランス、動作を持つヒューマノイド ロボットは、現在の物理エンジンを限界まで追い込んでいます。世界中で 25 万人を超えるロボティクス開発者は、シミュレーションでロボットに教えるスキルが現実世界で安全かつ確実に実行できるように、正確な物理演算を必要としています。
NVIDIA は、Linux Foundation が管理するオープンソースの GPU アクセラレーテッド物理エンジンである Newton のベータ リリースを発表しました。Google DeepMind、Disney Research、NVIDIA が共同開発した Newton は、NVIDIA Warp と OpenUSD フレームワークを基盤に構築されており、現在利用可能です。
Newton の柔軟な設計と多様な物理ソルバーへの対応により、開発者は雪や砂利の上を歩く動作、カップや果物を扱う動作など、極めて複雑なロボットの動作をシミュレートし、現実世界での展開に成功することが可能になります。
Newton を直近で採用している企業や機関には、チューリッヒ工科大学ロボティック システムズ研究室、ミュンヘン工科大学、北京大学などの著名な研究所や大学に加え、ロボティクス企業の Lightwheel、シミュレーション エンジン企業である Style3D などが挙げられます。
Cosmos Reason が新しいオープン Isaac GR00T N1.6 モデルのロボット リーズニングを向上
物理世界で人間のようなタスクを実行するには、ヒューマノイドが曖昧な指示を理解し、これまで経験したことのない多様かつ稀な事態にも対処する必要があります。
間もなく Hugging Face で提供されるオープンな Isaac GR00T N1.6 ロボット基盤モデルの最新リリースには、フィジカル AI 向けに構築されたオープンでカスタマイズ可能なリーズニング視覚言語モデルである NVIDIA Cosmos Reason が統合されます。ロボットの深く思考する脳として機能する Cosmos Reason は、曖昧な指示を段階的な計画に変換し、事前の知識、常識、物理法則を活用して新しい状況に対処し、多くのタスクにわたって一般化します。
100 万回以上ダウンロードされ、現在 Hugging Face で Physical Reasoning Leaderboard のトップにある Cosmos Reason は、モデルのトレーニング用の大規模な実データおよび合成データのキュレーションとアノテーション作成も可能です。Cosmos Reason 1 は、AI モデルの展開向けの使いやすいマイクロサービスである NIM として利用可能となりました。
Isaac GR00T N1.6 により、ヒューマノイドは移動とオブジェクト操作を同時に行えるようになり、胴体と腕の自由度向上によって重いドアを開けるなどの困難なタスクを完遂できます。
開発者は、Hugging Face で公開されているオープンソースの NVIDIA Physical AI Dataset を活用して、Isaac GR00T N モデルをポスト トレーニングできます。480 万回以上ダウンロードされたこのデータセットには、現在、数千の合成および実際の軌跡が含まれています。
AeiROBOT、Franka Robotics、LG Electronics、Lightwheel、Mentee Robotics、Neura Robotics、Solomon、Techman Robot、UCR などの主要なロボット メーカーは、汎用ロボットの構築に向けて Isaac GR00T N モデルを評価しています。
フィジカル AI 開発のための新しい Cosmos World 基盤モデル
NVIDIA は、300 万回以上ダウンロードされたオープンな Cosmos WFM の新しいアップデートを発表しました。これにより、開発者はテキスト、画像、ビデオのプロンプトを活用して多様なデータを生成し、大規模なフィジカル AI モデルのトレーニングを高速化できます。
-
間もなくリリースされる Cosmos Predict 2.5 は、3 つの Cosmos WFM のパワーを 1 つの強力なモデルに統合し、複雑性を軽減、時間を節約、効率を向上させます。最大 30 秒のビデオ生成が可能な長尺ビデオ生成をサポートし、さらにマルチビュー カメラ出力により、より豊富なワールド シミュレーションを実現します。
-
間もなく提供される Cosmos Transfer 2.5 は、前世代モデルより高速で高品質な結果を実現しつつ、モデル サイズを 3.5 分の 1 に縮小しました。このモデルは、グラウンド トゥルース 3D シミュレーション シーンおよび深度、セグメンテーション、エッジ、高精細マップなどの空間制御入力から、フォトリアルな合成データを生成できます。
ロボットの把持を指導するための新しいワークフロー
ロボットに物体を掴むことを教えることは、ロボティクスにおける最も困難な課題の 1 つです。重要なのは、単に腕を動かすことではなく、思考を正確な行動に変えることであり、ロボットが試行錯誤を重ねて学習しなければならないスキルです。
NVIDIA Omniverse™ プラットフォーム上に構築された Isaac Lab 2.3 の開発者プレビューにおける新しい器用な把持ワークフローは、自動化されたカリキュラムを使用して、仮想世界で多指ハンドおよびアーム ロボットをトレーニングします。簡単なタスクから始まり、徐々に複雑さが増していきます。ワークフローは、重力、摩擦、物体の重量などの側面を変化させ、予測不可能な環境でもロボットがスキルを学習できるようにトレーニングします。
Boston Dynamics の Atlas ロボットは、このワークフローを活用して把持を学習し、マニピュレーション能力を大幅に向上させました。
Agility Robotics、Boston Dynamics、Figure AI、Hexagon、Skild AI、Solomon、Techman Robot といった主要なロボット開発企業が、NVIDIA Isaac と Omniverse テクノロジを採用しています。
学習済みロボット スキルをシミュレーションで評価
カップを拾う、部屋を横切って歩くといった新しいスキルをロボットに習得させることは極めて困難であり、実際のロボットでこれらのスキルをテストすることは時間とコストがかかります。
この解決策は、シミュレーションにあります。シミュレーションは、ロボットが学習したスキルを無数のシナリオ、タスク、環境に対してテストする方法を提供します。しかし、シミュレーションにおいても、開発者は断片的で単純化されたテストを構築する傾向があり、それらは現実世界を反映していません。完璧でシンプルなシミュレーションでナビゲーションを学習したロボットは、現実世界の複雑さに直面した瞬間に失敗してしまいます。
開発者がシステムをゼロから構築することなく、シミュレーション環境で複雑な大規模評価を実行できるようにするため、NVIDIA と Lightwheel は、スケーラブルな実験と標準化されたテスト向けのオープンソースのポリシー評価フレームワークである Isaac Lab - Arena を共同開発しています。このフレームワークは間もなく利用可能になります。
NVIDIA の新しい AI インフラがあらゆるところでロボティクス ワークロードを強化
開発者がこれらの高度なテクノロジとソフトウェア ライブラリを最大限に活用できるようにするため、NVIDIA は最も要求の厳しいワークロード向けに設計された AI インフラを発表しました。これには以下が含まれます:
-
NVIDIA GB200 NVL72 は、36 基の NVIDIA Grace™ CPU と 72 基の NVIDIA Blackwell GPU を統合したラックスケール システムであり、複雑なリーズニングおよびフィジカル AI タスクを含む AI のトレーニングと推論を高速化するために、主要なクラウド プロバイダーに採用されています。
-
NVIDIA RTX PRO™ サーバーは、トレーニング、合成データ生成、ロボット学習、シミュレーションに至るすべてのロボット開発ワークロードに単一のアーキテクチャを提供します。RTX PRO サーバーは、RAI Institute に採用されています。
-
Blackwell GPU を搭載した NVIDIA Jetson Thor™ は、ロボットがリアルタイムかつインテリジェントなインタラクション向けにマルチ AI ワークフローを実行することを可能にし、リアルタイムのオンロボット推論を実現します。これは、ヒューマノイド ロボティクスに至る高性能なフィジカル AI ワークロードとアプリケーションにおける画期的進歩です。Jetson Thor は、Figure AI、Galbot、Google DeepMind、Mentee Robotics、Meta、Skild AI、Unitree などのパートナーに採用されています。
NVIDIA によるロボティクス研究の推進
GPU、シミュレーション フレームワーク、CUDA アクセラレーテッド ライブラリなどの NVIDIA の技術は、CoRL で採択された論文の半数近くで参照されており、カーネギーメロン大学、ワシントン大学、チューリッヒ工科大学、シンガポール国立大学といった主要な研究所や研究機関で採用されています。
CoRL ではまた、Stanford Vision and Learning Lab によるロボット学習ベンチマーク プロジェクトである BEHAVIOR や、北京大学が開発した視覚ベースの触覚ロボティクスを推進するための高性能シミュレーション プラットフォームである Taccel も注目を集めています。
※本発表資料は米国時間 2025 年 9 月 29 日に発表されたプレスリリースの抄訳です。
NVIDIAについて
NVIDIA (NASDAQ: NVDA) はアクセラレーテッド コンピューティングの世界的なリーダーです。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像