Helm.ai、生成AIシミュレーションで新たなフルHD(2MP)基準を確立――従来の業界ベンチマークの5倍の画素密度を達成
米国カリフォルニア州レッドウッドシティ — ADAS(先進運転支援システム)、自動運転、およびロボティクス向けのAIソフトウェアプロバイダーであるHelm.aiは本日、「GenSim-3」および「VidGen-3」の提供開始により、AI生成の合成データにおける画期的な進歩を発表しました。
これらの次世代基盤モデルは、6台のカメラによる360度サラウンドビュー全体で、世界で初めてネイティブなフルHD(1920x1080)解像度を達成しました。Helm.aiは、一瞬の描写(1タイムステップ)あたり計1200万画素の完全に同期された合成映像を描画することで、現在の生成世界モデルの最新ベンチマークの5倍にあたる画素密度を提供します。
自動運転業界は現在、現実世界での特殊な事例(エッジケース)の収集にかかるコストや時間が開発の足かせとなる「データの壁(Data Wall)」に直面していますが、Helm.aiの新しいモデルは、これに対する「すぐに実用可能な代替手段」を提供します。一般的な生成世界モデルは、通常HD未満やVGAレベル(カメラ1台あたり約40万画素)の低い解像度で動作します。一方、Helm.aiのネイティブなフルHD(200万画素)出力は、現代の市販車両用カメラのハードウェア仕様と完全に一致しており、レベル2およびレベル4自動運転における「シミュレーションと現実のギャップ」を効果的に埋めることができます。
5倍の画素密度がもたらすメリット:車載カメラとの完全な一致
今回の主なブレイクスルーは、複数のカメラを連動させた生成シミュレーションの再現度の高さにあります。フルHDの映像を生成することで、Helm.aiは従来の合成データセットの5倍の視覚情報を提供します。
この画素密度は、現代の自動運転開発において必須の前提条件です。現在の市販車両には高解像度センサーが搭載されているため、シミュレーションによる訓練データも、そのハードウェアの解像度と最初から一致していなければ効果を発揮しません。フルHDの認識システムを、解像度の低い合成データで訓練しようとすると、実際の走行時との間に深刻なズレが生じてしまいます。
Helm.aiはカメラ1台あたり200万画素で映像を自動生成することで、自動運転のAI(ニューラルネットワーク)が、実際の道路で処理するのと全く同じ画素密度で訓練されることを保証し、安全な実用化を劇的に加速させます。
また、さまざまなセンサーや訓練の要件に対応するため、このアーキテクチャ(システム構成)は柔軟に変更可能です。エンジニアリングチームは、3台のカメラ構成・毎秒30フレーム(30fps)に最適化して動きの速い動的な検証を行うことも、あるいは6台のカメラ構成(計1200万画素)・毎秒5フレーム(5fps)で周囲の状況把握を重視し、空間的な広がりを最大限に高めることもできます。
ハードウェアを正確に再現するセンサー・エミュレーション:「バーチャル・センサー・ツイン」
一般的なCGベースの動画生成ツールとは異なり、Helm.aiのモデルは物理的な制約を再現することで、実際のハードウェアに忠実な仮想センサーとして機能します。これには、実際のカメラセンサーで発生する、センサー特有の縞模様(バンディング)、レンズフレア(光の映り込み)、急激な明暗の変化による白飛び(露出ブラインディング)といった特有の乱れ(アノマリー)を、意図的に高い精度で再現することが含まれます。数学的に正確なハードウェアの入力をAIの認識システムに提供することで、Helm.aiは現実世界のセンサーの挙動を忠実にミラーリングした、より頑健(ロバスト)な訓練を可能にします。
2つのモデルで構成されるアーキテクチャ:「シーン変換」vs「完全自動生成」
Helm.aiのプラットフォームは、自動車メーカー向けに、データの「拡張」と「新規作成」の双方を可能にする仕組みを提供します。
-
GenSim-3(高精度なシーン変換):開発チームが現実世界の映像を、6台のカメラ(360度サラウンドビュー)で同期させながら、別の環境へと描き直すことができます。このモデルは、天気、照明、物体の外観などの要素をフルHD解像度で変更可能です。さらに最新モデルでは、周囲の質感、表面の光の反射、複雑な素材の上での光の挙動が大幅に改善されています。
-
VidGen-3(完全合成生成):非常にリアルな運転シーンの映像を、完全にゼロから自動生成します。複雑な環境、人間らしい歩行者や他車の動き、交通ルールをゼロからシミュレートすることで、VidGen-3は地域や環境によるデータの不足を大規模に解消します。
優れた効率性:少ない計算資源で高精度を実現
他の生成世界モデルが、HD未満の動画を生成するために何千台ものGPU(グラフィックプロセッサ)という膨大な計算リソースを必要とするのに対し、Helm.aiは高度に最適化されたわずか数百台の最先端GPUクラスターを使って、フルHD解像度というマイルストーンを達成しました。力任せの大規模化に伴う膨大な計算コストを回避することで、Helm.ai独自の生成アーキテクチャは、世界の自動車メーカーにGPU使用量を大幅に抑えた高精度な合成データを提供するだけでなく、最終的には高性能な自動運転ソフトウェアを、量産車向けの低コストな車載用チップに収まるサイズに圧縮することを可能にします。
「私たちは、業界を単なる一般的な『AI動画』のレベルから、本物のハードウェアを正確に再現する『センサー・エミュレーション』の次元へと引き上げています」と、Helm.aiのCEO兼創設者であるウラジスラフ・ヴォロニンスキーは述べています。「フルHD基準をリードし、1タイムステップあたり計1200万画素の出力を実現したことで、安全性が最優先されるシステムにおいて生成AIの有用性をこれまで制限してきた解像度のボトルネックを解消しました。計算アーキテクチャを最適化することで、パートナー企業に対し、実際の市販センサーの解像度と完全に一致する合成データを用いて、自動運転システムを検証できる高性能なプラットフォームを提供します」
Helm.aiについて
Helm.aiは、ADAS(先進運転支援システム)、自動運転、およびロボティクス向けのAIソフトウェアを開発しています。2016年に設立された同社は、独自の「Deep Teaching™」技術と生成AIを活用し、車載用のフルスタックAIソフトウェアおよびシミュレーションツールを提供しています。Helm.aiは、世界中の自動車メーカーと連携し、市販化に向けたプログラムを推進しています。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
- 種類
- 商品サービス
- ビジネスカテゴリ
- システム・Webサイト・アプリ開発
- ダウンロード
