AI inside、第2期に続き採択― 経産省とNEDOが実施するGENIAC事業第3期で日本語Full-Duplex-SpeechマルチモーダルLLMを開発

AIプラットフォームを提供するAI inside 株式会社(代表取締役社長CEO:渡久地 択、本社:東京都渋谷区、以下「AI inside」)は、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する国内生成AI開発力強化プロジェクト「Ganerative AI Accelerator Challenge (GENIAC)」*1 の第2期公募での採択に続き、2025年3月から実施された第3期公募に新たなテーマ「日本語Full-Duplex-SpeechマルチモーダルLLMの研究開発」が採択されたことをお知らせします。

本事業では、音声・画像・テキストを自然に理解し、自然な日本語で対話可能な小型マルチモーダル生成AI基盤モデルを開発し、データ入力を自動化するAIエージェント「DX Suite」への搭載を通じて、AIとの協働による社会課題解決に貢献します。

事業概要

  • 公募事業名:ポスト5G情報通信システム基盤強化研究開発事業/競争力ある生成AI基盤モデルの開発(GENIAC)

  • 当社提案テーマ名:一貫性のある日本語Full-Duplex-SpeechマルチモーダルLLMの研究開発

  • NEDO公表内容:https://www.nedo.go.jp/koubo/CD3_100397.html

 

*1 経産省が主導する、国内の生成AIの開発力強化を目的とし、生成AIのコア技術である基盤モデルの開発に対する計算資源の提供支援や、関係者間の連携促進、対外発信等を実施するプロジェクト。第3期は事業期間2025年8月から2026年2月末(予定)で基盤モデルの研究開発に関する支援が行われます。https://www.meti.go.jp/policy/mono_info_service/geniac/index.html

 

 研究開発の目的と特徴 

本事業では、日本語特化型のマルチモーダル生成AIモデルの研究開発を行います。

  • Full-Duplex音声対話

人間の対話の速度と同じ0.2msの発話を目指し、会話が途切れず自然に応答できるFull-Duplexの日本語商用モデルを実現します。

  • マルチモーダル対応

画像・音声・テキストを横断的に理解し対話へ反映できるマルチモーダル対応を備え、資料や図表などを参照しながら的確に応答することで、ビジネス現場でも即戦力となる高度な対話AIの実現を目指します。

  • 小型モデルでありながら高性能を実現

大型モデルの精度と軽量高速モデルの応答性を同一モデル内で実現する設計方針のもと、会話の流れや相手の意図を正確に捉え、一貫した応答を続けることが可能です。

開発したモデルは、「DX Suite」に搭載し、自治体窓口、医療・介護現場、コンタクトセンター、営業・コンサル部門など音声データが多い現場での利用を想定しています。商談内容の自動構造化・分析、VoC分析やFAQ自動生成、医療現場での記録効率化、法務相談・証言記録整理、自治体業務の議事録化など、多様な業務を高度化・効率化し、人とAIが自然に協働できる現場づくりを支援します。

さらに、3,000社以上に導入されている「DX Suite」への搭載を通じて、日本発マルチモーダルLLMの社会実装を加速し、人とAIが協働する社会基盤を築くとともに、少子高齢化による人手不足を補い、日本全体の生産性向上に貢献してまいります。

 

代表取締役社長CEO 渡久地 択のコメント

いま、AIは「業務を効率化する道具」から、「思考と判断を共に担う存在」へと進化し、これからの3年で“AGIの時代”に突入します。その実現には、膨大な計算資源だけでなく、緻密に設計されたアーキテクチャと、現実に根ざした信頼できるデータの積み重ねが不可欠です。 

今回の取り組みは、その中核である「設計」と「データ」という2つの知性基盤を、日本から世界に押し上げていく挑戦です。

私たちが目指すのは、音声・画像・テキストを統合的に理解し、人と共に考え、意思決定の質を高める、軽量かつ高性能な日本語マルチモーダルモデルの開発です。それは単なる業務自動化ではなく、“判断と対話のパートナー”として並走するAIの実現にほかなりません。

このモデルは、社会と人の知性が自然に接続されていくための“入り口”となり、日本から世界に向けた次世代AIの標準となる可能性を秘めています。

GENIACという機会を通じて、こうした構想を現実に近づけられることに、深く感謝しています。

 

執行役員CTO 井上 拓真のコメント

 本プロジェクトで私たちは、「3つの世界初」に挑戦しています。

 

1つ目は、“話す”ことと“聞く”ことを同時に行うFull-Duplex会話と、資料やスライドなどの視覚情報の理解を、ひとつの日本語モデルで実現することです。これは、まるで隣に人がいるかのような自然な体験を提供し、業務現場でも違和感なく使えるレベルを目指しています。

2つ目は、Full-Duplexが苦手とする「文脈の保持」を克服する設計に挑むことです。途切れない会話を続けながらも、複数ターンにわたる議論や複雑な意図の読み取りに対応できることを重視しています。

3つ目は、こうした高度な能力を維持しながらモデルを小型化し、当社のハードウェア「AI inside Cube」にも搭載可能にすることです。これにより、多くのお客様が自社環境でこのAIをすぐに活用できるようになります。

これらの実現に向けて、私たちはアーキテクチャ設計の段階から見直しを行い、LoRAなどの技術を活用しながら音声・画像などのモダリティ拡張にも取り組んでいます。こうした構成は、世界的にも実運用に耐えうる前例が少なく、技術的に非常にチャレンジングな領域です。この挑戦に強い意義を感じるとともに、日本のLLM開発に大きな一石を投じるべく、全力で取り組んでまいります。

 

当社における生成AI・LLMの研究開発

AI inside は、企業保有データを学習可能な「カスタマイズSLM」や、日本語ドキュメント処理に特化したLLM「PolySphere」シリーズを研究開発しています。

2025年6月にはGENIAC事業第2期採択テーマの成果*2 として「PolySphere-2」を「PolySphere-3」にメジャーアップデートし、データ構造化の精度において世界最高性能を達成しました。さらに、モデルが自律的に学習・最適化を行う「自律蒸留」技術を確立し、継続的な精度向上を可能にしています。

*2 2025年6月4日発表:AI inside、独自開発LLM「PolySphere-3」にメジャーアップデート― データ構造化の精度において世界最高性能を達成

 

AI inside 株式会社について

AI inside 株式会社は、生成AI・大規模言語モデル(LLM)や自律型AIの研究開発と社会実装を推進するテックカンパニーです。日本語のドキュメント処理に特化したLLM「PolySphere」の開発をはじめ、政府機関・地方公共団体・民間企業など約3,000社・6万ユーザ超への導入実績を持ち、独自のAI基盤の構築と普及を進めています。主力プロダクトである「DX Suite」は、データ入力業務に特化したAIエージェントとして前後工程全体の自動化を実現しています。これらの取り組みを通じて、人とAIの協働を推進し、生産性向上と業務効率化によって創出された時間を、より付加価値の高い業務へ移行する「VALUE SHIFT」を実現します。

https://inside.ai

※文中の製品またはサービスなどの名称は、AI inside 株式会社の商標または登録商標です。

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


関連リンク
https://inside.ai
ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

AI inside 株式会社

36フォロワー

RSS
URL
https://inside.ai/
業種
情報通信
本社所在地
東京都渋谷区渋谷3-8-12 渋谷第一生命ビルディング4階
電話番号
03-5468-5041
代表者名
渡久地 択
上場
マザーズ
資本金
12億3400万円
設立
2015年08月