JAPAN AI、マルチモーダルRAG実装

〜図面検索から設計データ抽出まで、製造業の技術資料活用を効率化〜

JAPAN AI株式会社

JAPAN AI株式会社(本社:東京都新宿区、代表取締役社長:工藤 智昭、以下JAPAN AI)は、画像とテキストを統合的に理解するマルチモーダルRAGを実装いたしました。

本機能の実装背景

これまでJAPAN AIでは、製造業を含む多くの企業のAI導入と伴走支援を実施してまいりました。

その中でも多くの製造業を営む企業においては、技能継承と知見活用の課題に直面していることが明らかになっています。製造業では熟練技術者の持つノウハウや経験値が非常に大きな役割を果たします。


しかし、技術者の退職や異動で、設計図面、作業手順書、品質管理データ、過去のトラブル対応事例などの膨大な技術資料が社内には存在するものの、長年蓄積された技術的ノウハウや経験値が部門や個人へ分散して管理され、必要な時に適切な情報にアクセスすることが困難な状況となってしまうケースが多発しています。


JAPAN AIでは、業界最高水準の82.7%の精度を誇るRAG(※)でテキスト情報検索の支援を行ってきましたが、図面や写真、グラフなどの視覚的情報に含まれるデータについては、従来のRAGでは取得できる情報が限られており、貴重な活用機会が失われていました。

このような背景から、画像とテキストを統合的に理解する「マルチモーダルRAG」の実装に至りました。

マルチモーダルRAGとは

マルチモーダルRAG(Retrieval-Augmented Generation)は、画像・文書・音声など複数のデータ形式を検索して、その結果を元に生成AIが回答を出力する仕組みです。

従来のRAGでは、社内に点在していた図面などの技術文書を検索して見つけることはできましたが、その図面に記載された具体的な数値や仕様を抽出し、回答を生成することは困難でした。


今回マルチモーダルRAGが実装されたことで、PDFファイル内のテキストと画像を自動判別し、両方の情報を統合的に理解して、回答を生成することができるようになりました。従来のテキスト抽出やOCRによる画像認識のみの処理から大幅に進化し、図面の詳細な寸法情報やグラフのデータなどの情報を理解して読み取ることが可能となります。

(※本実装は文書と画像の2つの形式に対応)

具体的な使用例

PDFファイルをアップロードすると、システムが高度な画像解析技術を用いてテキスト部分と画像部分を自動判別し、それぞれに最適化された処理を実行します。


〈使用例① 図面検索〉

図面検索機能では「船舶の設計図面で全長50メートル級の事例を探して詳細な仕様を教えて」といった具体的な条件での検索が可能になり、該当する図面を特定するとともに「全長52メートル、全幅8メートル、喫水3メートル、総トン数450トン、エンジン出力1200馬力」といった詳細な寸法情報や仕様データが自動的に抽出されて出力されます。設計者は過去の類似事例を効率的に参照でき、新規設計の参考資料として活用できるようになります。


〈使用例② グラフ理解〉

「四半期売上推移のグラフから2023年第3四半期の数値を教えて」という質問に対し、グラフの画像を詳細に解析して軸の値や線の位置を読み取り、「2023年第3四半期の売上は前年同期比15%増の1,200万円で、前四半期比では8%の増加を記録しており、年間目標達成に向けて順調な推移」といった具体的な数値データと傾向分析を含めた包括的な回答を提供します。

今後の展望

過去の設計事例に基づいた最適な業務改善提案機能や、過去の設計図面と見積を参照して、類似製品製造時の見積を作成できるようなAIエージェントの開発も予定しております。今後も、より複雑な図面や多様なグラフ形式への対応範囲を拡大できるようRAG技術の向上に努めてまいります。単なる情報検索を超えた知識活用支援システムとして、製造業をはじめとする各業界の業務効率化と技術革新に貢献してまいります。

※:約300の質問に対する回答の正答率


JAPAN AIのサービス概要

JAPAN AI AGENT

設定した目標やゴールに対し、AIが自ら思考し、特定のタスクを実行するAIシステム。日常的に発生する様々なタスクを自動化することができます。

サービスサイト:https://japan-ai.co.jp/agent/

JAPAN AI MARKETING

広告運用業務を包括的に支援するAIエージェントです。BigQuery連携による自動データ取得から、分析、レポーティングまでを一気通貫で実行します。広告代理店やマーケティング担当者の業務効率を大幅に向上させ、戦略的な意思決定に注力できる環境を提供します。

サービスサイト:https://japan-ai.co.jp/marketing/

JAPAN AI SALES

営業部門における日々の活動記録をAIが自動的に顧客管理システムへ入力するAIエージェントです。商談やメールのやり取りをAIが分析し、必要な情報を適切な形式で顧客管理システムに反映します。

サービスサイト:https://japan-ai.co.jp/sales/

JAPAN AI CHAT

最新の言語モデルを使用した法人向け生成AI活用プラットフォームです。通常のChatGPTとしての利用はもちろん、データ連携と独自開発による高精度のRAGにより、社内データの検索や、社内データを元にした回答生成も可能です。多数のプロンプトテンプレートや、カスタマーサクセスによるサポートも用意しています。

サービスサイト:https://japan-ai.co.jp/chat/

JAPAN AI SPEECH

議事録を自動で生成するAIサービスです。業界用語への対応や話者分離など、議事録として必要な機能はもちろん、文字起こしした文章をAIにより様々な形に要約・編集できる機能を備えています。

サービスサイト:https://japan-ai.co.jp/speech/

JAPAN AI CONSULTING

業界最高水準のAI開発技術とAIプラットフォームを起点に、企業の課題発掘からAI利活用の起案、実用化、社内浸透までを伴走支援。企業のAX(AIトランスフォーメーション)の実現を目指します。

サービスサイト:https://japan-ai.co.jp/consulting/

プロダクトに関してのお問い合わせ先

JAPAN AI株式会社

担当:花田

TEL:03-4500-8848

Mail:pr@japan-ai.co.jp

本リリースに関する報道関係者のお問い合わせ先

JAPAN AI株式会社

広報担当:佐藤

Mail:press@japan-ai.co.jp

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

JAPAN AI株式会社

15フォロワー

RSS
URL
-
業種
情報通信
本社所在地
東京都新宿区西新宿6-8-1 住友不動産新宿オークタワー6階
電話番号
03-5909-8187
代表者名
工藤 智昭
上場
未上場
資本金
-
設立
2023年04月