Galirage Research、ExcelファイルのXML化によるRAGの精度改善に関する論文を発表

株式会社Galirage、研究開発部門を本格始動し、業務効率化や新たなAI活用の可能性探究の加速化を目指す。当社初の研究論文をarXivにて発表。

株式会社Galirage

2025年2月14日 09時00分

株式会社Galirage（本社：神奈川県川崎市、代表取締役：森重真純、以下「Galirage」）は、研究開発部門であるGalirage Researchを本格始動、1本目の研究論文を発表しました。

Galirage Researchでは、現場での実践的な課題に根ざした研究を推進することで、業務効率化や新たなAI活用の可能性を探求していきます。企業としての「技術的な優位性」を醸成し続けるために、2025年は研究開発への大型投資を行い、年間12本の論文公開を目標としています。

今回、Galirage Researchの第一歩として、arXivにて初の論文を発表しました。

本論文では、Excelファイル内のフローチャートに対して、Vision-Language Model（VLM）やLarge Language Model（LLM）を用いて、RAGをすると精度が低くなる課題について、OfficeファイルのXML化（および前処理）によるデータのエンリッチ化により、精度改善する可能性を示唆する内容となっています。（論文はこちら）

■論文概要

タイトル：Overcoming Vision Language Model Challenges in Diagram Understanding: A Proof-of-Concept with XML-Driven Large Language Models Solutions

これまでの課題：従来、Excelファイル内のフローチャートに対してVLM / LLMを用いた情報検索（RAG）を行うと、精度が低下し誤った回答（ハルシネーション）が発生するという課題がありました。

本論文での検証と結果：本研究では、ExcelファイルをXML形式で読み込み、AIが解読しやすいデータ前処理を実施。その結果、従来手法ではハルシネーションを起こしていた課題において、より正確な回答を生成することに成功しました。

考察：この研究により、特定のシナリオにおいて、OfficeファイルのXML化（および前処理）によるデータのエンリッチ化により、LLMによる回答精度やRAGの検索精度が改善する可能性を示唆しました。

論文URL：https://arxiv.org/abs/2502.04389

今後の研究成果や発表についても、随時ご報告してまいりますので、ぜひご注目ください。

■会社概要

名称：株式会社Galirage（Galirage Inc.） ※ 「ガリレージ」と発音します。
住所：〒210-0007 神奈川県川崎市川崎区駅前本町 11番地 2 川崎フロンティアビル 4階
代表取締役CEO：森重真純
メンバー数：取締役 3名、正社員 10名、業務委託 90名
支援先企業：73社（内プライム上場企業：18社）
設立日：2023年5月9日
事業内容：生成AIシステム開発事業、生成AIコンサルティング事業、生成AIアドバイザリー事業、生成AIメディア事業、生成AIニュース配信事業、RAGコンペ事業（raggle.jp）
ホームページ：https://galirage.com/
YouTube：https://youtube.com/@masumi_engineer/
ウェブ本（無料教材）：https://zenn.dev/umi_mori?tab=books
書籍『AIとコミュニケーションする技術』（インプレス社）：https://amzn.to/3ME8mLF
お問い合わせ：https://forms.gle/G5g1SJ7BBZw7oXYA7

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザーログイン

メディアユーザー新規登録無料

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像

種類: 調査レポート
ビジネスカテゴリ: ネットサービスシステム・Webサイト・アプリ開発
キーワード: 生成AIAIRAG精度改善研究論文エンジニアAIエンジニア
ダウンロード: プレスリリース素材
このプレスリリース内で使われている画像ファイルがダウンロードできます