Galirage Research、ExcelファイルのXML化によるRAGの精度改善に関する論文を発表
株式会社Galirage、研究開発部門を本格始動し、業務効率化や新たなAI活用の可能性探究の加速化を目指す。当社初の研究論文をarXivにて発表。
株式会社Galirage(本社:神奈川県川崎市、代表取締役:森重真純、以下「Galirage」)は、研究開発部門であるGalirage Researchを本格始動、1本目の研究論文を発表しました。
Galirage Researchでは、現場での実践的な課題に根ざした研究を推進することで、業務効率化や新たなAI活用の可能性を探求していきます。企業としての「技術的な優位性」を醸成し続けるために、2025年は研究開発への大型投資を行い、年間12本の論文公開を目標としています。
今回、Galirage Researchの第一歩として、arXivにて初の論文を発表しました。
本論文では、Excelファイル内のフローチャートに対して、Vision-Language Model(VLM)やLarge Language Model(LLM)を用いて、RAGをすると精度が低くなる課題について、OfficeファイルのXML化(および前処理)によるデータのエンリッチ化により、精度改善する可能性を示唆する内容となっています。(論文はこちら)


■論文概要
タイトル:Overcoming Vision Language Model Challenges in Diagram Understanding: A Proof-of-Concept with XML-Driven Large Language Models Solutions
これまでの課題:従来、Excelファイル内のフローチャートに対してVLM / LLMを用いた情報検索(RAG)を行うと、精度が低下し誤った回答(ハルシネーション)が発生するという課題がありました。
本論文での検証と結果:本研究では、ExcelファイルをXML形式で読み込み、AIが解読しやすいデータ前処理を実施。その結果、従来手法ではハルシネーションを起こしていた課題において、より正確な回答を生成することに成功しました。
考察:この研究により、特定のシナリオにおいて、OfficeファイルのXML化(および前処理)によるデータのエンリッチ化により、LLMによる回答精度やRAGの検索精度が改善する可能性を示唆しました。
論文URL:https://arxiv.org/abs/2502.04389
今後の研究成果や発表についても、随時ご報告してまいりますので、ぜひご注目ください。
■会社概要
-
名称:株式会社Galirage(Galirage Inc.) ※ 「ガリレージ」と発音します。
-
住所:〒210-0007 神奈川県 川崎市 川崎区 駅前本町 11番地 2 川崎フロンティアビル 4階
-
代表取締役CEO:森重 真純
-
メンバー数:取締役 3名、正社員 10名、業務委託 90名
-
支援先企業:73社(内プライム上場企業:18社)
-
設立日:2023年5月9日
-
事業内容:生成AIシステム開発事業、生成AIコンサルティング事業、生成AIアドバイザリー事業、生成AIメディア事業、生成AIニュース配信事業、RAGコンペ事業(raggle.jp)
-
ホームページ:https://galirage.com/
-
ウェブ本(無料教材):https://zenn.dev/umi_mori?tab=books
-
書籍『AIとコミュニケーションする技術』(インプレス社):https://amzn.to/3ME8mLF
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像