Galirage Research、ExcelファイルのXML化によるRAGの精度改善に関する論文を発表

株式会社Galirage、研究開発部門を本格始動し、業務効率化や新たなAI活用の可能性探究の加速化を目指す。当社初の研究論文をarXivにて発表。

株式会社Galirage

株式会社Galirage(本社:神奈川県川崎市、代表取締役:森重真純、以下「Galirage」)は、研究開発部門であるGalirage Researchを本格始動、1本目の研究論文を発表しました。

Galirage Researchでは、現場での実践的な課題に根ざした研究を推進することで、業務効率化や新たなAI活用の可能性を探求していきます。企業としての「技術的な優位性」を醸成し続けるために、2025年は研究開発への大型投資を行い、年間12本の論文公開を目標としています。

今回、Galirage Researchの第一歩として、arXivにて初の論文を発表しました。

本論文では、Excelファイル内のフローチャートに対して、Vision-Language Model(VLM)やLarge Language Model(LLM)を用いて、RAGをすると精度が低くなる課題について、OfficeファイルのXML化(および前処理)によるデータのエンリッチ化により、精度改善する可能性を示唆する内容となっています。(論文はこちら

■論文概要

タイトル:Overcoming Vision Language Model Challenges in Diagram Understanding: A Proof-of-Concept with XML-Driven Large Language Models Solutions

これまでの課題:従来、Excelファイル内のフローチャートに対してVLM / LLMを用いた情報検索(RAG)を行うと、精度が低下し誤った回答(ハルシネーション)が発生するという課題がありました。

本論文での検証と結果:本研究では、ExcelファイルをXML形式で読み込み、AIが解読しやすいデータ前処理を実施。その結果、従来手法ではハルシネーションを起こしていた課題において、より正確な回答を生成することに成功しました。

考察:この研究により、特定のシナリオにおいて、OfficeファイルのXML化(および前処理)によるデータのエンリッチ化により、LLMによる回答精度やRAGの検索精度が改善する可能性を示唆しました。

論文URL:https://arxiv.org/abs/2502.04389

今後の研究成果や発表についても、随時ご報告してまいりますので、ぜひご注目ください。

■会社概要

  • 名称:株式会社Galirage(Galirage Inc.) ※ 「ガリレージ」と発音します。

  • 住所:〒210-0007 神奈川県 川崎市 川崎区 駅前本町 11番地 2 川崎フロンティアビル 4階

  • 代表取締役CEO:森重 真純

  • メンバー数:取締役 3名、正社員 10名、業務委託 90名

  • 支援先企業:73社(内プライム上場企業:18社)

  • 設立日:2023年5月9日

  • 事業内容:生成AIシステム開発事業、生成AIコンサルティング事業、生成AIアドバイザリー事業、生成AIメディア事業、生成AIニュース配信事業、RAGコンペ事業(raggle.jp)

  • ホームページ:https://galirage.com/

  • YouTube:https://youtube.com/@masumi_engineer/

  • ウェブ本(無料教材):https://zenn.dev/umi_mori?tab=books

  • 書籍『AIとコミュニケーションする技術』(インプレス社):https://amzn.to/3ME8mLF

  • お問い合わせ:https://forms.gle/G5g1SJ7BBZw7oXYA7

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

株式会社Galirage

4フォロワー

RSS
URL
https://galirage.com/
業種
情報通信
本社所在地
神奈川県川崎市川崎区駅前本町 11番地 2 川崎フロンティアビル 4階
電話番号
-
代表者名
森重 真純
上場
未上場
資本金
-
設立
2023年05月