ファーストアカウンティングのドキュメント画像解析に関する技術論文が国際会議LREC-COLING 2024に採択されました
大規模言語モデルを利用することで、画像化された文書をより柔軟に解析する技術を提案
ファーストアカウンティング株式会社(本社:東京都港区、代表取締役社長:森 啓太郎、以下、ファーストアカウンティング)は、2024年5月20日~25日にイタリア・トリノにて開催される計算言語学、言語資源および評価に関する合同国際会議にて、当社共同創業者でありチーフ・リサーチ・サイエンティスト(CRS)の藤武将人率いるFA Researchの論文が査読を通過し採択されたことを発表します。
■論文の概要
この度採択された論文は、画像化された文書を大規模言語モデル(LLM)を利用することでより柔軟に解析する手法を提案するものです。
これまでは画像、テキスト、レイアウト構造に関する事前学習を組み込むという手法で文書理解を強化していましたが、タスクやデータセットごとに微調整が必要なため、モデルの学習や運用にかかるコストが大きな負担となっていました。
そこで我々は、文書画像理解における既存の研究の強みと、LLMの優れた言語理解能力を統合し、マルチモーダル命令データセットで微調整された新しいモデルを提案しました。これは単一のモデルで文書画像の理解を実行するものです。
実験により、文書画像から読み取りたい項目の情報抽出、文書画像の種類分類、文書画像に対する質問に対して柔軟に回答を行う文書画像ビジュアル質問応答など、様々な文書解析タスクにおいてベースラインモデルよりも改善されることが実証されました。また、文書画像タスクの性能が上がるだけでなく、汎用的な自然言語処理タスクの性能も向上することが確認されました。
■LREC-COLING 2024について
計算言語学分野における2つの国際的な主要組織であるELRA言語資源協会(ELRA)と国際計算言語学委員会(ICCL)が共同で主催する計算言語学、言語資源および評価に関する合同国際会議です。2024年5月20日〜25日にイタリアのトリノにて開催されます。3日間の本会議に加え、その前後に合計3日間のワークショップとチュートリアルも開催されます。
このハイブリッド国際会議には、計算言語学、音声、マルチモーダリティ、自然言語処理の研究者や実務者が集まり、特に評価やこれらの分野の作業を支援するリソースの開発に注目が集まります。
親会議として定評のあるCOLINGとLRECの伝統を受け継ぐこの合同会議では、グランドチャレンジが特集され、口頭発表と広範なポスターセッションを通じて、参加者が情報やアイデアを交換する十分な機会が提供されます。
https://lrec-coling-2024.org/about-lrec-coling/
■ファーストアカウンティングのコメント
この度は大規模言語モデルに関する研究が進み、査読つき国際学会に採択されたことを嬉しく思います。今回の研究では英語の文書画像を対象に行いましたが、本研究で培った技術をさらに発展させ、多言語対応などの拡張を行っていきたいと思います。
(共同創業者/チーフ・リサーチ・サイエンティスト(CRS) 藤武将人)
■ファーストアカウンティングについて
ファーストアカウンティングは、AIの力を活用して経理業務の効率化と自動化を実現するための法人向けサービスを展開する企業です。
文字認識技術においては、コンピュータービジョン分野のみならずLLMなどの生成AIや最新技術を研究し、さまざまな学術会議で論文を発表。それらの研究成果を元にサービス開発を行い、多数の大企業のお客様や会計ベンダー様にご提供しています。
私たちのパーパスは「制約を取り払うことで、自信と勇気を与える」です。AI技術を活用してお客様の業務上のさまざまな制約を取り払い、より価値のある業務にフォーカスしていただけるよう力を尽くしてまいります。
社名 :ファーストアカウンティング株式会社(東証グロース:5588)
所在地:東京都港区浜松町1-6-15 VORT浜松町I 3階
設立 :2016年6月
代表 :代表取締役社長 森 啓太郎
URL :https://www.fastaccounting.jp/
■本件に関するお問い合わせ
ファーストアカウンティング株式会社
担当:広報担当
E-mail: press@fastaccounting.co.jp
すべての製品名および会社名は、それぞれの所有者の商標または登録商標です。