複雑なビジネス文書でもハルシネーションを大幅抑止した読解が可能 世界最高クラスの性能を誇るマルチモーダル基盤モデルを公開
~思考過程の段階生成でビジネスでも信頼できる生成AIへ~
ストックマーク株式会社(本社:東京都港区、代表取締役CEO:林 達、以下:当社)は、経済産業省とNEDOが実施する国内の生成AI開発力強化を目的としたプロジェクト「GENIAC」第2期にて開発した、ハルシネーション※1を大幅抑止した1,000億パラメータのドキュメント読解基盤モデル「Stockmark-2-VL-100B」を公開しました。
当モデルは、同じく「GENIAC」第2期にて開発・公開済みの国産のフルスクラッチ※2モデルでは最高性能を誇る日本語特化LLM「Stockmark-2-100B-Instruct-beta」に、図/表/画像などを含む複雑なドキュメントを豊富に学習させることでマルチモーダル※3化させた基盤モデルであり、日本語領域においてはGPT-4oを上回る世界最高クラスのマルチモーダル基盤モデルです。
※1:人工知能が学習したデータからは正当化できないはずの回答を堂々とする現象
※2:システムを作る際に、既存のモデルを用いずにゼロから組み上げる開発手法
※3:テキスト・音声・画像・動画など、複数の種類のデータを一度に処理可能な深層学習の一種

基盤モデル公開先
・Stockmark-2-VL-100B
https://huggingface.co/stockmark/Stockmark-2-VL-100B-beta
・Stockmark-2-100B-Instruct-beta
https://huggingface.co/stockmark/Stockmark-2-100B-Instruct-beta
「Stockmark-2-VL-100B」について

Stockmark-2-VL-100Bは、日本語を主な対象として学習された「Stockmark-2-100B-Instruct-beta」に、図表や画像を含む複雑なビジネスドキュメントを豊富に学習させたマルチモーダル基盤モデルです。その特徴として、公開されている既存の基盤モデルを用いずに、当社がフルスクラッチで開発した独自の基盤モデルです。
当モデルは、日本語のドキュメント読解で高い性能を有し、その性能は国内でも広く活用されている「GPT-4o」を上回る世界最高クラスの性能を誇ります。更に、生成AIが複雑な質問に回答する際に、最終的な回答を一度に出力するのではなく、回答に至るまでの中間的な思考過程を段階的に生成する「チェーンオブソート(Chain of Thought、CoT)」を実現することで、ビジネスシーンでも信頼して活用することが可能です。
社会実装に向けた今後の展開
「GENIAC」第2期にて開発した、「Stockmark-2-100B-Instruct-beta」と「Stockmark-2-VL-100B」の2つの基盤モデルは、商用利用可能モデルとして既に公開をしております。
短期的な展望としては、当社サービスである「Anews」・「SAT(Stockmark A Technology)」の2つのサービスへの実装や、当社のお客様へ基盤モデルを直接提供することで、より高精度なドキュメント解析を可能にし、企業のナレッジ活用や生成AI活用を促進してまいります。
また中期的には、基盤モデルの更なる性能強化、及び小型化などを行い全てのお客様にご活用頂ける環境を目指します。
「Stockmark-2-VL-100B」性能評価
「Stockmark-2-VL-100B」の性能評価は、日本語のドキュメント読解と一般的な画像読解の2方向で性能を比較しました。
1:日本語ドキュメント読解の性能評価
日本語ドキュメントの読解能力に関しては、一般的なマルチモーダル基盤モデルの性能評価で用いられる「Chart-QA-val」から100問をランダム抽出し日本語翻訳を行った「JChartQA」と、当社が独自に開発した日本語及びビジネス領域におけるドキュメント読解性能を評価する「BusinessSlideVQA※4」を用いて性能を比較したところ、双方の評価でGPT-4oを上回る結果となり、世界的に最高クラスの性能を有していることが分かりました。
※4:BusinessSlideVQA:https://github.com/stockmarkteam/business-slide-questions

2:一般的な画像読解における性能評価
一般的な画像読解能力においても、国産モデルの中では最高クラスの性能を有しており、ドキュメント読解に限らず多方面で当モデルが活用できることを示唆しております。

取締役CTO 有馬 幸介のコメント

この度のGENIAC第2期における挑戦を通じ、国産最高性能の日本語特化LLMに続き、世界最高クラスのマルチモーダル基盤モデル「Stockmark-2-VL-100B」を開発・公開できたことを大変光栄に思います。
情報が複雑かつ膨大に存在する現代において、多様な形式のデータを的確に理解し、ハルシネーションを抑えた信頼性の高いAIは、企業活動や社会全体の意思決定を支える上で不可欠な存在です。本モデルは、まさにその社会課題に応えるものであり、日本のAI開発力を世界に示す重要な一歩となると確信しております。
私たちはこの技術を核に、今後自社サービスへの展開はもちろんのこと、より多くの方々にご活用いただけるよう努め、AIによる真の価値創造と社会の発展に貢献してまいります。
GENIACについて
「GENIAC」は、経済産業省とNEDOが実施する、日本国内の基盤モデル開発力を底上げし、また企業等の創意工夫を促すためのプロジェクトです。
計算資源の提供、利活用企業やデータホルダーとのマッチング支援、グローバルテック企業との連携支援やコミュニティイベントの開催、 開発される基盤モデルの性能評価など、生成AIによって世界の変革がもたらされようとしている中、国内外の関係者の知見を結集し、日本の開発力向上を目指します。

ストックマーク株式会社について
ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI技術を活用し、多くの企業の企業変革を支援しています。
社内外の情報をワンストップで検索できる「Anews」及び、あらゆるデータを構造化し企業の資産に変える「SAT(Stockmark A Technology)」を運営しています。さらに、企業特化生成AIの開発や、独自システムの構築も支援しています。
会社名 :ストックマーク株式会社
所在地 :東京都港区南青山一丁目12番3号 LIFORK MINAMI AOYAMA S209
設立 :2016年11月15日
代表者 :代表取締役CEO 林 達
事業内容:自然言語処理を活用した、
事業機会の探索と意思決定の支援を行うサービスの開発・運営
URL :https://stockmark.co.jp/
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
- 種類
- 商品サービス
- ビジネスカテゴリ
- システム・Webサイト・アプリ開発アプリケーション・セキュリティ
- ダウンロード