MLism株式会社、独自AIを搭載し、日本語に特化した文書画像解析エンジン「YomiToku-Pro」をリリース

MLism株式会社(本社:千葉県柏市、代表取締役社長:木之下滉大郎、以下「MLism」)は、日本語の文書画像解析に特化したAIエンジン「YomiToku-Pro」をリリースしたことをお知らせします。
生成AIの発展に伴い、文書情報を正確にデータ化するニーズがますます高まっています。YomiToku-Proは、PDFやカメラで撮影した文書画像の文字起こしを実現するAI-OCR機能に加え、レイアウトや表の解析機能を備えており、高精度かつ高度な文書画像解析が可能です。リリース前から多くの問い合わせをいただいており、すでに複数の企業様に導入いただいています。標準機能の提供に加え、ユーザのニーズに合わせた特化型モデルの開発やカスタマイズのサービスの提供も行っています。
◾️YomiToku-Proの特徴
1. 独自開発のAIモデルを搭載
YomiToku-Proには、MLismが独自に構築したデータセットを用いて学習した4種類のAIモデルが搭載されています。日本語の文書に対して高精度な文字起こしとレイアウト解析を実現します。
2. 複雑なレイアウトにも対応
文字数の多い文書や細かい文字を含む文書、さらには縦書きの文書に対しても、高精度な認識が可能です。
3. 文書レイアウト解析機能
文書画像のレイアウト解析AIを活用し、文書に含まれる図表、画像、段落などの構成要素の位置を正確に特定します。また、表の構造解析AIにより、従来の画像処理では困難だったセル結合が含まれる表やセルの区切り罫線がない表に対しても、表構造を適切に認識し、出力することが可能です。
4. 豊富なエクスポート機能
解析した文書データは、HTML、Markdown、CSV、JSON形式で出力できます。また、抽出した画像やグラフを個別のファイルとして保存することも可能です。
5. サーバー組み込み型で高いセキュリティを確保
YomiToku-Proは、サーバー組み込み型のパッケージとして提供されます。これにより、個人情報や機密情報を含む文書画像を、外部ネットワークを介さずに自社サーバー内でセキュアかつ効率的に解析することが可能です。クラウド、オンプレミス、閉域ネットワーク環境のいずれにも対応し、軽量なモデルを採用しているため、CPUサーバーでも動作します。
<文書画像解析結果の例>


出典:「広報誌 令和 6 年 7 月号」:(総務省) を加工して作成


出典:「令和 7 年度歳出予算概算要求書(東日本大震災復興特別会計)」:(総務省) を加工して作成


出典: 「文部科学広報 2019 年 4 月号」:(文部科学省) を加工して作成
■ YomiTokuのライセンスの販売における業務提携
MLismは事業共創カンパニーである株式会社Relic(本社:東京都渋谷区、代表取締役CEO:北嶋 貴朗、以下「Relic」)と業務提携を開始しました。Relicが提供するAI/LLMを活用した新規事業開発支援サービスに加え、「YomiToku」の販売・サポートも提供できることで、多様なAI活用ニーズに応えます。
■参考:RelicのAI/LLMに関する取り組み
-
AI/LLMを活用した新規事業開発やDXをビジネス/技術開発の両面から支援する専門組織「AI Transformation Group」を新設
-
AI/LLMを活用した新規事業やプロダクト開発を支援するソリューション「AI Transformation Studio」
-
先端テクノロジー研究開発専門組織を発足
■MLism 株式会社 会社概要
会社名:MLism 株式会社
代表者:代表取締役 ⽊之下 滉⼤郎
本社所在地:千葉県柏市若柴178番地4 柏の葉キャンパス148街区2 ショップ&オフィス棟6F
設立:2024年12月
事業内容:アルゴリズムの研究・開発およびライセンスの販売、提供
コーポレートサイト:https://www.mlism.com/
■株式会社Relic 会社概要
会社名:株式会社Relic
代表者:代表取締役CEO 北嶋 貴朗
本社所在地:東京都渋谷区恵比寿4丁目20番3号 恵比寿ガーデンプレイスタワー19F
設立:2015年8月
事業内容:インキュベーションテック事業、事業プロデュース/新規事業開発支援事業、オープンイノベーション事業、イノベーター人材育成支援、地方創生・地域イノベーション事業、イノベーション・ワークプレイス事業
コーポレートサイト:https://relic.co.jp
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像