MLism株式会社、WED株式会社と共同で実環境レシートデータに最適化したレシート特化OCRモデルを開発

日本語OCRエンジン「YomiToku」を採用し、1日100万枚規模の処理とOCRランニングコスト80%以上削減を実現

MLism株式会社

MLism株式会社(本社:千葉県柏市、代表取締役社長:木之下 滉大郎、以下「MLism」)は、WED株式会社(本社:東京都渋谷区、代表取締役:新井 俊樹、以下「WED」)との共同チューニングにより、WEDが運営する「ONE」プラットフォームで収集された実環境のレシートデータに最適化した、レシート特化OCRモデルを共同開発しました。

本モデルは、MLismが提供する日本語OCRエンジン「YomiToku」をベースとして開発され、WEDにおける「ONE」プラットフォームのOCRエンジンとして採用されています。

背景

WEDは、ユーザーからレシートを買い取り、購買データとして活用する「ONE」を提供しています。「ONE」では、レシートから購買情報を抽出するため、1日あたり100万枚規模の画像をOCRで処理しています。


従来は他社製OCRエンジンを利用していましたが、ランニングコストの高さや、業務要件に応じたチューニングの柔軟性に課題がありました。こうした課題を受け、MLismは日本語OCRエンジン「YomiToku」をベースに、WEDが保有する実環境レシートデータを活用したレシート特化OCRモデルを共同開発し、OCRエンジンの内製化を支援しました。


取り組みの内容

今回の共同開発では、WEDが保有する実環境のレシートデータをもとに、「YomiToku」をレシート読取向けにチューニングしました。チューニングにあたっては、ピンボケ、手ブレ、折れ・曲がり、特殊フォントなど、実運用で発生する多様で複雑な条件を考慮し、モデルの最適化を進めました。


その結果、ベースモデルに対して5%以上の識字率向上を実現しました。さらに、大量処理に対応するため、モデルの軽量化と処理パイプラインの最適化を行い、処理時間を30%以上削減しました。これにより、1日あたり100万枚規模のレシート画像を安定的に処理できる体制を構築しています。また、従来利用していた他社製OCRエンジンと比較して、80%以上のランニングコスト削減を実現しました。

今後について

MLismは今後も、業種・用途ごとの実データに最適化したOCRモデルの提供を通じて、企業ごとの業務要件に即した高精度かつ高効率な文字認識基盤の構築を支援してまいります。

WED株式会社 代表コメント
「ONE」で収集した実データと、MLismの日本語OCRエンジン「YomiToku」を組み合わせることで、大幅なランニングコスト削減を実現しました。さらに、「ONE」で収集したデータは、今回のレシート特化モデルに加え、「YomiToku」の汎用モデルの精度改善にも活用されています。今後もYomiTokuとの連携を深めながら、蓄積した実購買データのさらなる価値化に取り組んでまいります。

MLism株式会社 会社概要

会社名:MLism株式会社

代表者:代表取締役社長 木之下 滉大郎

本社所在地:千葉県柏市若柴178番地4 柏の葉キャンパス148街区2 ショップ&オフィス棟6F

設立:2024年12月

事業内容:アルゴリズムの研究・開発およびライセンスの販売・提供

コーポレートサイト:https://www.mlism.com/

WED株式会社 会社概要

会社名:WED株式会社

代表者:代表取締役 新井 俊樹

本社所在地:東京都渋谷区千駄ケ谷4丁目14−4 SKビル千駄ケ谷2F

設立:2016年

事業内容:レシート事業を中心としたデータ活用型マーケティングサービスの提供

コーポレートサイト:https://wed.company

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


関連リンク
https://www.mlism.com/
ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

MLism株式会社

4フォロワー

RSS
URL
https://www.mlism.com/
業種
情報通信
本社所在地
千葉県柏市若柴178番地4柏の葉キャンパス148街区2 ショップ&オフィス棟6F
電話番号
-
代表者名
木之下滉大郎
上場
未上場
資本金
300万円
設立
2024年12月