日本語OCRエンジン「YomiToku」、WED株式会社との技術連携により、レシート読み取りに特化した専用カスタムOCRモデルを開発
日常の購買データが、日本語OCRの精度向上を加速
WED株式会社(本社:東京都渋谷区、代表取締役:新井 俊樹、以下「WED」)は、株式会社MLism(本社:千葉県柏市、代表取締役社長:木之下 滉大郎、以下「MLism」)が開発・提供する日本語OCRエンジン「YomiToku」との技術連携により、お金がもらえるお買い物アプリ「ONE」で収集された実環境レシートデータに最適化した専用カスタムOCRモデルを共同開発しました。また、本取り組みを通じ、YomiToku汎用モデルの精度向上にも貢献しています。本取り組みの詳細を、導入事例として本日より公開いたします。

背景・課題
高精度なOCRモデルの開発において、最大の課題は実環境を反映した学習データの確保です。現実の文書には、汎用データセットでは想定しきれないノイズ・歪み・特殊フォントが多数含まれています。
WEDの「ONE」サービスには、日々百万枚規模のレシート画像が蓄積されています。その中には印刷文字・装飾フォントが混在しており、高度なOCR処理が求められる実環境データが豊富に存在しています。
【取り組みの詳細】
MLismとWEDは、相互にデータと技術を提供する形でパートナーシップを構築し、以下2つの共同取り組みを実施しました。
1.WED専用カスタムモデルの開発
WEDのレシートデータをもとにYomiTokuをチューニングし、WED環境に最適化したカスタムOCRモデルを共同開発しました。チューニング過程では、折り曲がり・特殊フォントなど想定を超えるデータの多様性が確認され、実環境データならではの難易度と有用性が改めて実証されました。
2.モデルの成果
本取り組みにより開発されたWED専用カスタムモデルは、ONE上のレシート読み取り処理において、従来比で精度向上を実現しました。ONEに日々蓄積される百万枚規模のデータの多様性と規模があってこそ実現できたモデルであり、汎用OCRでは対応が困難だった条件下(折り曲がり・かすれ・装飾フォントなど)でも安定した読み取り性能を発揮しており、サービス品質の更なる向上を実現しています。
また本成果はYomiTokuの汎用モデル学習にも活用しています。この取り組みにより、特定分野における文字認識精度において90%以上を達成しました。
会社概要
WED株式会社
代表者:代表取締役 新井 俊樹
設立:2016年
所在地:東京都渋谷区
事業内容:レシート事業を中心としたデータ活用型マーケティングサービスの提供
企業ビジョン:「お金を使うたび、わくわくする世界へ」
URL:https://wed.company
MLism株式会社
代表者:代表取締役社長 木之下 滉大郎
設立:2024年12月
所在地:千葉県柏市若柴178番地4 柏の葉キャンパス148街区2 ショップ&オフィス棟6F
事業内容:アルゴリズムの研究・開発およびライセンスの販売・提供
コーポレートサイト:https://www.mlism.com/
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
- 種類
- 商品サービス
- ビジネスカテゴリ
- スマートフォンアプリ広告・宣伝・PR
- ダウンロード
