日本語OCRエンジン「YomiToku」、WED株式会社との技術連携により、レシート読み取りに特化した専用カスタムOCRモデルを開発

日常の購買データが、日本語OCRの精度向上を加速

WED

WED株式会社(本社:東京都渋谷区、代表取締役:新井 俊樹、以下「WED」)は、株式会社MLism(本社:千葉県柏市、代表取締役社長:木之下 滉大郎、以下「MLism」)が開発・提供する日本語OCRエンジン「YomiToku」との技術連携により、お金がもらえるお買い物アプリ「ONE」で収集された実環境レシートデータに最適化した専用カスタムOCRモデルを共同開発しました。また、本取り組みを通じ、YomiToku汎用モデルの精度向上にも貢献しています。本取り組みの詳細を、導入事例として本日より公開いたします。

背景・課題

高精度なOCRモデルの開発において、最大の課題は実環境を反映した学習データの確保です。現実の文書には、汎用データセットでは想定しきれないノイズ・歪み・特殊フォントが多数含まれています。

WEDの「ONE」サービスには、日々百万枚規模のレシート画像が蓄積されています。その中には印刷文字・装飾フォントが混在しており、高度なOCR処理が求められる実環境データが豊富に存在しています。

【取り組みの詳細】

MLismとWEDは、相互にデータと技術を提供する形でパートナーシップを構築し、以下2つの共同取り組みを実施しました。

1.WED専用カスタムモデルの開発

WEDのレシートデータをもとにYomiTokuをチューニングし、WED環境に最適化したカスタムOCRモデルを共同開発しました。チューニング過程では、折り曲がり・特殊フォントなど想定を超えるデータの多様性が確認され、実環境データならではの難易度と有用性が改めて実証されました。

2.モデルの成果

本取り組みにより開発されたWED専用カスタムモデルは、ONE上のレシート読み取り処理において、従来比で精度向上を実現しました。ONEに日々蓄積される百万枚規模のデータの多様性と規模があってこそ実現できたモデルであり、汎用OCRでは対応が困難だった条件下(折り曲がり・かすれ・装飾フォントなど)でも安定した読み取り性能を発揮しており、サービス品質の更なる向上を実現しています。
また本成果はYomiTokuの汎用モデル学習にも活用しています。この取り組みにより、特定分野における文字認識精度において90%以上を達成しました。

会社概要
WED株式会社
代表者:代表取締役 新井 俊樹
設立:2016年
所在地:東京都渋谷区
事業内容:レシート事業を中心としたデータ活用型マーケティングサービスの提供
企業ビジョン:「お金を使うたび、わくわくする世界へ」
URL:https://wed.company

MLism株式会社

代表者:代表取締役社長 木之下 滉大郎

設立:2024年12月

所在地:千葉県柏市若柴178番地4 柏の葉キャンパス148街区2 ショップ&オフィス棟6F

事業内容:アルゴリズムの研究・開発およびライセンスの販売・提供

コーポレートサイト:https://www.mlism.com/

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

WED株式会社

38フォロワー

RSS
URL
https://wed.company/
業種
情報通信
本社所在地
東京都渋谷区千駄ヶ谷4-14-4 SKビル千駄ヶ谷2階
電話番号
-
代表者名
新井俊樹
上場
未上場
資本金
-
設立
2016年05月