OCR技術の限界を突破。特許技術「マルチAI OCR」の実証実験で、信頼精度99.997%を達成
データエントリー業界の標準的な信頼精度99.97%を上回る、特許技術「マルチAI OCR」を確立
■実証実験の背景
紙に書かれた文字を読み取り、データ化する技術「OCR」。弊社では28年に渡り、さまざまなお客様にOCRを導入いただき、データエントリー業務を効率化するご支援をして参りました。昨今では、機械学習やディープラーニング、蓄積データの活用ができるAIと組み合わせることで「AI OCR」と呼ばれる、より精度が高いOCRが誕生しました。
AI OCRは精度が高いことが売りですが認識の精度を示す認識率は、99.1%※3 が一般的であり、データエントリー業界の標準信頼精度99.97%に及ばないのが現状です。「99.1%」という数値だけを見ると非常に高く感じますが、100項目に1項目の誤りが発生します。重ねて、この100項目に1項目の誤りがどこで発生しているか分かりません。データ量が多くなればなる程、この誤りは非常に大きな問題となります。
対策として挙げられるのは、人力によるデータの全件目検です。つまり、OCRを導入しても、人力による全件目検業務が残存するため、これまでの技術では業務効率化の範囲が限定的であるという課題がありました。この課題解消のため、弊社特許技術「マルチAI OCR(複数のAI OCRエンジンで項目を判読する技術)」により、入力業務がどのくらい効率化できるかをシミュレーションしました。
■実証実験の前提条件
日本年金機構のホームページにて公開されている次の対象帳票で実証実験を実施。
1.対象帳票
健康保険・厚生年金保険 被保険者報酬月額変更届/厚生年金保険 70歳以上被用者月額変更届
※サンプルデータを弊社にて準備し、テスト画像を作成
2.データ量
信頼性99.997%以上を実証するために、100,000項目以上の画像を弊社にて準備して、本検証の対象とした。
3.データ分布
準備した画像の活字と手書きの割合は、活字8割、手書き2割とした。
4.OCRエンジン
3つのOCRエンジンの結果を組み合わせてシミュレーションを実施。
※本実験ではそれぞれのOCRを下記の通り定義する。
・シングルOCR:1つのOCRエンジンで文字認識
・ダブルOCR:特性の異なる2つのOCRエンジンで文字認識し、結果を比較分析
・トリプルOCR:特性の異なる3つのOCRエンジンで文字認識し、結果を比較分析
■実証実験の結果
1.OCRの信頼精度
本検証の結果、以下の処理によって99.997%以上の信頼精度を実現できることが確認できた。
(1)トリプルOCRによる処理
(2)演算/マスタ利用による誤確定防止チェック処理
・OCRエンジン個々の認識精度は単体では99.997%以上の認識精度を実現することはできなかった。
・ダブルOCRでは99.997%以上の認識精度を実現することはできなかった。
・OCRの誤認識を見破るために、弊社特許技術である複数のOCRエンジンを組み合わせることで実現を確認。
<参考>
活字帳票に限定した場合は、ほぼ100%の信頼精度を実現できることが確認できた。
尚、本検証による正解率は2022年04月30日時点の各AI OCRエンジンの精度によるものであり、今後の追加学習により手書き文字の読取精度はより向上するものと想定する。
2.入力業務の効率化
トリプルOCRおよび誤確定防止チェック処理の結果から、人による「確認・修正」が必要なデータの割合は約20%となる。OCRの利用なしで人による2重入力を行っている作業量が200%であると仮定した場合に、約10倍の入力業務効率化が図れるものと考える。
本プレスリリースは実証実験 結果報告書の一部を抜粋しております。
お客様の課題に合わせたソリューションのご提案が可能です。
▼詳細はこちらからお問い合わせください。
https://hmk.web-tools.biz/dcs/inquiry/web_defact/?20220614=pr
※1:特許番号 5464474号
※2:ハンモック調べ
※3:ハンモック調べ
■株式会社ハンモックについて
ハンモックは、法人向けソフトウェアメーカーです。組織を強くするIT環境をすべての人へご提供するべく、法人に必要な3領域『セキュリティ、営業支援、業務効率化』でお客様課題の解決を実行しています。
<製品・サービスはこちら>
▼AssetView(アセットビュー):クライアントPCの運用管理×セキュリティ対策を支援
https://www.hammock.jp/assetview/?20220614=pr
▼ホットプロファイル:クラウド型名刺管理・営業支援ツール(名刺管理×SFA×MAを統合)
https://www.hammock.jp/hpr/?20220614=pr
▼ホットアプローチ:狙った企業に営業ができるフォーム営業ツール
https://www.hammock.jp/hap/?20220614=pr
▼DEFACT:さまざまな帳票の入力業務効率化を支援
・WOZE(ウォーゼ):AI OCR+人のチェックで高精度にデータ化。すぐに始められるクラウドサービス
申込書、勤怠表、アンケートのデータ入力、手書き文字も高精度に認識します。
https://www.hammock.jp/defact/woze/?20220614=pr
・AnyForm OCR:FAX注文書、請求書、納品書に対応した帳票データ化ソフトウェア
https://www.hammock.jp/anyform/?20220614=pr
代表者 : 代表取締役社長 若山 大典
設 立 : 1994年4月1日
資本金 : 3,648万円
売上高 : 36億円(2022年3月期)
従業員数 : 223名(役員除く/パート含む)
本社所在地 : 東京都新宿区大久保1-3-21 ルーシッドスクエア新宿イースト3F
URL : https://www.hammock.jp?20220614=pr
※本ニュースリリース記載の会社名および製品名は、各社の商標または登録商標です。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像