パナソニックがOCRソフトウェア開発キット(SDK)「情景内文字認識ライブラリー」を提供
~カメラ画像などの複雑な背景内文字や特殊文字の検出、認識を実現~
パナソニック ソリューションテクノロジー株式会社(以下、パナソニック)は、2020年3月末より、組み込み用のOCRソフトウェア開発キット「カラーOCRライブラリー」(※1)の製品ラインアップとして、「情景内文字認識ライブラリー」の発売を開始します。従来のOCR(Optical Character Recognition:光学的文字認識)では、正確に認識することが困難だったカメラ画像などの複雑な背景内の文字列や、飾り文字などの特殊な文字(情景内文字)を、検出・認識することができます。
▼「情景内文字認識ライブラリー」製品サイト
https://www.panasonic.com/jp/business/its/ocr_sdk/sceneryocr.html
2019年4月より「働き方改革関連法」が順次施行され、多くの企業では業務の効率化、生産性の向上が求められています。業務効率化の手段として、紙文書の電子化によるデータエントリー業務の効率化や、RPAとの組み合わせによる業務自動化、AI技術による手書き文字の読み取り精度の向上など、紙書類を扱う現場では、OCRの活用、技術の進化が続いています。紙書類以外を扱う現場でのIT化も進む中、カメラ画像などの背景内文字の認識など、多種多様な環境下でも文字列を正確に認識し、業務効率化へつなげるニーズも高まっています。しかし、これまでのOCRでは、背景と文字の境目の検出が困難なことから、認識精度に課題がありました。
今回、パナソニックはAIを活用した「情景内文字認識ライブラリー」を開発(※2)し、背景と一体化している文字や、白抜き文字などのテキスト化が難しい文字認識に対応しました。文字の検出と認識を行う2つのAIエンジンを組み合わせ、保有するAI画像認識ノウハウをもとに、効果的な学習を実施したことで、高い精度での文字検出、認識を実現しています。SDKとして提供することでお客様のシステム・ソフトウェア・サービスに組み込み、業務用途にあわせて利用することができます。また、用途に応じ、最適なAIモデル追加学習など(※3)により、さらに認識精度を向上させることが可能です。より多様な環境におけるデータ入力やチェックを省力化することで、幅広い分野のお客様のサービス提供ニーズ、業務自動化、労働生産性向上への取り組みをサポートします。
<活用例>
・訪日、在留外国人向けの多言語翻訳サービスへの組み込みによる、ポスターや観光地看板、商品名メニュー画像内文字の翻訳
・検査システムとの組み合わせによる、生産工程や出荷検査における、製品・梱包の印字不良チェック
・テレビ番組、動画内のテロップのテキスト抽出による、メタ情報・画像内テキストのタグ情報などのデータベース入力補助
今後もパナソニックでは、お客様のサービス品質の向上、柔軟な働き方の実現、労働生産性向上に貢献するため、AI、ICT技術を生かしたOCR技術の開発、精度の向上、サービスの改良に取り組んでいきます。
※1 累計出荷台数1,000万台以上の実績を持ち、かすれた文字など低品質文字にも強い高精度OCRエンジンを搭載し、スキャンした注文書・勤怠管理表・アンケートなどの帳票画像から、活字、手書き文字、チェックマーク、バーコード、QRコードなどを認識し、編集可能な電子データに変換する、帳票向けOCRソフトウェア開発キットです。
※2 本研究は総務省の情報通信技術の研究開発「グローバルコミュニケーション計画の推進-多言語音声翻訳技術の研究開発及び社会実証-(I. 多言語音声翻訳技術の研究開発)」の一環として行われました。
※3 AIモデルの追加学習などは、個別対応となります。
▼「帳票認識ライブラリー AI手書き文字認識オプション」製品サイト
https://www.panasonic.com/jp/business/its/ocr_sdk/sceneryocr.html
【お問い合わせ先】
パナソニック ソリューションテクノロジー株式会社
お問い合わせ受付窓口
電話番号:0570-087870
受付時間:9時00分~17時30分(土・日・祝・パナソニック指定休業日を除く)
▼ Webサイトからのお問い合わせはこちらから
https://www.panasonic.com/jp/business/its/ocr_sdk/sec/contact/agree.html
※「お問い合わせフォーム」よりお問い合わせください
すべての画像