独自開発の人工知能「Deep ICR」を中核としたAI-OCRソリューションを提供開始

ディープラーニング技術を用いて、従来のOCRにAIを搭載/個別の企業や自治体向けにカスタマイズし、より効果的・効率的な事業課題の解決へ

デロイト トーマツ グループ

有限責任監査法人トーマツとデロイト トーマツ リスクサービス株式会社は、独自に開発した人工知能モデル「Deep ICR」を中核としたAI-OCRソリューションの提供を開始します。
有限責任監査法人トーマツ(東京都港区、包括代表 國井泰成/以下、トーマツ)とデロイト トーマツ リスクサービス株式会社(東京都千代田区、代表取締役社長 丸山満彦/以下、DTRS)は、独自に開発した人工知能(AI: Artificial Intelligence)モデル「Deep ICR」を中核としたAI-OCR(Optical Character Recognition/Reader:光学的文字認識)ソリューションの提供を開始します。

日本はディープラーニングのビジネスにおける活用が、世界に比べ大きく出遅れています。労働人口の減少による働き手の不足により、業務の自動化・省力化が急務であるにも関わらず、その切り札とも言えるAIの活用はまだ進んでいません。AIが導入されているケースにおいても、単純なルールベースでのプログラム開発や、AIパッケージソフトの導入にとどまる企業が大半であり、個別の企業や自治体等の業務に特化したソリューションの構築には至っていません。その結果、業務を行う上で個別の企業や自治体等の課題解決に直結しにくく、投資回収が難しいケースも存在します。

こうした背景のなか、独自に開発したAIモデルを活用して、業務に応じた個別のカスタマイズが可能なOCRの研究開発に取り組み、新ソリューション「Deep ICR」を開発しました。Deep ICRは、膨大かつ多種多様な半定型(可変)帳票の見積書や請求書等の処理を抱える企業や自治体等への提供を想定しています。本ソリューションは、担当者による事前の帳票化設計をすることなく、業務ごとに異なる複雑な帳票書式をテーブル情報も含んで読み取るエンジンICR (Intelligent Character Recognition)を搭載しており、PDF化した帳票から、適切な勘定科目に仕訳を行うデータを抽出します。

「Deep ICR」を中核としたAI-OCRソリューションは、企業や自治体等の業務に合わせて様々な機能やAIモデルのカスタマイズが可能です。ユーザーインターフェースやファイルの入出力機能など、アプリケーションレイヤーのカスタマイズのみならず、必要な場合には2段階に分けてAIモデルのカスタマイズも行います。すでに学習済みのモデルを使うだけではなく、企業や自治体等の過去の帳票や業務に関連する外部情報など、その企業や業界に特化した文字や記号、外部情報等を学習させる場合には、特化型AIモデルレイヤーをカスタマイズすることができます。また、誤変換の修正等、マニュアル編集の作業ログや、データ出力時の項目選択パターンのログなど、個別の企業や自治体等がAI構築後に得られた情報を学習させる場合にも同様です。加えて、カスタマイズの効果に応じてベースAIモデルレイヤーまでを対象範囲とすることもあります。

本ソリューションでは、幅広く定義されるAIのなかでも、人間の意思決定を代替することが可能なディープラーニングをサービスコア技術として採用しています。個別の企業や自治体等の業務内容に合わせてディープラーニング技術を用いたAIモデルを柔軟にカスタマイズすることで、真に業務に使えるAIを提供します。その結果、個別の企業や自治体等がAI構築した際の効果がより効率よく発揮され、人手による転記作業、集計作業、監査証拠の整理などを自動化することにより、内部統制の強化、労働生産性向上等の課題解決に貢献します。

今後も性能の向上を予定しており、次のバージョンでは、活字(印字)の精度向上に加え、手書き文字や汎用的な記号への対応も行い、自然言語処理の技術を用いた新たな機能を実装し、AI構築によるさらなる効率化を実現します。

【Deep ICRの特徴】
  従来のOCRサービス・製品 Deep ICR
担当者による事前の帳票設計 必要であり、OCRパッケージに含まれる支援ツール等を利用  帳票設計は不要(AIに過去の帳票等を学習させるだけ)
ディープラーニングによる学習 不可(一部機能提供するサービスもあるが、限定的である)  可(過去帳票等による識字の学習、修正等の編集操作の学習)
カスタマイズによる業務に対する適合 アプリケーションレイヤー等の限られた範囲で可能  アプリケーションレイヤー以外に、2段階でAIモデルのレイヤで組織毎の業務内容に応じたカスタマイズが可能
自然言語処理の採用 なし 次期バージョンで対応予定


【Deep ICRにおけるカスタマイズ例】

企業や自治体等が抱える課題 想定されるカスタマイズ例
一般的な企業の学習データでは、自社取引先との帳票記載項目が認識できず、常に修正をする必要がある  業務都合で特殊な語彙の割合が多い場合、汎用的な学習データを使用するのではなく、自社の過去帳票を学習させ、特化型AIモデルレイヤーをカスタマイズする
帳票に記載する業務名称や商品名称には略称を使う慣習があり、OCRを導入する場合、専用の変換用辞書を作成する必要がある  自社の過去帳票を学習させる方式の他に、外部情報がある場合には、データ連携によるカスタマイズも可能である
OCR後にデジタル化したデータを会計システムに連携するため、加工編集する必要があるが、不要なデータまでデジタル化されるため、加工処理が煩雑になる 編集用のGUIで出力対象データを選別し、必要なデータのみ出力するように操作する。同様な操作を繰り返すことでAIが学習するが、精度や条件に応じ、ベースAIモデルレイヤーをカスタマイズする


【サービス提供体制】
個別の企業や自治体等がAI構築する際の、本ソリューション提供にあたっては、ディープラーニング技術の深い知見を持つ専門家がAIモデルの開発にあたるとともに、オフショアでの開発も併用することで、豊富な知見を持つ人材の確保と導入コストの低減を図ります。本ソリューションは、国内外ITメーカーおよびベンダーにて長年AI・ロボット、自動運転等の先端技術に関連した業務推進を行ってきたAI専門家をリーダーに迎え、本ソリューションの提供のために、2020年までにAI技術者を日本国内に20名、アジアパシフィックに40名程度の体制を構築する計画です。加えて、デロイト トーマツグループが持つ、幅広いインダストリー、会計の知見をフルに活用し、ビジネスの戦略から実務まで、包括的に効果をもたらすサービスを提供します。

今後もトーマツは、ディープラーニング技術とサービス普及に向け、最新の研究と実装の結果を随時外発信していきます(https://www.deloitte.com/jp/ra-new-business-promotion)。
 

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

デロイト トーマツ グループ

42フォロワー

RSS
URL
http://www.deloitte.com/jp/
業種
サービス業
本社所在地
東京都千代田区丸の内3-2-3 丸の内二重橋ビルディング
電話番号
03-6860-3300
代表者名
永田高士
上場
-
資本金
-
設立
1993年04月