双方向型のディープラーニング技術「Bi-LSTM」の実装で音声認識エンジンAmiVoice®の認識率が大幅向上　エラー改善率最大25%を記録

株式会社アドバンスト・メディア

2020年3月9日 11時00分

株式会社アドバンスト・メディア（本社：東京都豊島区、代表取締役会長兼社長：鈴木清幸以下、アドバンスト・メディア）は、双方向型のディープラーニング技術「Bi-LSTM（Bidirectional Long Short-Term Memory）」を音声認識エンジンAmiVoiceに実装しました。これによりエラー改善率が最大で25%（当社調べ）と、自然発話を中心とした認識率が大幅に向上しました。

Bi-LSTMは、ディープラーニングの発展技術の一つです。従来の音声認識エンジンAmiVoiceに実装していた、リカレントニューラルネットワーク技術の「LSTM（Long Short-Term Memory）」は、過去の情報を加味しながら処理を行いますが、「Bi-LSTM」は未来の情報を予測し加える事で、双方向の時間軸から処理を行います。その為、更に高い認識率を実現する事が可能になりました。

この度、音声認識エンジンAmiVoiceの音響モデルに「Bi-LSTM」技術を実装する事で、「LSTM」を実装した音声認識エンジンと比較し、リアルタイム認識で最大20%、バッチ認識で最大25%のエラー改善率となり、認識率が大幅に向上しました。オンライン音声認識エンジンに加え、オフラインの音声認識エンジンにも実装しました。

4月より音声認識APIの開発プラットフォーム「AmiVoice Cloud Platform」にて、「Bi-LSTM」を実装した音声認識エンジンAmiVoiceの提供を開始します。https://acp.amivoice.com/main/

また、今後も文字起こしソリューションやコールセンター等、順次各サービスへの実装を予定しています。

一昔前は、音響特徴量のパターンを連続分布でモデル化する「混合ガウス分布（GMM）」技術を活用した音声認識エンジンが主流でした。しかし2013年頃から徐々にディープラーニング技術の活用が広がり、この数年で認識率が飛躍的に向上しています。
同時に、私たちの生活やビジネス等、幅広いシーンで音声認識が使われるようになり、更なる需要の拡大が見込まれています。

アドバンスト・メディアでは、今後も継続的に技術開発を進め、お客様業務の効率化・価値創造に貢献するソリューションやサービスの提供に努めてまいります。

以上

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザーログイン

メディアユーザー新規登録無料

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像

種類: 商品サービス
ビジネスカテゴリ: システム・Webサイト・アプリ開発
ダウンロード: プレスリリース素材
このプレスリリース内で使われている画像ファイルがダウンロードできます

双方向型のディープラーニング技術「Bi-LSTM」の実装で音声認識エンジンAmiVoice®の認識率が大幅向上 エラー改善率最大25%を記録

会社概要

双方向型のディープラーニング技術「Bi-LSTM」の実装で音声認識エンジンAmiVoice®の認識率が大幅向上　エラー改善率最大25%を記録