AI音声認識エンジン利用動向レポート~AI文字起こし10,000件ご利用状況
登録不要ですぐにご利用可能な「AI文字起こし」サービスでの受付状況について
株式会社東京アーカイブセンター(本社:東京都豊島区、代表取締役:吉田 隆、以下東京アーカイブセンター)が提供する「AI文字起こし」サービスは、2020年9月のサービス開始から9カ月で10,000件を超えるご利用をいただきました。
本サービスは以下の特長より企業、ライター、大学など幅広い業種のお客さまにご活用いただいております。
・会員登録不要ですぐに利用可能
・音源1分あたり33円、9カ国語に対応可能
・Google、Azure、AmiVoice、3種類のAI音声認識エンジンの利用可能
多くのお客さまにご利用いただいている状況について集計を行い、日本におけるAI音声認識エンジンの利用状況についてレポートを作成しましたのでご一読ください。なお本データは受付状況をマーケティングデータとして集計したものであり、ご利用者さまの情報や音声内容については一切特定せず、また加工や学習データとしての利用を行っておりません。
【調査概要】
・調査対象:AI文字起こし<https://ai-ninshiki.jp/>サービスご利用者
・集計対象期間:2020年9月~2021年5月
・集計対象数:10,783件
・集計対象とするAI音声認識エンジン
-Google Cloud Speech-to-Text
-Microsoft Azure Speech to Text
-AmiVoice Cloud Platform(株式会社アドバンスト・メディア)
※AmiVoice Cloud Platformは日本語のみ対応
【調査結果】
1.9カ国語のうち、日本語の受付割合が97.4%
AI文字起こしで利用可能な9カ国語(日本語、英語、中国語、スペイン語、フランス語、韓国語、イタリア語、ドイツ語、ロシア語)のうち、日本語の割合が97.4%、その他言語の割合が2.6%。その他言語は英語、韓国語、スペイン語の順番に多く利用されている。
2.日本語での受付のうち、もっとも利用されている音声認識エンジンはAmiVoice Cloud
日本語での受付に絞って集計した場合、3つの音声認識エンジンのご利用割合は以下のとおり。
・AmiVoice Cloud Platform 受付割合:85.8%
・Google Cloud Speech-to-Text 受付割合:8.6%
・Microsoft Azure Speech to Text 受付割合:5.6%
本サービスでは3つの音声認識エンジンで音声の冒頭60秒間を無料でテキスト化した後に利用エンジンを選択するフローであるため、この範囲の文字起こし精度で利用エンジンが決定されていると考えられる。
3.依頼音声/動画の平均時間は37.5分
受付可能時間最大120分で、受付した音声/動画を平均すると1案件あたり37.5分。ご利用方法として、短時間音声を多数利用されるケースや120分近い会議音声を利用されるケースも多く見受けられる 。
4.リピート率は31.2%
複数回依頼されているリピートユーザーは31.2%。新しいサービスのため新規ユーザー割合が高く表れがちなこともあるが、リピート率は低めに出ている。通常の文字起こしマーケットのリピート率より明らかに低いため、現状では音声認識の結果に満足度が低い可能性が想定される 。
5.登録される音源は音声ファイルが91.8%、動画ファイルが8.2%
音声ファイル、動画ファイルとも受付可能なサービスだが、動画をそのままアップロードする方は8.2%にとどまる。mp3ファイルやiPhoneでの録音形式であるm4aファイルでのご利用が多い。
以上
「AI文字起こし」を提供する株式会社東京アーカイブセンターでは今後も誰もが安心して使える利便性の高いサービスをIT技術の活用によって提供し、社会の皆さまへ先端技術の恩恵が届くよう活動を続けてまいります。
◆会社概要
企業名:株式会社東京アーカイブセンター
代表者:代表取締役 吉田 隆
本社:〒171-0022 東京都豊島区南池袋3-13-15
設立 :2015年2月
◆本件に関する報道関係のお問い合わせ
株式会社東京アーカイブセンター
TEL:03-5956-5212 担当:田辺
Email:office@tokyo-archive.co.jp
※本文に記載されている会社名及び製品名、会社名およびロゴは該当する各社の商号、商標または登録商標です。
※本ニュースリリースに記載された情報は発表日現在のものです。サービス・商品の料金、サービス内容や仕様、その他の情報は予告なしに変更されることがありますことを、ご了承ください。
すべての画像