『Visual Bank』運営のアマナイメージズ、AIの機械学習用「感情音声データセット」販売開始。
日本初!AIデータプラットフォームを開発・提供するFastLabelとの共同提供
- 音声認識技術の市場について
国内の音声認識の市場は、2020~2025年度までの年平均成長率が16.4%と成長市場。2025年度には244億円に達すると予測されており、これからさらに成熟していく市場と注目されています。(出典:矢野経済研究所「2022 音声認識技術の活用実態と展望 ~AI技術調査シリーズ~」2021年12月発刊)
現在の需要は、企業のコールセンターやコンタクトセンターによる、AIによる電話音声の記録用文字起こしや、会議内容の文字起こしが主流です。今後はさらに発展し、音声の特性(声色、感情など)を解析していく段階が来ると見込まれています。
- 「感情音声データセット」販売の背景について
アマナイメージズとFastLabelは2022年10月25日に業務提携を締結し、高精度なAI開発の実現に向けた高品質かつセキュアな素材・教師データ(ストックフォト100万点超の販売、素材パッケージ・自動アノテーションモデルの販売・提供、素材データの収集・撮り下ろしサービス)を、2022年10月より提供開始しています。
今回、アマナイメージズが保有する収録ディレクション力、声優ネットワークとFastLabelが有する音声認識に対する知見を掛け合わせることにより、プロの声優や日本工学院専門学校の協力を得ながら、日本では初めて*となる、「プロの声優・声優専門学校生」による感情を込めた音声のデータセット構築を実現するに至りました。
※「日本初」に関しては、自社調べ(調査年月:2023年1月/ 日本国内における機械学習用途(感情ラベル付き)の音声データセット販売として)
【データセットの特徴】
・感情の先行研究に基づいた9種類の分類を一括パッケージで提供。
・声に感情を込めるトレーニングを積んだ、「プロの声優・声優専門学校生」による発話。
・ディレクターの指示の下でスタジオ収録を行った、高品質な音源データ。
・収録者・話者の許諾を取得した、権利クリアなデータを提供。
【データセットの内容】
・収録した感情9種類:①普通 ②落ち着き ③喜び ④悲しみ ⑤怒り ⑥恐れ ⑦嫌悪 ⑧驚き ⑨焦り
・収録人数:日本人100名の声
・収録した年齢分布:10~50代の声
・収録ファイル数:6,800ファイルの日本語の音源データ
【購入方法】
以下URLより『FastLabel』の簡易登録を行なうことで、すぐにご利用が可能です。
・ご登録URL:https://app.fastlabel.ai/
・ご登録方法:「サインアップ」ボタンから、メールアドレスとパスワードをご登録頂くのみです。
・数ファイルをサンプル視聴頂くことが可能です。
【画像イメージ】
- 今後の展望〜感情音声データセットによって広がるAI開発の可能性〜
日本語の感情の「正解」を定義できる音声データは、今まで存在がありませんでした。この度「感情音声データセット」を新たに開発し、活用できる段階になり、日本の音声のAI開発を単なる「文字起こし」から「感情解析」のフェーズへと押し上げることが可能になりました。また音声領域の生成系AI(Generative AI)の開発の促進にも寄与できるものと考えています。今後もFastLabelとアマナイメージズは、業務提携を通じて、日本企業のAI開発を支援し、AIが全ての人の生活を豊かにする社会の実現に向けて邁進して参ります。
- 会社概要
Visual Bank株式会社
-代表者:沼澤裕太(代表取締役)
-本社所在地:東京都世田谷区
-代表電話:03-3740-2055
-会社概要:https://visual-bank.co.jp/
株式会社アマナイメージズ
-代表者:沼澤裕太(代表取締役CEO)
-本社所在地:東京都品川区東品川2-2-43
-会社概要:https://amanaimages.com/about/
-AI・機械学習向け画像・動画提供サービス特設サイト:https://amanaimages.com/lp/machine-learning/
FastLabel株式会社
-代表者:代表取締役CEO 上田 英介
-本社所在地:東京都品川区北品川5-5-27 201号
-会社概要:https://fastlabel.ai/
すべての画像