音声感情認識に関する論文が音声処理系トップカンファレンス「INTERSPEECH 2021」にて採択されました
株式会社RevComm(レブコム、本社:東京都渋谷区、代表取締役:會田武史、以下RevComm)は、昨年5月以降、国立大学法人筑波大学(住所: 茨城県つくば市、学長: 永田恭介、以下筑波大学)と音声認識技術に関する共同研究を実施し、このたびその成果の一つとして、音声処理系トップカンファレンス「INTERSPEECH 2021」にて音声感情認識に関する論文が採択されましたので、お知らせいたします。
INTERSPEECHは、International Speech Communication Association (ISCA) が主催する音声言語処理分野で最も大規模かつ重要な国際会議です。この会議には、自然科学・人文科学の別け隔てなく、世界各国の音声言語処理の研究者が参加し、人間及び機械における音声言語の処理に関する基礎から応用まで包括する学際的な研究発表と討議が行われます。そして、この会議で発表された最新の研究成果を通じて、人類社会の進歩・文明の発展・福祉の向上に資することを目的とされています。採択された論文は8月にオンラインで開催される「INTERSPEECH 2021」にて発表を行います。
■内容
筑波大学との音声認識技術に関する共同研究を開始したことを昨年7月に公表しました。その研究成果として、筑波大学山田武志准教授、大学院生Jennifer Santoso及び、早稲田大学牧野昭二教授、RevComm CTO平村健勝、シニアリサーチエンジニア石塚賢吉が音声感情認識に関する論文「Speech Emotion Recognition based on Attention Weight Correction Using Word-level Confidence Measure」を「INTERSPEECH 2021」に投稿し、採択されました。本論文では、発話音声の音声特徴と、音声認識器により得られる単語と単語信頼度を入力情報として、DNNを用いて発話音声の感情を推定する、音声感情認識アルゴリズムを提案しています。単語信頼度をもとにDNNのSelf-Attentionの重みを補正し、信頼度の高い単語を重視することで、高い精度での音声感情認識を達成しています。感情認識用オープンデータセットIEMOCAPを使用し、従来のアルゴリズムとの比較検証を行った結果、提案アルゴリズムがSOTAの性能であることが示されました。
今後は、提案した音声感情認識アルゴリズムを弊社プロダクトに組み込んで現実のビジネス応対の音声に適用し、顧客の感情の可視化や、顧客の不満を示す対話の抽出と解析などへの応用に取り組みます。
このたび採択された論文
・Speech Emotion Recognition based on Attention Weight Correction Using Word-level Confidence Measure
Jennifer Santoso, Takeshi Yamada, Shoji Makino, Kenkichi Ishizuka and Takekatsu Hiramura
(University of Tsukuba, Japan, Waseda University, Japan, Revcomm, Inc., Japan)
RevCommはAI技術領域にイノベーションをもたらし、コミュニケーションをより豊かにしていくことを目指しています。そのために、今後も音声・言語・画像の領域に関わる研究開発を推進し、国内外への学術的貢献や製品・サービスのAI技術の深化を積極的に行います。
【会社概要】
「コミュニケーションを再発明し、人が人を想う社会を創る」という理念のもと、音声技術とAIにより、コミュニケーション課題を解決する企業です。
音声解析AI電話「MiiTel」は、インサイドセールス市場を中心に、営業やコールセンター業務におけるトークの可視化とセルフコーチング、リモートワーク体制構築にご活用いただいています。また、オンライン商談ツール「MiiTel Live」は、複数人でのオンライン商談の解析や振り返りが可能となり、営業の成約率を飛躍させます。
これまで、Google for Startups Acceleratorの採択をはじめ、B-Dash CampやTechCrunchによる様々な大会で優勝、入賞しているほか、Forbes JAPAN「日本の起業家ランキング 2021」、週刊東洋経済「すごいベンチャー100」にも選出されています。
企業名 :株式会社RevComm
所在地 : 東京都渋谷区渋谷1-3-9 ヒューリック渋谷一丁目ビル7階
代表者 : 會田 武史
事業内容 :AI × 音声のソフトウェア・データベースの開発
企業サイト:https://www.revcomm.co.jp/
■内容
筑波大学との音声認識技術に関する共同研究を開始したことを昨年7月に公表しました。その研究成果として、筑波大学山田武志准教授、大学院生Jennifer Santoso及び、早稲田大学牧野昭二教授、RevComm CTO平村健勝、シニアリサーチエンジニア石塚賢吉が音声感情認識に関する論文「Speech Emotion Recognition based on Attention Weight Correction Using Word-level Confidence Measure」を「INTERSPEECH 2021」に投稿し、採択されました。本論文では、発話音声の音声特徴と、音声認識器により得られる単語と単語信頼度を入力情報として、DNNを用いて発話音声の感情を推定する、音声感情認識アルゴリズムを提案しています。単語信頼度をもとにDNNのSelf-Attentionの重みを補正し、信頼度の高い単語を重視することで、高い精度での音声感情認識を達成しています。感情認識用オープンデータセットIEMOCAPを使用し、従来のアルゴリズムとの比較検証を行った結果、提案アルゴリズムがSOTAの性能であることが示されました。
今後は、提案した音声感情認識アルゴリズムを弊社プロダクトに組み込んで現実のビジネス応対の音声に適用し、顧客の感情の可視化や、顧客の不満を示す対話の抽出と解析などへの応用に取り組みます。
このたび採択された論文
・Speech Emotion Recognition based on Attention Weight Correction Using Word-level Confidence Measure
Jennifer Santoso, Takeshi Yamada, Shoji Makino, Kenkichi Ishizuka and Takekatsu Hiramura
(University of Tsukuba, Japan, Waseda University, Japan, Revcomm, Inc., Japan)
RevCommはAI技術領域にイノベーションをもたらし、コミュニケーションをより豊かにしていくことを目指しています。そのために、今後も音声・言語・画像の領域に関わる研究開発を推進し、国内外への学術的貢献や製品・サービスのAI技術の深化を積極的に行います。
【会社概要】
「コミュニケーションを再発明し、人が人を想う社会を創る」という理念のもと、音声技術とAIにより、コミュニケーション課題を解決する企業です。
音声解析AI電話「MiiTel」は、インサイドセールス市場を中心に、営業やコールセンター業務におけるトークの可視化とセルフコーチング、リモートワーク体制構築にご活用いただいています。また、オンライン商談ツール「MiiTel Live」は、複数人でのオンライン商談の解析や振り返りが可能となり、営業の成約率を飛躍させます。
これまで、Google for Startups Acceleratorの採択をはじめ、B-Dash CampやTechCrunchによる様々な大会で優勝、入賞しているほか、Forbes JAPAN「日本の起業家ランキング 2021」、週刊東洋経済「すごいベンチャー100」にも選出されています。
企業名 :株式会社RevComm
所在地 : 東京都渋谷区渋谷1-3-9 ヒューリック渋谷一丁目ビル7階
代表者 : 會田 武史
事業内容 :AI × 音声のソフトウェア・データベースの開発
企業サイト:https://www.revcomm.co.jp/