マルチモーダル信号処理に関する国際ワークショップ「MMSP 2023」に論文採択
当社の発表論文について
C. Liu and Y. Sato, "A Voice-Activity-Aware Loss Function for Continuous Speech Separation," 25th International Workshop on Multimedia Signal Processing (MMSP), 2023.
近年、音源分離の研究においては、発話が部分的にしかオーバラップしない設定が現実的なシナリオとして着目されています。一方で、従来の損失関数であるSI-SNRは参照信号が無音(すなわちオーバーラップ率が0)である時に発散してしまうという問題がありました。この研究は、参照信号の有音区間と無音区間を別々に扱うことにより特異的な挙動を回避し、音源分離の精度を向上させる新たな損失関数を提案したものです。
今後の展開について
今回発表された研究成果は当社の音声AIプラットフォームである「mimi」の高品質化や、当社の提供するさまざまな音声ソリューション事業の提供価値向上に利用されます。
今後もFairy Devicesは音声言語分野のリーディングカンパニーとして研究開発に取り組んで参ります。
「mimi®︎」について
フェアリーデバイセズ株式会社及び共同研究先等の音声技術に関する研究成果の集大成であり、機械の「耳」を実現するための音声AIサービス・製品群です。「mimi®︎」は、世界最高水準のエッジ音声AI、多言語音声認識・翻訳や音声感情認識、話者識別等を実現するクラウド音声AI、従来は音声認識が困難だった場面にも適用可能なユニークな専用ハードウェア・開発キットからなり、特に多言語対応と高騒音環境での音声認識性能に強みを持ちます。「mimi®︎」が提供するサービス・製品を最適に組み合わせることで、高い性能を持つ音声ユーザーインターフェースを様々な現場で構築することができます。
フェアリーデバイセズ株式会社について
フェアリーデバイセズ株式会社は、人類のあらゆる叡智を流通可能にするために、VUI(※a)・VPA(※b)関連技術や音声関連技術、クラウド基盤、それらの性能を活かすエッジデバイスの開発を行っています。インターネットに存在しない現場情報を機械学習が可能な形でデータ化し、学習・解析を進めることで、最先端の応用研究を実装した業務ソリューションをソフトウェアからハードウェアまで一気通貫で現場に提供しています。
(※a)VUI:Voice User Interfaceの意味
(※b)VPA:Voice Personal Assistantの意味
【会社概要】
会社名:Fairy Devices株式会社(フェアリーデバイセズ株式会社)
事業内容:人と機械をつなぐ音声テクノロジー「mimi®」、LTE搭載ウェアラブルプロダクト「LINKLET®」、現場DXの為の「Connected Worker Solution®」の開発、運営
代表者名:藤野 真人
所在地:〒113-0034 東京都文京区湯島2-31-22 湯島アーバンビル8階
ウェブサイト: https://www.fairydevices.jp/
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像