駅の窓口業務を行う「駅案内ロボット」に音声処理技術とマルチマイクハードウェアを提供
3月16日より京王電鉄下北沢駅で試験運用開始
フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「当社」)は、オムロングループのオムロン ソーシアルソリューションズ株式会社(本社:東京都港区、代表取締役社長:細井 俊夫、以下「OSS」)が京王電鉄株式会社 井の頭線 下北沢駅にて3月16日より試験運用を開始する駅案内ロボットに、音声処理技術およびマルチマイクハードウェアを提供したことをお知らせいたします。
少子高齢化による労働力不足、訪日外国人観光客の増加により、多様な利用客が行き交う公共施設では、接客業務の負荷軽減を行うために業務を代替するロボットの実現が求められています。このようなロボットに適切な接客対応を行わせるためには、騒音環境下で正確に音声を収集し、適切に聞き取る音声処理技術、および多言語での認識技術が必要となります。今回当社が持つ音声処理技術を提供することで、騒音が多い駅構内の環境においても高い精度で音声対話が可能なロボットを実現しました。
一般的に音声認識処理の精度は、マルチマイク(複数マイク)である方が精度が高まることが知られています。マルチマイクでの集音時に、マイクの異なる配置による音声の位相差や振幅差などを適切に処理することで、目的とする音声のみを強調することができ、それにより音声認識の精度向上がなされますが、その反面、マイク・スピーカー配置や筐体設計などのハードウェア的側面や、マルチマイク処理のアルゴリズムなどのソフトウェア的側面の両面を十分に擦り合わせる必要があり、高度な全体設計が求められます。「mimi XFE」はマルチマイク処理のソフトウェア側を担うソフトウェア・ライブラリであり、当社の業務用スマートスピーカー Fairy I/O Tumbler を始めとした様々なマルチマイク製品で利用されています。
16chを8ch2つに分け、認識精度の向上と自由なレイアウトを可能とし、音前段処理を担う「mimi XFE」、クラウドでの「高速音声認識処理 mimi ASR」と連携することで、ロボット/サイネージなどへの搭載に最適な構成となっています。
>「Fairy I/O 16chマルチマイク(バー型)」
ロボットから発せられるモーターなどの作動音の影響をできるだけ削減し、発話者の音声をクリアに集音することに適したマイクハードウェアです。2本のバー型形状により、自由なレイアウトを実現します。
>音前段処理 「mimi XFE」
「mimi XFE」は、音声を扱うために必要となる様々な音処理機能を提供しています。今回、雑音の多い環境においても正確な音声を収音するために、「mimi XFE」が持つ以下の技術を活用しています(主要機能のみ)
>バージイン対応(割り込み対話機能)
ロボットが発話している最中でも、人の声を認識できる技術により、ロボットがしゃべり終わるのを待つ必要のない、スムースで自然な対話を実現しました。
これまでのコミュニケーションロボットなどにおける対話ソリューションでは、「機械の準備が整うまで待つ」「機械がしゃべり終わるまで待つ」というように、人間側に不自然なコミュニケーションを強制している場合が多くありましたが、ロボットがバージイン対応となることで、人間にとってより自然なコミュニケーションを実現しています。
音声認識処理に関連するソフトウェアのみならず、音声を正確に集音するためのハードウェア開発も合わせて行うことで、駅をはじめとする雑踏環境下のみならず、あらゆる社会インフラへの音声技術の実装を目指しています。
「音声によるコミュニケーション」という人間の本能的な動作を、人間側の負荷を強いることなく機械側が認識する「ボイスファースト」時代の基盤となる技術を提供していきます。
参考URL: http://www.fairydevices.jp/mimi_about.html
参考URL: http://www.fairydevices.jp/fairy_io.html
※駅案内ロボットについて
乗換案内や構内・周辺案内といった利用客からの音声によるお問い合わせに、音声・ディスプレイ・ロボットの動きで回答します。これまでOSSが磨いてきた駅業務に特化した対話型AIエンジンに、多くの利用客が行き交う雑踏環境下でも正確に音声を集音し、言葉を認識できる「独自の音声処理技術」と、「クラウドでの高速な音声処理」に加え、ロボットの回答中に別の質問をすることができる「割り込み対話機能」を付加することで、より人と人との対話に近づけることに成功し、これまで困難であった窓口業務の自動化を実現します。
参考URL:https://www.omron.co.jp/press/2019/02/c0305.html
※オムロン ソーシアルソリューションズ株式会社について
オムロン ソーシアルソリューションズ株式会社は、オムロン株式会社の子会社として、社会システム事業を担っております。オムロン株式会社は、独自の「センシング&コントロール+Think」技術を中核としたオートメーションのリーディングカンパニーとして、制御機器、電子部品、車載電装部品、社会インフラ、ヘルスケア、環境など多岐に渡る事業を展開しています。
参考URL: https://www.oss.omron.co.jp/index.html
※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。
http://www.fairydevices.jp/
お問い合わせ窓口
電子メール contact@fairydevices.jp
- 音声処理技術について
一般的に音声認識処理の精度は、マルチマイク(複数マイク)である方が精度が高まることが知られています。マルチマイクでの集音時に、マイクの異なる配置による音声の位相差や振幅差などを適切に処理することで、目的とする音声のみを強調することができ、それにより音声認識の精度向上がなされますが、その反面、マイク・スピーカー配置や筐体設計などのハードウェア的側面や、マルチマイク処理のアルゴリズムなどのソフトウェア的側面の両面を十分に擦り合わせる必要があり、高度な全体設計が求められます。「mimi XFE」はマルチマイク処理のソフトウェア側を担うソフトウェア・ライブラリであり、当社の業務用スマートスピーカー Fairy I/O Tumbler を始めとした様々なマルチマイク製品で利用されています。
16chを8ch2つに分け、認識精度の向上と自由なレイアウトを可能とし、音前段処理を担う「mimi XFE」、クラウドでの「高速音声認識処理 mimi ASR」と連携することで、ロボット/サイネージなどへの搭載に最適な構成となっています。
>「Fairy I/O 16chマルチマイク(バー型)」
ロボットから発せられるモーターなどの作動音の影響をできるだけ削減し、発話者の音声をクリアに集音することに適したマイクハードウェアです。2本のバー型形状により、自由なレイアウトを実現します。
>音前段処理 「mimi XFE」
「mimi XFE」は、音声を扱うために必要となる様々な音処理機能を提供しています。今回、雑音の多い環境においても正確な音声を収音するために、「mimi XFE」が持つ以下の技術を活用しています(主要機能のみ)
VAD(発話区間抽出) | 人が話し始めこと、また話し終わったことを検出します。 |
エコーキャンセル | ロボットが発話している最中でも人間の声を認識することができるバージイン対応(割り込み発話対応)を実現しています。 |
ビームフォーミング | 目的とする音声のみを強調して集音します。 |
>高速音声認識処理 「mimi ASR」
人と人との会話は想像以上に速いやり取りがなされています。クラウドでの音声認識処理の速度を高速化し人間に近づけることで、人とロボットとの違和感のない会話体験に貢献しております。>バージイン対応(割り込み対話機能)
ロボットが発話している最中でも、人の声を認識できる技術により、ロボットがしゃべり終わるのを待つ必要のない、スムースで自然な対話を実現しました。
これまでのコミュニケーションロボットなどにおける対話ソリューションでは、「機械の準備が整うまで待つ」「機械がしゃべり終わるまで待つ」というように、人間側に不自然なコミュニケーションを強制している場合が多くありましたが、ロボットがバージイン対応となることで、人間にとってより自然なコミュニケーションを実現しています。
- 今後の展開について
音声認識処理に関連するソフトウェアのみならず、音声を正確に集音するためのハードウェア開発も合わせて行うことで、駅をはじめとする雑踏環境下のみならず、あらゆる社会インフラへの音声技術の実装を目指しています。
「音声によるコミュニケーション」という人間の本能的な動作を、人間側の負荷を強いることなく機械側が認識する「ボイスファースト」時代の基盤となる技術を提供していきます。
- 「mimi」 について
参考URL: http://www.fairydevices.jp/mimi_about.html
- 「Fairy I/O」について
参考URL: http://www.fairydevices.jp/fairy_io.html
- フェアリーデバイセズ株式会社について
フェアリーデバイセズ株式会社は、「使う人の心を温かくする一助となる技術開発」をコーポレート・アイデンティティとして掲げ、VUI・VPA関連技術、音/音声認識と関連する機械学習諸分野の応用研究開発、及び対話システム・UXデザインの設計と評価に強みを持ちます。
※駅案内ロボットについて
乗換案内や構内・周辺案内といった利用客からの音声によるお問い合わせに、音声・ディスプレイ・ロボットの動きで回答します。これまでOSSが磨いてきた駅業務に特化した対話型AIエンジンに、多くの利用客が行き交う雑踏環境下でも正確に音声を集音し、言葉を認識できる「独自の音声処理技術」と、「クラウドでの高速な音声処理」に加え、ロボットの回答中に別の質問をすることができる「割り込み対話機能」を付加することで、より人と人との対話に近づけることに成功し、これまで困難であった窓口業務の自動化を実現します。
参考URL:https://www.omron.co.jp/press/2019/02/c0305.html
※オムロン ソーシアルソリューションズ株式会社について
オムロン ソーシアルソリューションズ株式会社は、オムロン株式会社の子会社として、社会システム事業を担っております。オムロン株式会社は、独自の「センシング&コントロール+Think」技術を中核としたオートメーションのリーディングカンパニーとして、制御機器、電子部品、車載電装部品、社会インフラ、ヘルスケア、環境など多岐に渡る事業を展開しています。
参考URL: https://www.oss.omron.co.jp/index.html
※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。
- 【本件に関するお問い合わせ先】
http://www.fairydevices.jp/
お問い合わせ窓口
電子メール contact@fairydevices.jp
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザーログイン既に登録済みの方はこちら
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像