音声認識APIを30000回無料で。NICT×総務省主催の「多言語音声翻訳コンテスト」に技術協力。
多言語による音声認識・機械翻訳・音声合成の無償APIサーバーを開放しました。
フェアリーデバイセズ株式会社(本社:東京都⽂京区、代表取締役:藤野真⼈、以下「当社」)は、総務省と国⽴研究開発法⼈情報通信研究機構( 理事⻑: 徳⽥ 英幸、以下「NICT」)が主催する「多⾔語⾳声翻訳コンテスト」において、誰でも無償で「多⾔語による⾳声認識・機械翻訳・⾳声合成」のAPIを利⽤できるサーバー(サンドボックスサーバー)の開放に技術提供したことをお知らせいたします。
- 多言語音声翻訳コンテストについて
コンテストの詳細はこちらをご覧ください。
専用Webサイト: https://tagen.go.jp
総務省とNICTは、世界の「言葉の壁」をなくし、グローバルで自由な交流を実現するため、「グローバ
ルコミュニケーション計画」(※1)を推進し、多言語音声翻訳技術の開発・普及に取り組んでいます。
世界の「言葉の壁」をなくすことは、まさに社会を変革するイノベーションであり、「技術」だけでは引き起こすことはできません。技術は、新しい発想・アイデアと組み合わせた「製品」や「サービス」となって、初めて世の中を変えていくことができます。
このため、総務省・NICTにおいては、多言語音声翻訳技術の更なる普及や多種多様な翻訳サービスの出現を加速すべく、昨年度に引き続き(※2)、「言葉の壁」をなくすための多言語音声翻訳技術の新たな活用方法や使い方などの「アイデア」と「試作品(PoC)」を募集し、優秀作品には総務大臣賞等を授与する「多言語音声翻訳コンテスト(第2回)」を開催します。
※1グローバルコミュニケーション計画(2014年4月)
世界の「言葉の壁」をなくしグローバルで自由な交流を実現するために、音声翻訳技術の多言語化・多分野化を推進し、2020年までに社会実装を目指す計画。
http://www.soumu.go.jp/main_content/000285578.pdf
※2 昨年度の多言語音声翻訳コンテスト(第1回)では、合計153件の応募の中から、総務大臣賞(最優秀賞)1件、NICT賞(次点)1件、優秀賞3件を選定。開催模様は以下の通り。
アイデアコンテスト(2019年1月12日(土)): https://tagen.go.jp/report/report_01.html
試作品(PoC)コンテスト(2019年3月2日(土)): https://tagen.go.jp/report/report_02.html
- サンドボックスサーバー開放の背景
多言語音声翻訳コンテストはアイデアを募集する「アイデアコンテスト」と「試作品(PoC)コンテスト」の
⼆部構成となっており、や試作品コンテスト参加者は、「多⾔語による⾳声認識・機械翻訳・⾳声合成」APIを活⽤し、実際に動作する「製品・アプリ・サービスなどの試作品」を作成する事が求められております。
NICTが研究開発した多⾔語⾳声翻訳技術(⾳声認識、機械翻訳、⾳声合成)を、「共通API」により誰でも利⽤できる状態にすることで、コンテストに向けた試作品の開発を⽀援しています。申請者には30000回ものAPI利⽤権が付与され、不⾜したら再度追加することも可能です。
また、コンテストへの参加の有無にかかわらず、多言語⾳声翻訳技術の商⽤利⽤を検討している企業などにも、サンドボックスサーバーの開放期間中に無償で試⽤してもらうことで、多⾔語⾳声翻訳技術の社会実装を推進しています。
このサンドボックスサーバーは、バックエンドとして⼤規模運⽤実績のある当社の mimi® Cloud API Service の技術を活⽤する形で実現しています。
専用Webサイト上の「サンドボックスサーバー利用申請」より申請の上、御利用いただけます。
- mimi® cloud API serviceについて
当社では、mimi® Cloud API Service を⾳声応⽤・⾳声対話システムを開発する企業向けに技術提供しております。音声に関する要素技術を取り揃えており、一度音声を送信するだけで、認識から話者識別まで、ワンストップで様々な機能を利用する事が可能です。
音声認識 | 音声をテキスト化できます。 |
機械翻訳 | 送信したテキストを任意の言語に翻訳できます。 |
音声合成 | テキストを自然な発生の音声に変換できます。 |
話者識別 | 音声から話者を識別する事ができます。 |
態度認識(β版提供中) | 音声から、肯定、否定、疑問などの話者の態度を推定できます。 |
感情認識(開発中) | 音声から、話者の感情を推定します。 |
このうち音声認識、機械翻訳、音声合成に関しては、NICTにて研究開発された知的財産の実施契約に基づき、10ヵ国語 ※ に対応したAPIを「mimi® powered by NICT」として提供しています。
※対応する10言語は、日本語/英語/中国語/韓国語/ベトナム語/タイ語/ミャンマー語/インドネシア語/フランス語/スペイン語です。
- お試しAPIからビジネス利用まで
無償利用APIは、mimi® Cloud API Serviceと互換性を有しており、試作品(PoC)コンテストのお試しAPIの利用終了後も利用者はスムーズに商⽤利⽤に移⾏できます。
なおmimi® cloud API serviceも、1日50回までの無償評価利用が可能となっています。
URL: https://console.mimi.fd.ai/
- 今後の展開について
当社は⼈間と機械とのコミュニケーションをより⾃然なものとしたいと願っています。そのため、⾳声認識処理に関連するソフトウェアのみならず、⾳声を正確に集⾳するハードウェアの技術開発にも⼒を注いでいます。
当社は業務現場における⾳声AI技術活⽤のリーディングカンパニーとして、デジタルトランスフォーメーションのさらに先の世界を⾒据え、これまでの⾳声認識技術では踏み込めなかった領域を、ソフトウェア・ハードウェアの⼀体開発によって切り拓いてまいります。
- フェアリーデバイセズ株式会社について
フェアリーデバイセズ株式会社は、「使う人の心を温かくする一助となる技術開発」をコーポレート・アイデンティティとして掲げ、VUI・VPA関連技術、音/音声認識と関連する機械学習諸分野の応用研究開発、及び対話システム・UXデザインの設計と評価に強みを持ちます。
URL: https://www.fairydevices.jp/
VUI: Voice User Interface VPA: Voice Personal Assistant
※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザーログイン既に登録済みの方はこちら
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
- 種類
- イベント
- ビジネスカテゴリ
- パソコンソフトウェアシステム・Webサイト・アプリ開発
- ダウンロード
- プレスリリース素材
このプレスリリース内で使われている画像ファイルがダウンロードできます