開発者が任意のAIモデルに超低遅延の音声機能を追加できる新ソリューション

Agora, Inc

【2025年3月5日・カリフォルニア州サンタクララ】— リアルタイムエンゲージメントAPIのリーディングプラットフォームであるAgora, Inc.(NASDAQ: API)は本日、**「Conversational AI Engine(会話型AIエンジン)」**を発表しました。この最先端のソリューションにより、開発者は任意のAIモデルにリアルタイムの音声機能を統合し、超低遅延で自然な会話を実現することが可能になります。

本エンジンは、カスタムAIモデルや主要な大規模言語モデル(LLM)プロバイダーのAI、または任意のテキスト音声変換(TTS)技術を活用できる柔軟な設計となっており、リアルタイムの会話フローを最適化、発話の途中での割り込みを認識し、スムーズな対話を実現します。

Agora CEO Tony Zhao氏のコメント。

「ほとんどのAIモデルは、まだ音声でのインタラクションに対応しておらず、対応している場合でも最適化が不十分です。Agoraの新しいソリューションにより、AIとの会話がよりシームレスで自然なものになります。統合が簡単で、遅延がほぼゼロのリアルタイム音声体験を実現し、企業やユーザーの可能性をさらに広げます。」

最適な音声対話を実現する技術

本エンジンには、以下の技術が組み込まれています:

ノイズ抑制機能:環境音を低減し、クリアな音声対話を実現

AI駆動の音響アルゴリズム:リアルタイムでの高精度な音声処理

超低遅延の音声認識(STT):正確かつスムーズな音声対話を提供

Software-Defined Real-Time Network™:パケットロスを動的に管理し、デバイスやネットワーク環境を問わず最適なパフォーマンスを維持

本ソリューションは、Agoraがサポートする会話型AI構築向けのコミュニティプロジェクト**「TEN(The Engager Network)」**フレームワーク上に構築されています。本エンジンにより、企業は最小限の工数で、スケーラブルかつ自然で魅力的なリアルタイム音声エージェントを展開することが可能になります。

また、今後は**「App Builder」**にも本エンジンを統合予定です。コード不要の環境で、簡単に会話型AIのユーザーインターフェースを作成し、音声AIエクスペリエンスをさらに迅速に導入できるようになります。

Zhao氏による追加コメント。

「私たちの目標は、AIと人間のインタラクションのギャップを埋め、会話をより直感的、表現豊か、かつ影響力のあるものにすることです。AIモデルと人間の音声インタラクションを民主化し、これを人々がつながり、コミュニケーションを取り、革新を進めるための基盤として確立することに尽力しています。」

Oracleとのパートナーシップ

Agoraは、Conversational AI Engineのさらなる強化に向けて、主要なAIインフラプロバイダーとしてOracleと提携し、スケーラブルな**Oracle Cloud Infrastructure(OCI)**を活用することで、パフォーマンス、セキュリティ、効率性の最適化を図ります。

「AgoraのConversational AI Engineは、人とAIの音声対話における2つの大きな課題、レイテンシーとワイヤレスラストマイルの問題を解決します」と、Oracle APAC アライアンス&チャネルディレクターのHua Jiang氏は述べています。「Agoraとのパートナーシップを通じて、より自然で応答性が高く、信頼性のある音声対話型AIを支えるインフラを提供できることを誇りに思います。」

主な活用領域

本エンジンは、以下の分野で活用が期待されています:

24時間対応のカスタマーサポート:即時対応や問題解決、ガイド提供が可能なAI音声エージェントを構築

スマートデバイスの音声操作:IoT機器、ウェアラブル、ロボットの音声制御を実現

バーチャルショッピングアシスタント:リアルタイムで商品検索や比較をサポート

ライブAIホスト:リアルタイムで視聴者と対話し、コンテンツ管理も可能

メンタルヘルスサポート:利用者の声を聞き、助言を提供し、必要に応じて専門家と連携

ライブチューター:言語学習や特定科目の学習をリアルタイムで支援するAIチューターを構築

ゲーム内AI NPC:プレイヤーと自然な音声対話ができるAIキャラクターを構築し、より没入感のあるゲーム体験を実現

企業研修とオンボーディング:新入社員のトレーニングをサポートし、24時間対応の情報提供を可能に

パブリックベータ版提供開始

Conversational AI Engine」は現在パブリックベータ版として提供されており、開発者や企業はすぐに高度な音声AIアプリケーションの構築を開始できます。詳細は**Agora公式サイト** をご覧ください。

Agoraについて

Agoraは、リアルタイムエンゲージメントのグローバルリーダーとして、開発者向けにシンプルで柔軟なAPIを提供し、音声・ビデオ・ライブ配信・チャット・会話型AIをアプリケーションやIoTデバイスに組み込める環境を提供しています。カリフォルニア州サンタクララを本社とし、1,700以上の企業がソーシャルメディア、ライブコマース、教育、ヘルスケアなどでAgoraの技術を活用しています。Agora(NASDAQ: API)の詳細は、www.agora.io をご覧ください。

https://jp.vcube.com/sdk 日本代理店

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

Agora, Inc

0フォロワー

RSS
URL
-
業種
情報通信
本社所在地
2804 Mission College Blvd., Santa Clara, CA, USA 95054
電話番号
-
代表者名
Effie Fang
上場
海外市場
資本金
-
設立
-