AgoraとOpenAIのRealtime APIが実現する、マルチモーダルAIエージェントとのシームレスな対話

Agora, Inc

東京、2025年9月9日 – リアルタイム・エンゲージメントおよび会話型AIのリーディングプラットフォームである Agora(NASDAQ: API) は本日、OpenAIのRealtime APIへの拡張対応を発表しました。同APIはすでに一般提供が開始されています。

Agoraによる新たなRealtime APIの統合により、自動挨拶、マルチモダリティでの対話、選択的注意ロックなどが可能となり、ユーザーとAIエージェントの間でより自然なやり取りを実現する高度な機能が利用できるようになりました。

このマイルストーンは、AgoraとOpenAIのパートナーシップを基盤としており、Realtime APIはAgoraプラットフォームに組み込まれる初のマルチモーダル大規模言語モデル(MLLM)となります。両者を組み合わせたソリューションにより、開発者は開発の複雑性を軽減しながら、リアルタイムでの高度な機能を解放し、より自然で応答性が高く、人間らしいAIエージェントを構築できるようになります。

AgoraのCEOであるTony Zhao氏は次のように述べています。
 「リアルタイムのマルチモーダル対話は、AIエージェントを真に人間らしく感じさせるために欠けていた要素です。OpenAIのRealtime APIを当社のConversational AI Engineに統合することで、開発者にこれまで以上に高速で、スマートで、自然な体験を構築するためのツールを提供します。

​​AgoraのConversational AI Engineは、AIエージェントとの自然なやり取りを実現するために、さらに高度な機能を提供します:

自動挨拶(Automated Greetings):セッション開始時の認識を即座に行い、自然で温かみのあるオンボーディング体験を実現。

マルチモダリティ対話(Mixed-Modality Interaction):1つの対話セッション内で音声入力とテキスト入力をシームレスに切り替え可能。

柔軟なターン検出オプション(Flexible Turn-Detection Options):開発者が会話の流れやターンテイキングの挙動を細かく制御可能。

途切れない入力(Uninterrupted Input):Agora独自の「Selective Attention Locking」技術により、環境ノイズや周囲の声を排除し、中断のないエンゲージメントを実現。

AgoraのConversational AI Engineを通じて、開発者はRealtime APIの導入を効率化するだけでなく、マルチモーダルAIエージェントに新たな機能やユースケースをもたらす強力なツール群にアクセスできます。

OpenAIのリアルタイム言語モデルと、Agoraのグローバルリアルタイムネットワーク基盤(SDRTN®)、さらに専用の開発者向けツールキットを組み合わせることで、開発チームは市場投入までの時間を短縮し、アプリケーション開発を簡素化し、優れたリアルタイム会話型AI体験を提供することが可能になります。

ロボティクス系スタートアップ Carbon Origins はすでに、OpenAIのRealtime APIと統合されたAgoraの技術を活用し、重機のハンズフリー操作を可能にするとともに、オペレーターの効率向上を実現しています。

Carbon OriginsのCEO兼創業者である Amogha Krishna Srirangarajan 氏は次のように述べています。「OpenAIのリアルタイムAPIとAgoraの会話型AI技術を組み合わせることで、当社の自律型ロボット群を音声のみで操作することが可能になります。この技術は、当社の『Constellation AI』仕組みにおける複雑な確認項目やシステム運用を自動化し、作業者が手作業の実行ではなく、戦略的な業務や全体調整に専念できるようにします。」

この統合により、この統合により、Agoraは会話型AI、リアルタイム交流、複合型エージェント開発における主要基盤としての地位をさらに強化しました。その活用分野は、顧客対応、教育、ゲーム、ファンとの交流など多岐にわたります。

この勢いを背景に、Agoraは先ごろ開催された 2025 API World Conference において、Best Communications API賞 を受賞しました。この受賞は、人間とAIエージェント間のシームレスでリアルタイムなやり取りを可能にする Agora Conversational AI Engine の革新性を示すものであり、「すべてのAIとの会話を、人と人との会話と同じように自然で即時性のあるものにする」という同社のビジョンを裏付けています。

AgoraのConversational AI Engineの詳細はこちらをご覧ください:https://www.agora.io/en/products/conversational-ai-engine/

***

会社概要:Agora

Agoraはリアルタイム・エンゲージメント分野におけるグローバルリーダーであり、開発者に対し、会話型AI、音声、映像、双方向ライブ配信、チャット機能をアプリケーションやIoTデバイスに組み込むための、シンプルかつ柔軟で強力なAPIを提供しています。米国カリフォルニア州サンタクララに本社を構える同社は、ソーシャルメディアやライブコマースから教育や遠隔医療に至るまで、世界1,700を超えるリーディング企業に信頼され、最高水準のリアルタイム体験を支えています。

Agora(NASDAQ: API)に関する詳細は、www.agora.io をご覧ください。詳しくは日本語サイト:https://jp.vcube.com/sdk 

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

Agora, Inc

0フォロワー

RSS
URL
-
業種
情報通信
本社所在地
2804 Mission College Blvd., Santa Clara, CA, USA 95054
電話番号
-
代表者名
Effie Fang
上場
海外市場
資本金
-
設立
-