イレブンラボ、リアルタイム文字起こしの新時代を切り拓く「Scribe v2 Realtime」を発表

史上最速・最高精度の音声認識モデル

AI音声技術のグローバルリーダーであるElevenLabs(本社:米国ニューヨーク州、CEO:Mati Staniszewski 以下イレブンラボ)は、本日、最先端の低遅延音声認識モデル「Scribe v2 Realtime」の提供を日本市場で開始いたしました。本モデルは、日本語を含む90以上の言語に対応し、150ミリ秒未満という驚異的な速さで、高精度なリアルタイムの文字起こしを実現します。

イレブンラボが提供するリアルタイム文字起こしの精度

 Scribe v2 Realtimeは、特に日本語の認識において卓越した性能を発揮します。公式ベンチマークによると、日本語の単語誤り率(WER)はわずか4.2%を達成。これはGPT-4o(5.3%)やGemini 2.5 Flash(7.1%)といった主要な競合モデルを凌駕する、業界最高水準の精度です。

 また、本モデルはSOC 2、ISO 27001、PCI DSS Level 1、HIPAA、GDPRといったグローバルなコンプライアンス基準にも完全に準拠しており、EUおよびインドでのデータ保管オプションも提供。日本国内のエンタープライズ企業も安心してご利用いただけます。

リアルタイム文字起こしの活躍が期待される現場

 Scribe v2 Realtimeは、音声アシスタント、会議の議事録作成ツール、ライブ配信のキャプション生成など、即時性が求められるアプリケーションを開発する開発者や企業向けに設計されています。

次の単語や句読点を予測する「ネガティブレイテンシー」機能により、まるで会話の先を読んでいるかのような、人間レベルの自然な対話と即時応答を可能にします。

 さらに、接続が不安定な状況でも、前回の文脈を引き継いで文字起こしを再開できる「テキストコンディショニング」機能を搭載しており、あらゆる環境で途切れることのない安定したパフォーマンスを提供し続けます。

エンタープライズ向けの高度な機能と信頼性

 イレブンラボは、グローバルに事業を展開する企業が、各国のデータ規制を遵守しながら最先端の音声認識ソリューションを導入できるよう、エンタープライズレベルのセキュリティとコンプライアンスを最優先しています。Scribe v2 Realtimeは、ElevenLabs Agentsとシームレスに統合でき、開発者はカスタマーサポート、セールス、製品紹介のための、自然で人間らしい対話型AIシステムを迅速に構築できます。

主な機能:

  • 超低遅延 & ストリーミング対応: ミリ秒単位での文字起こしを実現。音声データをすべて受け取ってから処理するのではなく、細切れの部分音声もリアルタイムで送受信しながら実現。

  • ネガティブレイテンシー: 次の単語や句読点を予測し、よりスムーズな応答が可能に。

  • テキストコンディショニング: 接続障害が発生しても、前回の文脈を引き継いで文字起こしを再開。

  • 音声アクティビティ検出 (VAD): 無音検出に基づき、音声を自動的にセグメント化。

  • カスタムボキャブラリー: 専門用語や固有名詞を登録し、特定分野の認識精度を向上。

  • 多様な音声フォーマット: PCM(8kHz~48kHz)やμ-lawエンコーディングなど、幅広い形式に対応。

  • 柔軟な制御: 文字起こしセグメントを確定するタイミングを任意に制御できる手動コミットコントロール。

  • 多言語対応: 日本語を含む90以上の言語をサポート。

  • エンタープライズグレードのコンプライアンス: SOC 2、PCI DSS Level 1、ISO 27001、HIPAA、GDPRに準拠。ゼロリテンション(データ保持なし)モード、EUおよびインドでのデータ保管オプションも提供。

ElevenLabs APIを通じて本日より利用可能

Scribe v2 Realtimeは、ElevenLabs API経由で本日よりご利用いただけます。
https://elevenlabs.io/docs/capabilities/speech-to-text

 開発者は、ElevenLabs AgentsにScribe v2 Realtimeを直接導入し、人間品質のリアルタイム文字起こしを実世界のアプリケーションに組み込むことも可能です。

イレブンラボについて

 2022年に設立されたイレブンラボは、AI音声研究と技術のグローバルリーダーであり、企業、開発者、クリエイター、アーティストなど幅広い方に向けた最先端AIオーディオツールを構築しています。現在時価総額は66億ドル(日本円で約1兆円 2025年10月時点)で、プラットフォームは4000万人以上もの個人、そしてFortune 500企業の75%以上を含む数千もの企業に利用いただいております。私たちのサービスでは、高品質なボイスオーバーを手頃な価格でスピーディに、そして大規模に作成したり、30以上の言語で対話型AI音声エージェントを立ち上げたりすることが可能です。

イレブンラボ日本語サイト
https://elevenlabs.io/ja

イレブンラボSNS(日本語版)

X(旧ツイッター)https://x.com/ElevenlabsJapan

LinkedInhttps://www.linkedin.com/company/elevenlabs-japan/

Follow Us!

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

URL
https://elevenlabs.io/ja
業種
情報通信
本社所在地
東京都千代田区丸の内 1丁目6番5号
電話番号
-
代表者名
田村元
上場
未上場
資本金
-
設立
-