OrcaRouter、DeepSeek V4 Pro APIを75%割引価格で提供開始 ― エンタープライズAIエージェントワークフローのコスト最適化を加速

品質を保ちながらLLM運用コストを最大40%削減。フロンティアモデルとオープンモデルを最適ルーティング

FlashLabs株式会社

FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一)は、提携先のContinuum AIが提供する「OrcaRouter」において、DeepSeek V4 Pro APIを75%割引価格で提供開始することを発表いたします。これにより、エンタープライズAIエージェントワークフローの運用コスト削減を実現し、企業のAI活用を加速します。

■背景・狙い

2026年は、エンタープライズAIエージェントワークフローが本格普及する転換点を迎えています。Gartnerの予測によれば、2026年末までに企業アプリケーションの40%がAIエージェントを組み込むとされており、AIエージェント型ワークフローは業務自動化の新たな標準となりつつあります。

一方で、LLM(大規模言語モデル)の運用コストは、プロダクト成長とともに増え続ける新しい原価として企業の経営課題となっています。多くの企業が、すべての処理を高性能モデルに投げることで品質を確保する一方、本来そこまで高性能モデルを必要としない定型処理にも高単価を払い続けている現状があります。

この課題に対し、OrcaRouterはプロンプトごとに難易度を判定し、難しい推論はフロンティアモデルへ、定型処理は高性能なオープンモデルへ自動ルーティングすることで、品質を守りながらLLM支出を約40%削減する仕組みを提供してきました。

今回、DeepSeek社が公式にV4 Pro APIの75%割引を発表したことを受け、OrcaRouterも同価格での提供を開始し、エンタープライズAIエージェントワークフローの普及をさらに加速させます。

■OrcaRouterとDeepSeek V4 Pro API 75%割引の概要

価格:

  • DeepSeek V4 Pro API: 入力$0.14/M tokens、出力$0.28/M tokens(通常価格の75%割引)

  • トークン上乗せ: 0%(プロバイダー公開価格と同額)

主要機能:

  • プロンプト難易度判定(<1ms)による最適モデル自動ルーティング

  • LinUCBコンテキスト・バンディットによる学習型ルーティング

  • リクエスト単位の可視化(判定根拠、モデル、プロバイダー、価格)

  • ミッドストリーム切り替えによる99.99%稼働率保証

  • OpenAI互換API、1行で導入可能

対応モデル:

■企業にもたらす価値

1. 劇的なコスト削減

月1万ドル規模のLLM利用で年間約$47,700のコスト削減を実現(回収期間1日未満)。DeepSeek V4 Pro利用で従来比75%のコスト削減が可能です。

2. 品質を保った最適化

プロンプト難易度を自動判定し、定型処理(約65%)はオープンモデルで約1/15のコストで処理、高度な推論(約35%)はフロンティアモデルで処理することで、品質を一切損なわずにコストを最適化します。

3. 完全な透明性

トークン課金はプロバイダー公開価格と同額(上乗せ0%)。リクエスト単位で判定根拠、モデル、プロバイダー、価格を可視化し、監査性を確保します。

4. エンタープライズ対応の信頼性

ミッドストリーム切り替えによりプロバイダー障害時も自動フェイルオーバー。エージェントループの状態を維持しながら99.99%の稼働率を実現します。

5. 即座の導入

OpenAI互換APIにより、既存コードの変更は1行のみ。導入も切り戻しも低コストで、検証から本番まで進めやすい設計です。

■エンタープライズAIエージェントワークフローへの対応

OrcaRouterは、エンタープライズAIエージェントワークフローに最適化された設計となっています。

エージェントワークフローの特徴:

  • 定型処理(抽出・分類・整形・簡易要約など)と高度な処理(多段推論・長文コンテキスト・コード生成など)が混在

  • リアルタイムでの意思決定と適応が必要

  • 複数のエージェントが協調して動作

OrcaRouterが行う最適化:

  • プロンプト単位で難易度を判定し、最適なモデルを自動選択

  • 実行結果から学習し、ルーティング精度を継続改善

  • エージェントの状態を維持しながらフェイルオーバー

これにより、企業は安心してAIエージェントを本番環境に展開し、業務自動化から自律化への道を加速できます。

ガードレール・セキュリティへの取り組み

本番運用に必要なセキュリティ統制を、モデル到達前にゲートウェイで適用することにより、エンタープライズ本番環境で求められるセキュリティ・コンプライアンス機能を統合しています。

個人情報、シークレット、プロンプトインジェクション、ブランド安全性など、8つのガードレール機能をテンプレートまたはカスタムルールで適用し、本番運用の統制を強化します。

8つのガードレール機能:

1. PII Shield(個人情報保護) 

メール、氏名、住所、電話番号、SSN等を検知・マスキング。個人情報がLLMに送信される前にブロックし、データ保護規制への対応を支援します。

2. Secrets & API Keys(認証情報保護) 

OpenAI、AWS、GitHub等の認証情報漏えいをブロック。APIキーやアクセストークンの誤送信を防止し、セキュリティインシデントを未然に防ぎます。

3. Prompt Injection(プロンプトインジェクション対策) 

脱獄、ロールプレイ、システムプロンプト上書き試行を検知。悪意のあるプロンプト操作からシステムを保護します。

4. Profanity & Brand Safety(ブランド安全性) 

入力・出力の不適切表現をフィルタ。重大度を調整可能で、ブランドイメージを保護します。

5. Financial Data (PCI)(金融データ保護) 

カード番号、口座情報、金融系PIIをブロック。PCI DSS準拠を支援し、金融データの漏えいを防止します。

6. System-Prompt Leak(システム情報保護)

システム指示や内部スキャフォールドの漏えい出力を検知。企業の知的財産やシステム設計情報を保護します。

7. Compliance Logger(コンプライアンス監査)

監査用にログだけ残すObserve-onlyテンプレート。ブロックせずに記録し、事後分析とコンプライアンス対応を支援します。

8. Prompt-Size Cap(入力サイズ制限)

ルート、キー、モデルごとに入力長の上限を適用。過大なリクエストによるコスト増加やシステム負荷を防止します。

事前テンプレート、Builder/JSON、テストサンドボックス、入力/出力ステージで設定が可能です。カスタムルール対応により、企業のセキュリティポリシーに合わせた柔軟な設定が可能です。

■今後の展開

FlashLabsは、Continuum AIとの日本独占ディストリビューション提携を通じて、OrcaRouterの日本市場での普及を支援してまいります。今後も最新のLLMモデルへの対応、ルーティング精度の向上、エンタープライズ機能の拡充を継続的に実施し、企業のAI活用における「品質」と「コスト」の両立を実現してまいります。

また、Human-AI Hybridのビジョンのもと、機械の処理速度・精度と人間の戦略的洞察を融合させ、従来手法を凌駕する成果を企業にもたらすことを目指します。

■代表コメント

FlashLabs株式会社 代表取締役 細井 洋一:

「2026年はエンタープライズAIエージェントワークフローが本格普及する転換点です。LLM運用コストは新たな経営課題となっています。OrcaRouterは、品質を一切損なうことなく、エージェント型AIワークフローの運用コストを劇的に削減します。プロンプト難易度の自動判定により、定型処理はオープンモデルで、高度な推論はフロンティアモデルで処理することで、企業は安心してAIエージェントを本番環境に展開できます。

私たちは、AI応用研究所として、営業とカスタマーエクスペリエンスの自動化から自律化への道を切り拓き、Human-AI Hybridで企業に新たな価値を提供し続けます。」

■OrcaRouterについて

OrcaRouterは、Continuum AI(米国)が開発する次世代適応型推論ゲートウェイです。プロンプトごとに難易度を判定し、最適なモデルへ自動ルーティングすることで、品質を保ちながらLLM運用コストを約40%削減します。トークン上乗せ0%、200+モデルを1エンドポイントで提供し、エンタープライズAIエージェントワークフローに最適化された設計となっています。

OrcaRouter公式サイト
OrcaRouterの無料APIキー取得

■FlashLabs株式会社について

FlashLabsは、営業とカスタマーエクスペリエンスを自動化、そして最終的には自律化へ導くことを目指すAI応用研究所です。機械の処理速度・精度と人間の戦略的洞察を融合させた"Human-AI Hybrid"で、従来手法を凌駕する成果を企業にもたらします。

オープンソース音声モデルChromaシリーズの開発元として、NTTデータ、シャオミ、カカオ、Intel、G42、MBZUAIの開発者・機械学習エンジニアに利用されています。また、Continuum AI(米国)との日本独占ディストリビューション提携により、次世代適応型推論ゲートウェイ「OrcaRouter」を日本市場に提供しています。

会社名: FlashLabs株式会社

所在地: 東京都千代田区

代表者: 代表取締役 細井 洋一

事業内容: AI応用研究、音声モデル開発、AIゲートウェイ日本独占販売、営業・CX自動化ソリューション

URL: https://www.flashlabs.ai/

■Continuum AIについて

Continuum AIは、次世代AIインフラを開発する米国の研究機関です。適応型推論ゲートウェイ「OrcaRouter」を開発し、企業のAI活用における品質とコストの両立を実現する技術を提供しています。

URL:https://www.continuum01.ai/

■本件に関するお問い合わせ先

FlashLabs株式会社 マーケティング部

担当: 小林 光喜

Email: koki.kobayashi@myflashcloud.com

URL: https://www.flashlabs.ai/

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

FlashLabs株式会社

6フォロワー

RSS
URL
https://www.flashintel.ai/
業種
情報通信
本社所在地
東京都千代田区一番町10番8号
電話番号
-
代表者名
細井洋一
上場
海外市場
資本金
-
設立
2023年07月