AIエージェント向けスマートルーティング『OrcaRouter』がDify Marketplaceに登場──200以上のLLMを一元管理し、AI推論コストを最大70%削減
FlashLabsとContinuum AIが提携、Difyユーザーの最適モデル選択を自動化。DeepSeek V4 Pro、Claude Opus 4.7、GPT 5.5など最新モデルに対応
FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井洋一)は、提携先の次世代AIインフラを開発するContinuum AI(本社:米国)が、Dify向けスマートルーティングプラグイン「OrcaRouter」をDify Marketplaceに公開したことを発表します。本プラグインにより、Difyユーザーは200以上の大規模言語モデル(LLM)へのアクセスを一つのAPIで統合でき、プロンプトの内容に応じて最適なモデルを自動選択することで、AI推論コストを最大70%削減しながら出力品質を維持できます。

■背景・狙い
Difyは、ノーコード・ローコードでAIアプリケーションを構築できるプラットフォームとして急速に普及しています。一方、複数のLLMプロバイダーを活用する際、以下の課題が生じていました:
-
複数のモデルプロバイダーとの個別契約・管理の煩雑さ
-
固定モデル運用による過剰なコスト発生
-
プロンプトの複雑度に応じた最適なモデル選択の困難さ
-
新モデルリリース時の迅速な対応の遅れ
OrcaRouterは、これらの課題を根本から解決する「アダプティブ・ルーティング」技術により、Difyユーザーが最適なモデルを自動選択できる環境を実現します。
■OrcaRouter × Dify統合の概要
OrcaRouterプラグインは、Difyワークフロー内で以下の機能を提供します:
200以上のLLMを一つのAPIで統合
OpenAI、Anthropic、Google、xAI、Meta、Mistral、DeepSeek、Alibaba、Moonshot、ByteDanceを含む15社以上のプロバイダーから、200以上のモデルへのアクセスを一元化。ユーザーはエンドポイント、APIキー、請求書をそれぞれ一つに統合できます。
ミリ秒単位のインテリジェント・ルーティング
各リクエストに対して、「このプロンプトを指定された品質基準で処理できる中で最も安いモデルはどれか」を毎回計算。メール要約にはGPT-5は不要、複雑なコード生成には必要──その違いをルーターが自動判断します。
継続的な最適化
品質シグナル(リファレンスモデルによる採点、下流の成功率、ユーザーフィードバック)がルーティングポリシーに継続的に反映。顧客側のコード変更なしに、システムは週ごとに賢く、安くなっていきます。
リアルタイム市場対応
プロバイダーの価格、レイテンシ、エラー率、新モデルリリースを常時モニタリング。Anthropicが新Sonnetをリリースした瞬間、OrcaRouterはコーディング系プロンプトの振り分け先を自動で切り替えることが可能です。
■対応モデルと最新API
OrcaRouterは以下の最新モデルに対応しており、Difyユーザーは即座にアクセス可能です:
これらの最新フロンティアモデルを含む200以上のLLMから、Difyのワークフロー内で自動的に最適なモデルが選択されます。
■OrcaRouter導入のメリット
-
コスト削減:固定モデル運用との比較で、ワークロード構成に応じて推論支出を47~71%削減
-
品質維持:エンドユーザー側の品質指標に測定可能な劣化なし。特にエージェント系ワークロード(大半は単純処理、一部だけが高度推論を要する構成)で削減幅が最大化
-
運用効率化:Base URLとAPIキーを書き換えるだけで既存のDifyワークフローは無改修で動作。再設計も調達サイクルも不要
-
透明性と予測可能性:どのモデルが応答したかを完全に可視化。応答するモデルが、その仕事を実際にこなせる中で最も安いモデルであることを保証
■提供開始と利用方法
OrcaRouterプラグインは本日よりDify Marketplaceで公開。Difyユーザーは以下の手順で導入できます:
-
Dify Marketplaceから「OrcaRouter」プラグインをインストール
-
OrcaRouter APIキーを取得(https://www.orcarouter.ai)
-
Difyワークフロー内でOrcaRouterノードを配置し、ルーティング戦略を設定
-
既存のプロンプトを変更することなく、自動的に最適なモデルが選択される
従量課金プランの利用料はプロバイダー原価+定額プラットフォーム手数料のみ。マークアップ手数料はゼロです。
■経営陣のコメント
FlashLabs株式会社 代表取締役 細井洋一
「Difyは、ノーコードでAIアプリケーションを民主化するプラットフォームです。しかし、複数のLLMを活用する際の『モデル選択』という課題は、多くのユーザーが直面しています。OrcaRouterのアダプティブ・ルーティングは、その課題を自動化します。Difyユーザーは、モデル選択について考える必要がなくなります。最適なモデルが、毎回、自動的に選ばれるのです。」
Continuum AI担当者
「Difyとの統合は、OrcaRouterの戦略的な拡張です。Difyのノーコード・ローコード哲学と、OrcaRouterのインテリジェント・ルーティング技術は、相補的です。Difyユーザーは、複雑なモデル管理から解放され、アプリケーション開発そのものに集中できるようになります。」
会社概要
FlashLabs株式会社
FlashLabsは、営業とカスタマーエクスペリエンスを自動化、そして最終的には自律化へ導くことを目指すAI応用研究所です。機械の処理速度・精度と人間の戦略的洞察を融合させた「Human-AI Hybrid」で、従来手法を凌駕する成果を企業にもたらします。オープンソース音声モデルChromaシリーズの開発元として、NTTデータ、シャオミ、カカオ、Intel、G42、MBZUAIの開発者・機械学習エンジニアに利用されています。
Continuum AI
次世代AIインフラを開発する研究機関。OrcaRouter、OrcaRouter Liteなど、ゼロマークアップのLLMルーティング技術を提供し、AI基盤層の民主化を推進しています。
URL:https://www.continuum01.ai/
■本件に関するお問い合わせ先
FlashLabs株式会社 マーケティング部
担当者:小林光喜
メール:koki.kobayashi@myflashcloud.com
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像