FlashLabs、OrcaRouterの「Routing DSL」を提供開始 ― Fable 5レベルの推論知能をわずかなコストで実現、YAML+CEL記述の推論グラフでAIワークロードを自在に制御

200以上のLLMを単一エンドポイントに統合するOrcaRouterに、難易度・タスク別のマルチモデル振り分け、フォールバック、品質/コスト/レイテンシ最適化までを宣言的に記述できるDSLが登場

FlashLabs株式会社

FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一、以下「FlashLabs」)は、米Continuum AIが開発しFlashLabsが日本独占販売するAI推論ゲートウェイ「OrcaRouter」において、新機能「Routing DSL」の提供を開始しました。Routing DSLは、YAMLとCEL(Common Expression Language)を用いて推論グラフを宣言的に記述できるドメイン特化言語です。プロンプトの難易度やタスク種別に応じて複数のLLMを組み合わせることで、Claude Fable 5に代表されるフロンティアモデル級の品質を目標に、より低いコストでの実現を目指せます。

背景・狙い

2026年、企業のAI活用は「どのモデルを使うか」から「どのようにモデルを組み合わせるか」へとシフトしています。AnthropicのClaude Fable 5はArtificial Analysis Intelligence Indexで第1位(スコア64.9)を獲得し、推論知能の新たな基準を打ち立てました。しかし、その最高性能を享受できるのは限られたワークロードに限られます。

多くの実運用ワークロードは、単純な抽出・分類・整形が大半を占め、Fable 5のようなフロンティアモデルを常時使用することはコスト面で現実的ではありません。一方で、すべてを安価なオープンモデルに置き換えれば、高度な推論が必要な場面で品質が損なわれます。

「Routing DSL」はこの振り分けロジックを宣言的・監査可能・バージョン管理可能なコードとして扱えるようにし、エージェント時代の本番運用に必要な制御性を提供します。開発者はYAMLファイルひとつで、「このタイプのプロンプトはFable 5クラスのモデルで、このタイプは高速・低コストのモデルで」という推論グラフを設計できるようになります。

Routing DSLの概要

提供開始日: 2026年6月15日(月)

アクセス:

5つのルーティング戦略

Routing DSLでは、以下の5つの戦略を組み合わせて推論グラフを構築できます。

1. 難易度別ルーティング(Route by Difficulty)

プロンプトの複雑度を自動判定し、高度な推論はClaude OpusやGPT-5.5などのフロンティアモデルへ、定型処理はDeepSeek V4 ProやQwen3.6などのオープンモデルへ振り分けます。

2. タスク別ルーティング(Route by Task)

「コード生成」「要約」「翻訳」「データ抽出」など、タスク種別に応じて最適なモデルを選択します。コーディングにはClaude Sonnet、抽出にはDeepSeekといった使い分けが可能です。

3. マルチモデル並列実行(Fan-out to Multiple Models)

同一プロンプトをGPT-5.5、Claude Opus、Gemini 3.1 Pro等に並列送信し、結果を統合。単一モデルを超える回答品質を実現します。

4. フォールバックとジャッジ(Fallbacks & Judges)

モデルの応答を自動評価し、品質が基準を下回る場合は自動的に別モデルへフォールバック。ストリーム途中の切り替えにも対応します。

5. コスト/レイテンシ/品質の最適化(Optimize for Cost, Latency, or Quality)

「コスト優先」「速度優先」「品質優先」のポリシーをグラフ全体に適用。ビジネス要件に応じた最適化を宣言的に記述できます。

詳細を説明した記事はこちら

企業にもたらす価値

1. Fable 5レベルの推論を低コストで実現

単一のフロンティアモデルに依存せず、複数モデルをグラフ構造で組み合わせることで、Fable 5に匹敵する知能レベルの出力を大幅に低コストで実現します。すべてのプロンプトに最高額のモデルを使う必要はありません。

2. 宣言的設定で運用負荷を激減

YAMLファイルによる宣言的設定のため、if/elseのハードコーディングやモデル更新ごとのコード修正が不要です。新モデルがリリースされれば、YAMLの1行を書き換えるだけで推論グラフ全体に反映されます。

3. 透明性と監査性を維持

Routing DSLで構築した推論グラフの判断根拠は、すべてリクエスト単位で可視化されます。どのプロンプトがどのモデルにルーティングされ、どの条件でフォールバックが発生したか、ダッシュボードとレスポンスヘッダーで完全に追跡可能です。

技術的特徴

Routing DSLのルーティング条件はCELで記述され、以下のような表現が可能です:

  • prompt.difficulty >= 0.8 → フロンティアモデル

  • prompt.task_type == "code_generation" → コーディング特化モデル

  • response.quality_score < 0.7 → 自動フォールバック

  • cost_budget.monthly_remaining > 100 → コスト制約付きルーティング

OrcaRouterの既存機能であるLinUCBコンテキスト・バンディットによる学習的ルーティング、ミッドストリーム・フェイルオーバー、200以上のモデルラインナップとも統合されています。

利用可能モデル例

今後の展開

OrcaRouterは今後、Routing DSLで構築した推論グラフのテンプレートライブラリを公開し、コミュニティによるベストプラクティスの共有を促進します。また、グラフのパフォーマンス分析機能の強化や、A/Bテストによるルーティング戦略の自動最適化機能の追加を予定しています。

代表コメント

FlashLabs株式会社 代表取締役 細井 洋一

「Fable 5は現時点で最も知的なAIモデルの1つです。しかし、企業が本番環境で扱うすべてのリクエストをFable 5で処理することは、コスト面でも現実性でも正しい選択とは言えません。私たちがRouting DSLにより、難易度の高い推論には最高のモデルを、定型処理には最適なコストのモデルを。その組み合わせの設計図をYAMLで宣言できる世界を実現しました。日本のエンタープライズ企業が、コストを恐れずに最高水準のAIを活用できる基盤として、OrcaRouterを進化させ続けます。」

OrcaRouterについて

OrcaRouterは、米国のAI研究機関Continuum AIが開発し、FlashLabs株式会社が日本独占販売する次世代AI推論ゲートウェイです。200以上のLLMを単一エンドポイント・単一APIキーに統合し、プロンプトごとに難易度を判定して最適なモデルへ自動ルーティングします。トークン上乗せ手数料0%、導入はBase URLの1行書き換えのみ。ガードレール、トレーシング、監視、評価機能も同一ゲートウェイで提供します。

OrcaRouter 公式サイト

FlashLabs株式会社について

FlashLabsは、営業とカスタマーエクスペリエンスを自動化、そして最終的には自律化へ導くことを目指すAI応用研究所です。機械の処理速度・精度と人間の戦略的洞察を融合させた"Human-AI Hybrid"で、従来手法を凌駕する成果を企業にもたらします。オープンソース音声モデルChromaシリーズの開発元として、NTTデータ、シャオミ、カカオ、Intel、G42、MBZUAIの開発者・機械学習エンジニアに利用されています。

会社名: FlashLabs株式会社

所在地: 東京都千代田区

代表者: 代表取締役 細井 洋一

事業内容: AIソリューションの開発・販売、AIゲートウェイサービス「OrcaRouter」の日本独占提供、オープンソース音声AIモデル「Chroma」シリーズの開発

FlashLabs株式会社 公式サイト

Continuum AIについて

Continuum AIは、次世代AI推論インフラを開発する米国の研究機関です。「OrcaRouter」を中核製品として、マークアップゼロ・適応型ルーティング・エンタープライズグレードのガバナンス機能を備えたAIゲートウェイを世界中の開発者と企業に提供しています。

Continuum AI 公式サイト

本件に関するお問い合わせ先

FlashLabs株式会社 マーケティング部

担当: 小林 光喜

Email: koki.kobayashi@myflashcloud.com

URL: https://www.flashlabs.ai/

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

FlashLabs株式会社

7フォロワー

RSS
URL
https://www.flashintel.ai/
業種
情報通信
本社所在地
東京都千代田区一番町10番8号
電話番号
-
代表者名
細井洋一
上場
海外市場
資本金
-
設立
2023年07月