100万トークンの超長文コンテキスト対応モデル「Z.ai GLM-5.2」をOrcaRouterで提供開始 ― オープンモデルのコストでClaude Opus級のコーディング性能を実現

プロンプトの難易度に応じて最適なLLMに自動ルーティング。手数料0%・導入1行。発表から4日でラインナップ追加。

FlashLabs株式会社

2026年6月17日 19時10分

FlashLabs株式会社（本社：東京都千代田区、代表取締役：細井洋一）が運営するLLM自動ルーティングサービス「OrcaRouter」は、Z.ai（旧Zhipu AI）が開発した最新モデル「GLM-5.2」のAPI提供を本日2026年6月17日より開始したことを発表します。

GLM-5.2は、実用的な100万トークンのコンテキストウィンドウを備え、高度なエージェントコーディング能力を実現するオープンウェイトモデルです。OrcaRouterの200以上のモデルラインナップに即時追加され、プロンプトの難易度に応じた最適なモデルへの自動ルーティングが可能になります。

背景

AI利用料は、プロダクトの成長とともに増え続ける「新しい原価」です。すべての処理を高性能なフロンティアモデルに任せると品質は安定しますが、抽出・分類・整形といった定型処理にも高い単価を払い続けることになります。

一方で、オープンモデルの進化は加速しています。2026年6月、Z.aiが公開した「GLM-5.2」は、エージェント型コーディングやツール利用といった実務直結の領域で、フロンティアモデルに迫る性能をオープンウェイトで実現しました。

この変化は、AI活用のコスト構造を見直す好機です。難易度の高い処理も、適切なオープンモデルへ振り分けられれば、品質を保ったままコストを下げられます。OrcaRouterは「すべてを高性能モデルに投げる」のではなく、プロンプトごとに最適なモデルを選ぶという思想で設計されています。

今回の提供開始により、日本の開発者・企業は、最新の高性能オープンモデルを、いち早く・安心して本番環境で利用できるようになります。

Z.ai GLM-5.2について

Z.ai（Zhipu AI）が開発したGLM-5.2は、コーディングと長期エージェントタスクに特化したフラッグシップモデルです。GLM-5シリーズとしては2月のGLM-5、4月のGLM-5.1に続く、わずか4カ月で3世代目の更新となります。

価格（OrcaRouter公開価格・ゼロマークアップ）:

入力：$1.40 / 100万トークン
出力：$4.40 / 100万トークン

※参考：Claude Opus 4.8は入力$5 / 出力$25

主要仕様:

実用1Mコンテキスト（最大1,048,576トークン）- 大規模コードベースや長文ドキュメントを一度に処理
MITライセンスのオープンウェイト - 商用利用・改変・セルフホストが可能
エージェント型コーディング／ツール利用に強み（後述ベンチマーク参照）
推論にかける計算量（thinking effort）を切り替え可能 - 品質とコストのバランスを調整
約750B規模のMoEアーキテクチャ（アクティブ約40B）

主なベンチマーク:

SWE-bench Pro（ソフトウェア開発）：62.1 ― GPT-5.5（58.6）を上回る
MCP-Atlas（エージェント型ツール利用）：約77 ― Claude Opus 4.8（77.8）に肉薄
KingBench 3（独立系コーディング評価）：第3位 ― 上位をフロンティアモデルが占めるなか、オープンウェイトとして上位にランクイン
AIME 2026（数学）：99.2 ／ GPQA-Diamond（科学）：91.2（いずれもHuggingFaceモデルカード記載値）

URL:

企業にもたらす価値

1. 超長文コンテキストによる大規模コードベースの一貫処理

GLM-5.2の実用的な100万トークンのコンテキストウィンドウにより、大規模なレガシーコードベース全体を1回のセッションで分析・リファクタリングできます。コードレビュー、依存関係解析、マイグレーションなどの複雑なタスクを、コンテキスト分割不要で実行可能です。

2. フロンティア品質をオープンモデルのコストで

KingBench 3でClaude Opus 4.8に迫るスコア81.43を記録。OrcaRouterのプロンプト判定機能により、難しいコーディングタスクにはGLM-5.2を、定型処理にはさらに低コストなオープンモデルを自動選択することで、品質とコストの最適バランスを実現します。

3. AIエージェントの自律コーディングを可能に

OpenCodeとの連携により、AIエージェントが自律的にコードを生成・編集・テストするワークフローに対応。最大128Kトークンの出力により、1回の応答で大規模なコード生成が可能です。

OrcaRouterの特長

OrcaRouterは、単なるモデルプロキシではなく、プロンプトの難易度をリクエスト単位で判定するコンテキスト・バンディット技術を搭載したLLMルーティングサービスです。

主な特長:

プロンプト判定 — 各プロンプトの難易度をミリ秒未満で判定し、最適なモデルへ自動ルーティング
手数料0% — トークン課金はプロバイダー公開価格と同額。再販業者を挟まず各プロバイダーへ直接接続
学習するルーティング — LinUCBコンテキスト・バンディットにより、リクエスト結果から継続的にルーティング精度が向上
リクエスト単位の可視化 — 判定結果・モデル・プロバイダー・価格を全リクエストで記録
200以上のモデル — フロンティアモデルからオープンモデル、特化モデルまで1エンドポイントでアクセス
ミッドストリームフェイルオーバー — プロバイダー障害時にストリーム途中からシームレスに復旧
8つのガードレール — PIIマスキング、プロンプトインジェクション対策、機密情報漏洩防止など
導入は1行 — OpenAI SDKのbase_urlを変更するだけ。Cursor、Cline、Continue、Aider、LangChain等に対応

利用可能モデル例:

今後の展開

OrcaRouterでは、今後も、フロンティアからオープンまで、最適なモデルを迅速にOrcaRouterへ追加してまいります。また、企業の本番AIワークロードにおけるLLMルーティングのさらなる高度化に向けて、ルーティング戦略の拡張と評価機能の強化を進めてまいります。

代表コメント

FlashLabs株式会社代表取締役細井洋一

「OrcaRouterのビジョンは、品質を守りながらAIコストを最適化すること。単に安価なモデルに置き換えるのではなく、プロンプトごとに最適なモデルを選ぶ——このアプローチが日本企業の本番AI運用に必要だと考えています。高性能なオープンモデルが増えるほど、OrcaRouterのルーティング精度も向上し、お客様のAI支出削減効果はさらに高まります。

今回の最新モデルの追加を皮切りに、今後も最新モデルをいち早くOrcaRouterに取り込み、日本企業のAI導入とコスト最適化を支援してまいります。」

OrcaRouterについて

OrcaRouterは、FlashLabs株式会社が提供するLLM自動ルーティングサービスです。各プロンプトの難易度を判定し、最適なモデルへ自動ルーティングすることで、品質を維持しながらAI関連支出を約40%削減します。手数料0%、OpenAI SDK互換で導入は1行。200以上のモデルを1エンドポイントで利用でき、トレーシング・監視・評価・ガードレール機能を統合しています。

OrcaRouter 公式サイト