ai&、日本企業向け高性能AI推論プラットフォーム「ai& Inference」を提供開始。米OpenAI・Anthropicに代わる選択肢としてAI利用コストを最大80%削減

株式会社エーアイ・アンド

2026年6月23日 12時00分

ai&（株式会社エーアイ・アンド、本社：神奈川県横浜市、Co-Founder & CEO：デビット・ベネット、Co-Founder & President：原信平、以下「ai&」）は本日、日本企業向けに設計された高性能AI推論プラットフォーム「ai& Inference」（読み：エーアイアンド・インファレンス）の提供を開始しました。米Anthropicの「Claude」や米OpenAIの「GPT」シリーズなど海外フロンティアAIサービスに代わる選択肢として位置づけ、日本企業のAI利用コストを最大80%削減（注）できます。すべての処理を日本国内のインフラで完結させる点も特徴です。

同サービスは、現在ClaudeやGPTシリーズをはじめとする海外プロバイダーのAIを利用中の企業、あるいは規制やデータ主権の制約により海外サービスの採用が難しかった日本企業を主な対象とします。利用に際しては既存アプリケーションの設定を1行変更するだけで導入を開始でき、価格はWebサイト上で公開されています。

国内エンタープライズAI市場が抱える3つの課題

日本企業のAI活用は、過去2年で大きく進展した一方、エンタープライズ用途では依然として複数の課題が残されています。

第1の課題は「AI利用コストの急増」：1つのAIエージェントの業務処理は、計画ステップ、検索ステップ、ツール呼び出しステップ、検証ステップなど、多数のAI呼び出しが1つのループの中で連鎖します。各ステップでコストが発生し、リトライのたびに積み上がります。チャットアプリケーションでは少額で済んでいた処理が、エージェント化によって1,000倍規模に膨れ上がるケースも珍しくありません。最先端モデルの単価でこれを積み重ねれば、AIコストは「経費の一部」ではなく、エージェントを本番投入できるかどうかを決める「事業遂行上の制約要因」へと変わります。

第2の課題は「レイテンシ」：海外のAIサーバーへリクエストを送るたびに、AIが処理を開始する前に国境を越える通信遅延が発生します。リアルタイムのやり取りや、AIエージェントが何度もモデルを呼び出すループ処理では、この遅延が積み重なり、業務体験に無視できない影響を与えます。本番運用のAIに求められる性能要件が高度化するなか、国内からのサービス提供の重要性が増しています。

第3の課題は「データ主権」：金融、医療、公共、法律といった規制業界、あるいは機微な顧客情報を扱う企業においては、世界最高水準のAIモデルを業務に組み込むことが難しい状況が続いてきました。海外プロバイダーのAIサービスでは、推論処理の過程で顧客データが海外管轄を経由するため、エンタープライズに求められるデータプライバシー要件を満たせないケースが多いためです。

「適材適所」運用を実現したai&の国内基盤

こうしたコスト増を抑える有効な手段として注目されているのが、各タスクを必要な知性レベルに合わせて異なるAIモデルへ振り分ける、いわゆる「適材適所」運用です。複雑な推論や戦略立案といった「考える（Thinking）」タスクには高性能モデルを、定型処理やツール呼び出しといった「実行する（Doing）」タスクには安価で高速なモデルを充てます。階層化されたモデル群を賢く使い分けることで、ワークフロー全体のコストを大幅に下げられるという考え方です。

ただし、日本企業にとってこの運用を実現する手段は限られていました。海外の主要なマルチモデル提供事業者は日本管轄外で運用されており、規制対応や低遅延が求められる日本のエンタープライズにとって採用しがたい選択肢だったためです。

ai& Inferenceは、この空白を埋めるべく構築された推論プラットフォームです。フロンティアレベルのオープンソースモデルから軽量モデルまで、複数のAIモデルを単一のAPIから提供し、エージェントワークフローの中で最適なモデルを最適なタスクへルーティングします。同社独自のポストトレーニング（事後学習）により、日本企業向けの業務タスクに最適化されたモデル提供も行います。

わずか1行の設定変更で導入、80％コストを抑えた価格設定

ClaudeやGPTのAPIをすでに利用している開発者にとって、ai& Inferenceへの移行は最小限の変更で済むよう設計されています。アプリケーションの接続先設定を1行、海外プロバイダーからai&のエンドポイントへ変更するだけで、既存のコードはそのまま動作します。エンタープライズ用途で重要なワークロードにおいて、AIの出力品質は同水準を維持しつつ、コストは約80%（注）低く抑えられます。

専有キャパシティ、カスタムSLA、オンプレミス展開、特定ワークロード向けの専門チューニングなど、より踏み込んだ要件を持つエンタープライズ企業には、個別対応の選択肢も用意しています。

（注）Claude Opus 4.8の場合のトークン単価がInput 800円 Output 4,000円、ai&(Nemtron)の場合input 80円 Output 480円フロンティアAIに比較して約80％割安。（2026年6月、自社調べ）各モデルごとの単価はHPにて公開中。

https://www.aiand.com/jp/inference

データ主権を支える、3,000億円規模の国内インフラ投資

ai&は、コスト削減だけではなく、先に挙げた2つの課題、レイテンシーとデータ主権の課題解決にも取り組んでいます。今後3年間で日本国内に複数の100MW級AIデータセンターを建設する計画で、すでに約3,000億円の資金を確保しています。サービス基盤はすべて、ai&自身が保有・運営するハードウェア上で稼働します。レンタルのクラウドキャパシティは利用せず、データ経路に海外管轄が入ることもありません。計算リソースと顧客の請求額の間に第三者のマージン層を介在させない構造とすることで、コスト面の優位性を構造的に担保する設計です。また、物理的に日本国内に設置されているため、レイテンシーの課題を最小限に抑えることができます。

フロンティアレベルのAI性能、劇的に低いコスト、そして日本管轄での処理、ai& Inferenceはこの3点を兼ね備えた唯一の日本発のソリューションです。

提供時期

ai& Inferenceは、本日より console.aiand.com にて提供を開始しました。

クーポンコード「sakugen」を入力すると、10,000円相当の無料クレジットが付与されます。

ai&について

ai&は、「フルスタック全体を保有し最適化する者が勝つ」というシンプルな信念のもとに2026年に設立された日本発のグローバルAIテクノロジー企業です。次世代データセンター・インフラ、異種混在型コンピューティング（ヘテロジニアス・コンピュート）、そして最先端のAIモデルサービスを単一の最適化されたプラットフォームとして統合することで、ai&は企業や開発者に対し、単一レイヤーのプロバイダーでは実現できない性能、経済性、そしてデータ主権（ソブリンティ）を提供します。日本で創業し、現在はグローバル展開を進めるai&は、AIネイティブ時代の未来を支える基盤の構築に取り組んでいます。