DAIJOBU株式会社、AIエージェントの品質向上を実現するテスト/QAサービス「AI Agent品質担保くん」提供開始

徹底したTest/QAプロセスによりPoCレベルに留まっていたサービスを実用運用可能な品質へ引き上げる新サービス公開のお知らせ

DAIJOBU株式会社

DAIJOBU株式会社(本社:東京都大田区南千束3丁目25-4アベニール洗足池B号室、代表取締役:山中裕貴)は、LLM(大規模言語モデル)を基盤とするAIエージェントの動的な出力や予測困難な動作といった課題に対応すべく、徹底したTest/QAプロセスによりPoCレベルに留まっていたサービスを実用運用可能な品質へ引き上げるテスト/QAサービス「AI Agent品質担保くん」を本日より提供開始いたします。

サービス提供の背景

近年、AI技術を活用したプロダクトが急速に普及する一方で、LLMを基盤とするAIエージェントサービスでは、動作の不安定さや出力のばらつきなど、品質面での課題が顕在化しています。DAIJOBU株式会社は、これらの課題に対して独自のテスト自動化技術と品質保証手法を融合させたソリューションを提供することで、より安心して運用できるAIエージェントの実現を目指します。

「AI Agent品質担保くん」サービスの概要

「AI Agent品質担保くん」は、AIエージェントの特性に最適化されたテスト自動化と品質保証を実現するサービスです。主な機能は以下の通りです。

  • オートメーション×エキスパート検証型QA

    Langsmithを活用した自動テストによる広範囲な検証と、QAのエキスパートによるユースケースの徹底検証で、あらゆる角度からAIエージェントの品質を保証。迅速かつ精緻な検証体制を実現します。

  • 動作安定性評価

    LLM特有の出力のばらつきを定量化する評価指標を導入し、リアルタイムなモニタリングとフィードバックループにより、運用中のエージェントの安定性を持続的に改善します。

  • 継続的改善サイクルの確立

    テスト結果に基づき、AIエージェントのパラメータ調整や学習データの再検証を提案します。常に最新の運用環境に最適な品質を提供します。

  • 独自のテストデータセット活用

    DAIJOBU社独自のテストデータセットを活用することで、日本語に最適化した実用的かつ網羅的なAIテスト環境をすぐに導入いただけます。

サービスの特徴とメリット

  1. 実運用レベルへの品質引き上げ

    PoC段階で検証されたサービスを、実際の運用環境でも安定して活用できる品質へと改善します。

  2. 開発期間およびコストの削減

    自動テストと継続的なQAプロセスにより、手動テストの工数を大幅に削減し、全体の開発・運用コストを低減します。

  3. 柔軟かつ拡張性の高い運用体制

    AIプロダクト特有のテスト要件に対応可能なカスタマイズ機能を提供し、各プロジェクトのニーズに応じた最適な品質管理を実現します。

  4. 東大/京大のLLMエンジニアと熟練QAエンジニアのタッグ体制

    LLMとQAの双方の知識が求められる本サービスでは、東大/京大出身のLLMエンジニアと業界経験豊富なQAエンジニアが在籍するDAIJOBUだからこそ価値提供できる体制を整えています。

  5. 幅広いAI活用シーンへの展開が可能

    各業種・業態の特性に合わせたカスタマイズテスト手法により、多様なユースケースに適合。既存システムとの連携や拡張にも対応しやすくなります。

想定対象企業

  1. AI Agent領域に新規参入するエンタープライズ企業/大手SIer

    高いエンタープライズ品質を実現し、新規事業の成功を”確実に”いたします

  2. 製造業/建設業などで社内でRAGやAI Agentを実装する企業

    本当に社内で使われるAI品質へと導きます

  3. AI受託開発企業

    顧客を感動させ、1番のKPIである継続発注を生み出すサポートを実現します

ユースケース

A. 社内マニュアル検索のRAGシステムを開発した製造業の会社

導入背景 :

不安定な回答精度とPoC止まりの課題

LLMを活用したRAGシステムは構想段階でPoCを実施していたものの、回答のばらつきや更新の手間が大きく、現場の「本当に使える」レベルに到達していませんでした。

導入効果 :

LLMの回答精度が20%向上し、本番運用へ移行

「AI Agent品質担保くん」の導入で、テストシナリオの自動生成・評価が強化され、曖昧検索への正答率が顕著に上昇。PoC段階を脱して実運用に耐えうる安定度を獲得しました。

作業効率の飛躍的向上

統一化されたRAG環境が整備され、マニュアル探索にかかる時間が大幅に削減。現場エンジニアからは「必要情報が即時取得できる」「回答精度が高く、信頼性がある」という評価を得て、生産性が向上しました。

B. 社内の営業サポートのAI Agentを開発する営業代行会社

導入背景 :

PoCからの脱却と受注率向上

AI Agentによる営業支援は検討段階でPoCを行っていたものの、回答の信頼性と維持コストの両面で課題があり、実際の導入に踏み切れない状況が続いていました。

導入効果 :

PoCレベルを超えた“本当に使える”営業支援システムへ

「AI Agent品質担保くん」が提供する継続的なQAプロセスと自動テストにより、導入初期の不正確な回答や誤った提案が大幅に減少。PoC止まりだったAI Agentが本番運用に移行できました。

C. AI Agentの受託開発を行うスタートアップ

導入背景 :

大規模言語モデル特有の不確定動作への懸念

AI受託開発企業では、LLMを用いたサービス開発が進む一方、動的な応答のばらつきや想定外の振る舞いがあり、テスト設計が複雑化していました。

客観的品質証明とPoCからのステップアップ

クライアントに納品する段階で、外部の第三者による客観的な品質評価が必要とされており、PoCレベルで止まらず本格的なリリースに結びつける体制が求められていました。

導入効果 :

クライアントへの品質説明力・信頼度向上

「AI Agent品質担保くん」で行う網羅的な自動テストとエキスパートQAにより、LLMの回答精度や安定性を数値化。客観的な評価レポートがクライアントへの品質保証材料となり、開発企業の信頼度が高まりました。

追加発注・長期契約の獲得

早期検知した不具合をフィードバックループで改善し続けることで、クライアント側は納品後のリスクを大幅に軽減。結果として追加開発の発注や長期的な契約へと繋がり、ビジネス拡大に寄与しました。

今後の展開

DAIJOBU株式会社は、「AI Agent品質担保くん」を中核とした品質保証体制のさらなる拡充を図り、国内外のAIプロダクトの成功を支える体制を強化してまいります。今後は、業界標準のテスト指標の策定や、各社の個別ニーズに応じた専用ツールの提供を進め、より多くの企業が安心してAIエージェントを活用できる環境の整備に努めます。


少数精鋭の専門家によるソフトウェアテスト・品質保証サービス「ダイジョウブ」

「ダイジョウブ」は、web3やAIなど最先端領域をはじめとして、DXや基盤システムなど幅広い領域のプロダクトに対するソフトウェアテスト・品質保証サービスです。少数精鋭の品質保証の専門家による、さまざまな領域に特化したテスト観点の活用などの品質保証活動を通じて、プロダクトの品質の向上、開発リソースの最適化、不具合に伴うリスクの削減といった価値を提供しています。
プロダクトから不具合を除くだけでなく、ユーザーから愛されるような魅力的な品質を、お客様と伴走しながら作り込んでいきます。

DAIJOBU株式会社

DAIJOBU株式会社は、少数精鋭の専門家による、ソフトウェアテスト・品質保証の専門会社です。web3やAIなど最先端領域をはじめとして、DXや基盤システムなど幅広い領域のプロダクトに対する総合的な品質保証ソリューションを提供しています。 顧客に伴走し、事業を伸ばす”攻めの品質保証”を実現します。

社名

DAIJOBU株式会社

代表

山中裕貴

事業

・ソフトウェアテスト
・品質保証事業
・上流品質コンサルティング支援事業
 ・SI支援事業
・QA領域特化のAI Agent開発事業

住所

東京都大田区南千束3丁目25-4アベニール洗足池B号室

コーポレートサイト

https://daijobu.io/

広報メールアドレス

info@daijobu.io

お問い合わせフォーム

https://daijobu.io/contact

X(旧Twitter)

https://twitter.com/0xdaijobu_jp

note

https://note.com/daijobu_inc

Podcast

https://open.spotify.com/show/75MJefuUnK9e9MUtOmDDDW?si=214fff33d318453d

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

DAIJOBU株式会社

7フォロワー

RSS
URL
https://daijobu.io/
業種
情報通信
本社所在地
東京都大田区南千束3丁目25-4 アベニール洗足池B号室
電話番号
080-8339-0966
代表者名
山中裕貴
上場
未上場
資本金
-
設立
2024年01月