GBase On-prem × NVIDIA SparkによるオンプレミスAIエージェント基盤の構築

~オンプレミスで数十人同時GPT-4o級AI~

Sparticle

Sparticle株式会社(本社:東京都中央区、代表取締役:金田達也、以下「Sparticle」)が提供する生成AIプラットフォーム「GBase」は、企業における生成AI導入時の課題を解決します。「ハードウェアコストの高さ」「モデルの重さによるオンプレミス環境での動作困難」「社内システムとの連携やセキュリティ面での懸念」といった指摘に対し、デスクトップサイズのNVIDIA SparkにGBase(オンプレミス特化型生成AIパッケージ)をインストールすることで、社内業務に最適化された知識ベースとAIエージェント基盤を現実的なコストで構築することが可能となります。

GBase on Sparkについて

GBase on Sparkはオンプレミス環境向けに設計された生成AIプラットフォームで、LLM大規模言語モデル+VLM視覚言語モデルを内蔵。 手書きメモ、走り書き、スキャン文書、複雑な表や図解を含むあらゆるドキュメントを理解・回答できる高精度RAG技術を特徴としています。 これらのモデルは量子化処理+ARMプラットフォーム最適化により、Spark上でスムーズに動作し、社内完結のナレッジ活用を実現します。

GBase on Spark公式サイト

デスクトップサイズのAIサーバー「NVIDIA Spark」

NVIDIA Sparkは、いわゆるラックマウント型の大規模サーバーではなく、デスクの上に置けるコンパクトなAIサーバーです。筐体は一般的なデスクトップPCと同等かそれ以下のサイズ感で、オフィスの一角や開発チームの席のそばにそのまま設置して利用できます。

静音性にも優れており、通常のオフィス環境であれば、稼働中でもほとんど気にならないレベルのノイズです。専用サーバールームや特別な空調設備を用意する必要がなく、「高性能なワークステーションを1台導入する」感覚に近い形で、社内専用のLLMサーバーを持つことができます。

また、市場で一般販売されているモデルをそのまま購入できるため、「カスタムサーバーを発注して長期間待つ」といった調達リスクやリードタイムも最小限に抑えられます。調達・設置・初期設定までのハードルが低く、スピーディーに社内向けのAI基盤を立ち上げられる点も大きな魅力です。

なぜ「GBase on Spark」なのか

1. コスト:従来GPUサーバーの約1/20レベル

従来、オンプレミスで大規模言語モデルを運用しようとすると、専用のGPUサーバーが必要となり、1台あたり数百万円クラスの投資が前提になるケースが一般的でした。

NVIDIA Sparkクラスのマシンであれば、価格帯はおよそ数十万円レベルから検討でき、同等のLLM推論環境を構築した場合でも、ハードウェアコストを従来の1/20程度まで抑えられる可能性があります。

GBase on Sparkは、こうした「手の届く価格帯のSparkマシン1台〜」から利用できるように設計されており、これまでオンプレLLMを諦めざるを得なかった企業にとっても、現実的な選択肢となります。

2. 量子化LLM:1台のSparkに企業向け機能を凝縮

LLM+VLMのデュアル構成により、手書きメモ、スキャン文書、図解付きマニュアルなど、あらゆる複雑ドキュメントを理解・回答可能。

量子化+ARM最適化により、これら高機能モデルがSpark 1台上でスムーズに動作し、社内FAQからTable RAG、画像解析まで一括対応します。

3. データセキュリティとオンプレ完結

GBase on SparkとSparkの組み合わせでは、LLM推論やRAG検索をすべて社内ネットワーク内で完結させることができます。

機密情報や社外秘資料をクラウドに送信する必要がなく、ゼロトラストやデータ主権の観点からも安心して利用できます。

アクセス制御や権限管理、操作ログの記録機能により、「誰が・いつ・どの情報にアクセスしたか」を追跡できるため、内部統制やコンプライアンスの要件にも対応しやすく、金融・公共・製造など、クラウド前提の運用に踏み切りづらい組織にも適した構成です。

4. 運用コスト:ほぼメンテナンスフリーに近い構成

Sparkは完成度の高いAIサーバーとして提供されており、ハードウェア周りの設定やチューニングに過度な工数を割く必要がありません。

GBase on Sparkも、ブラウザベースの管理画面や自動ログ取得・モニタリング機能を備えており、ユーザー管理やナレッジベースの運用を一つのインターフェースで完結させることができます。

その結果、「インフラ専任の担当を置かなければ運用できない」といった状況ではなく、既存の情報システム部や企画部門と連携しながら、日常運用にかかる工数を最小限に抑えた、ほぼメンテナンスフリーに近い運用体制を構築しやすくなります。

GPT-4oクラスをオンプレミスで実現

GBase on Sparkでは、最先端のオープンソースLLMをインストール可能。1台のSparkで数十人同時接続をサポート、32kコンテキスト下TTFT 10秒以内、128K+長文対応。

モデル種類

OpenAI OSS-GPT-120B

OpenAI初オープンウェイト推論モデル。GPT-4oクラス性能(総パラメータ117B、有効5.1B/token、コンテキスト128K、Apache 2.0)

Qwen3-Next-80B(Alibaba)

次世代MoEモデル。GPT-4o媲美、10倍推論速度+超長文(総80B、有効3.9B/token、コンテキスト256K、Apache 2.0)

gbase-onsparkとgpt-4oの性能比較

GBase on Sparkが提供する主な機能

GBase on Sparkは、社内に散在する情報を「安全にまとめて、すぐ引き出せる状態」にするための機能を一通り備えています。

  • 多様な複雑文書対応:手書き・スキャン・図解付きPDF/Word/Excelなど、あらゆる形式をLLM+VLMで解析

  • 高精度チャット+引用ハイライト:参照元を明示し、回答の信頼性を担保

  • Q&A蓄積+継続学習:利用でナレッジが自動拡充

  • セキュリティ機能:権限制御・利用ログ記録・監査対応

Sparkが担う「前処理・更新エンジン」の役割

GBase on Sparkがナレッジベースと対話インターフェースを担う一方で、Sparkは「データの前処理・更新エンジン」として機能します。

  • 複雑文書のテキスト化・クレンジング・ベクトル化をGPUで一括処理

  • 新規文書追加時に自動でRAGインデックス更新

  • ナレッジベースを常に最新状態に維持

これにより、「ナレッジベースを作ったはいいが、すぐに古くなってしまう」という問題を避けやすくなり、GBase on Spark上のエージェントが、常に最新に近い情報を踏まえて回答できる状態を保ちやすくなります。

どんな課題を解決できるのか

  • 高額な専用GPUサーバーに頼らず、Spark 1台からオンプレLLM・RAG基盤を構築できることで、初期投資のハードルを下げられる。

  • 量子化LLMとGPU加速により、リソースが限られたオンプレ環境でも、社内FAQやナレッジ検索に十分な性能を確保しやすくなる。

  • 社内マニュアルや議事録、仕様書などを横断的に検索できるようにすることで、「必要な情報を探す時間」を大幅に削減できる。

  • 機密データを社外に出さずに生成AIを活用できるため、セキュリティ要件の厳しい組織でも導入を検討しやすくなる。

業務で見る活用シーン

問い合わせ対応支援(社内ヘルプデスク/フロント業務)

社内ヘルプデスク(IT・総務・人事):PCトラブル、経費精算ルール、休暇制度などへの24時間一次対応。担当者負担軽減+社員待ち時間ゼロ。

フロント業務(店舗・コールセンター):商品情報、営業時間、ルール説明などへのオペレーター支援。新人でもベテラン品質の応対を実現。

近日公開予定:文書自動生成機能により、定型回答書・FAQマニュアル・提案書テンプレートなどを、蓄積ナレッジから自動作成。問い合わせ対応から「文書作成業務」まで一気通貫で効率化します。

ナレッジ活用・属人化解消

手書きメモ、スキャン仕様書、議事録、保守手順書など、従来検索しづらかった非構造化資産をRAG化し、全社横断で即時引き出し可能に。

製造保守、営業提案、カスタマーサクセスなど、部署ごとの属人化ノウハウを「誰でも使える状態」に変換し、スキル平準化・新人立ち上がり加速を実現します。

今すぐ始められる次のステップ

無料相談・デモからスタート

  • まずは「社内資料検索」「社内ヘルプデスク」「特定部門のナレッジ共有」など、貴社の1つの業務シーンを選んで、スモールスタートすることをおすすめします。

  • ショッピングセンター接客、社内ITヘルプデスク、工場保守といった現場に近いユースケースでも、2週間でPoC完了、1ヶ月で本番稼働まで進めることが可能です。

  • 既存サーバー/GPU環境をお持ちの場合は、その環境を活かしたデモ環境の即日構築にも対応できます。

お問い合わせはこちらから

30分のオンライン相談で、「自社の業務でも本当に使えるのか」「どこから始めるのが良いか」を一緒に整理させていただけます。

導入事例や機能の詳細がわかる資料も、サイトから無料でダウンロードいただけます。

今後の展望

会議記録自動化:音声から議事録生成、要点抽出/アクションアイテム整理/共有一括、過去蓄積で検索可能。

文書自動生成:ナレッジから定型回答/FAQ/提案書テンプレート自動作成、問い合わせ~文書業務一気通貫効率化。

会社概要

社名: Sparticle株式会社

所在地: 東京都中央区日本橋小伝馬町6-12 日本橋森ビル 3F

代表者: 代表取締役 金田達也

事業内容:

- AIコンサルティング事業

- AI研究開発事業

- AIプロダクト事業

- AIソフトウェア設計およびソフトウェア開発に関連するサービス

- SaaS

- クラウドサービス導入支援

URL: https://www.sparticle.com/

お問い合わせ

Sparticle株式会社 広報担当

お問い合わせフォーム: https://news.sparticle.com/contact/

Tel: 03-3527-2828

すべての画像


会社概要

Sparticle株式会社

20フォロワー

RSS
URL
https://meet.felo.me/introduce
業種
情報通信
本社所在地
東京都中央区日本橋小伝馬町6−12 日本橋 森ビル 3F
電話番号
03-3527-2828
代表者名
金田 達也
上場
未上場
資本金
9000万円
設立
2020年07月