チェック・ポイント傘下のAIセキュリティプラットフォームLakera、LMM特化のAIエージェント向けオープンソースセキュリティベンチマークを発表
「脅威スナップショット」によってAIエージェントの脆弱性を可視化し、現実世界の様々な攻撃に対するセキュリティ態勢の強化に貢献
サイバーセキュリティソリューションのパイオニアであり、世界的リーダーであるチェック・ポイント・ソフトウェア・テクノロジーズ(Check Point Software Technologies Ltd.、NASDAQ:CHKP、以下チェック・ポイント)と、チェック・ポイント傘下で、世界有数のエージェンティックAIアプリケーション向けのAIネイティブセキュリティプラットフォームであるLakeraは、英国AIセキュリティ研究所(The UK AI Security Institute、AISI)の研究者と共同で、AIエージェント内のLLM(大規模言語モデル)のセキュリティに特化したオープンソースのセキュリティ評価ツール「Backbone Breaker Benchmark(以下b3)」のリリースを発表しました。
b3は、「脅威スナップショット」という新しいコンセプトに基づいて構築されています。AIエージェント全体を最初から最後までシミュレートするのではなく、大規模言語モデルの脆弱性が最も発生しやすい重要なポイントに焦点を絞ります。これらの正確なタイミングでモデルをテストすることで、AIモデル開発者やモデルのプロバイダーは、エージェント全体のワークフローをモデル化する複雑さやオーバーヘッドなしに、より現実的な敵対的攻撃に対してシステムがどの程度耐えられるかを確認することができます。
Lakeraの共同創設者兼チーフサイエンティストであるマテオ・ロハス=カルーラ(Mateo Rojas-Carulla)は、次のように述べています。
「今日のAIエージェントは、その基盤となるLLMのセキュリティレベルに依存しています。そのため、私たちはb3ベンチマークを開発しました。『脅威スナップショット』を活用することで、これまで複雑なエージェントワークフローの中に隠れていた脆弱性を体系的に発見できるようになりました。このベンチマークをオープンソースとして公開することで、開発者やモデルプロバイダーが、より実践的な方法でセキュリティレベルを測定し、向上させるためのツールを提供したいと考えています」
b3は、10種類の代表的な「脅威スナップショット」と、ゲーム化されたレッドチーミング演習ツール、Gandalf: Agent Breaker を通じて収集された、19,433件の高品質な攻撃データセットを組み合わせたものです。システムプロンプトの漏えい、フィッシングリンクの挿入、悪意あるコードの注入、DoS攻撃、不正なツール呼び出しなど、様々な攻撃に対する脆弱性を評価します。
31種類の主要なLLMを検証した初期の研究結果から、以下の重要な知見が明らかになりました。
-
推論能力の向上は、セキュリティの大幅な改善につながる
-
モデルのサイズとセキュリティ性能には相関関係がない
-
クローズドソースのモデルは、一般的にオープンソースモデルを上回る性能を示すが、上位のオープンモデルはその差を縮めつつある
b³は現在、オープンソースライセンスのもと https://arxiv.org/abs/2510.22620 からご利用いただけます。
Gandalf: Agent Breakerは、現実的なシナリオの中でAIエージェントを攻略・悪用することに挑戦するハッキングシミュレーターゲームです。ゲーム内の10種類の生成AIアプリケーションは、実際のAIエージェントの動作を再現しています。各アプリケーションには、複数の難易度、多層的な防御機能、そしてプロンプトエンジニアリングからレッドチーミングまで幅広いスキルセットに対応した最新の攻撃対象領域が用意されています。チャットべースのアプリもあれば、コードレベルの思考、ファイル処理、メモリ、外部ツールの使用に依存するものもあります。
Gandalfの初期バージョンは、Lakeraの社内ハッカソンから誕生しました。秘密のパスワードを保持するLLMに対し、ブルーチームとレッドチームが最強の防御と攻撃の構築を競い合う中で生まれたものです。2023年のリリース以来、世界最大級のレッドチームコミュニティへと成長し、8,000万件を超えるデータポイントを生成しています。当初はゲームとして開発されましたが、現在では生成AIアプリケーションの実際の脆弱性を明らかにし、AIファーストセキュリティの重要性に対する認識を高める役割を果たしています。
Lakeraについて
Lakeraは、エージェント型AIアプリケーション向けの世界有数のAIネイティブ・セキュリティ・プラットフォームであり、フォーチュン500企業や大手テクノロジー企業を最新のAIサイバーリスクから保護しています。Lakeraの防御システムは、世界有数のレッドチーミングコミュニティであるGandalfと独自のAIにより、リアルタイムで進化し、企業を新たな脅威から保護します。Lakeraは、2021年にDavid Haber、Mateo Rojas-Carulla博士、Matthias Kraft博士によって設立され、チューリッヒとサンフランシスコに本社を置いています。詳細については、Lakera.ai、もしくはGandalf、Gandalf:Agent Breakerをご覧ください。LinkedInでの情報発信もご確認ください。
チェック・ポイントについて
チェック・ポイント・ソフトウェア・テクノロジーズ(https://www.checkpoint.com/)は、デジタルトラストのリーディングプロバイダーとして、AIを駆使したサイバーセキュリティソリューションを通じて世界各国の10万を超える組織を保護しています。同社のInfinity Platformとオープンガーデン型エコシステムは、防止優先のアプローチで業界最高レベルのセキュリティ効果を実現しながらリスクを削減します。SASEを中核としたハイブリッドメッシュネットワークアーキテクチャを採用するInfinity Platformは、オンプレミス、クラウド、ワークスペース環境の管理を統合し、企業とサービスプロバイダーに柔軟性、シンプルさ、拡張性を提供します。Check Point Software Technologiesの全額出資日本法人、チェック・ポイント・ソフトウェア・テクノロジーズ株式会社(https://www.checkpoint.com/jp/)は、1997年10月1日設立、東京都港区に拠点を置いています。
ソーシャルメディア アカウント
・Check Point Blog: https://blog.checkpoint.com
・Check Point Research Blog: https://research.checkpoint.com/
・YouTube: https://youtube.com/user/CPGlobal
・LinkedIn: https://www.linkedin.com/company/check-point-software-technologies/
・X: https://x.com/checkpointjapan
・Facebook: https://www.facebook.com/checkpointjapan
将来予想に関する記述についての法的な注意事項
本プレスリリースには、将来予想に関する記述が含まれています。将来予想に関する記述は、一般に将来の出来事や当社の将来的な財務または業績に関連するものです。本プレスリリース内の将来予想に関する記述には、チェック・ポイントの製品およびソリューションならびにLakeraの製品およびソリューションに関する見通し、Lakeraの機能を活用し統合する当社の能力、エンドツーエンドのAIセキュリティスタックを提供する当社の能力、チェック・ポイントの新たなGlobal Center of Excellence for AI Security設立に関する記述、そして買収の完了に関する記述が含まれますが、これらに限定されるものではありません。これらの事項に関する当社の予想および信念は実現しない可能性があり、将来における実際の結果や事象は、リスクや不確実性がもたらす影響によって予想と大きく異なる可能性があります。本プレスリリースに含まれる将来予想に関する記述に伴うリスクや不確実性は、2025年3月17日にアメリカ合衆国証券取引委員会に提出した年次報告書(フォーム20-F)を含む証券取引委員会への提出書類に、より詳細に記されています。本プレスリリースに含まれる将来予想に関する記述は、本プレスリリースの日付時点においてチェック・ポイントが入手可能な情報に基づくものであり、チェック・ポイントは法的に特段の義務がある場合を除き、本プレスリリース記載の将来予想に関する記述について更新する義務を負わないものとします。
本件に関する報道関係者からのお問い合わせ
チェック・ポイント広報事務局 (合同会社NEXT PR内)
Tel: 03-4405-9537 Fax: 03-6739-3934
E-mail: checkpointPR@next-pr.co.jp
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
