【京大×東大発AIセキュリティ】Aladdin Security、OpenAI主催「GPT-OSS 20B Red Teaming」大会にて入賞

〜汎用的かつ再現性のあるJailbreak手法が評価〜

Aladdin Security株式会社

2025年9月22日 10時01分

【概要】

AIセキュリティ事業を展開するAladdin Security株式会社（本社：京都市、代表取締役CEO：勘佐圭吾）は、日本補助金支援機構の志田遥飛氏と共同で、OpenAIが主催する国際的なセキュリティ競技大会「GPT-OSS 20B Red Teaming」に参加し、入賞を果たしました。

本大会は世界中の研究者・開発者が集い、大規模言語モデルのリスクを検証することを目的として実施されたもので、当社が持つAIリスク評価・防御技術の優位性が改めて証明される結果となりました。

【大会の背景】

近年、生成AI（Generative AI）の普及が急速に進む一方で、有害出力・機密情報漏洩・AIの不正利用といった新たなセキュリティリスクが顕在化しています。

こうした課題に対応するため、OpenAIは「GPT-OSS 20B Red Teaming」を開催し、参加者が独自の攻撃手法や脆弱性検証を持ち寄り、安全性向上に資する成果を競い合いました。

【Aladdin Securityの成果】

当社チームは、

◼︎Jailbreak脆弱性の再現性ある検出

実験ではJailBreak手法の組み合わせ数を単純に増加させていくだけでJailbreakの成功確率が上昇する結果が得られました

◼︎エージェントの不正なツール利用の呼び出し

◼︎エージェントのsabotage(仕事放棄)に関する弱点の抽出

大規模言語モデルに対する汎用的かつ再現性のある従来検知が難しかった脅威の実証に成功しました。

本アプローチは以下の点で高く評価されました。

・再現性：単発の偶発的成功ではなく、体系的な手法として検証可能

・実効性：既存のセーフガードを迂回し、有害出力を誘発可能であることを立証

・汎用性：特定のモデルに依存せず、広範囲の生成AIに適用可能

これにより、今後のAIファイアウォールやRed Teamingサービスの技術的基盤をさらに強化する成果となりました。

技術記事：

【受賞手法解説】OpenAI主催のセキュリティコンペで発見した脆弱性について解説

【大会講評】

【今後の展望】

Aladdin Securityは「セキュアなAI活用の社会実装」を目的に

・AIファイアウォール

・AIレッドチーム演習サービス

・AIマネジメントツール「AI-Fortress」

などの提供を通じ、企業のAIリスク低減に貢献してまいります。

今回の入賞を契機に、国内外の金融機関・大企業を中心に、生成AIの安心安全な活用を支えるリーディングカンパニーを目指します。

【Aladdin Security株式会社について】

Aladdin Securityは「A Whole New World~新しい世界を創出する~」ことをミッションに掲げるAIセキュリティカンパニーです。企業がセキュアなAI活用を実現するために生成AIに対するシャドーAI検出、AIガバナンスの可視化、AIファイアウォールなどのソリューションを提供し、国内外企業の安全なAI活用を支援しています。

【会社概要】

社名：Aladdin Security株式会社

所在地：京都府京都市上京区甲斐守町97西陣産業創造會館

代表者：代表取締役勘佐圭吾

設立：2025年2月

事業内容：AIセキュリティ事業、サイバーセキュリティサービス
ホームページ：https://aladdin-security.net/

【問い合わせ先】

Aladdin Securityお問い合わせメール：info@aladdin-security.net

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザーログイン

メディアユーザー新規登録無料

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。