Aladdin Securityは2025年9月22日、セキュリティサービス「AIレッドチームサービス」を提供開始したと発表した。攻撃者の視点で生成AIシステムを検証し、リスクを顕在化させる。生成AIが持つ有害出力、バイアス、誤情報、機密情報漏洩、不正利用などのリスク/脆弱性を事前に検出する。シナリオ設計、攻撃の実施、評価、改善提案の4ステップで構成する。
Aladdin Securityの「AIレッドチームサービス」(画面1)は、サイバー攻撃者の視点で生成AIシステムを検証し、存在するリスク/脆弱性を可視化するセキュリティサービスである。
生成AIが持つ有害出力、バイアス、誤情報、機密情報漏洩、不正利用などのリスク/脆弱性を事前に検出する。リスク/脆弱性検出の対象として、以下の生成AIシステム/ユースケースを挙げている。
- チャットボット・顧客対応AI(コールセンター、FAQ応答など)
- 業務支援AI(社内文書検索、RAGシステム、自動要約など)
- 生成系アプリケーション(文章生成、コード生成、画像生成AIなど)

以下の4つのステップでサービスを実施する。
- リスクヒアリング・設計:利用中または導入予定のAIシステムに合わせ、対象範囲・攻撃シナリオを設計する。
- 攻撃シミュレーション:ジェイルブレイク攻撃、アドバーサリアルプロンプト、情報漏洩誘発、バイアステストなど、各種の攻撃を実行し、AIの脆弱性を検証する。
- 評価・レポーティング:発見したリスクを体系的に分類し、深刻度・影響範囲を提示する。経営層向けサマリーと技術チーム向け詳細レポートを提供する。
- 改善提案:対策案を提示する。継続的にAI防御体制を強化する。
今後はAIレッドチーム演習を自動化する予定。攻撃の自動生成や検証の仕組みの高度化により、これまで人手に依存していた演習工程を効率化。より迅速かつ網羅的にAIリスクを可視化できる仕組みを構築するとしている。