講演情報
[4E5-GS-11b-05]プロンプトインジェクションを用いた機密情報を窃取する攻撃の評価
〇早坂 健一郎1、小関 義博1、岡原 英輝1 (1. 三菱電機株式会社)
キーワード:
プロンプトインジェクション、大規模言語モデル
大規模言語モデル(LLM)を利用したサービスでは、外部からの悪意あるプロンプトによってサービス提供者が意図しない動作を誘発するプロンプトインジェクションが脅威となる場合がある。本研究では、事前にLLMに付与した秘密の情報を不正に漏洩させるプロンプトインジェクションのデータセットを作成し、複数のモデルを対象に秘密の情報を漏洩するか実験を行った。また、英語のテキストで記述されたプロンプトだけでなく、日本語や画像に変換されたプロンプトもデータセットに加えて実験を行った。結果、Llama 4 Maverickに対する攻撃成功の割合が最も高い約33%で、特に画像に変換された日本語のプロンプトの攻撃成功の割合が高いことが分かった。
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
