講演情報
[4M5-GS-2f-05]敵対生成プロンプト同時探索による内省型プロンプト最適化
〇井上 耕太朗1 (1. 株式会社SmartHR)
キーワード:
敵対的学習、ハルシネーション検知、プロンプト最適化
大規模言語モデル(LLM)の出力品質はプロンプトに強く依存する。しかし実社会の課題では十分な教師データを事前に用意できず、プロンプト最適化はコールドスタートとコストの両面で難しい。そこで本研究は内省により少ない反復でプロンプト最適化を実現するGEPAを基盤に、敵対的学習を統合したAdversarial GEPAを提案する。提案手法は対象プロンプトの最適化に加え、それを攪乱する敵対生成プロンプトも同時に最適化する。また対象プロンプトの改善のたびに敵対的サンプルを再生成し、評価難易度を段階的に向上させることで、より高度なプロンプト最適化を促す。提案手法はハルシネーション検知タスクにおいて、最小4サンプルから開始した最適化結果が既存手法よりもAUROCやF1といった多角的指標で高い精度を達成した。
