講演情報

[5F3-GS-10s-05]強化学習を用いた妨害対応型パズルゲームAIの構築と評価

〇岡田 飛彩1、森山 甲一1、松井 藤五郎2、島 孔介1、武藤 敦子1、犬塚 信博1 (1. 名古屋工業大学、2. 中部大学)

キーワード:

強化学習、ぷよぷよ、落ち物パズルゲーム、AlphaGo Zero、おじゃまぷよ

対戦型パズルゲームにおいては,妨害要素を含む環境下での盤面安定性と連鎖構築能力の両立が求められる.一方で,深層強化学習手法をこのようなゲームに適用した際の性能特性や限界については,十分に整理されていない.本研究では,ぷよぷよを対象とし,AlphaGo Zeroの枠組みを応用した強化学習型ゲームAIを構築した.妨害ぷよが降下する1人プレイ環境において自己対戦学習を行い,平均獲得スコア,連鎖数,生存手数などの指標を用いて性能評価を行った.実験の結果,提案手法は,対象環境に特化していないこともあり,実験では環境に特化した既存AI手法に比べて劣る結果となったが,無連鎖行動の発生率が低く,盤面の安定性を重視した行動特性が確認され,強化学習による戦略獲得の可能性が示唆された.これらの結果から,妨害を含むパズルゲーム環境における強化学習手法の適用可能性と課題について考察する.