講演情報

[2L5-GS-5a-03]社会的ジレンマにおける不平等嫌悪を用いた相互報酬調整

〇水野 翔真1、浪越 圭一1、櫻井 祐子1 (1. 名古屋工業大学)

キーワード:

マルチエージェントシステム、ゲーム理論、マルチエージェント強化学習

逐次社会的ジレンマは,マルチエージェントシステムにおける逐次意思決定問題において,個人と社会的な最適解が一致しない社会的ジレンマを内包する問題である.この問題において,相互報酬調整は,強化学習を用いるエージェント間で報酬を調整することで協調的な解を獲得する.既存手法では,学習状況に応じた「トークン」を送信する相互通信プロトコルの有効性を検証している.一方でこの手法は,トークンで扱える情報量が限られることに加え,近傍エージェントとの相対比較や罰則といった概念が含まれない.そこで本研究は,既存手法に動的なトークンと不平等嫌悪の概念を取り入れることで,集団の利益をより改善できることを示す.