Presentation Information
[2L5-GS-5a-03]Mutual Reward Adjustment Using Inequity Aversion in Sequential Social Dilemmas
〇Shoma Mizuno1, Keiichi Namikoshi1, Yuko Sakurai1 (1. Nagoya Insutitute of Technology)
Keywords:
Multi-Agent System,Game Theory,Multi-Agent Reinforcement Learning
逐次社会的ジレンマは,マルチエージェントシステムにおける逐次意思決定問題において,個人と社会的な最適解が一致しない社会的ジレンマを内包する問題である.この問題において,相互報酬調整は,強化学習を用いるエージェント間で報酬を調整することで協調的な解を獲得する.既存手法では,学習状況に応じた「トークン」を送信する相互通信プロトコルの有効性を検証している.一方でこの手法は,トークンで扱える情報量が限られることに加え,近傍エージェントとの相対比較や罰則といった概念が含まれない.そこで本研究は,既存手法に動的なトークンと不平等嫌悪の概念を取り入れることで,集団の利益をより改善できることを示す.
