講演情報
[4D1-OS-1-03]高密度マルチエージェント経路計画における譲り合い動作の学習
〇牧野 寛也1、野城 滉司2、長谷部 浩二2、伊藤 誠悟1 (1. 株式会社豊田中央研究所、2. 筑波大学)
キーワード:
マルチエージェント経路計画、マルチエージェント強化学習、模倣学習、混雑環境
柔軟性やスケーラビリティといった利点により,近年,強化学習に基づくマルチエージェント経路計画手法が数多く提案されている.しかし,既存手法にはエージェント密度が高くなると成功率が低下するという問題がある.例えば,先にゴールしたエージェントがその場に留まることで,他のエージェントをブロックしてしまう.エージェント数が増加しても高い成功率を維持するため,本研究では Learning to Yield in Congested Multi-Agent Path Finding (LYCO) を提案する.LYCO は,軽量でスケーラブルな分散アルゴリズム Priority Inheritance with Backtracking (PIBT) をエキスパートとした模倣学習を用いる.さらに,局所的な譲り合いを促すよう観測設計と報酬設計を工夫する.数値実験では,既存手法と比較して,高エージェント密度条件で高い成功率を示した.
