講演情報

9:30 〜 9:45

[4D1-OS-1-03]高密度マルチエージェント経路計画における譲り合い動作の学習

〇牧野寛也¹、野城滉司²、長谷部浩二²、伊藤誠悟¹ (1. 株式会社豊田中央研究所、2. 筑波大学)

キーワード：

マルチエージェント経路計画、マルチエージェント強化学習、模倣学習、混雑環境

柔軟性やスケーラビリティといった利点により，近年，強化学習に基づくマルチエージェント経路計画手法が数多く提案されている．しかし，既存手法にはエージェント密度が高くなると成功率が低下するという問題がある．例えば，先にゴールしたエージェントがその場に留まることで，他のエージェントをブロックしてしまう．エージェント数が増加しても高い成功率を維持するため，本研究では Learning to Yield in Congested Multi-Agent Path Finding (LYCO) を提案する．LYCO は，軽量でスケーラブルな分散アルゴリズム Priority Inheritance with Backtracking (PIBT) をエキスパートとした模倣学習を用いる．さらに，局所的な譲り合いを促すよう観測設計と報酬設計を工夫する．数値実験では，既存手法と比較して，高エージェント密度条件で高い成功率を示した．

セッション詳細へ戻る