講演情報

[4D1-OS-1-05]失敗学習機構を備えたマルチエージェントプランニングシステム

〇東松 哲見1、古川 岳澄1、上野 侑紗2、栗原 聡1 (1. 慶應義塾大学理工学部、2. 慶應義塾大学大学院理工学研究科)

キーワード:

タスクプランニング、ロボティクス、物体把持、マルチエージェント

即応性と熟考性を両立し,かつ説明可能性を備えた手法としてAgent Network Architecture(ANA)が提案されている.ANAは記号的に表現された行動エージェント間の活性伝播により動的環境に適応したプランニングを可能とする.しかし,従来のANAは行動失敗の原因を明示的に表現・学習する仕組みを持たず,同一の失敗を繰り返すという問題があった.本研究では,ANAが行動失敗から学習し適応的に振る舞うための拡張手法を提案する.提案手法では,行動エージェントの失敗時における環境状態に着目し,失敗と高い相関を持つステータスを統計的に推定する.この失敗原因ステータスを介した3種類の活性伝播を導入し,失敗を引き起こしやすい状態での行動発火を回避するとともに,失敗原因を打破する行動を間接的に促進する.ロボットの物体把持タスクを対象とした実験の結果,従来のANAと比較して把持失敗の繰り返しが抑制され,成功率およびタスク達成の安定性が向上した.これにより,提案する失敗学習機構がANAの実環境適用において有効であることが示された.