講演情報
[7B-01]深層強化学習を用いた月面洞窟探索ローバ群の動的経路最適化
*原 亜美佳1、鳥越 湧真1、山本 拓実1、金城 富宏1,2、田原 康之1、清 雄一1 (1. 電気通信大学、2. 宇宙航空研究開発機構)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
機械学習、DQN、マルチロボット、協調、惑星探査
本研究では,月面に存在すると想定される地下地形環境において,複数台の自律移動探査ロボット(ローバ)群が効率的かつ適応的に経路を決定・修正する手法を提案する.月の洞窟内部は衛星観測や地中レーダデータから得られるデータを基に事前に経路を設計できるものの,実際の環境との差異が生じる可能性があり,その場合は経路を動的に変化させる必要がある。提案手法では,事前に正確ではない環境情報を基にローバが行動した結果をDeep Q-Network(DQN)によって学習させ,その学習結果を活かして個々のローバが環境変化に適応的な経路修正を行う.シミュレーション実験を通じて,DQNベースの手法による動的な経路決定が有効であることを示す.