Presentation Information

[4D1-OS-1-04]Application of DreamerV3 to Lifelong MAPF Considering Workers in Warehouses

〇Jumpei Kawahara1, Yoshihiro Ueda2, Takayoshi Morii2, Katsuhide Fujita1 (1. Tokyo University of Agriculture and Technology, 2. TOPPAN Digital Inc.)

Keywords:

Lifelong MAPF,Picking Warehouse,Carrier,Model-Based Reinforcement Learning,Dreamer

近年,マルチエージェント技術の社会実装が進んでおり,その1つに物流倉庫におけるピッキング作業の自動化が挙げられる. この自動化において,作業者と自律搬送ロボット(AMR)が協働するハイブリッド型ピッキングシステムは,既存レイアウトを維持しつつ安価に導入できる利点がある. しかし,作業者とロボットが混在する環境下であるためデッドロックが発生しやすい. 一方,多くの先行研究では,他エージェントの行動予測モデルを保持しないため,周囲の状態に対する将来予測に限界がある. そこで,本研究では,モデルベース強化学習DreamerV3を用いた経路探索手法を提案する. 学習済みの世界モデルを活用することで,実行時の計算負荷を上げずに環境の将来予測を取り入れることができる. 本手法により,リアルタイム性を維持しながら,デッドロックの回避と搬送効率の向上を両立させる. また,検証実験では,既存手法との比較を通じて,搬送効率や総移動距離における提案手法の有効性を明らかにする.