Presentation Information

[5I1-OS-3-05]Safe Reinforcement Learning-based Exploration of Optimal UAV Positions for Wireless Power Transfer

〇Kazunobu Serizawa1, Kazumune Hashimoto1, Junya Ikemoto1, Masako Kishida2, Shigemasa Takai1 (1. The University of Osaka, 2. University of Tsukuba)

Keywords:

Reinforcement Learning,Drones,Control Barrier Function,Wireless Power Transfer

電波を用いた無線電力伝送(Wireless Power Transfer: WPT)の研究開発が進められており,飛行中のドローンへの給電手段としての活用が検討されている.無線給電ドローンの受電電力は,送電アンテナに対するドローンの相対位置,ビーム形状,受電アンテナの構成といった複数の要因に依存する.そのため,受電電力が最大となる最適な給電位置を解析的に求めることは困難である.本研究では,受電電力に基づく報酬設計のもとで,オフライン強化学習により最適な給電位置を探索する枠組みを検討する.従来の強化学習手法では,探索過程で給電領域から外れる可能性があり,報酬の受電電力が低下することで学習が停滞する恐れがある.そこで,本稿では給電領域を安全領域として定義し,制御バリア関数(Control Barrier Function: CBF)に基づく安全制約を組み込むことで,効率的に探索を行う手法を提案する.数値シミュレーションにより,CBFを用いない場合と比較して領域逸脱が抑制され,効率的に最適な給電位置を探索できることを確認した.