講演情報
[5I1-OS-3-03]エキスパート情報再構成に基づくハイブリッド車エネルギーマネジメントのための方策学習
〇Wang Yuepeng1、瀋 迅1 (1. 東京農工大学)
キーワード:
人工知能、学習型制御
ハイブリッド電気自動車のエネルギーマネジメントにおいて,深層強化学習は収束の遅さや未知走行条件に対する汎化性能の不足という課題がある.本研究では,動的計画法により大域最適方策を再構成し,その専門家データを活用した二段階学習手法を提案する.まず逆強化学習により専門家の意思決定構造と整合的な報酬を推定し,次にその報酬に基づいて方策を最適化する.価値学習と方策更新を分離することで学習の安定化と高速収束を実現し,複数走行サイクルにおいて高い燃費性能と汎化能力を確認した.
