講演情報
[1M4-GS-5x-05]非定常リソース制約下における適応的タスクスケジューリング:指数関数的 疲労コストと MaxEnt IRL による動的選好推定
〇山口 雅和1 (1. 日々創発)
[[オンライン]]
キーワード:
ヒューマンエージェントインタラクション、適応的スケジューリング、逆強化学習、指数関数的コスト関数、リソース制約
本研究は、Human-Agent Interaction (HAI) において、ユーザーの内部リソース(体力・気力)が非定常かつ非線形に変動する環境下での最適行動計画問題を扱う。既存の静的なスケジューリング手法では、変動する身体的制約への適応が困難である。そこで本稿では、リソース残量に依存して実行コストが指数関数的に増大する「動的疲労コストモデル」を提案し、これをリソース枯渇を回避するための制御バリア関数として機能させる。さらに、ユーザーの潜在的な価値観(選好)を動的に学習するため、行動履歴から報酬関数を推定する最大エントロピー逆強化学習 (MaxEnt IRL) を導入する。離散事象シミュレーション実験の結果、リソース低下時にコスト関数の急上昇を検知したエージェントが、自律的に低負荷な代替タスク (Minimum Viable Product) へと提案を切り替えるスイッチング挙動が確認された。これにより、ユーザーの長期的目的関数を最大化しつつ、システムの持続可能性 (Sustainability) を確保する適応的アーキテクチャの工学的有効性を示した。
