講演情報
[4N5-GS-10g-02]深層強化学習を用いた歩行者群衆の経路選択モデル
〇藤川 直人1、藤井 秀樹1 (1. 東京大学)
キーワード:
群衆シミュレーション、深層強化学習、経路選択
群衆シミュレーションは、歩行者の軌跡を計算機を用いて再現する手法であり、防災や建築設計、コンピュータグラフィクスなどへの応用が期待されている。既存のモデルは単純なマップでは妥当な結果を再現できる一方で、複雑なマップにおいて選択経路にエージェントごとのばらつきが見られないといった、非現実的な挙動が見られる場合がある。
本研究は、より現実に近い通行経路の再現を目的として、深層強化学習を用いた新たな経路選択モデルを提案する。具体的には、歩行者の経路選択を積分型の効用関数の最大化問題として定式化し、深層強化学習を用いて期待収益が最大となる方策を学習させることで、各時点での観測結果を踏まえた次ステップの速度を出力する。
目的地への方向の代替としてディスタンスマップを観測として与えることで、学習に使用していない複雑な形状のマップにおいても、妥当な経路を出力する汎化性能が確認された。また、希望移動速度についても観測に含めることで、異なる希望移動速度を持つ群衆を単一の方策で再現可能であることが示された。
本研究は、より現実に近い通行経路の再現を目的として、深層強化学習を用いた新たな経路選択モデルを提案する。具体的には、歩行者の経路選択を積分型の効用関数の最大化問題として定式化し、深層強化学習を用いて期待収益が最大となる方策を学習させることで、各時点での観測結果を踏まえた次ステップの速度を出力する。
目的地への方向の代替としてディスタンスマップを観測として与えることで、学習に使用していない複雑な形状のマップにおいても、妥当な経路を出力する汎化性能が確認された。また、希望移動速度についても観測に含めることで、異なる希望移動速度を持つ群衆を単一の方策で再現可能であることが示された。
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
