講演情報
[4N5-GS-10g-05]交通シミュレータを用いた強化学習による交通流の最適化と渋滞緩和
〇伊藤 陸人1、井上 寛康1,2 (1. 兵庫県立大学大学院情報科学研究科、2. 理化学研究所計算科学研究センター)
キーワード:
信号制御、強化学習、交通シミュレーション
交通信号制御における強化学習では、エージェントが観測する状態表現が学習性能に大き な影響を与える。 しかし、従来の研究は単一交差点や理想化されたグリッド形状のネットワ ークにおける検証が中心であり、実環境を模した不均一な道路構造や複数交差点が相互に 影響し合う環境において、状態表現が制御性能や協調学習に与える影響は十分に解明され ていない。本研究では、神戸市三宮地区の複雑な道路網を対象に、マルチエージェント (MA2C)および独立型(IA2C)の 2 つのモデルを用いて、占有率(Occ)と行列長(QL)の状態表現が学習挙動と交通制御性能に与える影響を比較・検証した。実験の結果、状態表 現の有効性は学習手法に依存することが明らかとなった。 各エージェントが独立に学習する IA2C では局所的な混雑を反映する QL が有効であったのに対し、協調学習を行う MA2C で は交差点間距離を考慮した Occ を用いることで平均待ち時間が低減した。これは、広域的 な交通状況を表現できる状態表現が、エージェント間の協調的な方策更新に有利に働く可 能性を示唆している。本知見は、実環境への強化学習適用における最適な状態設計への指針を与えるものである。
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
