Presentation Information
[2Yin-A-51]Traffic Risk Estimation via Stepwise Reasoning and Structured Knowledge Reference in Large Vision-Language Models
〇Tatsuya Kobayashi1, Takamichi Isowa1, Kotaro Fujimura1, Reo Shimoda1, Kentaro Yamada1 (1. Honda R&D Co.,Ltd.)
Keywords:
Vision-Language Model,Traffic Risk Estimation,Stepwise Reasoning
本稿では,対話型ドライビングエージェントによる高度なリスク説明の実現に向け,大規模視覚言語モデル(VLM)を用い,交通シーンのリスク度とリスク内容を段階的に推論する手法を提案する.本手法は,リスク対象物の検出からリスク内容の記述までを順に推論し,別シーンの構造化推論結果を参照データとして利用することで,少ないコンテキスト内学習コストで高精度なリスク推定を実現する.公開データセットを自動アノテーションで拡張した評価データセットによる比較実験の結果,提案手法が代表的な既存手法を上回り,安全運転支援技術の高度化に寄与しうることを示した.
