The 40th Annual Conference of the Japanese Society for Artificial Intelligence, 2026

Presentation Information

[2Yin-A-51]Traffic Risk Estimation via Stepwise Reasoning and Structured Knowledge Reference in Large Vision-Language Models

〇Tatsuya Kobayashi¹, Takamichi Isowa¹, Kotaro Fujimura¹, Reo Shimoda¹, Kentaro Yamada¹ (1. Honda R&D Co.,Ltd.)

Keywords:

Vision-Language Model,Traffic Risk Estimation,Stepwise Reasoning

本稿では，対話型ドライビングエージェントによる高度なリスク説明の実現に向け，大規模視覚言語モデル（VLM）を用い，交通シーンのリスク度とリスク内容を段階的に推論する手法を提案する．本手法は，リスク対象物の検出からリスク内容の記述までを順に推論し，別シーンの構造化推論結果を参照データとして利用することで，少ないコンテキスト内学習コストで高精度なリスク推定を実現する．公開データセットを自動アノテーションで拡張した評価データセットによる比較実験の結果，提案手法が代表的な既存手法を上回り，安全運転支援技術の高度化に寄与しうることを示した．

Back to Session information