講演情報

[2Yin-A-51]段階的推論と構造化知識参照を用いた大規模視覚言語モデルによる交通リスク推定

〇小林 達也1、磯和 隆道1、藤村 晃太郎1、下田 玲央1、山田 健太郎1 (1. 株式会社本田技術研究所)

キーワード:

視覚言語モデル、交通リスク推定、段階的推論

本稿では,対話型ドライビングエージェントによる高度なリスク説明の実現に向け,大規模視覚言語モデル(VLM)を用い,交通シーンのリスク度とリスク内容を段階的に推論する手法を提案する.本手法は,リスク対象物の検出からリスク内容の記述までを順に推論し,別シーンの構造化推論結果を参照データとして利用することで,少ないコンテキスト内学習コストで高精度なリスク推定を実現する.公開データセットを自動アノテーションで拡張した評価データセットによる比較実験の結果,提案手法が代表的な既存手法を上回り,安全運転支援技術の高度化に寄与しうることを示した.