講演情報

[2Yin-A-51]段階的推論と構造化知識参照を用いた大規模視覚言語モデルによる交通リスク推定

〇小林達也¹、磯和隆道¹、藤村晃太郎¹、下田玲央¹、山田健太郎¹ (1. 株式会社本田技術研究所)

キーワード：

視覚言語モデル、交通リスク推定、段階的推論

本稿では，対話型ドライビングエージェントによる高度なリスク説明の実現に向け，大規模視覚言語モデル（VLM）を用い，交通シーンのリスク度とリスク内容を段階的に推論する手法を提案する．本手法は，リスク対象物の検出からリスク内容の記述までを順に推論し，別シーンの構造化推論結果を参照データとして利用することで，少ないコンテキスト内学習コストで高精度なリスク推定を実現する．公開データセットを自動アノテーションで拡張した評価データセットによる比較実験の結果，提案手法が代表的な既存手法を上回り，安全運転支援技術の高度化に寄与しうることを示した．

コメントの閲覧・投稿にはログインが必要です。ログイン

セッション詳細へ戻る