講演情報

[2Yin-B-33]時系列データ解釈のためのマルチモーダルLLM開発に向けた車両走行データセット構築

〇関孝一¹、松坂修吾¹、樗澤英明¹、新立拓也²、尤書恒²、曹永鵬²、薛曦²、吉田聖²、鈴木都生² (1. トヨタ自動車株式会社、2. NABLAS株式会社)

キーワード：

大規模言語モデル、マルチモーダルLLM、時系列データ、キャプション生成、データセット構築

近年、自然言語に加え、画像・動画・音声などの多様なデータセットを活用した大規模言語モデル（LLM）のマルチモーダル化が精力的に研究されている。しかし、時系列データを解釈可能なマルチモーダルLLMの開発は十分には進んでいない。その要因の一つとして、時系列データと説明文が対応付けられた大規模データセットの不足が挙げられる。本研究では、時系列データの中でも車両走行データに着目し、走行状況の説明文を生成するとともに、大規模データセットの構築を目的とする。具体的には、車両走行データをグラフ化し、視覚言語モデル（VLM）で処理するパイプラインを提案する。特徴的な工夫は、「急加速」や「緩やかな右カーブ」など車両走行データから読み取りたいイベントを定義し、それらをプロンプトに組み込むことで、意図した説明文が生成可能なように設計している。妥当性を検証した結果、車両走行データに対して概要および詳細説明文が生成できることを確認した。最終的には、10秒または1分間の走行データを対象とした約2万件のデータセットを構築した。本成果は、車両走行データに限らず、各種の時系列データに対してデータセットが構築可能であると期待される。

セッション詳細へ戻る