Presentation Information

[3Yin-A-42]Evaluation of Blow Detection Performance in Yacht Racing Using Multimodal LLMs

Takumi Terauchi1, 〇Kotaro Nishimura1, Kensuke Ota1, Keiichi Namikoshi1, Yuko Sakurai1 (1. Nagoya Institute of Technology)

Keywords:

Large Language Model,Image Recognition,Multi-Modal

本研究の目的は,ヨット競技における「ブロー(局所的に発生する強風)」の判別を対象に,マルチモーダルLLMの特性と限界を明らかにすることである.近年,画像とテキストを扱うマルチモーダルLLMが登場したが,微細な視覚的差異を見分ける専門タスクにおける性能は十分に検証されていない.そこで本研究では,海面の波や色の微細な変化として現れるブローを判別するタスクにおいて,ヨット競技の経験者と初心者,LLMの正解率を比較した.実験の結果,LLMは経験者と同様に視覚的特徴を認識している一方で,「ブローなし」と判定する傾向が強いことが確認された.