講演情報

[2Yin-A-57]VLM図表理解の評価データセットのスケーラブルな拡張に向けて

〇小原有以¹、森部七海¹、土田悠佳¹、西潟優羽¹、倉光君郎¹ (1. 日本女子大学)

キーワード：

視覚言語モデル、評価データセット、ソフトウェア開発

図表は専門的な情報を視覚的に表現する重要な手段であり，視覚言語モデル（VLM）を活用した図表からの情報抽出が実務において期待されている．しかし，セキュリティ上の理由から商用VLMの利用が制限される環境も多く，適切なオープンソースVLMを選定する必要がある．我々はこれまでに，VLMの図表理解能力を評価するデータセットModelVistaを構築し，多様な図表に対する評価を行ってきた．しかし，現状のModelVistaはあらかじめ用意された固定的な評価セットであるため，企業や組織ごとの異なるニーズに柔軟に対応できない．本研究では，ModelVistaをスケーラブルに拡張することを目指す．GitHub上でオープンソースとして公開することにより，各組織が必要に応じて図表や問題を追加でき，図表のメタデータ管理や標準化された作問基準により評価問題の質を維持しながら拡張することが可能となる．本手法により，ModelVistaは継続的に発展し，多様なニーズに対応できる評価データセットとして機能する．

セッション詳細へ戻る