講演情報
[2H1-OS-28-02]マルチモーダルLLMを活用した、地図写真からのGeoAI駆動型ルート生成
〇李 漢奇1、廣井 慧1、畑山 満則1 (1. 京都大学)
キーワード:
人工知能、地理情報システム、コンピュータビジョン
本論文では、自然言語によるユーザーの要求に基づき、地図画像上にルートを自動生成するGeoAIシステムを提案する。ユーザーが紙の地図の写真をアップロードし、「病院までの最短ルートを表示して」といったクエリを入力すると、システムは地図の視覚的な内容とテキストによる要求の両方を解釈し、地図画像上に直接、適切なルートを描画する。本手法では、マルチモーダル大規模言語モデル(LLM)を活用してユーザーの意図を理解し、地図写真から道路ネットワークを認識する。抽出された空間情報は、コンピュータビジョンおよびGIS(地理情報システム)の処理手法と組み合わされ、正確な経路計算と可視化を実現する。実験結果により、本システムが多様なユーザーのクエリに対し、実際の地図写真上で正確なルートを生成できることが実証された。
