講演情報

[3K2-OS-27b-01]人間と大規模言語モデルによる不動産間取り評価の比較分析― 視覚的印象評価と構造理解の差異 ―

〇楢原 太郎1、山崎 俊彦2 (1. ニュージャージー工科大学、2. 東京大学)

キーワード:

間取り評価、主観スコア予測、マルチモーダル学習、大規模言語モデル、人間–AI協調

本研究は、大規模言語モデル(LLM)が不動産間取り画像から「住み心地」をどの程度評価可能かを、人間の主観評価データと比較し検証することを目的とする。クラウドソーシングにより構築した1000件・9項目の主観評価データを正解とし、GPTを用いてZero-shot、Few-shot、Vision Fine-tuningの3設定でスコア予測を行い、相関係数により精度を比較した。その結果、開放感・現代性・高級感など視覚的印象評価ではGPTは高い精度を示し、Zero-shotでも一定の有効性が確認された。一方、動線やプライバシーなど部屋間の構造理解を要する項目では精度が低く、Fine-tuningでも十分な改善は見られなかった。LLMは視覚的抽象化には強いが、大域的構造推論には限界があることが示唆された。