[2Q1-IS-3-01]Assessing the Aesthetic Evaluation Capabilities of GPT-4 with Vision: Insights from Group and Individual Assessments
〇Yoshia Abe1, Tatsuya Daikoku1, Yasuo Kuniyoshi1(1. the university of Tokyo)
近年,大規模言語モデルが様々な知的タスクで高い性能を示すことがわかってきた.一方で,美的評価のような感性的なタスクにおける人間とのアライメントを調査した事例は少ない.本研究は,画像入力を扱える最新鋭の言語モデルであるGPT-4 with Visionを対象に,画像の美的評価タスクにおける性能を調査するものである.集団の平均評価値予測と個人の評価値予測の二つのタスクを採用し,プロンプトの探索や予測結果の解析を通して,GPT-4 with Visionの振る舞いを調査する.実験では,GPT-4 with Visionの優れた美的評価予測性能と,美と醜に対する異なる評価応答の性質を明らかにしている.最後に,美的評価AIシステムを構築するために,人間の美の知覚プロセスの科学的知見を踏まえ,従来の深層学習モデルと大規模言語モデルを統合するエージェント技術を用いた開発が必要であることについて議論する.
