Presentation Information
[1F4-OS-10b-03]A Method for Generating Pseudo-Individual-Level Data Reflecting the Distribution and Correlation Structure of Big Five Personality Trait Scores
〇Yoshiyuki Suimon1 (1. Keio University)
Keywords:
Big Five,Personality Traits,Survey Simulation
人間の行動や意思決定を対象とするAI・シミュレーション研究において,性格特性は重要な特徴量である.一方で,実測の人格データは個人情報に該当するため,共有や再利用が難しい.本研究では,日本人成人におけるビッグファイブ性格特性の分布および特性間の相関構造を定式化し,それらを同時に再現する疑似個票データを生成する手法を提案する.具体的には,日本語版Big Five Inventory–2ベースの各性格特性の平均値・標準偏差および,性格特性間の相関行列に基づく多変量正規分布モデルを構築し,1000人分のビッグファイブ得点(100段階尺度)からなる疑似データセットを生成した.さらに,この疑似人格集団を用いて大規模言語モデル(LLM)によるアンケート回答のシミュレーションを行い,生成データの実用性を検証した.本手法によって生成された疑似データは,社会調査や行動予測を目的としたデータサイエンス研究の基盤として有用であることが示唆される.
