講演情報

[3A-020-PI]内的選好に基づく価値は外的報酬・罰に基づく価値とは異なる

*朱 建宏1、李 受珉1、中尾 敬1 (1. 広島大学)

キーワード:

意思決定、強化学習、選択による選好の変化