講演情報

[4L-02]クラウドソーシングにおけるワーカの回答根拠を用いたラベル集約

*西尾 朋哉1、伊藤 寛祥2、森嶋 厚行2 (1. 筑波大学、2. 筑波大学 図書館情報メディア系)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

クラウドソーシング、Human-in-the-loop

近年,不特定多数の群衆に作業を委託することで問題解決を図るクラウドソーシングに関心が集まっている.不特定多数の群衆に作業を委託することから,クラウドソーシングにおいては品質管理が重大な課題である.品質管理の方法として,同一の問題に対して複数の作業者を割り当て,結果を集約する方法が一般的であるほか,回答根拠を用いた品質管理手法が有効であることが知られている.本研究では,クラウドソーシングにおける品質管理手法として,作業者の回答根拠を用いた集約手法を提案する.提案手法は,クラウドソーシングにおいてワーカがラベルと根拠を回答する過程を確率的生成モデルとして記述する.このモデルを用いることで,タスクの真のラベルの期待値と,潜在変数を推定する.実際の推定においては,EM アルゴリズムを用いて,E ステップで真のラベルの期待値を,M ステップで潜在変数を推定する.合成データと実世界データを用いた実験の結果,提案手法は既存手法と比較して高い集約品質を達成し,特に既存手法が苦手とする,冗長性が低い状況,ワーカあたりの回答数が少ない状況,スパムワーカが混在する状況において,正解率の大幅な向上を見せた.