講演情報

[4Yin-A-29]追加的な教師情報を用いたラベルの品質改善と汎化性能向上

〇杉山 孔亮1、内田 真人1 (1. 早稲田大学)

キーワード:

統計的学習理論、情報幾何学、ラベル品質、追加的な教師情報、経験リスク最小化

本稿では,ハードラベル付きの訓練データセットの各サンプルに対し,ラベル生成分布に関する追加的な教師情報を付与し,より高品質なソフトラベルを構築する枠組みを提案する.最初に,真のラベル生成分布との差で表されるソフトラベルの品質と予測モデルの汎化誤差との関係を解析する.そして,この品質改善に寄与する追加的な教師情報の性質を解析する.具体的には,確率分布で表現したハードラベルと追加的な教師情報をアフィン結合する場合,追加的な教師情報にはハードラベル以外のクラスの情報のみが必要であることを明らかにする.最後に,この理論結果に基づいた追加的な教師情報により,汎化性能が向上することを実験的に確かめる.