講演情報
[4M4-GS-2e-02]統計的クラスタリングを内包したニューラル分類器と動的特徴選択
〇上原 宏1,3、持橋 大地2,3 (1. 共愛学園大学 デジタル共創学部、2. 統計数理研究所、3. 総合研究大学院大学)
キーワード:
統計的ニューラルモデル、内包型クラスタリング、動的特徴選択、混合分布モデル
本研究では,クラスタが混在する2値ラベル付き高次元データに対し,分類とクラスタリングを同時に行うとともに,各クラスタ中で固有なスパース重要特徴量を検出するEnd-to-Endモデル を提案する.近年,ニューラルネットワークに離散な混合分布モデルや潜在変数モデルを導入し,分類・生成タスクの性能向上を図る研究が進められている.例えば,入力特徴に応じてスパースな サブセットネットワーク(experts)にルーティングするモデル,変分オートエンコーダにおいて,連続緩和したカテゴリ分布で潜在変数層を推定するモデルなどが代表例である.これらのモデルでは,訓練過程において入力特徴に応じた潜在クラスタ構造が形成されると考えられるが,クラスタリング性能を明示的に評価した例は少なく,また特徴量のスパース化も正則化項に基づくものが主であり,クラスタ中の重要特徴次元との対応は明確でない.本研究では,分類器内部に離散な混合モデルによるクラスタ推定機構を組み込み,正則化によらず,クラスタ割当と直接対応づいた重要特徴次元の選択を同時 に実現する.人工データにより,分類性能を維持しつつ,クラスタ構造と重要特徴量を安定的に推定 できることを示す.
