講演情報
[4Yin-A-KA04]研究会優秀賞:「テンソル分解手法を用いた関係データの因子分解」知識ベースシステム研究会(SIG-KBS)
〇磯邊 猛1、井上 克巳2、杉山 麿人2 (1. 総合研究大学院大学、2. 国立情報学研究所)
関係データを解釈可能な部分的関係へと因子分解することは,知識発見およびデータ処理における重要な問題である.既存手法は離散的な組合せ最適化に基づいており,大規模かつノイズを含むデータに対してスケーラビリティの限界を抱えている.本研究では,テンソルに変換された関係データを,テンソル多体近似と呼ばれるテンソル分解手法を用いて分解する.従来の低ランクテンソル分解手法(CP分解やTucker分解など)とは異なり,多体近似によって得られる因子は元のテンソルの各モードに明示的に対応付けられており,二値化によって離散的な関係データとして解釈可能である.さらに理論的には,テンソル多体近似はKLダイバージェンスに関する凸最適化であり,二次収束する自然勾配法によって得られる確率因子は大域最適である.本論文ではまず,ルールベースの関係データ因子分解とテンソル多体近似との間に対応関係を構築する.そして,二値化によって確率因子から新たな関係を得る方法を提案する.実験では,解集合プログラミング(ASP)を用いた組合せ最適化的なアプローチと比較して,提案手法が同等の精度を維持しつつ,大幅なスケーラビリティ向上を実現することを示した.
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
