講演情報

[7E-01]レビューデータからの各次元が意味を持つ Disentangled な映画のベクトル表現の獲得

*金田 悠路1、藤田 澄男2、莊司 慶行1 (1. 静岡大学情報学部、2. LINEヤフー株式会社)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

分散表現、Embedding、映画検索、Disnentangled Representation

本論文では,文書をベクトル化した際にその各次元が独立して意味を持つようにする,Disentangled Representationを獲得するための手法を提案する.そのために,小規模ニューラルネットワークによる周辺単語予測タスクに基づく,古典的な埋め込み表現手法獲得を改良した.具体的には,1)モデルの学習時に,周辺単語だけではなく同時にメタデータも推定するというガイドタスクを同時に解かせる,2)パラメータの更新時に,バッチ内のベクトルが多変量正規分布に近いかを計算し,ロスに加味する,という2つの工夫を施した.実際に文書を各次元が独立し,意味を持った状態でベクトル化できているかを確認するために,映画レビューデータを対象にした被験者実験を行った.実験結果から,提案手法によって得られたベクトルにはどのような特徴があるか,それぞれの工夫にどの程度の効果があったか,実際にアプリケーションとして検索などのタスクに使えるかを明らかにする.