講演情報
[4Yin-B-37]研究者/文献検索におけるニューラル線形ベクトルの多言語化
〇小林 健輔1、松本 匡史1、小泉 周2、持橋 大地3 (1. 岡山大学、2. 北陸先端科学技術大学院大学、3. 統計数理研究所)
キーワード:
機械学習
分散表現を用いたベクトル検索は,研究者検索や文献推薦などの情報検索タスクにおいて研究支援者に広く利用されている.しかし,従来手法では言語ごとに独立したベクトル空間が形成され,多言語間の意味的対応関係が十分に反映されないという課題がある.その結果,検索に使用する単語やクエリは元データと同一言語である必要があり,多言語環境における実運用上の制約となっていた.
本研究の目的は,researcher2vec による研究者表現を基盤とし,検索クエリの言語を元データの言語に依存させない多言語対応ベクトル検索手法を検討することである.
提案手法では,機械学習モデルを用いて言語間のベクトル演算を行い,多言語間の意味的対応を考慮した共通表現空間上で検索を実現する.
その結果,検索クエリと元データの言語が異なる場合においても,意味的に関連する研究者や概念を検索可能であることを確認した.
本研究の目的は,researcher2vec による研究者表現を基盤とし,検索クエリの言語を元データの言語に依存させない多言語対応ベクトル検索手法を検討することである.
提案手法では,機械学習モデルを用いて言語間のベクトル演算を行い,多言語間の意味的対応を考慮した共通表現空間上で検索を実現する.
その結果,検索クエリと元データの言語が異なる場合においても,意味的に関連する研究者や概念を検索可能であることを確認した.
