Presentation Information
[4Yin-B-54]Disentangling Meaning and Language Components in Diverse Multilingual Sentence Embeddings
〇Kanade Nonomura1, Keita Fukushima1, Risa Kondo1, Tomoyuki Kajiwara1,2 (1. Ehime University, 2. The University of Osaka)
Keywords:
Embeddings,Representation Learning,Quality Estimation,Multilingual
本研究では,多言語文埋め込みを意味要素と言語要素に関する2つの埋め込みに分離し,前者を言語非依存な埋め込みとして言語横断タスクに活用する.先行研究はエンコーダ由来のモデルに対して入力文のみを与える文埋め込みのアプローチを対象にしていたが,本研究ではデコーダ由来のモデルや入力文とともにプロンプトを与えるアプローチも含めて,広範な文埋め込みに対する分離手法の有効性を検証する.実験の結果,埋め込みの分離手法が多くの文埋め込みに対して有効に働くことが明らかになった.
