講演情報

[5Yin-A-17]裁決文を対象とした大規模言語モデルの埋め込み表現に基づくセマンティック検索システム

〇山岸 竜也1、穴口 史将1、森田 武史1 (1. 青山学院大学)

キーワード:

セマンティック検索、大規模言語モデル、埋め込み表現、裁決文

税理士実務において,過去の裁決文を適切に検索することは,事案検討や判断根拠の整理において重要である.しかし,裁決文検索に広く利用されている一般社団法人 日税連税法データベースが運営する税理士情報ネットワークシステム(TAINS)はキーワード検索を前提としており,表現の揺れや言い換えに起因して,利用者の意図に沿った裁決文を取得できない場合がある.本研究では,この課題に対し,TAINSに収録された裁決文を対象とした大規模言語モデルの埋め込み表現に基づくセマンティック検索システムを提案する.裁決文をタイトル・概要・本文という文書構造に基づいて分割し,各構成要素を独立にベクトル化した上で,複数のベクトルデータベースから得られた検索結果を裁決文単位で統合する手法を採用した.さらに,実務利用を想定したWebベースの検索インタフェースを実装し,検索結果の評価およびログ収集を可能とした.既存のキーワード検索システムとの比較評価およびTAINS利用経験者による主観評価の結果,既存システムの検索結果が50件以上の絞り込みが困難なクエリに対して,提案手法は関連性の高い裁決文を上位に提示できる傾向を示した.