講演情報
[9D-02]深層学習を用いた文字列長を考慮した文字列述語の選択率推定
*杉浦 射央1、土田 隼之2 (1. 明石工業高等専門学校 機械・電子システム工学専攻、2. 明石工業高等専門学校 電気情報工学科)
発表者区分:学生
論文種別:ショートペーパー
インタラクティブ発表:あり
論文種別:ショートペーパー
インタラクティブ発表:あり
キーワード:
問合せ最適化、選択率推定、文字列述語
近年,深層学習を用いた選択率推定を行う手法が注目されている.Astrid-Embedは,LIKE述語の選択率推定を英文に対して高い精度で行えることが知られており,和文に対しても住所などの短い文字列が対象であれば出現頻度の多いデータを水増しする前処理を行うことで2表結合の結合方式の選択には十分な推定精度であることが確認されている.しかし,従来の手法では推定の精度が検索する文字列の長さが推定結果に与える影響が大きく,長い文字列を対象とした場合に選択率の推定精度が不十分である.本稿では長い文字列に対する推定精度を改善する文字列長を考慮したデータの前処理の方法を提案する.さらに,長い文字列長を扱う必要があるユースケースとして,ECサイトでの売り上げ分析データを対象とした選択率推定を行う.売上分析における複数表の結合において提案手法が十分な推定精度であるかを検証する.