講演情報
[7D-03]多次元ソートのための整数値変換手法の提案
*高尾 大樹1、黒川 能毅1、西川 記史1、茂木 和彦1、藤原 真二1 (1. 株式会社日立製作所)
発表者区分:一般
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
データベース技術、ストレージ管理、性能管理、チューニング
高次元データに対する分析クエリ処理速度向上のためには、複数次元の値を同時に考慮した多次元ソートによる前処理が有効であるという研究結果が報告されている。しかしデータを均等に分割し分割統治法に基づいてソートするため、データ分布に偏りがある場合には、ソートの粒度が粗くなり値が大きく異なるデータが混ざってしまうという問題が指摘されている。これにより分析クエリ処理時のデータ読出し量が増大し、処理速度低下が懸念される。そこで本稿では多次元ソートのための整数値変換手法を提案する。本手法はデータ分布に基づいて階層的にデータを分割することでソートの粒度を細かくでき、多次元ソートにおける上述の問題点を解消する。