講演情報

[8D-04]データベースからの独立被覆な代表元集合を用いたDBSCANの計算

*鹿野 友翔1、塙 雪耶1、大森 匡1、新谷 隆彦1、藤田 秀之1 (1. 電気通信大学)
発表者区分:学生
論文種別:ショートペーパー
インタラクティブ発表:あり

キーワード:

問い合わせ処理、問い合わせ最適化、独立性・被覆性、クラスタリング

データベースからそれらを代表するデータ集合を抽出することは,巨大データの応用において重要である.DrosouのDisC Diversityはその手法の一つで,データ集合から独立性と被覆性を持つ代表元集合DisC diverse subsetを計算する.この代表元集合Sをデータ集合Dのサンプルとして用いてデータ分析を行うことで,データ分析の計算効率の向上が期待できるが,元データであるDを分析したときと比べて精度に課題がある.そこで本研究では,独立性と被覆性をもつDisC diverse subsetを用いてDBSCANでクラスタリングを行い,元のオブジェクト集合を用いた場合と近い結果がSから得られるような方法を提案する.