講演情報
[9F-03]既存データセットの活用事例に基づく新規データセットの活用方法推薦に関する検討
*林 沙也加1、畑 玲音1、松下 光範1 (1. 関西大学)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
データセット活用支援、データ特性、データの類似性
本研究の目的はユーザのデータ利活用を支援することである.現在提供しているサービスの有用性検証や新規サービスの考案など,様々な利用目的の下でユーザの購買データやレビューデータなど様々な大規模データセットが日々構築されている.こうしたデータセットを分析して有益な情報を抽出するために様々な技術が開発されているが,ユーザが目的に沿った情報を取得するには,適切な技術の選択が不可欠である.しかし,技術に不慣れなユーザが未知のデータに対して適用すべき技術を適切に選択することは容易ではない.そこで本稿では,データの特性,適用する分析技術,得られる結果の三者の関係に注目し,既存の活用事例を分類整理することで,ユーザが未知のデータを扱う際の支援を試みる.提案手法では,類似した特性を持つデータには同じ分析技術が適用可能であるという仮説のもと,データセット内のカラムの形式と性質の類似性から適用可能な技術を推薦する.