講演情報

[7C-01]SQL/PGQを対象としたプロパティグラフの並列分散処理

*山﨑 昂輔1、増田 正2、天笠 俊之2 (1. 筑波大学院理工情報生命学術院システム情報工学研究群情報理工学位プログラム 知識・データ工学研究室、2. 筑波大学 計算科学研究センター)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

Apache Spark、SQL/PGQ、並列分散処理、プロパティグラフ

本研究では,Apache SparkのSpark SQLを利用してプロパティグラフに対してSQL/PGQのパスクエリを処理するシステムを提案する.プロパティグラフはノードとエッジそれぞれにキーバリューペアのプロパティを複数含めることができるグラフであり,近年幅広い分野で利用されている.SQL/PGQは,SQLを拡張することで従来のRDB処理に加えてグラフパターンを指定することによるプロパティグラフへの問合せを可能にしたものである.我々の知る限り,SQL/PGQには現在OSSの並列分散処理を対象にした処理システムが存在していない.そこで本研究では,Apache SparkでSQL/PGQのパスクエリを処理するシステムを提案し,実験を通じてボトルネックの解析を行なった.実験の結果,提案手法は結果件数が少ないクエリではスキャンや通信などの影響を受ける一方,結果件数が多いクエリにおいて比較手法を上回ることを確認した.