講演情報

[2L-02]PrivJail: 差分プライバシーを強制するPythonライブラリ

*椎名 峻平1、中谷 翔1、平岡 拓海2、田浦 健次朗2 (1. トヨタ自動車株式会社、2. 東京大学)
発表者区分:一般
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

差分プライバシー、セキュリティ、Python、データフレーム、pandas

本稿では、プライバシーを侵害する可能性のあるデータの出力を禁止し、常に差分プライバシーが保証された結果のみを出力するPythonライブラリ、PrivJailを提案する。類似の既存システムは独自のクエリ言語やSQLに限定したものが大部分であるが、PrivJailではデータ解析者に馴染みのあるPython上でnumpyやpandasの記法を用いた柔軟なデータ処理が可能である。Python上で差分プライバシーの適用を強制するため、PrivJailでは (i) 複数のデータ変換操作に対する感度(sensitivity)の追跡により適切な大きさのノイズを加えることを保証し、(ii) Python上での想定外の操作による生データの盗み見を防止する設計を行った。評価では、実際にPrivJailを用いて決定木構築アルゴリズムを実装し、プログラムの記述性と性能について議論する。