講演情報

[4Yin-A-12]説明可能フェアネスに向けたフェアネス指標の構造推定と寄与分析

〇大原一輝¹ (1. 株式会社リクルート)

キーワード：

フェアネス、AIガバナンス、人工知能、因果推論

Impact Ratio (IR) や Equal Opportunity (EO) などの群公平性指標は監査で広く用いられるが、単一のスカラー値であるため、指標悪化の要因や指標間の不一致（Disagreement）の理由を説明できない点が課題である。本研究では、サブグループレベルの指標変動を構造的に説明する事後診断フレームワーク SAFE を提案する。SAFE は、サブグループの分布要約から指標値を予測するメタモデルを構築し、SHAP を用いて指標変動の主要因・寄与方向・値域感度（Sensitivity Profiles）を可視化する。さらに、比率指標（IR）において特に問題となる推定不確かさに支配された警報を特定するため、ブートストラップに基づく「不安定領域（Volatility Region）」を導入する。UCI Adult データセットを用いた実験では、低ベースレート領域において IR が急激な感度変化を示す一方、EO は比較的安定していることを可視化し、指標間の不一致が感度プロファイルの違いに起因することを実証した。

セッション詳細へ戻る