The 40th Annual Conference of the Japanese Society for Artificial Intelligence, 2026

Presentation Information

[4Yin-B-65]Auditing Machine Learning Models Using Model Explanations

〇Yasuhito Fujii¹, Satoshi Hara² (1. Shimane University, 2. The University of Electro-Communications)

Keywords:

Explainable AI,Machine Learning,Fairness,Auditing

機械学習モデルの監査において，監査者が観測できるのはクエリに対する予測ラベルに限られる．そのため，モデル運用者は監査中の予測ラベルだけを変更し，モデルの不適切な挙動（不公平性など）を隠蔽できる．さらに，既存の監査手法ではこのような隠蔽を見抜けない場合もあることが報告されている．本研究では，モデルの説明として特徴重要度が得られると仮定し，この場合に隠蔽操作を適切に検出できるかに着目する．そして，予測ラベルに加えて説明も監査材料として用い，両者に基づいて隠蔽を検出する方法を提案する．ACSEmploymentデータセットを用いた実験により，提案手法が既存手法よりも高い精度で隠蔽操作を検出できることを確認した．

Back to Session information