講演情報

[2M4-GS-11a-03]金融与信におけるLLM埋め込み表現の公平性監査:線形プローブによる職業バイアス増幅メカニズムの解明

〇山口 伸弘1 (1. 株式会社リクルート)

キーワード:

公平性、金融与信、大規模言語モデル、職業バイアス、線形プローブ

金融分野でのLLM活用において,学習データ由来の社会的バイアスによる不当な与信拒絶が懸念されている.本研究は,Llama 3.1の埋め込み表現を対象に,職業属性が金融リスク評価に与える影響とその増幅メカニズムを検証した. 与信の「5つのC」に基づき職業以外の属性を統制した人工データを用いた実験の結果,コサイン類似度における職業間の差異は0.006と極めて微小であり,表面的な公平性は保たれていた.しかし,線形プローブによる審査シミュレーションでは,事務職と運転手等の間で承認率に最大約22ポイントの乖離が生じた.決定境界の幾何学的解析により,この乖離は,埋め込み空間上の微小な位置ズレが決定境界付近の非線形性によって合否を分ける決定的な要因として「増幅」されることに起因すると解明された. 特に,ジェンダー以上に「労働形態(事務・管理職への選好と,現場・ケア職へのペナルティ)」に起因するバイアスが支配的であり,かつ全職業で承認率が低下する悲観的な傾向も確認された.本研究は,類似度評価では不可視なバイアスが実務上の優良顧客排除(偽陰性)に直結するリスクを実証し,その定量的監査手法を提案する.

コメント

コメントの閲覧・投稿にはログインが必要です。ログイン