講演情報

[9G-03]日本語の単語埋め込みのジェンダーバイアスとデバイアス効果の可視化

*杉野 有咲1、伊藤 貴之1 (1. お茶の水女子大学 伊藤研)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

情報可視化、単語埋め込み、ジェンダーバイアス

近年チャットボットや画像解析技術を用いた翻訳など,AIを活用したサービスが日々増加し,AIは我々の生活のあらゆる場面で活躍している.単語埋め込みとは,自然言語処理において単語を数値に変換してコンピュータ上で扱えるようにする技法である.しかし,単語埋め込みには,言語モデルを作成する際の事前学習に用いたデータセットに内包されたバイアスが,そのモデルに影響を与える欠点がある.日本語の単語埋め込みのバイアス及びデバイアスは先行研究が少なく,そのほとんどの研究対象が英語の単語埋め込みである.そこで本研究は,日本語版Wikipediaを元に学習した学習済みWord2vecのデータセットのジェンダーバイアスを対象とし,デバイアス前後の単語のカテゴリ分類タスクの結果から,単語の特徴ごとにデバイアスの度合いを調整することで,デバイアスとモデルの性能劣化抑止の両立に取り組んだ.