講演情報
[2Yin-B-09]大規模言語モデルを用いた有害文章に対するアノテーション能力の検証
〇三浦 凜1、プタシンスキ ミハウ2、桝井 文人2、レネ メレンデス3、中嶋 悠太3 (1. 北見工業大学工学部、2. 北見工業大学情報通信系、3. 北見工業大学大学院工学研究科)
キーワード:
大規模言語モデル、有害情報検知、日本語テキスト分類
ソーシャル・ネットワーキング・サービス(SNS)の普及に伴い,有害情報の拡散による問題が発生している.健全なプラットフォームに必要不可欠な自動検出技術のための日本語有害情報データセットは不足しており,構築には多大なコストを要する.本研究では,コストを削減するために大規模言語モデル(LLM)を用いてSNS文章に対するアノテーション能力の比較評価した.手法として語彙密度と文章量に基づく情報量を用いて傾向を分析した.クラウドLLMが高い性能を示す一方で,ローカルLLMもFew-shotプロンプトを用いることで性能向上が確認された.また,情報量の減少に伴い性能の低下が確認され,特に中情報量以下での性能向上が課題である.
