講演情報
[8A-05]類似度を利用した大規模言語モデルのHallucination検出手法の提案
*根本 成明1、木村 昌臣1 (1. 芝浦工業大学工学部情報工学科データ工学研究室)
発表者区分:学生
論文種別:ショートペーパー
インタラクティブ発表:あり
論文種別:ショートペーパー
インタラクティブ発表:あり
キーワード:
LLM、テキスト生成、有害情報・偽情報・誤情報の検出と排除
大規模言語モデルは多くの自然言語処理タスクにおいて高い性能を示している一方で,誤った情報を生成するhallucinationの問題が指摘されている.本研究では,モデルが生成する出力の候補同士の意味的な類似度を利用した新たなhallucination検出に必要な手法を提案する.本手法では,モデルが生成する最初のトークンの候補をモデルの確信度順にソートし,上位5つのトークンをそれぞれ出力の最初のトークンとして固定したうえで,それに続く文章を生成することで複数の出力候補を定義する.生成された複数の出力候補間のコサイン類似度を利用し,hallucinationの検出に必要な手法を提案する.