講演情報
[5L3-OS-6b-02]大規模言語モデルによるコンセプトドリフト分析の解釈性向上
〇佐久間 啓太1、松野 竜太1、根本 龍昌1、廣川 暢一1 (1. 日本電気株式会社)
キーワード:
コンセプトドリフト、可視化、大規模言語モデル、決定木、探索的データ分析
機械学習モデルの実運用において, 特徴量と目的変数の関係が時間とともに変化するコンセプトドリフトは重要な課題であり, 変化の詳細を理解することが不可欠である. 筆者らが先行研究で提案したCDST-Vizは, 目的変数の変化の傾向に基づいて特徴空間をセグメント化する決定木を学習し, Treemap形式で可視化する手法である. しかし, 多数のノードを持つ木構造ではドリフトパターンの把握が困難であり, 解釈には統計的知識とドメイン知識が必要である. 本研究では, CDST-Vizの可視化に大規模言語モデル(LLM)による自然言語説明を統合した探索的分析ツールCDST-Narratorを提案する. CDST-Narratorは, CDSTの情報とデータの基本情報をLLMに入力し, 事実の要約とLLMの世界知識に基づく仮説の提唱を, 全体要約・原因考察・ノード解説の3タスクを通じて提供する. 可視化とLLM説明を統合したGUIにより, 俯瞰から深掘りへの探索的分析を実現した. 実データを用いたデモンストレーションにより, 先行研究と整合する知見の自動抽出に加え, 新たな洞察の提供も確認した.
