講演情報

[5K3-OS-38b-04]連続的に変動する測定不備要因に対応可能なデータセット品質可視化手法の検討

〇尾関 剛成1、田中 信秋1、栗山 俊通1 (1. 三菱電機株式会社)

キーワード:

品質管理、異常検知、製品検査、予知保全、データ可視化

異常検知技術は機械学習アルゴリズムの進展に伴い急速に発展している.しかし,実運用環境では,センサの個体差や設置位置のばらつき,機材設定の変更,背景雑音などの測定不備による信号の変化が無視できないことも多い.このような問題が発生する要因は多様かつ不確実であり,事前にモデル化することは困難である.本研究では診断タスクとは直接関係しない付加的情報(サブラベル)を活用し,「サブラベルの予測のしやすさ=測定不備の可能性」と捉え,単純な線形回帰モデルを用いて特徴量とサブラベルの関係を解析し,測定不備を定量化する手法を提案した.提案手法はデータセットに潜在する不要な情報やバイアスの存在を簡易かつ明確に検出できることを実証した.本手法は,モデル構築前のデータ品質評価や前処理方針の決定に有用であり,今後の信号処理や機械学習におけるデータセット設計の改善に寄与することが期待される.