講演情報

[3Yin-A-08]サーブリッグ動作遷移を用いたVLM要素動作認識の高精度化

〇小谷 俊貴1、坂井 亮1、藤 大樹1、吉村 健太郎1 (1. 株式会社日立製作所)

キーワード:

視覚言語モデル、要素動作認識、サーブリッグ分析

製造・保守現場の人手不足に伴い,ロボットによる労働の代替が急務となっている.従来のロボット教示作業は多大な時間を要するため,ヒトの作業映像などの記録から少工数で直接ロボットを動作させる技術が求められている.この実現には,身体性の異なるヒトとロボットの動作を共通記述する要素動作体系の利用が有効である.本研究では,サーブリッグ分析の要素動作体系を用いて,追加学習不要なVision Language Model (VLM)による要素動作認識技術を提案する.単一画像フレームでのVLM推論は,物体把持前の予備動作で生じる手と物体の重なりを把時動作と誤認識する課題がある.一方で,常時前後フレームを参照すれば精度向上が期待できるが,計算コストが増加する.そこで,サーブリッグの要素動作体系に基づき,誤認識が生じやすい動作遷移パターンを定義し,該当パターンの検出時のみ前後フレームを追加で参照する認識技術を開発した.点検作業を対象とした評価実験の結果,計算コストを抑制しつつ,認識精度が向上することを確認した.