講演情報

[2G6-OS-47c-06]衝突リスク予測を用いたFlow Matching方策の推論時補正

李 思哲1、〇青木 達哉1、堀井 隆斗1,2 (1. 大阪大学、2. 東京大学IRCN)

キーワード:

ロボットマニピュレーション、Flow Matching、衝突回避、推論時補正、失敗からの学習

ロボットマニピュレーションにおいて,Flow Matching などの生成モデルを用いた模倣学習は複雑な動作生成に有効であるが,障害物との衝突によりタスクの達成が大きく阻害される.対策として推論時の軌道補正が挙げられるが,衝突が多発する環境ではデータ収集が困難のため,成功動作データの分布に依存する既存手法は性能が制限される.そこで本研究では,このような環境で簡単に得られる失敗データで学習した衝突リスク予測モデルの勾配情報を用いて,Flow Matching に基づく方策の生成過程ベクトル場を補正し,衝突リスクを軽減しながら成功率を向上させる.また,補正ベクトルによる意図しない加速や減速が干渉として働き,タスクの進行を妨げてしまうことがある.そのため,補正前のベクトル場と水平になる干渉成分を除去する直交射影を導入し,衝突リスクの軽減とタスク達成の両立を図る.LIBEROをベースとした2つのタスクにおいて複数条件で評価した結果,衝突リスク予測に基づいた補正は衝突リスクの高い環境下において衝突を抑制しつつ成功率を改善する効果が見られ,直交射影がタスク進行への悪影響を抑制することが示された.

コメント

コメントの閲覧・投稿にはログインが必要です。ログイン