Presentation Information

[2G6-OS-47c-06]Correction of Flow Matching Policy via Collision Risk Prediction at Inference Time

Sizhe Li1, 〇Tatsuya Aoki1, Takato Horii1,2 (1. The University of Osaka, 2. IRCN The University of Tokyo)

Keywords:

Robot Manipulation,Flow Matching,Collision Avoidance,Correction at Inference Time,Learning from Failure

ロボットマニピュレーションにおいて,Flow Matching などの生成モデルを用いた模倣学習は複雑な動作生成に有効であるが,障害物との衝突によりタスクの達成が大きく阻害される.対策として推論時の軌道補正が挙げられるが,衝突が多発する環境ではデータ収集が困難のため,成功動作データの分布に依存する既存手法は性能が制限される.そこで本研究では,このような環境で簡単に得られる失敗データで学習した衝突リスク予測モデルの勾配情報を用いて,Flow Matching に基づく方策の生成過程ベクトル場を補正し,衝突リスクを軽減しながら成功率を向上させる.また,補正ベクトルによる意図しない加速や減速が干渉として働き,タスクの進行を妨げてしまうことがある.そのため,補正前のベクトル場と水平になる干渉成分を除去する直交射影を導入し,衝突リスクの軽減とタスク達成の両立を図る.LIBEROをベースとした2つのタスクにおいて複数条件で評価した結果,衝突リスク予測に基づいた補正は衝突リスクの高い環境下において衝突を抑制しつつ成功率を改善する効果が見られ,直交射影がタスク進行への悪影響を抑制することが示された.

Comment

To browse or post comments, you must log in.Log in