講演情報

[2G6-OS-47c-05]人ロボット協調タスクにおけるリカバリ動作の事後学習

〇吉村 優汰1,2、深沢 建人3,2、中條 亨一2、山野辺 夏樹2,3、堂前 幸康2、尾形 哲也1,2 (1. 早稲田大学、2. 産業技術総合研究所、3. 東京農工大学)

キーワード:

リカバリ動作、ファインチューニング、人ロボット協調、模倣学習

模倣学習に基づくロボット制御において,学習データの規模拡大は性能向上に寄与する一方で,特定の失敗モードが現れ性能が飽和する場合がある.実環境運用においては,あらゆる失敗を事前に予測して学習データに含めることには限界があり,推論時に生じる未見の失敗から自律的にリカバリすることも困難である.そのため,運用段階で顕在化した失敗モードを,事後的な介入によって解消するアプローチが重要となる.本研究は,人のジェスチャーを合図としたリカバリ策データの追加学習により,特定の失敗モードを事後的に解消する手法を確立することを目的とする.協調的な手渡しタスクを対象に検証を行った結果,少量のリカバリ策データで既存モデルをfine-tuningさせることで,人の合図によるリカバリ能力を事後的に獲得できることが示された.本手法により,大規模データのみでは解決できない予測困難な失敗に対して,運用段階での追加学習を通じて柔軟に機能を拡張し,システム全体の信頼性を向上させることが可能となる.

コメント

コメントの閲覧・投稿にはログインが必要です。ログイン