講演情報
[2G6-OS-47c-04]知識グラフに基づく把持戦略選択の構造的推論モデル
〇古川 岳澄1、東松 哲見1、上野 侑紗2、栗原 聡1 (1. 慶應義塾大学理工学部、2. 慶應義塾大学理工学研究科)
キーワード:
認知ロボティクス、知識グラフ、物体把持、説明可能性、知識表現
ロボットによる把持において,幾何的な姿勢推定の精度は向上している一方で,物体の状態や部位に基づく戦略的な把持手法の選択には依然として課題がある.本研究では,物体の意味表現(Object/Part/State)に基づき把持戦略の確率分布を推論するシステムSemantic Grasp Reasoner(SemGR)を提案する.視覚言語モデル(VLM)で画像から抽出した意味情報をシンボルとして知識グラフ(KG)へ入力する推論パイプラインを構成した.KGは33種類の人間による把持手法に基づき構築され,未知物体を含む複数の推論条件に対応する.人間被験者の選択を基準とした評価の結果,基礎実験では人間と整合的な把持戦略分布を生成できることを確認した.また,現実条件の実験ではVLMのノイズに対するロバスト性に加え,未知物体に対しても既知の物体知識を合成することで,妥当な把持戦略をゼロショットで導出できる一般化能力が確認された.本手法は,画像から意味的文脈を考慮した高度な把持戦略を決定する有効な枠組みを提供する.
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
