講演情報
[9H-04]空間的な編集指示に忠実な画像編集モデル
*石井 里奈1、宮森 恒1 (1. 京都産業大学 情報理工学部 宮森研究室)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
画像生成、画像編集、空間操作、ユーザ意図、忠実性
本稿では,空間操作を伴う画像編集の問題に取り組む.近年,Stable DiffusionやDALL-Eをはじめとする画像生成モデルの進化により,ユーザから与えられたテキストに基づいて画像を編集する画像編集技術の研究が大きく進展している.しかし,従来の画像編集モデルでは,色やスタイルの変更に焦点を当てたものが多く,特に空間操作を伴う画像編集において課題が残されている.例えば,オブジェクトの指定した位置への移動や拡大縮小などの空間操作は,従来のモデルでは十分生成結果に反映できないことが多い. そこで,本研究では画像編集モデルにおける空間操作に焦点を当て,ユーザの指定した空間操作を反映する画像編集モデルの実現を目指す.提案手法では,オブジェクトの平行移動や回転,拡大縮小といった空間操作を反映するデータセットを構築し,Stable Diffusionで学習を行う.実験では,モデルに対して編集タスクを行い,編集された画像の評価を行った.