講演情報
[1Yin-B-26]深層画像編集モデルにおけるAttentionを用いた属性の連続的な制御
〇三富 昂耶1、松原 崇1,2 (1. 北海道大学、2. 株式会社サイバーエージェント AI Lab)
キーワード:
深層学習、画像編集
拡散モデルによって自然言語を用いた画像編集技術が急速に普及しているが,画像中の物体が持つ色味や形状,質感などの特定の属性を連続的に調整することは困難である.本研究では,この課題に対処するため,テキストと画像が相互作用するMulti-Modal Attention層に着目し,特定のテキストトークンが画像トークンに与える影響の大きさを制御する手法を提案した.これにより,多様な画像編集タスクにおいて,画像中の属性を滑らかかつ自然に変化させられることを確認し,提案手法の有効性を示した.
