講演情報
[2K4-GS-7b-05]多様な「かわいい」表現に対応する画像スタイル変換手法
〇土井 央都1、秋吉 政徳1 (1. 神奈川大学)
キーワード:
画像生成、かわいい、Stable Diffusion
本研究では、個人の曖昧な「かわいい」のイメージを具現化し共有するシステムを提案する。具体的には「きもかわ」等5つのサブジャンルをLoRAとして学習させ、入力画像への適用比率をスライダーで調合可能とした。さらにLLMによる対話機能を実装し、「もっと不気味に」等の言語指示を生成パラメータ(ノイズ除去強度、ControlNetの形状維持度等)へ自動変換する仕組みを構築した。
特徴は、全パラメータをJSON形式の「設計図」として保存する点である。これにより生成プロセス自体を構造化データとして記録し、生成の一過性問題を解消するとともに、第三者による再現や異なる対象物へのかわいさの転用を可能にした。また、DINOv2を用いたセグメンテーションに基づき、ユーザーが指定した領域に対してのみスタイルを反映させる部位別制御を実現した。
提案システムの有効性を検証するためアンケート調査を実施した結果、生成画像と被験者の認識スタイルの合致、および設計図を介した異種物体への感性転用の妥当性において、いずれも過半数を超える肯定的な評価を得た。
特徴は、全パラメータをJSON形式の「設計図」として保存する点である。これにより生成プロセス自体を構造化データとして記録し、生成の一過性問題を解消するとともに、第三者による再現や異なる対象物へのかわいさの転用を可能にした。また、DINOv2を用いたセグメンテーションに基づき、ユーザーが指定した領域に対してのみスタイルを反映させる部位別制御を実現した。
提案システムの有効性を検証するためアンケート調査を実施した結果、生成画像と被験者の認識スタイルの合致、および設計図を介した異種物体への感性転用の妥当性において、いずれも過半数を超える肯定的な評価を得た。
