講演情報

[2Yin-A-47]Stable Diffusion XLにおける日本語文字生成の安定化に関する検討

〇藤本 竜也1、竹内 孔一1 (1. 岡山大学)

キーワード:

画像生成、文字画像、Stable Diffusion

近年,Stable Diffusionに代表される拡散モデルは多様な画像生成タスクで利用されているが,文字を含む画像生成においては,文字形状の崩れや配置制御の困難さといった課題が残されている.特に,画数や構造的制約の大きい日本語文字を対象とした検証は限定的である.本研究では,日本語文字を含む定型的な画像を対象とし,Stable Diffusion XLに対する追加学習を通じて,文字生成の安定性および制御可能性を検証した.苗字データとフォントを用いて合成した画像から学習データセットを構築し,LoRAによる軽量学習を行った.生成結果について,文字の可読性,形状の保持,配置の一貫性の観点から評価を行い,追加学習を行わない場合と比較した.その結果,日本語文字を含む画像生成において,文字形状の再現性および配置の安定性が向上することを確認した.本研究は,拡散モデルにおける文字生成の課題に対し,日本語文字を対象とした実証的知見を提供し,文字を含む画像生成の実用化に向けた基礎的指針を示すものである.