Stable Diffusionでの画像生成には、適切なプロンプト(呪文)や強調構文の使用が不可欠です。この記事では、効果的なプロンプトを作成するための基本的なテクニックと、画像生成のクオリティを向上させるための強調構文について詳しく解説します。
- 1 プロンプト作成の基本
- 1.1 シンプルなプロンプト例
- 1.2 詳細なプロンプト
- 1.3 描画タッチ
- 1.4 クオリティの高い高解像度画像を生成する方法
- 1.5 生成条件
- 1.5.4 masterpiece, best quality, ultra-detailed, illustration, an extremely delicate and beautiful, (inumimi,:1.5),(Shiba Inu tail:1.2),Brown Hair,petite,flat chest,pubic hair,skirt, (skirt,wind lift, panties:1.2),(1 Tomgirl, boy face, solo:1.2), (random moment pose,random clothes,Random Situations:1.5),
- 1.5.5 prompt: fused bodyparts,ugly, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,artist name,text,monochrome,comic,multiple-views,hood,pubic hair,extra body parts,multiple views,comic,grown girl,looking at viewer,kissing,hugging,, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, out of focus, censorship, Missing vagina, Blurry faces, Blank faces, bad face, Ugly, extra ear, amputee, missing hands, missing arms, missing legs, Extra fingers, 6 fingers, Extra feet, Missing nipples, ghost,letters on wear,nude,man,boy,pussy,Nipples,(dog,cat,animal:1.8)
- 1.5.6 Steps: 150, Sampler: DPM++ 3M SDE, Schedule type: Exponential, CFG scale: 7, Seed: 2947612275, Size: 800×800, Model hash: e12177c4b0, Model: himawarimix_v11, Denoising strength: 0.85, Hires upscale: 1, Hires steps: 30, Hires upscaler: SwinIR_4x, Version: v1.9.3
- 1.6 まとめ
プロンプト作成の基本
まず、プロンプトとは、Stable Diffusionに対して生成したい画像の内容を伝えるための文章です。プロンプトはシンプルで明確である必要があります。具体的な例を見てみましょう。
シンプルなプロンプト例
otoko no ko
このようなプロンプトでは一人の女の子の画像が生成されます。
詳細なプロンプト
シンプルなプロンプトに詳細を加えることで、より具体的な画像を生成することができます。例えば、以下のように詳細を追加します。
otoko no ko,student
描画タッチ
年齢を指定することで任意の画風にすることが可能です。
otoko no ko,10 years old,
otoko no ko,15 years old,
otoko no ko,20 years old,
クオリティの高い高解像度画像を生成する方法
ここからが本題です。Stable Diffusionの画像生成はプロンプトが同一であってもseed値によって生成される画像が変わります。そこで今回は高画質になるように画像を生成していきたいと思います。具体的にはHires. fixを使用していきたいと思います。
Hires fixとは
「Hires fix」は高解像度(High Resolution)で画像を生成する際に、より鮮明で細部がきれいに描写されるようにするための手法です。通常、画像生成モデルは低解像度で生成された画像を元にしますが、この方法では細部がぼやけたり、アーティファクトが発生することがあります。Hires fixを用いることで、これらの問題を軽減し、高品質な画像を生成することができます。
Hires fixの利点
- ディテールの向上: 低解像度で生成された画像よりも、細部が鮮明で詳細に描かれるため、よりリアルで高品質な画像が得られます。
- ノイズの低減: 高解像度でのノイズ処理により、画像中の不要なアーティファクトが減少します。
- 画質の向上: 全体的な画質が向上し、特に拡大時にその違いが顕著になります。
Hires fixを使用する際の注意点
- 計算リソースの消費: 高解像度での処理は計算リソースを多く消費します。処理時間も長くなるため、十分なハードウェアリソースが必要です。
- パラメータ設定: 適切なスケーリングファクターやノイズレベルを設定することが重要です。これにより、最適な結果を得ることができます。
生成条件
プロンプト
masterpiece, best quality, ultra-detailed, illustration, an extremely delicate and beautiful,
(inumimi,:1.5),(Shiba Inu tail:1.2),Brown Hair,petite,flat chest,pubic hair,skirt,
(skirt,wind lift, panties:1.2),(1 Tomgirl, boy face, solo:1.2),
(random moment pose,random clothes,Random Situations:1.5),
ネガティブプロンプト
prompt: fused bodyparts,ugly, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,artist name,text,monochrome,comic,multiple-views,hood,pubic hair,extra body parts,multiple views,comic,grown girl,looking at viewer,kissing,hugging,, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, out of focus, censorship, Missing vagina, Blurry faces, Blank faces, bad face, Ugly, extra ear, amputee, missing hands, missing arms, missing legs, Extra fingers, 6 fingers, Extra feet, Missing nipples, ghost,letters on wear,nude,man,boy,pussy,Nipples,(dog,cat,animal:1.8)
生成条件
Steps: 150, Sampler: DPM++ 3M SDE, Schedule type: Exponential, CFG scale: 7, Seed: 2947612275, Size: 800×800, Model hash: e12177c4b0, Model: himawarimix_v11, Denoising strength: 0.85, Hires upscale: 1, Hires steps: 30, Hires upscaler: SwinIR_4x, Version: v1.9.3
まとめ
Hires fixは、Stable Diffusionで高品質な画像を生成するための強力な手法です。低解像度での生成から高解像度へのスケーリング、そしてディテールの追加というステップを経ることで、より鮮明で詳細な画像が得られます。ただし、計算リソースや適切なパラメータ設定が重要となるため、それらを考慮した上で使用しましょう。