Stable Diffusionでの画像生成には、適切なプロンプト(呪文)や強調構文の使用が不可欠です。この記事では、効果的なプロンプトを作成するための基本的なテクニックと、画像生成のクオリティを向上させるための強調構文について詳しく解説します。
プロンプト作成の基本
まず、プロンプトとは、Stable Diffusionに対して生成したい画像の内容を伝えるための文章です。プロンプトはシンプルで明確である必要があります。具体的な例を見てみましょう。
シンプルなプロンプト例
2girl
このようなプロンプトでは一人の女の子の画像が生成されます。
詳細なプロンプト
シンプルなプロンプトに詳細を加えることで、より具体的な画像を生成することができます。例えば、以下のように詳細を追加します。
2girl,teenage
描画タッチ
描画タッチを指定することで任意の画風にすることが可能です。
2girl,teenage,game cg
2girl,teenage,anime colored
2girl,teenage,illustration
クオリティの高い高解像度画像を生成する方法
ここからが本題です。Stable Diffusionの画像生成はプロンプトが同一であってもseed値によって生成される画像が変わります。そこで今回は高画質になるように画像を生成していきたいと思います。具体的にはHires. fixを使用していきたいと思います。
Hires fixとは
「Hires fix」は高解像度(High Resolution)で画像を生成する際に、より鮮明で細部がきれいに描写されるようにするための手法です。通常、画像生成モデルは低解像度で生成された画像を元にしますが、この方法では細部がぼやけたり、アーティファクトが発生することがあります。Hires fixを用いることで、これらの問題を軽減し、高品質な画像を生成することができます。
Hires fixの利点
- ディテールの向上: 低解像度で生成された画像よりも、細部が鮮明で詳細に描かれるため、よりリアルで高品質な画像が得られます。
- ノイズの低減: 高解像度でのノイズ処理により、画像中の不要なアーティファクトが減少します。
- 画質の向上: 全体的な画質が向上し、特に拡大時にその違いが顕著になります。
Hires fixを使用する際の注意点
- 計算リソースの消費: 高解像度での処理は計算リソースを多く消費します。処理時間も長くなるため、十分なハードウェアリソースが必要です。
- パラメータ設定: 適切なスケーリングファクターやノイズレベルを設定することが重要です。これにより、最適な結果を得ることができます。
生成条件
masterpiece, best quality, (wind lift, panties:1.3) , (otoko no ko:1.5) ,student,school, (bulge:1.2) , (pussy juice:1.1) ,netorare,
A 15-year-old boyish girl in a skirt, standing on the school rooftop during a sunny afternoon. She wears a school uniform with a pleated navy skirt, a white blouse, and underneath, glimpses of cute patterned shorts can be seen when the wind lifts her skirt slightly. She leans against the railing, her face filled with a mix of shyness and contentment as she enjoys the warm breeze. Around her, the cityscape stretches out under the clear blue sky, and the distant sounds of students can be heard from the playground below. She takes a moment to herself, feeling both the freedom of the open sky and the thrill of her small, hidden fashion secret. landscape art by Vincent van Gogh, masterpiece, best quality, (wind lift, panties:1.3) , (otoko no ko:1.5) ,student,school, (bulge:1.2) , (pussy juice:1.1) ,netorare, Post-Impressionism, expressive brushwork, vibrant colors, handsome, imposing, pure, professional creative, lush, unique
Negative prompt: emotionless, plain, boring, low contrast, photorealism, modernist, minimalist, gothic, (dark:1.3), (moody:1.3), (monochromatic:1.3), ugly, gritty, amateurish, sloppy, unattractive, baggy, cheap, trashy clothing, night, washed out, portrait, cropped, worst quality, low quality, poorly drawn, low resolution, nsfw,multiple angle,blurry,longbody, lowres, bad anatomy, bad hands, missing fingers, pubic hair,extra digit, fewer digits, cropped, worst quality, low quality,text,error,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,missing fingers,bad hands,missing arms,large breasts,head_out_of_frame,2koma,panel layout,
Steps: 150, Sampler: DPM++ 3M SDE, Schedule type: Exponential, CFG scale: 7, Seed: 1998288857, Size: 800×800, Model hash: e12177c4b0, Model: himawarimix_v11, Denoising strength: 0.85, Hires negative prompt: “low contrast, photorealism, modernist, minimalist, drawing, sketch, frame, watermark, gothic, dark, moody, monochromatic, ugly, gritty, amateurish, sloppy, unattractive, baggy, cheap, trashy clothing, portrait, cropped, worst quality, low quality, poorly drawn, low resolution, emotionless, plain, boring, nsfw,multiple angle,blurry,longbody, lowres, bad anatomy, bad hands, missing fingers, pubic hair,extra digit, fewer digits, cropped, worst quality, low quality,text,error,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,missing fingers,bad hands,missing arms,large breasts,head_out_of_frame,2koma,panel layout,”, Hires upscale: 1, Hires steps: 40, Hires upscaler: SwinIR_4x, Version: v1.9.3
まとめ
Hires fixは、Stable Diffusionで高品質な画像を生成するための強力な手法です。低解像度での生成から高解像度へのスケーリング、そしてディテールの追加というステップを経ることで、より鮮明で詳細な画像が得られます。ただし、計算リソースや適切なパラメータ設定が重要となるため、それらを考慮した上で使用しましょう。