Stable Diffusionでの画像生成には、適切なプロンプト(呪文)や強調構文の使用が不可欠です。この記事では、効果的なプロンプトを作成するための基本的なテクニックと、画像生成のクオリティを向上させるための強調構文について詳しく解説します。

プロンプト作成の基本

まず、プロンプトとは、Stable Diffusionに対して生成したい画像の内容を伝えるための文章です。プロンプトはシンプルで明確である必要があります。具体的な例を見てみましょう。

シンプルなプロンプト例

2girl


このようなプロンプトでは一人の女の子の画像が生成されます。

詳細なプロンプト

シンプルなプロンプトに詳細を加えることで、より具体的な画像を生成することができます。例えば、以下のように詳細を追加します。

2girl,teenage

このプロンプトでは制服を着た一人の女の子の画像が生成されます。

強調構文の使用

プロンプトの一部を強調することで、特定の要素を目立たせることができます。強調構文は中括弧({})を使って行います。

2girl,teenage,(anime:0.5)

2girl,teenage,anime

2girl,teenage,(vulgarity:1.5)

 

クオリティの高い高解像度画像を生成する方法

ここからが本題です。Stable Diffusionの画像生成はプロンプトが同一であってもseed値によって生成される画像が変わります。そこで今回は高画質になるように画像を生成していきたいと思います。具体的にはHires. fixを使用していきたいと思います。

Hires fixとは

「Hires fix」は高解像度(High Resolution)で画像を生成する際に、より鮮明で細部がきれいに描写されるようにするための手法です。通常、画像生成モデルは低解像度で生成された画像を元にしますが、この方法では細部がぼやけたり、アーティファクトが発生することがあります。Hires fixを用いることで、これらの問題を軽減し、高品質な画像を生成することができます。

Hires fixの利点

  • ディテールの向上: 低解像度で生成された画像よりも、細部が鮮明で詳細に描かれるため、よりリアルで高品質な画像が得られます。
  • ノイズの低減: 高解像度でのノイズ処理により、画像中の不要なアーティファクトが減少します。
  • 画質の向上: 全体的な画質が向上し、特に拡大時にその違いが顕著になります。

Hires fixを使用する際の注意点

  • 計算リソースの消費: 高解像度での処理は計算リソースを多く消費します。処理時間も長くなるため、十分なハードウェアリソースが必要です。
  • パラメータ設定: 適切なスケーリングファクターやノイズレベルを設定することが重要です。これにより、最適な結果を得ることができます。

生成条件

(wind lift, panties:1.3),
An athletic teenage girl with medium-length black hair tied in a ponytail and dark brown eyes, wearing an Olympic soccer uniform top and a skirt. She is running swiftly across the soccer field, dribbling the ball with focused determination. The background includes other players, Olympic banners, and a stadium filled with cheering fans.
Negative prompt: nsfw,nude,multiple angle,blurry,longbody, lowres, bad anatomy, bad hands, missing fingers, pubic hair,extra digit, fewer digits, cropped, worst quality, low quality,text,error,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,missing fingers,bad hands,missing arms,large breasts,head_out_of_frame,2koma,panel layout
Steps: 75, Sampler: DPM++ 3M SDE, Schedule type: Exponential, CFG scale: 7, Seed: 289585293, Size: 512×512, Model hash: e12177c4b0, Model: himawarimix_v11, Denoising strength: 0.7, Hires upscale: 2, Hires steps: 30, Hires upscaler: SwinIR_4x, Version: v1.9.3

 

まとめ

Hires fixは、Stable Diffusionで高品質な画像を生成するための強力な手法です。低解像度での生成から高解像度へのスケーリング、そしてディテールの追加というステップを経ることで、より鮮明で詳細な画像が得られます。ただし、計算リソースや適切なパラメータ設定が重要となるため、それらを考慮した上で使用しましょう。

最新情報をチェックしよう!