本文へジャンプ

Stable Diffusionを使って画像を作ってみた 〜イヌ編〜

Posted by OYM

夏の終わりを感じながら、あんまり夏らしいことをしなかったOYMです。
毎年夏前には、やりたいことをいくつも思いつくんですが、いざ夏になると暑くて外にも出たくなくなるので、毎回計画して実行されない夏を送っています。

前回、「Stable Diffusionを使ってダミー画像を作ってみた 〜ネコ編〜」 を公開しましたが、早くも1年経ってしまいました。早いものですね...。

あれから、生成AIの進化がどうなったのかも気になり、前回よりも より進化したStable Diffusionに触れていければと思います。そして今回はディレクターのINH氏に相談したところ、イヌ(特にサモエド)というリクエストも頂いたので、新たに可愛らしいサモエドを作れればと思います。

昨年からのアップデート

自分が以前使用していた、Stable Diffusion web UI は、バージョンが 1.2.2 から 1.7.0 までアップデートしていました。
その段階で、かなりの期待が出来そうでワクワクですが、ここでアップデートの内容を下記にまとめました。

  • ユーザーインターフェースの改良
    • 直感的で使いやすくなり、操作性が向上。
    • 初めて使う方でもスムーズに操作可能。
  • 新機能の追加
    • 高度な画像生成オプションや新しいフィルター、エフェクト機能が追加。
    • 多彩な表現が可能になり、クリエイティブな作品作りが容易に。
  • パフォーマンスの最適化
    • 画像生成の速度が向上。
    • より効率的に高品質な画像を生成可能に。
  • カスタマイズ性の強化
    • インストール可能なプラグインや拡張機能が増加。
    • ユーザーが環境を自由にカスタマイズできるように。

1年でかなり変更が加わったようなので、期待大ですね!

また、チェックポイント(生成モデル)の数も増えたようで、よりリアルなものが生成できるかもしれません。

試しにチャレンジしてみましょう!

プロンプト:a picture dog, realistic, bright, detailed eyes, natural light, natural color, 4k, bestQuality
ネガティブプロンプト:text, human
サンプリングステップ数:100

Stable Diffusion v1.2.2で生成したサモエド

  • version: v1.2.2  経過時間: 2m 51.49s

Stable Diffusion v1.7.0で生成したサモエド

  • version: v1.7.0  経過時間: 2m. 7.6s

上記比較して確かに感じたのは、生成スピードの速さです。すごく早い!

生成時間も40秒ほど縮んでいる上に、ボタンを押してから生成開始されるのも早まっていました。以前と比べて生成する時のストレスが減りました。

また、出力された画像も、心なしか以前より品質とクオリティが増したように感じます。
より生成したい文章に的確な画像ができているのではないかと思います。

サンプラー

Stable Diffusionで画像を生成する際に、「サンプラー」という重要な要素があります。これは、画像生成の過程でノイズを取り除く手順を制御するアルゴリズムです。サンプラーの選び方によって、最終的に得られる画像の質や生成時間が変わってきます。

代表的なサンプラーの種類

  1. DPM
    • 特徴: ディープ・ラーニングに基づいたプロセスで、精度の高い画像を生成します。ディテールを重視したい場合に向いています。
  2. Euler a
    • 特徴: スムーズな生成過程で、創造的な画像を作りやすいです。特に独自性のあるデザインに適しています。
  3. Heun
    • 特徴: 画像の滑らかさと連続性を保ちながら安定した生成が可能です。グラデーションや微細な調整に向いています。
  4. LMS
    • 特徴: 細部にわたるディテールを保ちながら、ノイズを効果的に除去できます。ディテール重視の画像生成に最適です。
  5. PLMS
    • 特徴: 安定していて、ステップごとの変動が少なく、安定した結果を求める場合に適しています。
  6. Restart
    • 特徴: 特定のステップから再生成を行うことで、生成プロセスを再調整できるサンプラーです。試行錯誤が必要な場合に便利です。

サンプラー選びのポイント

サンプラーは、生成したい画像のスタイルやクオリティ、生成時間に応じて選ぶのがポイントです。例えば、細かいディテールを重視するなら「DPM」や「LMS」、安定した結果が欲しいなら「PLMS」を選ぶといった具合です。

Stable Diffusionを使う際は、目的に合ったサンプラーを選んで、理想の画像を作りましょう!

Stable Diffusionのサンプラー

今回比較を作ってみましたが、パッとみただけでは ほとんど違いが分からないと思います。 作った自分ですらも 軽微な変化しか捉えられませんでした...

分かりやすく、APNGにしたものも参考にしてみてください。

APNGにした参考

こうして見ると、なんとなく分かるかと思います。
今回の内容だけでは、なかなか変化こそ生まれませんでしたが、どういったものが何に適しているかを自分で試行錯誤して、見つけ出す必要がありそうだと思いました。

個人的に、生き物を忠実に再現させるには「DPM++ 3M SDE Karras」が相性がいいなと感じました。

最終生成

それでは今回も、最終的に上で用いたサンプラーを使用して、最高のサモエド を生成していこうと思います。昨年よりも、よりリアルなものが生成できることが今回のゴールだと思います。

Stable Diffusionで生成した最高のサモエド

プロンプト:a picture samoyed, realistic, bright, detailed eyes, natural light, natural color, 4k, bestQuality
ネガティブプロンプト:text, human, comic, sketch, out of focus,  (worst quality:2)
モデル:wildlifexAnimals
サンプリングステップ数:100
サンプリング:DPM++ 3M SDE Karras

昨年と比較して、どれほど変化したのかと淡い期待をしておりましたが、思ってた以上に進化を遂げていて驚きました。
強いていうならば、どれも正面の画像になってしまうため、自然なサモエドにならないところが、まだAIらしい部分かなと感じています。

弊社のエンジニアでもAIに関心を持ち、業務で取り込んでいくというのが目的となっておりますが、日々目覚ましい進化を遂げていると感じています。

今回のサモエドも、来年にはもっとリアリティのあるものになってくれるだろうと思います。
そして、ディレクターのINH氏には、生成したサモエドで癒されて欲しいと思います。

いつかは、生成AIのみで画像が事足りて、画像素材を購入するということが無くなってしまうのかもしれません。
エンジニアやデザイナーもAIに仕事を奪われないよう、上手く利用していきたいと実感しました。

Recent Entries
MD EVENT REPORT
What's Hot?