これらの安定拡散モデルで寝ないでください

安定拡散モデルは、リアルな画像、テキスト、さらには音楽の作成に使用できる生成モデルの一種です。これらは、ランダムなノイズ画像またはテキストから開始し、拡散プロセスに従って徐々に詳細を追加していきます。このプロセスにより、モデルが非現実的または不安定な画像を作成しないことが保証されます。

安定拡散モデルは、最初にランダムノイズイメージを作成することで機能します。次に、拡散プロセスを使用して、テキストの説明を考慮して画像を徐々に洗練します。

拡散プロセスは、「ソファに座っている猫」などの画像の高レベルの説明から始まります。プロセスが進むにつれて、「暖炉の前の青いソファに座っているトラ猫」のように、描写が詳細になっていきます。

最良の安定拡散モデルは何ですか?

安定した拡散モデルは、さまざまなオブジェクトやシーンの高品質の画像を生成できることが示されています。また、実際の写真と見分けがつかない画像を作成するためにも使用されています。

最適な安定拡散モデルの選択は、実際にはニーズによって異なります。各安定拡散モデルは独自の生成スタイルに特化しており、すべては生成されるビジュアルに依存します。

ワイフの拡散

リリース以来、Waifu Diffusion はアニメ Stable Diffusion のよく知られた改作となっています。興味をそそられる小規模なデータセットでモデルのトレーニングを続けることで、巨大なデータセットでトレーニングされたモデルを微調整できます。最新バージョンである Waifu Diffusion v1.4 は、Stable Diffusion v2 からのアップグレードであり、有名なアニメ画像掲示板 Danbooru からの 5,468,025 個のテキスト画像サンプルを利用しています。

最適な安定拡散モデル — Waifu Diffusion を使用して独自の Waifu を生成できます (画像クレジット)

現実的なビジョン

リアリズムは、機械に画像の作成を教える際に最も難しい側面の 1 つです。コンピューターは、最も小さな欠陥や微妙な点さえも検出する能力があるため、真に本物のような画像を作成することは困難です。ただし、Realistic Vision のトレーニング済みモデルによって提供される結果は優れています。

「白い背景」はモデルにとって唯一の困難な領域であり、モデルは私たちの課題に非常に近いリアルな女性のイメージを作り出すことができました。一方、景色は息をのむほど素晴らしく、環境の美しさをよく捉えています。最後のグラフィックは、Realistic Vision がデジタルアートの細部にまでこだわっていることを示しています。

ドリームシェイパー

DreamShaper は、その素晴らしいデジタルアートスタイルにより、よりイラストに似ています。このモデルはポートレートの仕事で素晴らしい仕事をし、描かれる人物の個性と美的特質を完璧に捉えた豪華な作品を作成しました。 DreamShaper は田園地帯を越えて、興味深いディテールを備えた美しく活気に満ちたアートワークを作成することができました。この画像には、目を引く色とともに奥行きと立体感を与えるさまざまな幾何学的形状が含まれています。

このモデルは、安定拡散モデルでグラフィックスを生成できるようにする場合に必要なものです。さらに、いくつかの設定を変更して、完成品をデジタルアートワークのように見せることもできます。

何でもモデル

Anything モデルは、主にアニメスタイルのシーンを再現するために開発されました。これは、さまざまな微妙なデザインの選択肢を持つ若い主人公を生み出したポートレートの課題の場合に特に顕著です。どれもコミカルな要素を持ちながらも、柔らかなトーンで素晴らしい空間を作り出していました。この例では、Anything が複雑な構造とコンポーネントを作成できることも示しました。

どのような主題でも、アニメスタイルのアートワークの基礎として使用できます。この素晴らしい安定拡散モデルを最大限に活用するために、VAE を試してみることを強くお勧めします。

安定拡散モデルのインストール方法

安定した拡散モデルを使用するには、まず必要なツール (正確には、Automatic111 SD Web UI) を入手する必要があります。 Automatic111 をインストールするには、次のものが必要です。

Python 3.10.6以降
ギット

これらを入手したら、次の手順に従って Automatic111 をインストールします。

Automatic111 リポジトリのクローンを作成する
ターミナルウィンドウを開き、Automatic111 をインストールするディレクトリに移動します。次に、次のコマンドを実行します: git clone https://github.com/AUTOMATIC111/web-ui.git
自動111を実行します。ターミナルウィンドウで、Automatic111 リポジトリのクローンを作成したディレクトリに移動します。
次に、次のコマンドを実行します: python webui.py

これにより、Automatic111 Web インターフェイスが起動します。 Web インターフェイスを使用して、安定した拡散モデルで画像やテキストを作成できます。

それが完了したら、Civit.AI にアクセスして気に入ったモデルをダウンロードし、Stable Diffusion のインストールディレクトリ内の「Models」フォルダに移動して、そこにモデルを貼り付けるだけです。

モデルを使用するには、Automatic111 の SD Web UI を開いて、左上隅からモデルを選択する必要があります。どのモデルも独自のスタイルを生成するのが得意であるため、独自の世代に対してさまざまな Stable Diffusion モデルを試すことが、Stable Diffusion を使用して見事なビジュアルを作成する成功の鍵となることに注意してください。

Epic Gamesは、もう1つの「ミステリーゲーム」を提供します。カウントダウンと噂

最適な安定拡散モデルのリストからモデルを選択したら、ControlNet 安定拡散を使用してより良い画像を生成する方法を必ず学習してください。

注目の画像クレジット: Chandlervid85/Freepik。

Source: これらの安定拡散モデルで寝ないでください