Stability AI の主要なテキストから画像へのアルゴリズムの最も強力なバージョンである SDXL 1.0 が発表されました。 消費する処理リソースが少なく、0.9 バージョンよりも高解像度の画像が生成され、テキスト クエリの数が少なくなります。 Stable Diffusion XL 1.0 を使用すると、これまで以上に便利で効率的になります。
ChatGPT のような人工知能ツールは、単にテキストを生成するだけではありません。 彼らは現在、音楽、映画、画像などのさまざまなメディアを制作する可能性があります。 AI プログラム Stable Diffusion を使用すると、誰でも実質的にあらゆる画像を作成できます。 すでに広く使用されている SD および同等のツールの使用率は、アップグレードによって大幅に向上します。
「SDXL 1.0 を使用すると、カスタム データに合わせてモデルを微調整することがこれまでより簡単になります。 カスタム LoRA またはチェックポイントは、データ ラングリングの必要性を減らして生成できます。 Stability AI チームは、SDXL に特化した T2I / ControlNet を使用して、タスク固有の次世代の構造、スタイル、および構成コントロールを構築しています。 これらの機能は現在ベータ プレビュー段階ですが、微調整に関する最新情報をお待ちください」と Stability AI は発表しました。

SDXL 1.0の機能
新しい微調整ベータ機能のおかげで、顧客はわずか 5 枚の画像で特定の人物や物を生成することに特化できるようになりました。 このユーティリティは、少数の写真を使用して SDXL 1.0 を磨きます。
現在市場にある最も効果的なオープンアクセス画像モデルの 1 つである SDXL 1.0 には、66 億のパラメータ モデル アンサンブル パイプラインと 35 億のパラメータ ベース モデルがあります。 Stability.ai の Clipdrop を使用してモデルを無料で試すことができます。
Stability AI の新しい機能で画像を強化 SDXL0.9
潜在拡散の完全なモデルは、さまざまな専門家のパイプラインです。最初のフェーズでは、基本モデルが (ノイズの多い) 患者を生成し、その後、最終的なノイズ除去ステップ用に特別に作成された改良モデルによってさらに処理されます。 ベースモデルはモジュールとして独立して使用できることを忘れないでください。

この 2 段階のアーキテクチャにより、速度を落とさず、また過剰な CPU リソースを必要とせずに、画像生成の復元力が実現します。 SDXL 1.0 は、8GB VRAM を備えたコンシューマ GPU または広くアクセス可能なクラウド インスタンスで効果的に動作するはずです。
「SDXL は、事実上あらゆるアート スタイルで高品質の画像を生成し、フォトリアリズムに最適なオープン モデルです。 モデルによって与えられる特定の「感触」を持たせることなく、独特のイメージを促すことができ、スタイルの完全な自由を保証します。 SDXL 1.0は、ネイティブ解像度1024×1024で、前バージョンよりも優れたコントラスト、ライティング、シャドウを備え、鮮やかで正確な色を実現するために特によく調整されています」とStability AIはブログ投稿で述べた。
スタビリティ AI が起動 安定の落書き スケッチから画像への生成を可能にします
さまざまなプラットフォームで SDXL 1.0 を使用する方法
このモデルには、Stability AI API、GitHub ページ、およびその Clipdrop および DreamStudio コンシューマー アプリケーションを通じてアクセスできます。 これは、ユーザーが ML ソリューション、モデル、アルゴリズムを入手できる ML ハブである Amazon SageMaker JumpStart にもあります。
SDXL 1.0 のリリースは、7 月の研究専用の SDXL 0.9 リリースに続いて行われました。 同社はモデルを変更して、より忠実な色とまばゆいばかりの色を生成し、コントラスト、照明、影を強化したとされています。 イメージング プロセスも改善され、さまざまなアスペクト比でフル 1 メガピクセル解像度のイメージ (1024 x 1024) をより迅速に生成できるようになりました。
Stable Diffusion XL 1.0 を使用するために必要なリンクの一部を以下に示します。 SDXL 1.0 の使用を開始するには、次のさまざまなプラットフォームを確認してください。
- クリップドロップ
- GitHub
- 安定性AI API
- AWS セージメーカー
- AWS の基盤
- 安定した財団の不和
- ドリームスタジオ
SDXL はオープンソースであるため、Midjourney よりもさらに多くの機能と可能性を秘めていますが、効果的に使用するにはもう少し努力が必要です。 おそらく、画質の点でMidjourneyの品質の程度に匹敵する市販の画像モデルはSDXLだけです。
注目の画像クレジット: Stability AI
Source: 強化された機能を備えた SDXL 1.0 が登場
