本日、Google Muse AI として知られる人工知能システムが正式に発表されました。 並列デコードと小さな個別の潜在空間の使用に基づいて、新しいテキストから画像への変換モデルは、既存の代替モデルよりも高速であると主張しています。 Google Muse AI の作成者は、彼らの作成により、最高の最高のものに匹敵する品質レベルで写真を生成できると主張しています。
我々が提示します ミューズ、拡散または自己回帰モデルよりも大幅に効率的でありながら、最先端の画像生成パフォーマンスを実現するテキストから画像への Transformer モデル。
Google Muse AI チーム
Google Muse AI とは
チームは、Google Muse AI が、Imagen や DALL-E 2 などの以前のテキストから画像へのトランスフォーマー モデルに比べて大幅に改善されていると主張しています。Muse は、大きな言語モデルのテキスト埋め込みを使用して、個別のトークン スペース (LLM) でマスクされたモデリング ジョブでトレーニングされます。 )。

Muse は、意のままに偽装された画像内のトークンを認識することができます。 離散トークンの使用とサンプル サイズの要件の減少により、Muse は、Imagen や DALL-E 2 などのピクセル空間拡散モデルを打ち負かすことを約束します。このモデルは、応答で画像トークンを繰り返しリサンプリングすることにより、無料のゼロ ショット、マスクなしの編集を生成します。プロンプトに。
MUSE のベンチマークに基づくと、Muse の推論時間は競合モデルよりも大幅に短くなっています。
| モデル | 解決 | 推論時間 (↓) |
| 安定拡散 1.4 | 512×512 | 3.7秒 |
| パート3B | 256×256 | 6.4秒 |
| イメージン | 256×256 | 9.1秒 |
| イメージン | 1024×1024 | 13.3秒 |
| ミューズ-3B | 256×256 | 0.5秒 |
| ミューズ-3B | 512×512 | 1.3秒 |
Parti や他の自己回帰モデルとは異なり、Muse は並列デコードを利用します。 高品質の画像を生成し、オブジェクト、それらの空間的関係、スタンス、カーディナリティなどの視覚的概念を認識するために、すでに教えられた LLM は英語を詳細なレベルで理解する必要があります。 Muse がインペインティング、アウトペインティング、およびマスクなしの編集をサポートするために、モデルを反転する必要はありません。

Google Muse AI の機能
Muse は、テキストから画像を生成および変更するための迅速で最先端のモデルであり、次のような便利な機能がいくつかあります。
- テキストから画像への生成
- テキスト入力に反応して、Google の人工知能 (AI) Muse が高品質のビジュアルを迅速に生成します (TPUv4 では、512×512 解像度で 1.3 秒、256×256 解像度で 0.5 秒)。

- ゼロショット、マスクフリー編集
- Google Muse AI モデルは、テキストの指示に応じて画像トークンを繰り返しサンプリングすることで、無料のゼロショット、マスクなしの編集を提供します。

- イメージを変更する場合、マスクフリー編集により、単純なテキスト プロンプトで複数のオブジェクトを操作できます。

- ゼロショットインペインティング/アウトペインティング
- Google の Muse AI は無料で、マスクベースの編集機能 (インペインティングとアウトペインティング) が付属しています。 エディットにマスクを適用することで、新世代と機能的に同等になります。

Elon Musk のようにツイートするのに役立つ最高の AI ツイート ジェネレーターをチェックしてください。
Google Muse AI モデルの詳細
以下で、Google の Muse AI のトレーニング フローを確認できます。

Google チームは 2 つの異なる VQGAN トークナイザ ネットワークを使用しています。1 つは低品質の写真用で、もう 1 つは高解像度の画像用です。 低解像度 (「ベース」) および高解像度 (「スーパーレス」) トランスフォーマーは、マスクされていないトークンと T5 テキスト埋め込みを使用してトレーニングされ、マスクされたトークンを予測します。
Google Muse AI の詳細については、ここをクリックしてください。
説明した AI ツール
「AI で生成された画像にはノー」と言う人もいますが、ほぼ毎日、次のような新しい AI ツールが私たちの生活に登場します。
- 落ち着いた AI
- カクタス AI
- OpenAI ポイント E
- ユーバーダック AI
- QQ 異次元の私
- MyHeritage AI タイム マシン
- メタのシセロ AI
- 概念 AI
- メタギャラクティカ AI
- 小説AI
- Make-A-Video メタ AI
- ダルイー2
- ウォンボドリーム
- Google の DreamBooth AI
- 安定拡散
詳細をお楽しみに!
Source: Google Muse AI: 機能、例など








