メタバースを形成することで知られるテクノロジー巨人である Meta は、最近、人工知能の目覚ましい進歩である Emu AI (略称) を発表しました。 表現力豊かなメディア ユニバース。

この最先端の AI モデルは、 テキストの説明から画像を生成するプロセスに革命をもたらします。

エミュAI
Emu AI は、テキストの説明から画像を作成する方法を完全に変える可能性を秘めています (画像クレジット)

Emu AIによる品質チューニング

Emu の創意工夫の中心には、として知られるテクニックがあります。 「クオリティチューニング」。 この革新的なアプローチにより、AI テキストから画像へのモデルによって生成された画像の視覚的な魅力。 結果は、視覚的に印象的なだけでなく、提供されたテキストに非常に忠実です。

広範な研究努力の中で、Meta の AI チームは次のような旅に乗り出しました。 潜在拡散モデルの事前トレーニング。 この初期段階には次のことが含まれていました 驚異的な 11 億の画像とテキストのペアで構成される巨大なデータセット。 しかし、 真のブレークスルーは微調整段階で現れました。 システムがトレーニングを受けた場所 厳選されたわずか 2000 枚の高品質画像。

テクノロジーと人間の専門知識の融合

このプロセスは、「発見」と表現されます。 「干し草の山の中の写真映えする針」 最先端のテクノロジーと不可欠な人間味を融合させます。 初期のデータセットは膨大で、数十億の画像をキャプチャしていました。 それでも、それは終わった 一連の自動フィルター この画像の宝庫が洗練されていることを。 などの要因 攻撃的なコンテンツ、画像とテキストの配置、 そして テキストオーバーレイ 精査された。 ただし、自動フィルタリングの限界は明らかでした。 人間のアノテーターの重要な参加につながります。

ジェネラリストからスペシャリストまで幅広いアノテーターが参加 極めて重要な役割 選考過程で。 彼らの洞察力のある目は、最高級の画像、つまり超越した画像のみを確実に撮影しました。 ‘良い’ 達成する 「例外的な」 ステータス – 最終カットを行いました。 最後に、 わずか2000枚の画像が残っていたのですが、 それぞれが紛れもない魅力を持っています。

エミュAI
エミューは、その珍しい、注目を集める性質で有名な鳥であり、エミュー AI というあだ名が与えられています (画像クレジット)

区別のあだ名

この画期的なモデルの愛称として「Emu」を選択したのは、 シンボリック。 に敬意を表しています。 エミューは、その独特で注目を集める性質で知られる鳥です。 この選択は、Emu の能力を反映しています。 注目を集める そして 画像生成の分野で際立っています。

Emu AI の最先端技術への勝利

Emu AI の優れた能力は、フォトリアルな設定の領域を超えており、 スケッチや漫画を作成します。 との比較評価 最先端のSDXL1.0モデル 顕著な結果をもたらしました。 Emu が優先される選択肢として浮上しました。 希望率68.4%視覚的にアピールするために PartiPrompts ベンチマークではさらに優れた結果が得られました。 希望率 71.3% Open User Input ベンチマークでの結果です。

Meta の研究者らは、Emu の卓越したパフォーマンスはモデル アーキテクチャだけでなく、決定的に重要なことであると考えています。 微調整に使用されるデータの品質と多様性。 驚くべきことに、その影響は、 わずか 100 枚の高品質トレーニング画像 on Emu AI の生成機能は充実していました。 これは、AI の創造性を人間の美学と一致させる上で、選ばれた一連の模範的な例の有効性を強調しています。

  Alienwareは、CES2022で世界初の量子ドットOLEDゲーミングモニターをデビューさせます

Emuの多面的な芸術性

Emu の最も賞賛に値する機能の 1 つは、その多用途性です。 描写力を発揮します 膨大な数の概念、 からの範囲 肖像画広大な風景 そして 抽象芸術さえも。 この多用途性により、Emu は次のような強力なツールとして位置づけられます。 アーティスト、デザイナー、 そして クリエイター さまざまな視覚分野にわたって。

エミュAI
Emu AI は、アイデアを視覚的に魅力的なコンテンツに簡単に変える AI を作成するメタにとって大きな一歩を踏み出しました (画像クレジット)

AI 主導の創造性の未来を開拓する

エミューが代表する メタにとって大きな飛躍 シームレスに実現できるAIへ アイデアを視覚的に魅力的なコンテンツに変換します。 これは、機械学習データセットにおける細心の注意を払ったキュレーションの価値を証明するものとなります。 さらに、テキストだけで私たちの想像力豊かなビジョンを実現するのに十分かもしれない未来への興味深い垣間を提供します。

Emu の機能は間もなく Meta AI チャットボットを通じてアクセスできるようになり、 視覚的に素晴らしいコンテンツの作成を民主化する 無数のアプリケーションやデバイスにわたって。

注目の画像クレジット: メタ

Source: Emu AI が GenAI レースに見事に参戦