AI駆動型の画像とビデオ生成の著名なプレーヤーであるLuma AIは、Ray3を発表しました。これは、精度が強化された複雑なアクションシーケンスに取り組むように設計された最初の推論ビデオモデルです。 Ray3は、すぐにリリースされ、すぐに利用可能なAIビデオテクノロジーの大幅な進歩を表しているため、作成者は時間の経過とともに一貫性を維持するより洗練されたクリップを作成できます。 Ray3のイノベーションの中心にあるのは、従来のモデルと区別する推論能力です。テキストプロンプトをビジュアルに直接翻訳する標準のAIシステムとは異なり、Ray3などの推論モデルは、追加のコンピューティングリソースを徹底的に処理するために割り当てます。これには、出力を改良し、エラーを減らし、詳細を追加するセルフチェックメカニズムが含まれます。ビデオ生成の場合、これは、より長いシーケンスで見られる典型的な劣化なしに複雑なプロンプトを処理することを意味します。業界のベンチマークは、ほとんどのAIに生成されたビデオが5〜10秒の範囲で繁栄し、長期にわたって継続的または「不安定な」結果をもたらすことが多いことを示しています。 Ray3は、その作成を系統的に評価して反復することにより、これらの問題を軽減し、以前は挑戦的だったより高度なシーンを可能にします。 Luma AI CEOのAmit Jainは、CNETとのインタビューでモデルの評価能力を強調しました。 「「ああ、これは良くないか、このようにこれがより良いものになる必要がある」と言うことができます」とJainは説明し、Ray3が単純なテキストからピクセルへの変換を超えてコンテンツの品質を積極的に向上させる方法を強調しました。 Ray3は、推論エンジンを補完するもので、ユーザー向けの実用的なツールを紹介します。新しい視覚アノテーション機能は、モデルの意思決定プロセスへの透明性を提供し、調整や領域のキャラクターのマーカーなどの注釈を表示して、変更しないようにします。これにより、ユーザーはフレームをマークアップし、その後のプロンプトの変更を指定し、反復的な創造性を促進できます。さらに、Ray3は16ビットHDR形式の生成をサポートし、標準出力と比較して優れた解像度、より細かい詳細、および高度の明確さを提供します。ワークフローを合理化するために、Luma AIはプロトタイピングを加速するドラフトモードを実装しました。このモードでは、ユーザーは約20秒で低解像度のクリップを生成でき、概念のテストに最適です。 Jainによると、満足すると、これらのドラフトは高忠実度のバージョンにアップスケールすることができます。これは2〜5分かかるプロセスです。これらの機能は、Ray3をプロのクリエイターとAI愛好家の両方にとって、効率的で高品質のビデオ制作を求めている汎用ツールとして位置付けています。 Ray3の発売は、業界の巨人からのAIビデオモデルの急増の中で到着します。 MidjourneyやGoogleのVEO 3などの競合他社も同様に、品質の向上、音声統合(VEO 3など)、およびプロのユーザーを引き付けるためのより広範なアクセシビリティに焦点を当てて提供しています。しかし、このような技術の急速な拡散は、創造的なコミュニティ内の懸念を引き起こしました。専門家は、データトレーニングの実践や展開リスクなど、AIが生成されたメディアの倫理的意味合いについて警報を発しています。これにより、AI企業に対してアーティストによって提起されたいくつかの集団訴訟が行われ、著作権で保護された作品の誤用が主張されています。 Luma AIは、プライバシーポリシーでユーザーデータ処理に対処し、提供された情報を使用してサービスを改善および強化するために利用できると述べています。 AIビデオのランドスケープが進化するにつれて、Ray3のような革新は、生成技術の持続可能性と公平性に関する継続的な議論をナビゲートしながら、クリエイティブツールのギャップを埋める推論モデルの可能性を強調しています。
Source: Luma AIは、Ray3推論ビデオモデルを発表します





