AIを搭載したクリエイティブテクノロジーの先駆者であるLightricksは、これまでに最も高度な生成ビデオモデル(LTXビデオ130億パラメーターシステム、またはLTXV-13B)を正式に開始しました。このマイルストーンは、同社のフラッグシップ製品ラインの主要なアップグレードを示しており、優れた品質、比類のないレンダリング速度、およびエコシステム全体のより広範なアクセシビリティを約束します。 LTXV-13Bモデルは、同社のコアストーリーテリングプラットフォームであるLTX Studio内で入手できるようになり、Lightricksのツールスイート全体に統合されています。

LTXV-13Bは、Lightricksにとって重要な技術的飛躍を示し、新しいレベルの創造的な精度、ビデオの忠実度、パフォーマンスのロックを解除するために設計された130億パラメーターアーキテクチャを活用します。このモデルは、最先端の学術研究とオープンソースコミュニティの最近のイノベーションと統合し、サンプリング制御や、ビデオ編集ワークフローを強化するための空間的なガイダンスなどの高度なメカニズムを統合します。これらの機能強化により、モデルは生成ビデオAIの急速に進化する市場で積極的に競争するように配置されています。

LTXV-13Bを競合他社から分離しているのは、速いレンダリング速度を維持しながら、非常に高品質のビデオ出力を提供する能力です。このパフォーマンスの背後にある主要な要因は、Lightricksの新しい「マルチスケールレンダリング」アーキテクチャです。これは、視覚芸術家や映画製作者の創造的なワークフローに触発されたレンダリング方法です。

マルチスケールレンダリングは、伝統的なアーティストが色、深さ、より細かい詳細を重ねる前に、広いストロークでシーンをスケッチする方法を模倣します。技術的には、これはモデルが最初にシーンの高速で物理的に正確なベースレイヤーを生成し、第2段階で高解像度の詳細パスを適用することを意味します。この反復プロセスは、視覚的な一貫性と解像度を強化するだけでなく、同様にサイズのモデルが必要とするもののほんの一部にレイテンシを削減します。 Lightricksによると、LTXV-13Bを使用したレンダリング時間は、同等のサイズの競合システムよりも最大30倍高速になります。

同社はまた、現実世界のアクセシビリティを念頭に置いてモデルを設計しました。 LTXV-13Bは、さまざまな消費者グレードGPUで効率的に実行するように最適化されています。これは、クラウドスケールのインフラストラクチャやプロフェッショナルグレードのハードウェアを必要とせずに、クリエイターが個人デバイスで作業できるようにすることでAIビデオ生成を民主化する動きです。

「13BパラメーターLTXビデオモデルの導入は、AIビデオ生成の極めて重要なモーメントをマークし、消費者GPUで高速で高品質のビデオを生成する機能です」とLightricksの共同設立者兼CEOであるZeev Farbman氏は述べています。 「当社のユーザーは、より一貫性、より良い品質、より厳しいコントロールを備えたコンテンツを作成できるようになりました。この新しいバージョンのLTXビデオは、消費者ハードウェアで実行され、すべての製品を違うものにしておくことができます – スピード、創造性、ユーザビリティ。」

モデルの機能とデータセットの整合性をさらに拡大するために、Lightricksはトップメディアプロバイダーとの主要な戦略的パートナーシップに参加しました。 2024年12月に発表されたShutterStockとの同様の合意に続いて、Getty Imagesとの顕著なコラボレーションが確立されました。これらの提携は、モデルトレーニングのためのプレミアムビジュアルコンテンツの膨大なアーカイブへのLightricksにアクセスでき、強力で視覚的に豊富なだけでなく、商業用に倫理的に訓練され、安全なツールを構築するという野心をサポートします。

LTXV-13Bプラットフォームは、より深い創造的な制御を可能にするより広範な機能を備えており、次のような高レベルの生産機能をサポートしています。

  • キーフレーム編集
  • カメラモーションコントロール
  • キャラクターとシーンレベルのモーション調整
  • マルチショットシーケンスと編集

Lightricksはまた、LTXV-13Bモデルの無料ライセンスを1,000万ドル未満の年間収益を上げる企業に拡張し、小規模なクリエイティブチームと新興のスタートアップの扉を開き、企業ライセンスの財政的障壁なしに高度なAIビデオツールを統合しています。並行して、LightricksはLTXVモデルのオープンソーシングに取り組んでおり、現在はLTX-Videoという名前でFaceとGithubを抱きしめて公開されています。

「モデルを一貫して改良し、オープンコミュニティと協力することで、芸術的コントロールを維持しながら物理的に自然な動きを生成するAIシステムを構築しました」と付け加えました。 LightricksのLTXビデオのディレクター、Yoav Hacohen

2024年11月の最初の発売以来、LTXビデオでは、学術研究者とより広範なオープンソース開発者コミュニティからの貢献によってサポートされている継続的な改良が見られました。このコラボレーションにより、動きの滑らかさ、時間的一貫性、全体的な創造的な柔軟性の着実な改善が生じました。

LTXV-13Bに組み込まれている注目すべきオープンソースイノベーションのいくつかは次のとおりです。

  • VACEモデルの推論 – 参照対ビデオ(R2V)を含む高度なビデオ生成および編集ツール。 Githubの詳細
  • ビデオ編集用のアップサンプリングコントロール – ノイズを逆にし、フレームの粒度を改良するツール。 Githubの詳細。
  • カーネルの最適化 – UEFFICTIAL Q8カーネルの使用により、リソースの低いデバイスでのパフォーマンススケーリングが可能になります。 GithubとHuggingfaceの詳細。

LTXV-13Bモデルのリリースにより、Lightricksは生成AIビデオで何が可能かを再定義するという使命を2倍にしています。同社の戦略は、パフォーマンス、アクセシビリティ、コラボレーションに基づいており、AIを搭載したクリエイティブメディアの新しい時代の最前線に配置します。 Lightricksのオープンソースイニシアチブとモデルへのアクセスの詳細については、www.lightricks.comをご覧ください。


特集画像クレジット

Source: Lightricksは、HQ AIビデオ生成のための13B LTXビデオモデルを発表します

  Google が作ったもの: 2024 年までに形作られる