Google は、Vertex AI を使用した Google Cloud の顧客向けにビデオ生成モデル Veo のプライベート プレビューを発表しました。この発表により、Quora や Mondelez International などの企業は、クリエイティブおよびマーケティング目的でこの AI テクノロジーを活用できるようになります。
4 月に発表された Veo は、さまざまなフレーム レートで最大 6 秒間の 1080p クリップを含む高解像度ビデオを生成できます。ユーザーはプロンプトとともに画像を提供することでビデオを作成でき、モデルがさまざまなビジュアルおよび映画のスタイルをキャプチャできるようになります。 Google Cloud のプロダクト管理担当シニア ディレクターであるウォーレン バークレー氏は、API の提供が長らく待たれたのは、エンタープライズ向けの対応モデルを強化するためだったと強調しました。
このモデルは、爆発などの特定の効果を生成することに優れており、基本的な物理概念を理解しています。また、マスクされた編集を実行して、ユーザーがビデオ内の特定の領域を変更できるようにすることもできます。 Veo は、その機能にもかかわらず、オブジェクトの消失や非現実的な物理的動作など、現在の生成 AI に典型的な矛盾を示しており、その使用に潜在的な制限が生じています。
Veo と Imagen 3: 提供するもの
Google は、テキスト プロンプトから最高品質の画像を生成するように設計された生成画像モデルである Imagen 3 と並行して Veo を導入しました。どちらのモデルも Vertex AI の顧客に提供され、Imagen 3 は来週広く利用可能になる予定です。これらのツールを利用し始めた企業には Oreo や Cadbury などがあり、商用アプリケーションを強調しています。
以下のビデオのプロンプト: 美しい夕日、柔らかな光、暖かい色彩の中、一人のカウボーイが馬に乗って広い平原を横切っていきます。
(ビデオ: Google)
以下のビデオのプロンプト: 岩だらけの崖の上にそびえ立つ灯台の航空写真。その灯台が早朝の夜明けを切り裂き、波が下の岩に打ち寄せる
(ビデオ: Google)
Barkley 氏は、生成 AI がビジネス変革を推進しており、86% の企業が収益の増加を報告していると指摘しました。同氏は、Google が生成 AI テクノロジーの進歩に取り組んでいることが、Veo と Imagen 3 による最新のサービスに明らかであると述べました。
潜在的な悪用に対処するために、どちらのモデルにも有害なコンテンツの生成を防ぐための安全装置が組み込まれています。さらに、すべての出力には、誤った情報や誤った帰属に対抗するために目に見えないマーカーを埋め込む Google DeepMind の SynthID を含む電子透かしが含まれます。 Googleは、モデルのトレーニングには顧客データを使用せず、代わりに公開されているデータセットに重点を置いていると主張している。
Veo の最初の発表以来、エンタープライズ機能の強化が優先事項でした。モデルは膨大な数の高品質ビデオ サンプルを使用してトレーニングされましたが、特定のトレーニング データ ソースの詳細は未公開のままです。 Barkley氏は、一部のデータにはYouTubeのコンテンツが含まれる可能性があるが、それはGoogleとコンテンツ作成者との契約に基づいて運用されることを認めた。
Google の積極的なアプローチは、生成 AI に関連する知的財産リスクにも対処しています。 Veo は、暴力的で露骨なコンテンツをブロックするためのプロンプトレベルのフィルターを提供する予定であり、バークレー氏は、Veo の出力には著作権侵害の申し立てからユーザーを保護する補償ポリシーが付属することを示唆しました。
Veo は徐々に多くの Google 製品に統合されるため、このモデルは 5 月に Google Labs を通じて試験的に導入され、9 月に YouTube ショートの一部として発表されました。しかし、Googleは生成AI分野でOpenAIやAdobeなどの企業との競争に直面しており、これらの企業はさまざまなスタジオやクリエイティブエージェンシーとのパートナーシップを迅速に確保している。
注目の画像クレジット: Google DeepMind
Google の新しい AI ツールがビデオと画像の作成を永遠に変えるという記事は、TechBriefly に最初に掲載されました。
Source: Google の新しい AI ツールはビデオと画像の作成を永遠に変える