アリババ AI は、静止したポートレートを本物のようなアニメーションビデオに変換する機能を持つ EMO (「Emote Portrait Alive」の略) と呼ばれる画期的なテクノロジーを発表しました。
AI はビデオに対する私たちの考え方を変えつつあるので、準備をしてください。 OpenAI や Alibaba のような企業は、新しいツールで私たちの心を驚かせています。 OpenAI の Sora を覚えていますか? テキストだけから全身ビデオキャラクターを作成できます。 現在、アリババは、古いポートレートを撮影して生き生きとさせることができる EMO (「Emote Portrait Alive」) と呼ばれるものを開発しました。
特にビデオを作るのが好きな人、または AI に魅了されている人にとっては、これは非常に大きなことです。 EMO がどのように機能するのか、そして EMO を使ってどんなクレイジーなことができるのかを詳しく見てみましょう。

Alibaba AI EMO (エモート ポートレート アライブ) とは何ですか?
EMO はアリババが開発した高度な AI システムで、1 枚の静止画からリアルな話したり歌ったりするビデオを生成できます。 オーディオ主導のトーキング ヘッド ビデオ生成を利用して、信じられないほどリアルなアニメーションを作成します。
EMO がどのように機能するかを詳しく見てみましょう。
- 単一画像入力: EMO の魔法は 1 枚のポートレート写真から始まります。 歴史上の人物、架空の人物、または自分の写真でも構いません
- オーディオ入力: ポートレートをアニメーション化するには、EMO には音声入力 (スピーチまたは歌) が必要です
- AIマジック: EMO の洗練された AI アルゴリズムが画像と音声の両方を分析し、提供された音声と完全に同期する正確な顔の表情、口の形、頭の動きを生成します。
Alibaba AI EMO は、信じられないほどリアルなアニメーションを作成する能力で他と一線を画しています。 生成されるビデオは実際の映像と区別できないことが多く、AI を利用したコンテンツと現実の境界があいまいになります。 このレベルのリアリズムは、AI 主導のアニメーション テクノロジーにおける大きな進歩です。
EMO は、本物のような動きを超えて、歌と音声の両方を簡単に処理します。 音声録音でも歌でも、EMO は音声に合わせた適切な表現でポートレートをアニメーション化します。 この多用途性により、さまざまなアプリケーションにとって強力なツールになります。
EMO では、オーディオ入力の長さによってアニメーション ビデオの長さを決定できるため、柔軟性も提供されます。 つまり、必要に応じて短いクリップや、より長くて詳細なアニメーションを作成できます。
アリババには AI 研究プロジェクト チームがあるのですか?
アリババは重要な AI 研究プロジェクトを進行中です。
2017 年に、AI、機械学習、データ インテリジェンスなどの最先端テクノロジーの探索に特化した世界的な研究イニシアチブである DAMO アカデミー (発見、冒険、勢い、展望) を設立しました。 アリババは、自社の広大な電子商取引プラットフォームやその他のさまざまな分野に AI を積極的に適用しています。
たとえば、AI はスマート物流システム内で配送ルートや倉庫管理を最適化する役割を果たします。 また、自然言語処理を通じてチャットボットと顧客サービスを強化し、顧客向けにパーソナライズされた製品の推奨事項を作成します。 アリババは、こうした取り組みに数十億ドルを投資することで、AI 研究への取り組みを示しています。
ディープフェイクの疫病
Alibaba AI の EMO は、すでに懸念されているディープフェイクの世界に深刻なリスクをもたらします。 欺瞞的なコンテンツの作成がはるかに簡単になる可能性があります。 EMO を使用すると、広範な技術知識を持たない人でも、実際に行ったことのないことを言う人々のリアルなビデオを生成できます。 EMO の高度なアニメーション技術は、これらのディープフェイクをさらに説得力のあるものにし、本物と捏造の境界線を曖昧にする恐れがあります。 音声入力だけで人物の肖像を操作できるこの機能は、潜在的に壊滅的な虚偽表示への扉を開きます。
EMO は、AI を活用した操作の驚くべき機能を強調しています。 この種のテクノロジーは悪者の手に渡れば危険な可能性があり、より厳格な規制と保護措置が緊急に必要であることが浮き彫りになっています。 潜在的な被害は、単純な人物の暗殺から、メディアの信頼を完全に揺るがす可能性のある大規模な誤情報キャンペーンまで多岐にわたります。 こうした悪影響を防ぐために、細心の注意を払って EMO や同様のテクノロジーに取り組むことが重要です。
研究論文全文はこちらをご覧ください。
注目の画像クレジット:マーク・デインズ/アンスプラッシュ。








