OpenAI は、ChatGPT のリアルタイム ビデオ機能を開始し、ビジュアル機能機能をアドバンスト ボイス モードに統合しました。この発表は、2024 年 12 月 12 日に開催されたライブストリーム イベント中に行われました。更新されたバージョンでは、ユーザーのデバイスのカメラを通じてリアルタイムでオブジェクトを認識し、画面共有を通じて視覚情報を処理し、人間のような会話を行うことができます。 ChatGPT Plus、Team、および Pro の加入者が利用できるこのアップデートは来週にかけて公開される予定ですが、EU の一部のユーザーは遅延する可能性があります。
この機能強化により、ChatGPT は、デバイスの設定の説明を提供したり、数学の問題を解決するための提案を提供したりするなど、表示された内容を解釈してユーザーに応答できるようになります。これらの機能を利用するには、ユーザーは ChatGPT アプリで音声アイコンをタップし、ビデオまたは画面共有をアクティブにします。この展開は Plus 加入者が優先されますが、ChatGPT Enterprise および Edu ユーザーは 2025 年 1 月にアクセスできるようになります。
OpenAI がライブ デモンストレーションで高度な機能を紹介
最近のライブ デモンストレーション中に、OpenAI 社長のグレッグ ブロックマン氏は、ビジョンを備えたアドバンスト ボイス モードの魅力的な機能を強調しました。ブロックマン氏は、CNNのアンダーソン・クーパー氏に解剖学についてクイズを出し、クーパー氏が黒板に描いた絵をChatGPTがどのように理解してコメントできるかを実演した。このインタラクションは、リアルタイムのインタラクティブな学習とフィードバックの可能性を示しましたが、ChatGPT は幾何学問題の計算ミスなどのいくつかのエラーを示し、モデルの精度に関連する継続的な課題を強調しました。
この更新された機能は開発の遅れに直面しており、OpenAI は以前、最終的に延長された起動期間を示唆していました。アドバンスト音声モードは当初 2024 年 5 月にデモンストレーションされ、それより早く登場すると予想されていました。最近の発表は、この機能を改良し完成させるための取り組みの集大成を示しており、チャットボットのユーザー エクスペリエンスと技術的能力の向上に戦略的に重点を置いていることが示されています。
新しいビジュアル機能に加えて、OpenAI はホリデー シーズンに向けて、ユーザーがお祭り気分で ChatGPT と対話できるようにする「サンタ モード」も発表しました。この機能にアクセスするには、ユーザーはアプリケーション内のスノーフレーク アイコンをクリックします。この季節限定オプションは、最初のインタラクションの使用制限をリセットし、ユーザーがお祭り機能を利用する機会を増やすことができます。
Google や Meta などのライバルも、Google の Project Astra など、同様の機能を開発しており、最近 Android の一部のテスターが利用できるようになりました。これらの取り組みは、大手テクノロジー企業が自社の AI モデルにインタラクティブなビデオ機能を統合し、ユーザー エンゲージメントとアプリケーションの多用途性を強化しようと取り組んでいる、より広範な傾向を反映しています。
OpenAIはまた、特殊なタスクでモデルのパフォーマンスを最適化するために設計された強化微調整研究プログラムの強化など、他の機能強化を展開する計画も示しています。このプログラムは研究機関や企業を対象としており、複雑なアプリケーション向けに OpenAI モデルをカスタマイズできるようになります。
注目の画像クレジット: OpenAI
OpenAI が ChatGPT のリアルタイム ビデオ機能を開始するという記事は、TechBriefly に最初に掲載されました。
Source: OpenAI、ChatGPT のリアルタイム ビデオ機能を開始