2024 年 5 月 10 日、OpenAI の共同創設者兼 CEO の Sam Altman は、X に関する今後の OpenAI Spring Update を予告しました。

GPT-5や検索エンジンに関する噂が飛び交う中、アルトマン氏は「魔法のような」「新しいもの」をほのめかした。

GPT-4o から ChatGPT デスクトップ アプリまで、OpenAI Spring Update で発表されたすべてがここにあります。 シートベルトを締める!

GPT-4o は OpenAI Spring Update ショーで大注目でした

OpenAI は、非常に人気のある ChatGPT の最新の進歩である GPT-4o を発表しました。これは、CTO の Mira Murati 氏が「最新のフラッグシップ モデル」と表現しています。

この繰り返しは、GPT-4 の機能、特に音声、テキスト、視覚を介して推論する機能に基づいて構築されています。

Murati は、高度な AI ツールを無料で提供することを目指し、アクセシビリティへの取り組みを強調しました。 これは、強力な言語モデルへのアクセスを民主化するという彼らの使命と一致しています。

別の OpenAI 従業員、 ウィリアム・フェダス、「GPT-4o は、当社の新しい最先端のフロンティア モデルです。 私たちは LMSys アリーナで im-only-a-good-gpt2-chatbot としてバージョンをテストしてきました。新しい GPT-4o が X 上の LMSys アリーナで得られたベンチマーク結果は次のとおりです。

OpenAI API への GPT-4o の導入により、OpenAI はイノベーションを促進し、開発者に権限を与えるという取り組みを実証します。

将来的には、オーディオおよびビデオ機能がより広く利用可能になり、画期的なアプリケーションの可能性がさらに拡大するため、エキサイティングな可能性が秘められています。

ユーザーは ChatGPT の無料版をさらに活用できます

以前はモバイル デバイスに限定されていた ChatGPT 音声モードが、一部の憶測にあるような音声アシスタントではなく、専用の Mac アプリケーションを通じてデスクトップでも利用できるようになりました。 Murati氏によると、これは人間と機械が協力する方法の変化を浮き彫りにしているという。 彼女は、GPT-4o はさまざまなモダリティにわたって情報を処理し、GPT-4 レベルのインテリジェンスを無料ユーザーに拡張できるようにしており、これは彼らが数ヶ月にわたって取り組んできた機能であると説明しました。

1 億人を超えるユーザーが ChatGPT に依存しています、GPT-4o の改善されたリソース効率により、 OpenAI、カスタマイズ可能なチャットボットを提供、カスタム GPT、 無料枠内で。 ユーザーは間もなく、データ、コーディング、画像分析用のツールを期待できるようになり、基本的なビジュアル タスクのための有料サブスクリプションの必要性がなくなります。

  これはドミニク・トレットにとって初のEVとなる可能性がある

これらの機能は今後数週間以内に展開される予定です

無料枠の大幅な機能強化により、月額 20 ドルの ChatGPT Plus サブスクリプションの価値提案について疑問が生じます。 Murati 氏は、主な利点は依然として次のとおりであると明言しています。 無料プランと比較して、GPT-4o に対して毎日 5 倍のリクエストを実行できる

GPT-4o を使用すると、ChatGPT Free ユーザーは次のような機能にアクセスできるようになります。

  • GPT-4レベルのインテリジェンスを体験
  • モデルと Web の両方から応答を取得します
  • データを分析してグラフを作成する
  • 撮った写真についてチャットする
  • 要約、執筆、分析を支援するためにファイルをアップロードする
  • GPT と GPT ストアを検出して使用する
  • メモリを使用してより役立つエクスペリエンスを構築する

ChatGPTによるリアルタイム音声チャット

GPT-4o は音声入力を直接処理するため、テキストの転写の必要がありません。 OpenAI Spring Update でのデモンストレーション中、OpenAI スタッフ メンバーが呼吸法をシミュレートし、GPT-4o はテクニックの向上、歌唱力の向上、さらには気分を高揚させるアドバイスを提供することに成功しました。

さらなる革新として、ライブストリーミングを通じてリアルタイムの支援を提供する GPT-4o の機能が備わっています。 これは、インタラクティブな問題解決と教育に対するプラットフォームの可能性を示しています。 学生や研究者がライブストリーム中に複雑な方程式を提示し、ChatGPT が即座に説明と解決策を提供することを想像してください。 学習への革命的なアプローチ

方法を確認してください グレッグ・ブロックマン 以下のビデオでこの機能を紹介しています。

ChatGPT デスクトップ アプリが登場

Mac デスクトップ アプリケーションは、ChatGPT の非常に自然な音声インターフェイスを示しています。 OpenAI Spring Update のプレゼンテーションでは、書かれているコードをリアルタイムで観察し、分析し、潜在的な問題を含めた観察結果を明確に表現できることがわかりました。 表示されたグラフを調べて洞察を提供するアプリの機能が示すように、ビジョン機能はコードを超えて拡張されているようです。

リアルタイム翻訳者としての ChatGPT

そして最後に、OpenAI Spring Update で、OpenAI チームは次のことを披露しました。 ライブ翻訳ツールとしての ChatGPT Voice

Murati がイタリア語で話した文章はシームレスに英語に翻訳され、応答は英語からイタリア語に翻訳され、 トム・ウォーレン X の瞬間を捉えました:

これらのアップデートは、OpenAI と大規模言語モデルの分野にとって重要な前進を表しています。 OpenAI は、アクセシビリティ、機能の向上、リアルタイム機能に重点を置き、言語処理テクノロジーの最前線に位置しています。 これらの進歩がもたらす影響は計り知れず、コミュニケーション、教育、創造的な取り組みに革命をもたらす可能性があります。

GPT-4o の詳細については、OpenAI チームによるブログ投稿をご覧ください。


注目の画像クレジット: オープンAI

Source: OpenAI Spring Update で発表されたすべて