OpenAIによるGPT-4o miniのリリースで、一つの章が終わります。リリースされたばかりなのに、時代遅れになっているAIもあります。この新しいモデルは、広く使用されている無料のChatGPT 3.5に代わるものです。旧モデルよりも効率的で省電力なGPT-4o miniは、前モデルよりもはるかにスマートになっていると言われています。私たちが慣れ親しんだモデルからGPT-4o miniへの移行において、ユーザーは新しい機能を期待でき、GPT-4o miniは完全に無料です。

この変更の重要性を完全に理解するには、ChatGPT 3.5 の歩みを振り返る必要があります。2022 年にリリースされた ChatGPT 3.5 は、人間のようなテキストを生成し、質問に答え、さまざまなタスクを支援する機能でユーザーを魅了し、すぐに有名になりました。個人と企業の両方で広く使用されるようになりました。コンテンツ作成、問題解決、一般的な情報検索のための強力なツールとしても機能しました。しかし、近年では、無料でリリースされた他の AI が ChatGPT 3.5 を追い抜いています。

ChatGPT 3.5はGPT-4o miniに置き換えられます
モデルの機能はさまざまなベンチマークでテストされました(画像クレジット)

GPT-4o mini は何ができますか?

GPT-4o mini には、当然ながら前モデルとは一線を画す数多くの機能強化が加えられています。そうでなければ、それは不合理です。最も注目すべき改善点の 1 つは、テキストと画像の両方の処理を実行できることです。この新しいデュアル機能により、モデルは複数のソースからの情報を処理して理解できるようになり、より包括的で正確な出力が得られる可能性があります。

モデルの機能は、さまざまなベンチマークでテストされました。幅広いトピックにわたる推論を測定する MMLU (Massive Multitask Language Understanding) ベンチマークでは、GPT-4o mini は 82% のスコアを達成しました。これらの結果によると、OpenAI の新しいモデルは、市場に出回っている他の小型 AI モデルよりも優れています。私たちは、独自のファミリーでベンチマークを作成します。そしてもちろん、それはあなた次第です。

GPT-4o mini が優れていると言われているもう 1 つの分野は、数学的推論です。このモデルは、MGSM (Mathematics Grade School Merge) ベンチマークで 87% という素晴らしいスコアを獲得しました。つまり、この新しい友人は美しいコードを書いたり、論理問題を解いたり、複雑な宿題を手伝ったりできるということです。

実用的なアプリケーションに関しては、GPT-4o mini は API でテキストと画像の両方をサポートしています。つまり、アプリケーションを Web サイトで使用するだけでなく、他のメディアに統合することができます。OpenAI はそれだけに留まらず、モデルの機能を拡張して将来的にビデオとオーディオの処理を含める計画を​​発表し、潜在的な使用例をさらに拡大します。

ChatGPT 3.5はGPT-4o miniに置き換えられます
GPT-4o miniの最も重要な利点の1つはそのスピードです(画像クレジット)

GPT-4o miniの仕様

技術的な観点から見ると、GPT-4o mini はパフォーマンスと効率性のバランスを実現しようとしています。OpenAI はモデルの正確なサイズを明らかにしていませんが、Llama 3 8b、Claude Haiku、Gemini 1.5 Flash などの他の小型 AI モデルと同等であると述べています。つまり、他に何があるというのでしょうか?

GPT-4o mini の最も重要な利点の 1 つは、その速度です。ご存知のように、ChatGPT 3.5 モデルでは、回答に最大 20 秒かかることがありましたが、現在は最大 10 秒で済みます。初期テストによると、このモデルの平均スループット レートは 1 秒あたり 202 コインです。これは、GPT-4o および GPT-3.5 Turbo の 2 倍以上の速度であり、応答時間の高速化が重要なアプリケーションに特に適しています。

モデルのコンテキスト ウィンドウは、もう 1 つの重要な技術的特徴です。GPT-4o mini は、一度に最大 128,000 枚のコインを処理できます。これは、平均的な本の長さに相当します。この大きなコンテキスト ウィンドウにより、モデルは、長いインタラクションや長いドキュメントを処理するときに一貫性と関連性を維持できます。

GPT-4o mini には、2023 年 10 月までの情報とデータが含まれています。このデータは更新によって更新される可能性があります。ただし、現時点では、その日付以降のイベントや開発に関する有効な回答が得られない可能性があります。

長すぎますか?

  • テキストと画像の処理をサポート
  • MMLUベンチマークスコア: 82%
  • MGSMベンチマークスコア: 87%
  • APIはテキストと視覚入力をサポート
  • 他の小型 AI モデル (Llama 3 8b、Claude Haiku、Gemini 1.5 Flash) と同等のサイズ
  • 平均出力速度: 1秒あたり202トークン
  • コンテキストウィンドウ: 128,000 トークン
  • 知識のカットオフ: 2023年10月
  • 応答時間は最大10秒
  マスク氏、不当利得としてOpenAIとマイクロソフトに1,340億ドルを要求
ChatGPT 3.5はGPT-4o miniに置き換えられます
GPT-4o mini の実行コストの削減は、AI アクセシビリティに広範囲にわたる影響を及ぼす可能性があります (画像クレジット)

GPT-4o miniの価格はどうですか?

APIの価格はまだ発表されていないが、OpenAIはこのモデルの価格を次のように設定している。 15セント 百万入力トークンあたり 60セント 同社のAPIを使用する開発者には、100万出力トークンあたり1ドルが支払われます。この価格設定により、GPT-4o miniは前モデルよりも手頃な価格となり、OpenAIはGPT-3.5 Turboよりも60%安価であると主張しています。

GPT-4o mini の実行コストの削減は、AI のアクセシビリティに広範囲にわたる影響を及ぼす可能性があります。OpenAI は、高度な AI 機能を低価格で利用できるようにすることで、さまざまな業界や地域で AI テクノロジーをより広く採用する道を開く可能性があります。

このモデルの効率性と手頃な価格は、AI モデルの繰り返し呼び出しを必要とする大量の単純なタスクに特に魅力的です。これは、予算が限られているプロジェクトに取り組んでいる中小企業や開発者にとって特に有益です。

ChatGPT 3.5はGPT-4o miniに置き換えられます
結局のところ、「最適な」モデルは要件によって異なります(画像クレジット)

GPT-4o miniと他の主要モデルの比較

新しいモデルをよりよく理解するために、他のモデルとの技術的な比較をしてみましょう。

モデル正確さ (%)MMLUGPQA落とすMGSM数学ヒューマンエバルMMMU数学ビスタ
GPT-4o ミニ82.040.279.787.070.287.259.456.763.8
ジェミニフラッシュ77.938.678.475.540.971.556.158.40.0
クロード・ハイク73.835.778.471.740.975.950.246.40.0
GPT-3.5 ターボ69.830.870.256.343.168.00.00.00.0
GPT-4o88.753.683.490.576.690.269.10.00.0
GPT-490.055.085.092.078.092.570.560.065.0
GPT-4 ターボ91.056.086.093.079.093.571.061.066.0
ジェミニ85.050.080.088.072.088.565.055.060.0
ジェミニ アドバンス87.052.082.090.074.090.067.057.062.0
  • MMLU (大規模マルチタスク言語理解): さまざまなドメインにわたる幅広いタスクで言語モデルを評価するための包括的なベンチマーク。
  • GPQA (汎用質問応答): 一般知識の質問に正確に答えるモデルの能力をテストするためのベンチマーク。
  • DROP (段落ごとの個別推論): テキストに対して加算や減算などの個別の演算を実行するモデルを必要とする読解ベンチマーク。
  • MGSM (マルチステップ数学): 複数ステップの数学問題を解決するモデルの能力を評価するためのベンチマーク。
  • 数学: 言語モデルの数学的問題解決能力の評価に特に焦点を当てたベンチマーク。
  • 人間評価: コード生成を評価するためのベンチマーク。問題ステートメントから正しい機能的なコードを生成する能力に基づいてモデルが評価されます。
  • MMMU (マルチモーダル機械理解): テキスト、画像、音声などの複数のモダリティからの情報を理解して統合するモデルの能力をテストするベンチマーク。
  • 数学ビスタ: さまざまな数学分野における言語モデルの数学的推論および問題解決能力を評価するために設計された特定のベンチマーク。
  『スーサイド・スクワッド異世界』アニメシリーズが発表された

結局のところ、「最適な」モデルは要件によって異なります。GPT-4o mini は、よりコンパクトなパッケージでさまざまな機能を提供するため、多くのユーザーにとって魅力的な選択肢となります。


注目の画像クレジット: OpenAI

Source: ChatGPT 3.5はGPT-4o miniに置き換えられます