ChatGPT 3.5はGPT-4o miniに置き換えられます

OpenAIによるGPT-4o miniのリリースで、一つの章が終わります。リリースされたばかりなのに、時代遅れになっているAIもあります。この新しいモデルは、広く使用されている無料のChatGPT 3.5に代わるものです。旧モデルよりも効率的で省電力なGPT-4o miniは、前モデルよりもはるかにスマートになっていると言われています。私たちが慣れ親しんだモデルからGPT-4o miniへの移行において、ユーザーは新しい機能を期待でき、GPT-4o miniは完全に無料です。

この変更の重要性を完全に理解するには、ChatGPT 3.5 の歩みを振り返る必要があります。2022 年にリリースされた ChatGPT 3.5 は、人間のようなテキストを生成し、質問に答え、さまざまなタスクを支援する機能でユーザーを魅了し、すぐに有名になりました。個人と企業の両方で広く使用されるようになりました。コンテンツ作成、問題解決、一般的な情報検索のための強力なツールとしても機能しました。しかし、近年では、無料でリリースされた他の AI が ChatGPT 3.5 を追い抜いています。

ChatGPT 3.5はGPT-4o miniに置き換えられます — モデルの機能はさまざまなベンチマークでテストされました（画像クレジット）

GPT-4o mini は何ができますか?

GPT-4o mini には、当然ながら前モデルとは一線を画す数多くの機能強化が加えられています。そうでなければ、それは不合理です。最も注目すべき改善点の 1 つは、テキストと画像の両方の処理を実行できることです。この新しいデュアル機能により、モデルは複数のソースからの情報を処理して理解できるようになり、より包括的で正確な出力が得られる可能性があります。

モデルの機能は、さまざまなベンチマークでテストされました。幅広いトピックにわたる推論を測定する MMLU (Massive Multitask Language Understanding) ベンチマークでは、GPT-4o mini は 82% のスコアを達成しました。これらの結果によると、OpenAI の新しいモデルは、市場に出回っている他の小型 AI モデルよりも優れています。私たちは、独自のファミリーでベンチマークを作成します。そしてもちろん、それはあなた次第です。

GPT-4o mini が優れていると言われているもう 1 つの分野は、数学的推論です。このモデルは、MGSM (Mathematics Grade School Merge) ベンチマークで 87% という素晴らしいスコアを獲得しました。つまり、この新しい友人は美しいコードを書いたり、論理問題を解いたり、複雑な宿題を手伝ったりできるということです。

実用的なアプリケーションに関しては、GPT-4o mini は API でテキストと画像の両方をサポートしています。つまり、アプリケーションを Web サイトで使用するだけでなく、他のメディアに統合することができます。OpenAI はそれだけに留まらず、モデルの機能を拡張して将来的にビデオとオーディオの処理を含める計画を発表し、潜在的な使用例をさらに拡大します。

GPT-4o miniの仕様

技術的な観点から見ると、GPT-4o mini はパフォーマンスと効率性のバランスを実現しようとしています。OpenAI はモデルの正確なサイズを明らかにしていませんが、Llama 3 8b、Claude Haiku、Gemini 1.5 Flash などの他の小型 AI モデルと同等であると述べています。つまり、他に何があるというのでしょうか?

GPT-4o mini の最も重要な利点の 1 つは、その速度です。ご存知のように、ChatGPT 3.5 モデルでは、回答に最大 20 秒かかることがありましたが、現在は最大 10 秒で済みます。初期テストによると、このモデルの平均スループットレートは 1 秒あたり 202 コインです。これは、GPT-4o および GPT-3.5 Turbo の 2 倍以上の速度であり、応答時間の高速化が重要なアプリケーションに特に適しています。

モデルのコンテキストウィンドウは、もう 1 つの重要な技術的特徴です。GPT-4o mini は、一度に最大 128,000 枚のコインを処理できます。これは、平均的な本の長さに相当します。この大きなコンテキストウィンドウにより、モデルは、長いインタラクションや長いドキュメントを処理するときに一貫性と関連性を維持できます。

GPT-4o mini には、2023 年 10 月までの情報とデータが含まれています。このデータは更新によって更新される可能性があります。ただし、現時点では、その日付以降のイベントや開発に関する有効な回答が得られない可能性があります。

長すぎますか？

テキストと画像の処理をサポート
MMLUベンチマークスコア: 82%
MGSMベンチマークスコア: 87%
APIはテキストと視覚入力をサポート
他の小型 AI モデル (Llama 3 8b、Claude Haiku、Gemini 1.5 Flash) と同等のサイズ
平均出力速度: 1秒あたり202トークン
コンテキストウィンドウ: 128,000 トークン
知識のカットオフ: 2023年10月
応答時間は最大10秒

国営ポーランドのラジオ局、世論の反発を受けてAI実験を中止

GPT-4o miniの価格はどうですか？

APIの価格はまだ発表されていないが、OpenAIはこのモデルの価格を次のように設定している。 15セント 百万入力トークンあたり 60セント 同社のAPIを使用する開発者には、100万出力トークンあたり1ドルが支払われます。この価格設定により、GPT-4o miniは前モデルよりも手頃な価格となり、OpenAIはGPT-3.5 Turboよりも60％安価であると主張しています。

GPT-4o mini の実行コストの削減は、AI のアクセシビリティに広範囲にわたる影響を及ぼす可能性があります。OpenAI は、高度な AI 機能を低価格で利用できるようにすることで、さまざまな業界や地域で AI テクノロジーをより広く採用する道を開く可能性があります。

このモデルの効率性と手頃な価格は、AI モデルの繰り返し呼び出しを必要とする大量の単純なタスクに特に魅力的です。これは、予算が限られているプロジェクトに取り組んでいる中小企業や開発者にとって特に有益です。

GPT-4o miniと他の主要モデルの比較

新しいモデルをよりよく理解するために、他のモデルとの技術的な比較をしてみましょう。

モデル	正確さ（％）	MMLU	GPQA	落とす	MGSM	数学	ヒューマンエバル	MMMU	数学ビスタ
GPT-4o ミニ	82.0	40.2	79.7	87.0	70.2	87.2	59.4	56.7	63.8
ジェミニフラッシュ	77.9	38.6	78.4	75.5	40.9	71.5	56.1	58.4	0.0
クロード・ハイク	73.8	35.7	78.4	71.7	40.9	75.9	50.2	46.4	0.0
GPT-3.5 ターボ	69.8	30.8	70.2	56.3	43.1	68.0	0.0	0.0	0.0
GPT-4o	88.7	53.6	83.4	90.5	76.6	90.2	69.1	0.0	0.0
GPT-4	90.0	55.0	85.0	92.0	78.0	92.5	70.5	60.0	65.0
GPT-4 ターボ	91.0	56.0	86.0	93.0	79.0	93.5	71.0	61.0	66.0
ジェミニ	85.0	50.0	80.0	88.0	72.0	88.5	65.0	55.0	60.0
ジェミニアドバンス	87.0	52.0	82.0	90.0	74.0	90.0	67.0	57.0	62.0