OpenaiはO3-Proを発売しました。これは、会社が「これまでで最も有能」と説明している新しいAIモデルです。 O3-Proモデルは、今年初めに導入されたOpenaiのO3 Reasoningモデルの拡張バージョンです。
O3やO3-Proなどの推論モデルは、物理学、数学、プログラミングなどの複雑なドメインのパフォーマンスを改善することを目的とした段階的な問題を順番に処理するように設計されています。
火曜日から、O3-PROはChATGPT Proおよびチームプランのユーザーが利用でき、以前のO1-Proモデルを置き換えます。 Openaiは、エンタープライズとEDUのユーザーがその後の週にO3-Proにアクセスできると述べました。
CHATGPT内での可用性に加えて、O3-PROモデルは現在、OpenAIの開発者APIでライブになっています。 APIの価格は、入力トークンあたり20ドル、100万ドルあたり80ドルに設定されています。 Openaiは、100万の入力トークンが750,000語にほぼ同等であることを明確にしています。
Openaiは、モデルのパフォーマンスの改善を強調し、「専門家の評価では、テストされたすべてのカテゴリ、特に科学、教育、プログラミング、ビジネス、執筆ヘルプなどの主要なドメインでO3よりも一貫してO3-Proを好む」と述べています。同社はまた、レビュアーが「明確さ、包括性、指導のフォロー、および正確性」についてO3-Proを高く評価していると指摘しました。
O3-Proは、さまざまなツールと統合され、Webブラウジング、ファイル分析、視覚入力の理解、Pythonの使用、メモリ機能によるパーソナライズなどの機能を有効にします。ただし、Openaiは欠点を認めました。O3-Pro応答は通常、O1-Proと比較して生成に時間がかかります。
新しいモデルには、リリース時に特定の制限もあります。 O3-Proとの一時的なチャットセッションは、現在進行中の技術的な問題のためにChatGPTで無効になっています。 O3-Proは、Image Generationをサポートせず、OpenaiのAI搭載ワークスペース機能であるCanvasと統合しません。
これらの暫定的な制限にもかかわらず、OpenAIは標準のAIベンチマークで強力なパフォーマンスを示す内部テスト結果を提示しました。同社のデータによると、O3-Proは、AIME 2024 Math SkillsテストでGoogleのGemini 2.5 Proよりも優れたパフォーマンスを発揮しました。さらに、O3-Proは、科学の博士号レベルでのベンチマークテスト知識であるGPQAダイヤモンドで最近リリースされたClaude 4 Opusを最近リリースしたClaude 4 Opusを上回りました。
Openaiは、O3-ProがO3と同じコアモデルを共有すると、包括的な安全性の詳細がO3システムカードに記載されていることを指定しました。
Source: Openaiは、AIモデルのO3-Pro推論を起動します








