OpenAI は、PC を制御して自律的にタスクを実行できる AI ツール Operator をリリースしようとしているかもしれません。報道によると、発売予定日は1月になるとのこと。
OpenAIのOperatorツールの詳細
今後の AI 製品に関する情報を正確にリークすることで知られるソフトウェア エンジニアである Tibor Blaho 氏が、長らく期待されていた Operator ツールの証拠を発見したと伝えられています。 ブルームバーグ および他の出版物では、コードの作成や旅行の予約などのタスクを処理できる「エージェント」システムとして Operator について以前に説明されています。
The Information によると、OpenAI は Operator を 1 月にリリースすることを目指しています。コードを含む Blaho の最近の発見は、このスケジュールを強化します。
Blaho が報告したように、macOS 用 ChatGPT クライアントはアップデートを受け取りました。これには、「Toggle Operator」と「Force Quit Operator」のショートカットを設定するための隠しオプションが含まれています。さらに、OpenAI の Web サイトでは Operator への言及が確認されていますが、まだ一般には公開されていません。
Blaho はまた、OpenAI の Web サイトには、Operator のパフォーマンスを他のコンピューターを使用した AI システムと比較した表が掲載されており、これはプレースホルダーである可能性があると指摘しました。これらのテーブルのデータが正確であれば、タスクによって異なりますが、オペレーターに信頼性の問題があることを示します。
OSWorld が実施したベンチマークでは、Operator をサポートするモデルと思われる「OpenAI Computer Use Agent (CUA)」のスコアが 38.1% でした。このスコアは Anthropic のコンピュータ制御モデルのスコアを上回っていますが、依然として人間のスコアである 72.4% を大幅に下回っています。流出したデータによると、OpenAI CUAは、AIのウェブサイトナビゲーションスキルを評価するベンチマークであるWebVoyagerでは人間のパフォーマンスを上回っているが、別のベンチマークであるWebArenaでは人間レベルのスコアには達していない。

Operator は、人間が簡単に実行できるタスクを実行する際の課題を実証しました。クラウド プロバイダーにサインアップして仮想マシンを起動するトライアルでは、Operator はわずか 60% の確率で成功しました。ビットコインウォレットを作成する別のタスクでは、漏洩した情報に基づくと、Operator は 10% の確率でしか成功しませんでした。
OpenAI による差し迫った Operator の導入は、同様に AI エージェントに投資している Anthropic や Google などの競合他社の取り組みと一致しています。 AI エージェントにはリスクと投機的な性質があるにもかかわらず、ハイテク大手は AI エージェントを AI テクノロジーの未来として宣伝しています。分析会社マーケッツ・アンド・マーケッツは、AIエージェント市場の評価額は2030年までに471億ドルに達する可能性があると予測している。
現在の AI エージェントは原始的であると考えられていますが、技術が急速に進歩した場合には安全性が懸念されます。流出したあるグラフでは、オペレーターが「違法行為」の実行や「機密個人データ」の検索を阻止するために設計されたテストなど、特定の安全性評価で良好な成績を収めていたことが示されている。安全性への重点は、Operator の長期にわたる開発サイクルの要因として注目されています。
OpenAIの共同創設者であるWojciech Zaremba氏は、Xに関する最近の投稿で、安全性の緩和策がないとされるエージェントをリリースしたAnthropicを批判し、「OpenAIが同様のリリースをした場合の否定的な反応は想像することしかできない」と述べた。
OpenAIは、安全性の考慮よりも迅速な製品展開を優先しているとして、元スタッフを含むAI研究者からの批判に直面している。
注目の画像クレジット: Tibor Blaho
OpenAI が自律型 AI ツール Operator の 1 月のリリースを計画しているという記事は、TechBriefly に最初に掲載されました。








