Anthropic は、最新の AI モデルである Claude Opus 4.7 をリリースしました。これは、Opus 4.6 に比べて「顕著な改善」を特徴としていますが、未リリースの Opus Mythos Preview よりも「機能の幅が狭い」と特徴付けられています。新しいモデルは、コーディング、エンジニアリング、および複数ステップのタスクに重点を置き、既存の強みを強化します。
クロード オーパス 4.7 は、専門的な知識作業において優れたパフォーマンスを示し、困難な状況において「より徹底的で一貫性がある」と主張しています。このモデルのベンチマーク テストでは、SWE-bench Pro および SWE-bench Verified のエージェント コーディングで 64.3% のスコアを獲得し、その機能が実証され、公開されているモデルの中でトップの座を取り戻しました。
Opus 4.6 と比較すると、Opus 4.7 では、エージェントによるコンピューターの使用と大学院レベルの推論の向上も見られます。ただし、サイバーセキュリティ脆弱性スコアはわずかに減少し、前バージョンの 73.8% と比較して 73.1% に達しました。 Anthropic 氏は、この変更は、高リスクのサイバーセキュリティ要求を検出してブロックすることを目的とした新しい保護手段の結果である可能性があると指摘しました。
Claude Opus 4.7 のリリースは、主要なベンチマーク全体で優れたパフォーマンスを実証している Claude Mythos プレビューを促進するものと思われますが、現在は一部の組織のみが利用できます。 Anthropic 氏は、Opus 4.7 のサイバー能力は Mythos Preview のサイバー能力と一致しないことを強調しました。
「私たちは、Claude Mythos Preview のリリースを限定的に保ち、最初に能力の低いモデルで新しいサイバー保護手段をテストすると述べました」と同社は述べています。 「Opus 4.7 はそのようなモデルの最初のものです。そのサイバー機能は Mythos Preview ほど高度ではありません。」
Claude Opus 4.7 は、以前のモデルと同じ価格を維持しながら、すべての Claude 製品および同社の API を通じてすぐに利用可能です。








