Anthropic は、Claude Sonnet 4 と同様のコーディング パフォーマンスを備え、レイテンシが最適化された「小型」モデルである Claude Haiku 4.5 をリリースしました。同社の報告によると、Haiku 4.5 は Sonnet 4 の 2 倍以上の速度で、コストは 3 分の 1 です。これは、Anthropic の API を通じて、また Amazon Bedrock および Google Cloud Vertex AI のパートナー カタログからすぐに利用できます。 Haiku 4.5 の価格は、入力トークン 100 万あたり 1 ドル、出力トークン 100 万あたり 5 ドルに設定されています。プロンプト キャッシュの場合、記載されている料金は、100 万書き込みトークンあたり 1.25 ドル、100 万読み取りトークンあたり 0.10 ドルです。 Anthropic は、Haiku 4.5 を、リアルタイム アシスタント、カスタマー サポートの自動化、ペア プログラミングなど、レイテンシー バジェットが厳しく、スループットが高いワークロード向けに位置付けています。同社は、コスト重視のインタラクティブなワークロードにおける Haiku 3.5 および Sonnet 4 のドロップイン代替品としてこれを提案しています。 Claude for Chrome などの製品に見られるように、GUI やブラウザの操作を伴う「コンピュータ使用」タスクでは Sonnet 4 を上回っていると報告されています。また、マルチエージェント プロジェクトやラピッド プロトタイピングに対する Claude Code の応答性も向上します。 Anthropic のモデル ラインナップの中で、Sonnet 4.5 は依然として同社のフロンティア モデルであり、これを「世界最高のコーディング モデル」と表現しています。 Haiku 4.5 は、より優れたコスト効率でほぼフロンティアのパフォーマンスを提供する位置付けにあります。 Anthropic は、Sonnet 4.5 が複数ステップの計画を処理し、Haiku 4.5 ワーカーのプールが並列実行を管理するオーケストレーション パターンを推奨しています。開発者は、識別子を使用して Anthropic の API 上のモデルにアクセスできます。 claude-haiku-4-5。 Anthropic は、発売時に Amazon Bedrock と Google Cloud Vertex AI で利用可能であることを確認しましたが、特定のモデルのカタログ ID と地域の対象範囲は時間の経過とともに変更される可能性があることに同社は言及しています。 Anthropic は、モデルの機能を実証するためにベンチマーク結果を提供しました。 SWE ベンチ検証では、Haiku 4.5 は、bash およびファイル編集ツールを備えたシンプルなスキャフォールドを使用して 73.3% のスコアを達成しました。この結果は、128,000 の思考予算を使用し、テスト時間の計算を行わずに 50 回の試行を行った結果の平均です。同社はまた、Terminus-2 エージェントを使用して 11 回の実行でテストした Terminal-Bench と、4 回の実行で最大 100 ステップでテストした OSWorld-Verified の結果も共有しました。 AIME と MMMLU のパフォーマンスも、デフォルトのサンプリングと 128,000 の思考バジェットを使用して測定されました。同社は、これらの結果は Sonnet 4 とのコーディング同等性と、特定のテスト足場の下でのコンピューター使用タスクのパフォーマンスの向上を示していると述べました。パフォーマンスを一般化する前に、独自のオーケストレーションとツール スタックを使用してテストを複製することをユーザーに推奨しています。このモデルは ASL-2 ライセンスに基づいてリリースされています。 Anthropic 社の内部テストでは、Haiku 4.5 は Sonnet 4.5 や Opus 4.1 よりも測定されたずれ率が低かったと報告しています。





