以前は Zhipu AI として知られていた Z.ai は、火曜日に GLM-5.1 モデルをリリースしました。このオープンソースのフラッグシップ モデルはエージェント エンジニアリング用に設計されており、単一のコーディング タスクを最大 8 時間自律的に処理し、計画、実行、テスト、最適化を連続ループで実行できます。
GLM-5.1 モデルは、SWE-Bench Pro ベンチマークで 58.4 のスコアを獲得し、GPT-5.4、Claude Opus 4.6、および Gemini 3.1 Pro を上回りました。このリリースは、7,440 億パラメータの専門家混合モデルとして 2 月に導入された GLM-5 のトレーニング後の改良に続き、トークンごとに約 400 億のアクティブなパラメータを利用し、Nvidia ハードウェアを使用せずに Huawei Ascend チップ上で完全にトレーニングされました。
Z.aiのドキュメントによると、GLM-5.1は、マルチタスク教師付き微調整や強化学習ステージなどの技術を通じて、コーディングとエージェントの機能を強化します。このモデルは 8 時間の自律実行を維持でき、完全な「実験 – 分析 – 最適化」ループを完了します。デモでは、8 時間以内に完全な Linux デスクトップ システムをゼロから構築することに成功し、655 回の反復を実行し、ベクトル データベース クエリのスループットを 6.9 倍に向上させました。
GLM-5.1 は 200,000 トークンのコンテキスト ウィンドウを備え、最大 128,000 の出力トークンをサポートします。エージェントティック コーディング ワークフロー向けに最適化されており、Claude Code や OpenClaw などのツールと互換性があります。このモデルは、KernelBench レベル 3 最適化ベンチマークにおいて、実際の機械学習ワークロードで幾何平均 3.6 倍の高速化を達成しました。
GLM-5.1 は、すべての GLM コーディング プラン加入者が利用でき、その重みは MIT ライセンスに基づいて公開されています。 Z.ai は 1 月に香港証券取引所に上場し、評価額は 313 億ドルで、入力トークン 100 万あたり 1.00 ドル、出力トークン 100 万あたり 3.20 ドルのコストで GLM-5.1 への API アクセスを提供しています。
この発表により、オープンソースのコーディング モデル領域における競争が激化し、GLM-5.1 がクローズドソースの対応物に先駆けて SWE-Bench Pro の最前線に位置することになります。 Z.ai は、モデルの機能が Claude Opus 4.6 と一致していると主張していますが、独立した評価によると、Opus 4.6 のより広範なコーディング スコアの約 94.6 パーセントを達成しており、推論と創造的なタスクにいくつかのギャップがあることが示されています。








