DeepSeek は、中国国産チップに最適化されたパフォーマンスの向上を主張する新しい AI モデル DeepSeek V4 を発表しました。このモデルは、100 万語の超長いコンテキストを特徴としており、エージェントの能力、世界の知識、および推論パフォーマンスを強化します。
DeepSeek V4 には、DeepSeek V4-Pro と DeepSeek V4-Flash の 2 つのバージョンがあります。同社は後者をより効率的で経済的な選択肢だと説明している。 DeepSeek によると、V4-Pro は世界のナレッジ ベンチマークで他のオープンソース モデルを大幅に上回り、Google のクローズドソース モデルである Gemini-Pro-3.1 をわずかに上回る程度です。
V4-Pro バリアントには、オープンソース モデルの知識機能を向上させるように設計された「最大推論努力モード」が含まれており、この分野でのトップ候補としての地位を確立しています。 DeepSeekは以前、より低い開発コストでOpenAIのChatGPTなどのAIシステムに挑戦した初期モデル「R1」で株式市場に数兆ドル規模の暴落を引き起こした。
昨年の R1 リリースは大手テクノロジー企業に多大な損失をもたらし、Nvidia は 1 日で 5,000 億ドル以上の損害を被りました。この立ち上げはまた、中国のAI企業が米国の既存のハイテク大手と対戦する初の大規模な競争でもあった。 DeepSeekのリリースは、米国の中国への半導体輸出制限の中で行われ、特にAI開発に不可欠なハイエンドGPUに影響を与えている。
DeepSeek V4のトレーニングに使用されるチップシステムは明らかにされていないが、同社はNvidiaとHuaweiの両方のチップをサポートしていると述べた。 DeepSeek V4 は、AI モデルのデータの基本単位である最大 384,000 個のトークンを処理できます。これは、128,000 トークンしか管理しなかった前世代の V3 に比べて、大幅な改善を示しています。
このアップグレードにより、複数文書の推論が可能になり、AI が書籍全体とコード データベース全体を理解できるようになります。同社は、この機能は「計算効率の劇的な飛躍」を表し、100万長のコンテキストを持つ大規模言語モデルの新時代の幕開けとなると主張している。
DeepSeek V4-Pro は Google の Gemini-3.1-Pro よりも優れていますが、それでも Anthropic の Claude Opus 4.6 モデルには及ばません。 DeepSeek は、さまざまなタスクやシナリオにわたってモデルのインテリジェンス、堅牢性、使いやすさをさらに強化することを目指しています。








