Nvidiaは、AI Infra Summitで「Rubin CPX」GPUを発表しました。これは、大規模なコンテキストAIモデル向けに設計された今後の「Rubin」ファミリーの専門的なアクセラレータです。 2026年後半までに、このチップは、128 GBのGDDR7メモリを備えたモノリシックダイで30個のペタフロップスのNVFP4コンピューティングを提供します。このモノリシック構成は、Nvidiaの現在のBlackwellとBlackwell Ultra ArchitecturesのデュアルGPUパッケージと、Rubinファミリーの残りの部分からの逸脱です。 Rubin CPXは、拡張コンテキストシナリオの計算ボトルネックに対処し、包括的なソフトウェアコードベース分析や1時間のビデオ処理などのアプリケーションで同時に数百万トークンを処理します。プロセッサは、4つのNVENCと4つのNVDECビデオエンコーダーをオンチップで統合し、合理化されたマルチメディアワークフローを可能にします。 Nvidiaは、Rubin CPXが現在のGB300 Blackwell Ultra Accelerator Systemsの注意処理速度の3倍を提供すると述べています。アーキテクチャは、コストが最適化されたシングルダイアプローチを使用して、計算密度を維持しながら、製造の複雑さを潜在的に減少させます。メモリ帯域幅の仕様は非公開ですが、512ビットインターフェイスは、30 Gbps GDDR7メモリチップで約1.8 Tb/sのスループットを生成する可能性があります。 NVIDIAは、従来のルービンGPUと特殊なCPXバリアントを組み合わせて、Rubin CPXプロセッサをVera Rubin NVL144 CPXプラットフォームに統合する予定です。このハイブリッドセットアップは、完全なラック展開全体にわたって、8つのエクセラフロップの凝集コンピューティングと1.7 pb/sのメモリ帯域幅を対象としています。 「Kyber」ラックには、1600Gネットワーキングを備えたConnectX-9ネットワークアダプター、102.4Tスイッチングを備えたSpectrum6、および共同パッケージ化された光学系が含まれます。 Nvidiaは、Rubin CPXをRubinファミリーの1回限りのものとしてマーケティングして、テスト時間スケーリングAIシステムの複雑さを処理しています。モデルが洗練された推論エージェントに進化するにつれて、計算集中的なコンテキスト処理とメモリバンド幅依存トークン生成の間の推論が分割されます。 CPX設計は、これらのデュアル要件に合わせて最適化されており、256,000トークンを備えたエンタープライズチャットボットのコンテキストPrefill操作または100,000行を超えるコード分析を処理します。この専門化は、拡張された相互作用全体で永続的なメモリを必要とするAIシステムにとって重要です。これは、Nvidiaがこのハードウェアでシームレスに有効にすることを目指しています。 Nvidiaの迅速な開発サイクルは財務パフォーマンスを促進し、直近の四半期に411億ドルのデータセンターの売り上げを報告しています。

Nvidiaは、長いコンテキストAIについてRubin CPX GPUを発表します
Written by
Emre’s love for animals made him a veterinarian, and his passion for technology made him an editor. Making new discoveries in the field of editorial and journalism, Emre enjoys conveying information to a wide audience, which has always been a dream for him.
View all posts →Related Stories
Microsoft、高度な AI ワークロード向けの Surface RTX Spark Dev Box を発表
Microsoft の Surface RTX Spark Dev Box は、NVIDIA の RTX Spark チップと最大 128 GB のメモリを組み合わせて、高度な AI ワークロードと開発を強化します。
X が iOS ユーザー向けに「React with Video」機能を開始
X は iOS 向けの「React with Video」機能を開始し、ユーザーが元の投稿と一緒に TikTok スタイルのリアクション ビデオを直接投稿できるようにします。
Microsoft、次世代エージェントファーストデバイスを強化する Project Solara を発表
Project Solara は、ソフトウェアとハードウェアを融合して、特化したパーソナライズされた適応性のある AI エクスペリエンスを作成するエージェント ファースト コンピューティングを導入します。
Google、新しい安全機能と共有機能を備えた Android アップデートを 6 月に公開
6 月の Android Drop では、新しいパーソナライゼーション ツール、スタイリッシュなアップデート、強化された安全機能が導入され、ユーザーが安全でクリエイティブな状態を維持できるようになります。




