Nvidiaは、AI Infra Summitで「Rubin CPX」GPUを発表しました。これは、大規模なコンテキストAIモデル向けに設計された今後の「Rubin」ファミリーの専門的なアクセラレータです。 2026年後半までに、このチップは、128 GBのGDDR7メモリを備えたモノリシックダイで30個のペタフロップスのNVFP4コンピューティングを提供します。このモノリシック構成は、Nvidiaの現在のBlackwellとBlackwell Ultra ArchitecturesのデュアルGPUパッケージと、Rubinファミリーの残りの部分からの逸脱です。 Rubin CPXは、拡張コンテキストシナリオの計算ボトルネックに対処し、包括的なソフトウェアコードベース分析や1時間のビデオ処理などのアプリケーションで同時に数百万トークンを処理します。プロセッサは、4つのNVENCと4つのNVDECビデオエンコーダーをオンチップで統合し、合理化されたマルチメディアワークフローを可能にします。 Nvidiaは、Rubin CPXが現在のGB300 Blackwell Ultra Accelerator Systemsの注意処理速度の3倍を提供すると述べています。アーキテクチャは、コストが最適化されたシングルダイアプローチを使用して、計算密度を維持しながら、製造の複雑さを潜在的に減少させます。メモリ帯域幅の仕様は非公開ですが、512ビットインターフェイスは、30 Gbps GDDR7メモリチップで約1.8 Tb/sのスループットを生成する可能性があります。 NVIDIAは、従来のルービンGPUと特殊なCPXバリアントを組み合わせて、Rubin CPXプロセッサをVera Rubin NVL144 CPXプラットフォームに統合する予定です。このハイブリッドセットアップは、完全なラック展開全体にわたって、8つのエクセラフロップの凝集コンピューティングと1.7 pb/sのメモリ帯域幅を対象としています。 「Kyber」ラックには、1600Gネットワ​​ーキングを備えたConnectX-9ネットワークアダプター、102.4Tスイッチングを備えたSpectrum6、および共同パッケージ化された光学系が含まれます。 Nvidiaは、Rubin CPXをRubinファミリーの1回限りのものとしてマーケティングして、テスト時間スケーリングAIシステムの複雑さを処理しています。モデルが洗練された推論エージェントに進化するにつれて、計算集中的なコンテキスト処理とメモリバンド幅依存トークン生成の間の推論が分割されます。 CPX設計は、これらのデュアル要件に合わせて最適化されており、256,000トークンを備えたエンタープライズチャットボットのコンテキストPrefill操作または100,000行を超えるコード分析を処理します。この専門化は、拡張された相互作用全体で永続的なメモリを必要とするAIシステムにとって重要です。これは、Nvidiaがこのハードウェアでシームレスに有効にすることを目指しています。 Nvidiaの迅速な開発サイクルは財務パフォーマンスを促進し、直近の四半期に411億ドルのデータセンターの売り上げを報告しています。

Source: Nvidiaは、長いコンテキストAIについてRubin CPX GPUを発表します

  NHL 23 Be A Pro の変更: Be A Pro モードの説明