[市場動向]

NVIDIA、Blackwell後継の新世代GPU「Rubin」を発表、AI推論性能が5倍に

2026年後半にパートナー各社がRubinベースの製品を提供予定

2026年1月7日(水)日川 佳三、河原 潤(IT Leaders編集部)

米NVIDIAは2026年1月5日(米国現地時間)、現行世代「Blackwell」の後継となる新世代AI/GPUコンピューティングプラットフォーム「NVIDIA Rubin」を発表した。新GPUの「Rubin GPU」はNVFP4によるAI推論性能が50PFLOPSで現行世代比5倍に向上した。これを中核に、CPU「Vera CPU」、GPU間通信のインターコネクトスイッチ「NVLink 6 Switch」、ネットワークカード「ConnectX-9 SuperNIC」、データ処理用プロセッサ「BlueField-4 DPU」、Ethernetスイッチ「Spectrum-6 Ethernet Switch」の計6つのチップが相互に密結合する。

 米NVIDIAは、米ラスベガスで開催の「CES 2026」で、2024~2025年に順次出荷した現行世代「Blackwell」の後継となる、AI推論処理に最適化されたGPUコンピューティングプラットフォーム「NVIDIA Rubin」を発表した。

 同社の創業者兼CEO、ジェンスン・フアン(Jensen Huang)氏は、生成AI/AIエージェントの広範な普及や、注目が急速に集まるフィジカルAIなど「ハイパフォーマンスなコンピューティング需要が急増する中、Rubinは絶好のタイミングで登場した。ハードウェアとソフトウェアの緊密な協調設計により、AIの次のフロンティアに向けた大きな飛躍となる」とコメントしている。

 NVIDIAによるとすでに量産段階にあり、パートナー各社が2026年後半に、Rubinベースの製品を提供する計画を発表している。デル・テクノロジーズ、ヒューレット・パッカード・エンタープライズ(HPE)、レノボ、Supermicroなどが搭載サーバーを、AWS、Google Cloud、Microsoft Azure、Oracle Cloud Infrastructure(OCI)などがRubinベースのインスタンスを提供する。特にマイクロソフトは、次世代AIデータセンター「Fairwater AIスーパーファクトリー」にRubin NVL72を採用する方針を明らかにしている。

「Rubin GPU」のAI推論性能はBlackwell世代の5倍

 中核となる新しいGPU「Rubin GPU」は、NVFP4(NVIDIAが開発した4ビット浮動小数点演算フォーマット)によるAI推論性能が50PFLOPS(ペタフロップス)で、Blackwell世代の10PFLOPSと比べて5倍に向上している(図1)。

 また、大規模なMoE(Mixture of Experts:複数モデルの並列動作)モデルの推論コストは、現行Blackwell世代と比べて最大10分の1に抑えられ、学習処理は以前の4分の1のGPU数で実行可能になったという。

図1:現行世代「Blackwell」と比較した新世代GPU「Rubin GPU」の処理性能(出典:米NVIDIA)
拡大画像表示
図2:AI/GPUコンピューティングプラットフォーム「NVIDIA Rubin」を構成する6つのチップ(出典:米NVIDIA)
拡大画像表示

 Rubinプラットフォームは、AIのトレーニング時間短縮と推論コストの大幅な削減を目的として設計されている。Rubin GPUを中核にした以下の6つのチップで構成する(図2)。

  • Rubin GPU:第3世代Transformer Engineを搭載し、AI推論向けに50ペタフロップスのNVFP4演算性能を提供する。
  • Vera CPU:Armv9.2互換のOlympusコアを88個搭載し、エージェンティックAIの推論処理に最適化したCPU。
  • NVLink 6 Switch:GPU間通信を高速化するインターコネクトスイッチ。各GPUに3.6TB/sの帯域幅を提供し、ラックスケールでインターネット全体の帯域幅を超える260TB/sを実現する。
  • ConnectX-9 SuperNIC:最大1600Gb/sの通信速度をサポートし、超高速ネットワーキングを実現するネットワークカード。
  • BlueField-4 DPU:Rubinプラットフォームのインフラ全体のセキュリティとデータ処理をオフロードするデータ処理用プロセッサ。
  • Spectrum-6 Ethernet Switch:X800シリーズのEthernetスイッチで、AIワークロードに最適化されたネットワークファブリックを提供する。

●Next:ラック構成のリファレンスモデル「Vera Rubin NVL72」の処理性能

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
  • 1
  • 2
関連キーワード

NVIDIA / GPU / HPC / 生成AI / ITインフラ / PCサーバー / CES / 協業・提携 / Dell / Lenovo / HPE / Supermicro / Azure / Microsoft / AWS / OCI / フィジカルAI / AIエージェント

関連記事

トピックス

[Sponsored]

NVIDIA、Blackwell後継の新世代GPU「Rubin」を発表、AI推論性能が5倍に米NVIDIAは2026年1月5日(米国現地時間)、現行世代「Blackwell」の後継となる新世代AI/GPUコンピューティングプラットフォーム「NVIDIA Rubin」を発表した。新GPUの「Rubin GPU」はNVFP4によるAI推論性能が50PFLOPSで現行世代比5倍に向上した。これを中核に、CPU「Vera CPU」、GPU間通信のインターコネクトスイッチ「NVLink 6 Switch」、ネットワークカード「ConnectX-9 SuperNIC」、データ処理用プロセッサ「BlueField-4 DPU」、Ethernetスイッチ「Spectrum-6 Ethernet Switch」の計6つのチップが相互に密結合する。

PAGE TOP