[事例ニュース]

大規模HPCクラスタ「さくらONE」のGPU間高速通信を担うホワイトボックススイッチ

オープン性とマルチテナント対応を貫き4カ月で構築

2026年1月8日(木)日川 佳三、河原 潤(IT Leaders編集部)

さくらインターネットが生成AIの急速な進化に応じて構築した、大規模HPCクラスタ/スーパーコンピュータ「さくらONE」。GPUを800基搭載したこのモンスターシステムを、2024年8月のプロジェクト開始から4カ月という短期間で構築している。構築・技術支援を行ったマクニカは2026年1月7日、ネットワーク基盤に台湾Edgecore Networksの800GbEホワイトボックススイッチとオープンソースネットワークOS「エンタープライズSONiC」を導入したことなど、プロジェクトの詳細を明らかにした。

 「生成AI技術の急速な発達を背景に、製造業・医療・金融をはじめとする多様な産業分野において、AIを活用した研究開発の中核を担う高性能スパコンの需要が高まっている」(マクニカ)

 こうした市場ニーズを受け、さくらインターネットは旺盛なGPU需要に早急に応えるべく、800基のGPUを搭載した大規模HPCクラスタ/スーパーコンピュータ「さくらONE」の構築プロジェクトを2024年8月に開始した(図1関連記事さくらインターネット、マネージドスパコン「さくらONE」にNVIDIA B200搭載ノード48台構成を追加)。

図1:「さくらONE」の構成(出典:さくらインターネット)
拡大画像表示

 プロジェクトの最大の課題は、異例の短納期での構築だった。同社によれば、4カ月という限られた期間で800基規模のGPUクラスタを立ち上げ、2024年12月からの本番稼働を実現する必要があったという。

オープン性とマルチテナント対応を重視し、ホワイトボックススイッチを選択

 GPU間通信の要件として、さくらインターネットはネットワークのオープン性とマルチテナント対応を重視。結果、汎用性の高いEthernetを採用した。メモリ間で直接データを高速転送する「RoCEv2(RDMA over Converged Ethernet version 2)」プロトコルがIPネットワーク上での処理を可能にしている。

 ネットワーク基盤の構築において複数のベンダーを検討する中、要求仕様、価格、および4カ月での構築という短納期への対応力において、マクニカが提案した台湾Edgecore Networksの800GbEホワイトボックススイッチ「AIS800-64O」(写真1)を採用した。

写真1:さくらONEが採用したホワイトボックススイッチ「AIS800-64O」の外観(出典:マクニカ)

 ネットワークOSについては、Linux環境での運用自動化に適していたことが決め手となり、Edgecoreがサポートを提供する「エンタープライズSONiC」を導入した。マイクロソフトが開発したオープンソースソフトウェア(OSS)のネットワークOS「SONiC」を基にしたLinuxベースのOSで、ベンダー各社がそれぞれチューニングを施したディストリビューションを提供している。

 マクニカによると、ホワイトボックススイッチやオープンソースネットワークOSの導入は、技術革新やコスト削減、構築と運用の柔軟性といった理由から、スパコン需要の高まりを受けて加速しているという。

●Next:大規模HPCクラスタの構築でマクニカが支援したこと

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
  • 1
  • 2
関連キーワード

さくらインターネット / HPC / GPU / スーパーコンピュータ / TOP500 / ホワイトボックス / マクニカ / ITサービス / 台湾

関連記事

トピックス

[Sponsored]

大規模HPCクラスタ「さくらONE」のGPU間高速通信を担うホワイトボックススイッチさくらインターネットが生成AIの急速な進化に応じて構築した、大規模HPCクラスタ/スーパーコンピュータ「さくらONE」。GPUを800基搭載したこのモンスターシステムを、2024年8月のプロジェクト開始から4カ月という短期間で構築している。構築・技術支援を行ったマクニカは2026年1月7日、ネットワーク基盤に台湾Edgecore Networksの800GbEホワイトボックススイッチとオープンソースネットワークOS「エンタープライズSONiC」を導入したことなど、プロジェクトの詳細を明らかにした。

PAGE TOP