東京工業大学は2023年5月18日、次期スーパーコンピュータ「TSUBAME4.0」の構築を開始すると発表した。2024年春に稼働させる予定である。理論演算性能は、科学技術計算で使う倍精度(64bit)で66.8PFLOPS、AIで使う半精度(16bit)で952PFLOPSである。これらの数値は、現存する国内のスパコンの中では「富岳」に次ぐ2位に相当する。
東工大の学術国際情報センター(GSIC)は、次期スーパーコンピュータ「TSUBAME4.0」の構築を開始する(写真1)。2024年春に稼働させる予定。理論演算性能は、科学技術計算で使う倍精度(64bit)で66.8PFLOPS、AIで使う半精度(16bit)で952PFLOPSである。これらの数値は、現存する国内のスパコンの中では「富岳」に次ぐ2位に相当する。
拡大画像表示
TSUBAMEシリーズは、まだGPUを搭載したスーパーコンピュータがそれほどなかった頃からGPUを搭載してきた。初代のTSUBAME1.0は2006年4月に稼働開始し、TSUBAME1.2ではNVIDIAのGPUであるTeslaを搭載。これ以降、TSUBAME2.0ではFermi、TSUBAME2.5ではKepler、TSUBAME3.0ではPascalと、NVIDIA社製のGPUを採用してきた。
今回のTSUBAME4.0では、NVIDIA Hopperアーキテクチャに基づくNVIDIA H100 TensorコアGPUを本スパコン向けにチューニングした製品を採用。TSUBAME4.0のGPU数は960台であり、TSUBAME3.0の2160台と比べて少なくなるが、高性能なGPUの採用と、GPUの論理分割機構の活用により、前世代機を超える性能と使い勝手を達成するとしている。
TSUBAME4.0の調達に先立ち、東工大すずかけ台キャンパスに、新たなスパコン用の建屋を整備した。TSUBAME4.0の開発にあたっては、政府調達「TSUBAME4.0スーパーコンピュータ」が実施され、日本ヒューレット・パッカード(HPE)が落札した。今後、東工大は、HPE、米NVIDIA、関連各社とともに構築を進めていく。
TSUBAME4.0の構成は、今までのTSUBAMEシリーズを継承し、x86_64アーキテクチャのCPUとCUDA対応GPUで構成する。これまでのプログラム資産をそのまま使えるほか、世の中で幅広く使われているアーキテクチャであることから、世界中で開発が行われている最新の計算科学技術をいち早く導入可能である。
計算ノード部には、HPE Cray XD6500シリーズのサーバーを240台採用。各計算ノードは、第4世代AMD EPYCプロセッサを2基、NVIDIA H100 TensorコアGPUを4基、768GiBのメインメモリー、NVIDIA Quantum-2 InfiniBandネットワークインタフェースを4ポート搭載する。
ストレージシステムは、Cray ClusterStor E1000で構成し、Lustreファイルシステムを介してHDDベースの共有ストレージ44.2PBと、SSDベースの高速ストレージ327TBに接続する。さらに、各計算ノードにも容量1.92TBのNVMe SSDを搭載する。計算ノードとストレージシステムはInfiniBandで接続。さらに、SINET6を経由して100Gbit/sの速度で東工大すずかけ台キャンパスから直接インターネットに接続する。
TSUBAMEシリーズはこれまで、「みんなのスパコン」を標榜し、幅広いユーザー層に向けて潤沢な計算環境を提供してきた。TSUBAME4.0ではこの理念を発展させ、従来型のコマンドラインを介したバッチスクリプトベースの利用だけではなく、Webアプリケーション経由でも利用できるようにした。幅広い分野の研究者にも使いやすいソフトウェア環境を備えたことで、日常的に活用されることを狙っている。