ヒューレット・パッカード エンタープライズ(HPE/日本ヒューレット・パッカード)は2024年10月17日、AI学習用途のPCサーバー「HPE ProLiant Compute XD685」を発表した。GPUに「AMD Instinct MI325X」を8基搭載可能である。同日、見積もりを開始した。2025年初頭から出荷する。
ヒューレット・パッカード エンタープライズ(HPE/日本ヒューレット・パッカード)の「HPE ProLiant Compute XD685」は、AI学習用途のPCサーバーである(写真1)。高さ5Uのラックマウント型シャーシに、米AMD製GPU「AMD Instinct MI325X」または下位モデルの「AMD Instinct MI300X」を最大8基搭載する。CPUは「AMD EPYC 9005シリーズ」を2基搭載する。冷却は空冷または液冷(DLC)。
拡大画像表示
Instinct MI325Xは、AMDが2024年10月10日に出荷した上位GPU(写真2)。GPUメモリー容量は256GBで、メモリー帯域幅は6TB/秒。GPU間およびCPUとの接続はInfinity Fabric Linkで帯域は128GB/秒。AI性能の公称値は、FP8(8ビット浮動小数点演算)で2614.9TFLOPS(テラフロップス)、FP16/BF16(Tensor/Matrix)で1307.4TFLOS、TF32で653.7TFLOPS。AMDによると「競合するNVIDIA H200 SXMと比べて性能は1.3倍」という。
拡大画像表示
ハードウェアと合わせて、サーバークラスタの管理に必要な機能群を備えたシステム管理ソフトウェア「HPE Performance Cluster Manager」を提供する。詳細なテレメトリー(遠隔からの観測・測定)やGPUストレステストによって、クラスタを健全に保ち、稼働を維持するとしている。また、サーバーにはシステム監視用ハードウェアチップ「HPE iLO」を搭載しており、システム障害の予兆を検知するほか、ファームウェアの改竄を検知・復旧する。