[市場動向]
さくらインターネット、AI用途を想定したGPUクラウドサービスを2024年1月以降に開始
2023年6月19日(月)IT Leaders編集部
さくらインターネットは2023年6月16日、半精度(AI用途)の浮動小数点演算で合計2EFLOPS(エクサフロップス)に相当する、大規模なクラウドサービス基盤を構築すると発表した。3年間で130億円規模を投資し、GPU「NVIDIA H100 Tensor コア GPU」を2000個以上採用する。大規模言語モデルなどの生成AIを中心とした利用を想定している。2024年1月以降に、同社が運営する石狩データセンターにおいて同サービスを提供開始する予定である。
さくらインターネットは、半精度(AI用途)の浮動小数点演算で合計2EFLOPS(エクサフロップス)に相当する、大規模なクラウドサービス基盤を構築する。3年間で130億円規模を投資し、GPU「NVIDIA H100 Tensor コア GPU」を2000個以上採用する。大規模言語モデルなどの生成AIを中心とした利用を想定している。2024年1月以降に、同社が運営する石狩データセンターにおいて同サービスを提供開始する予定である。
拡大画像表示
同サービスは、2024年1月以降、さくらインターネットが運営する石狩データセンターでの提供を予定している(写真1)。石狩データセンターは、北海道の冷涼な外気を活用した外気冷房と水力発電を中心とした、再生可能エネルギー電源100%のデータセンターである。
同サービスでは、性能に応じて4種類のGPUをラインアップすることを検討している。Tensorコアの性能(半精度)が高い順に「H100 SXM」(989TFLOPS)「H100 PCIe」(756TFLOPS)「L40」(181.05TFLOPS)「L4」(121TFLOPS)である。それぞれのGPUの需要を調べるためのアンケートも同日開始した。アンケートを通じて、無料トライアルと有料の先行利用の申し込みが可能である。
なお、今回の取り組みは、経済産業省が認定した、経済安全保障推進法に基づく特定重要物資である「クラウドプログラム」の供給確保計画に基づくもの。AIに関わるコンピューティングリソースを安定供給確保することは日本のデジタル社会を発展させるために必要不可欠と考えて申請したとしている。