[新製品・サービス]
“国内完結”可能な生成AIシステム開発/実行基盤「さくらの生成AIプラットフォーム」─さくらインターネット
2025年5月16日(金)IT Leaders編集部、日川 佳三
さくらインターネットは2025年5月14日、生成AIシステム/アプリケーション開発・実行基盤「さくらの生成AIプラットフォーム」を提供開始した。AIシステムの開発を容易にする仕組みとして、GPUサーバーのベアメタルクラウドサービス「高火力シリーズ」の接続用APIと、RAG(検索拡張生成)用のベクトルデータベースを提供する。国内にデータを置いて通信するLLMを選択することで、生成AIシステムの構築と運用を日本国内で完結させることができる点をアピールしている。
さくらインターネットの「さくらの生成AIプラットフォーム」は、生成AIシステム/アプリケーション開発・実行基盤である。2024年11月に発表し、今回提供を開始した。
GPUサーバーのベアメタルクラウドサービスとして提供する「高火力シリーズ」や各種の大規模言語モデル(LLM)/基盤モデルへの接続用APIと、RAG(検索拡張生成)構成を可能にするベクトルデータベースを提供する(図1、関連記事:さくらインターネット、生成AIアプリ開発用のPaaS、RAG用ベクトルDBや各種APIを提供)。

拡大画像表示
選択可能なLLM/基盤モデルの1つとして、NECの「cotomi(コトミ)」を提供する。今後、各企業との連携によって選択肢を拡充していく。さくらインターネットは、国内にデータを置いて通信するLLMを選択することで、生成AIシステムの構築と運用を日本国内で完結させることができる点をアピールしている。
マネージド型PaaSとして、実行基盤の構築や管理の大半をさくらの生成AIプラットフォームが担う。「手間をかけずに、またLLMの専門知識がなくても各種のLLMを利用可能で、ユーザーは生成AIを活用したアプリケーションの開発に注力できる」(同社)としている。
接続先となる高火力シリーズでは、石狩データセンター(北海道石狩市)で稼働するAI用途を想定したGPUサーバーをベアメタルクラウドサービスとして提供している。さくらインターネットによると、2027年12月末までに半精度(16ビット演算)で18.9EFLOPSの計算リソースを配置する計画である(関連記事:さくらインターネット、生成AI向けクラウド基盤「高火力」を拡張、2027年内に18.9EFLOPSへ)。
さくらの生成AIプラットフォームの先行ユーザーとして、京都芸術大学(本部:京都市左京区)が試験導入を始めている。LLMに上述のcotomiを採用し、ノーコードのAI構築サービス「miibo(ミーボ)」を用いてAIアプリケーションを開発している。