さくらインターネットは2024年11月25日、生成AIアプリケーションを開発・実行するためのシステム基盤を開発すると発表した。今後、クラウドサービスとして提供する予定である。アプリケーション開発を容易にする機能として、クラウド型のGPUサーバー「高火力」シリーズを使うためのAPIと、RAG(検索拡張生成)向けのベクトルデータベースを提供する。
さくらインターネットは、生成AIアプリケーションを開発・実行するためのシステム基盤を開発し、今後クラウドサービスとして提供する(図1)。アプリケーション開発を容易にする機能として、クラウド型のGPUサーバー「高火力」シリーズを使うためのAPIと、RAG(検索拡張生成)向けのベクトルデータベースを提供する。
拡大画像表示
選択可能な大規模言語モデル(LLM)の1つとしてNECの「cotomi(コトミ)」を提供する。今回、このための基本合意契約をNECと交わした。今後も、各企業と連携し、基盤モデルの選択肢を増やす予定である。アプリケーション開発者は、選択する基盤モデルによって、データの通信や保管を日本国内で完結させられるようになる。
なお、接続先となる「高火力」は、AI用途を想定したGPUベースのクラウドサービスである(関連記事:さくらインターネット、生成AI向けクラウド基盤「高火力」を拡張、2027年内に18.9EFLOPSへ)。石狩データセンター(北海道石狩市)で提供している。整備計画によると、2027年12月末までに半精度(16ビット演算)で18.9EFLOPSの計算リソースを配置する。