開発ツール/プラットフォーム 開発ツール/プラットフォーム記事一覧へ

[新製品・サービス]

さくらインターネット、生成AIアプリ開発用のPaaS、RAG用ベクトルDBや各種APIを提供

2024年11月25日(月)日川 佳三(IT Leaders編集部)

さくらインターネットは2024年11月25日、生成AIアプリケーションを開発・実行するためのシステム基盤を開発すると発表した。今後、クラウドサービスとして提供する予定である。アプリケーション開発を容易にする機能として、クラウド型のGPUサーバー「高火力」シリーズを使うためのAPIと、RAG(検索拡張生成)向けのベクトルデータベースを提供する。

 さくらインターネットは、生成AIアプリケーションを開発・実行するためのシステム基盤を開発し、今後クラウドサービスとして提供する。アプリケーション開発を容易にする機能として、クラウド型のGPUサーバー「高火力」シリーズを使うためのAPIと、RAG(検索拡張生成)向けのベクトルデータベースを提供する(図1)。

図1:今後提供する予定の、生成AIアプリケーションを開発・実行するためのシステム基盤の概要(出典:さくらインターネット)
拡大画像表示

 選択可能な大規模言語モデル(LLM)の1つとしてNECの「cotomi(コトミ)」を提供する。今回、このための基本合意契約をNECと交わした。今後も、各企業と連携し、基盤モデルの選択肢を増やす予定である。アプリケーション開発者は、選択する基盤モデルによって、データの通信や保管を日本国内で完結させられるようになる。

 なお、接続先となる「高火力」は、AI用途を想定したGPUベースのクラウドサービスである(関連記事さくらインターネット、生成AI向けクラウド基盤「高火力」を拡張、2027年内に18.9EFLOPSへ)。石狩データセンター(北海道石狩市)で提供している。整備計画によると、2027年12月末までに半精度(16ビット演算)で18.9EFLOPSの計算リソースを配置する。

関連キーワード

さくらインターネット / PaaS / RAG / 生成AI

関連記事

トピックス

[Sponsored]

さくらインターネット、生成AIアプリ開発用のPaaS、RAG用ベクトルDBや各種APIを提供さくらインターネットは2024年11月25日、生成AIアプリケーションを開発・実行するためのシステム基盤を開発すると発表した。今後、クラウドサービスとして提供する予定である。アプリケーション開発を容易にする機能として、クラウド型のGPUサーバー「高火力」シリーズを使うためのAPIと、RAG(検索拡張生成)向けのベクトルデータベースを提供する。

PAGE TOP