Snowflakeは2023年11月9日、説明会を開き、クラウド型データウェアハウス(DWH)「Snowflake」に今後追加する機能について説明した。Apache Iceberg形式のテーブルデータを事前に取り込むことなくSnowflakeで扱えるようにするほか、大規模言語モデル(LLM)への対応、セルベースで対話型の開発環境「Notebook」などを新機能として提供する。
Snowflakeは、クラウド型データウェアハウス(DWH)「Snowflake」に今後追加する機能を説明した。データ基盤の簡素化・強化と、AIの活用促進の2系統で新機能を提供する。
データ基盤の簡素化・強化では、Apache Iceberg形式で保存されたテーブルデータを、事前に取り込むことなくSnowflakeから扱えるようにする。近日中にパブリックプレビューを開始する(図1)。
拡大画像表示
また、どのクエリーにどのぐらいリソースや負荷がかかっているかを可視化する「コスト管理インタフェース」のプライベートプレビューを紹介した(図2)。
拡大画像表示
AI活用の促進では、大規模言語モデル(LLM)をSnowflakeから使うための基盤「Snowflake Cortex」のプライベートプレビューを紹介した。Snowflakeが既存の各LLMをベースにファインチューニングを施したLLM群を提供する(図3)。
拡大画像表示
SQLやPythonからLLMを使うための関数群をプライベートプレビューとして紹介した。会話型LLMによる推論やベクトル検索を実行できる汎用関数などを備えており、外部データを参照するRAG(Retrieval-Augmented Generation:検索拡張生成)アプリケーションを容易に構築できるという(図4)。
拡大画像表示
LLMを活用したアプリケーションとして、ドキュメントから構造化データを抽出する「Document AI」、自然文からSQLを生成する「Snowflake Copilot」(図5)、Snowflake内のデータをベクトル化して検索する「ユニバーサル検索」などを提供する。
拡大画像表示
セルベースのインタフェースを備えた開発環境「Snowflake Notebooks」のプライベートプレビューを紹介した。SQL、Python、Markdownを使って対話型での開発を可能にする。コードやその実行結果、説明などを記載可能である(図6)。
拡大画像表示