[新製品・サービス]

CSV/ParquetファイルをSQLで分析可能な「MySQL HeatWave Lakehouse」、2023年前半に提供

2022年12月16日(金)日川 佳三(IT Leaders編集部)

日本オラクルは2022年12月16日、CSV/Apache Parquetファイル向けSQLエンジン「MySQL HeatWave Lakehouse」について説明した。オブジェクトストレージ上にあるファイル形式のデータに対してSQLで分析をかけられる。SQLエンジンには、高速データベース「MySQL HeatWave」を使う。2022年10月に開催したプライベートイベント「Oracle CloudWorld 2022」で発表したサービスであり、現在ベータ版を提供中。2023年前半に一般提供開始を予定している。

 日本オラクルの「MySQL HeatWave Lakehouse」は、CSV(カンマ区切り形式)ファイルやApache Parquetファイルなどのファイル形式データをSQLで分析可能なデータベースエンジンである(図1)。オブジェクトストレージ上にあるファイル形式のデータに対してSQLで分析をかけられる。SQLエンジンには、高速データベース「MySQL HeatWave」を使う。現在ベータ版を提供中であり、2023年前半に一般提供開始を予定している。

図1:「MySQL HeatWave Lakehouse」の概要(出典:日本オラクル)
拡大画像表示

 ファイルから得たテーブルとRDB上で管理しているテーブルをJOIN(結合)する、といったことも可能である。オブジェクトストレージのデータ転送速度に合わせてオブジェクトストレージからのデータのロード速度を自動で制御する、といった機能も備える。オブジェクトストレージごとの性能のばらつきを吸収する仕掛けも備える(図2)。

図2:オブジェクトストレージからデータを高速に取り込む仕掛けの例(出典:日本オラクル)
拡大画像表示

 背景について日本オラクルは、分析すべき多くのデータが、RDBMS(リレーショナルデータベース管理システム)上ではなく、オブジェクトストレージ上にファイル形式で置かれている、という現状を指摘する。IoTセンサーデータや業務データなどである。RDBMSに取り込まない限り、このままではSQLで分析できない。これをSQLで分析できるようにする製品としてMySQL HeatWave Lakehouseを用意した。

MySQL HeatWave for Azureも発表

 Oracle CloudWorld 2022では、ベースとなる高速データベース「MySQL HeatWave」についても、新サービスや機能強化を発表している。新サービス「MySQL HeatWave for Azure」は、Oracle Cloud上のMySQL HeatWaveを、あたかもAzureのサービスであるかのように使えるようにするもの(図3)。クラウド間のネットワーク設定やデータ転送費用は不要である。

図3:「MySQL HeatWave for Azure」の概要(出典:日本オラクル)
拡大画像表示

 MySQL HeatWaveに追加した新機能の1つ「Auto Shape Prediction」は、データベースサーバーのリソースとなるサーバーインスタンスのサイズについて推奨値を提示する機能である。稼働状況に関する情報を常時収集し、マシンラーニング(機械学習)などを使って負荷などを予測し、適切なインスタンスサイズを推奨する(図4)。

図4:サーバーインスタンスの適切なサイズを推奨する機能「Auto Shape Prediction」の概要(出典:日本オラクル)
拡大画像表示

OLTP/OLAP兼用のインメモリー分散データベース

 MySQL HeatWaveは、インメモリー型で動作する分散データベースである。MySQLをMySQL HeatWaveに置き換えることで処理が高速になる。完全互換なので、アプリケーションからはMySQLと同じように利用できる関連記事クラウドDB「Oracle MySQL HeatWave」にマシンラーニング機能、SQLを介して学習・推論)。

 OLTP(オンライントランザクション処理)に使う通常のMySQLノード(InnoDB)と、OLAP(オンライン分析処理)に使うインメモリー型のクラスタノード(HeatWave)で構成する。InnoDBで更新したデータは、データ分析用のHeatWaveクラスタに透過的に伝達する。OLTPとOLAPを兼ねるので、ETLツールでOLAPデータベースにデータを移行するといった手続きが不要である。

 格納データを利用したマシンラーニング(機械学習)機能も搭載している。データを抽出して別のシステムに移すことなく、MySQLデータベース内で学習と推論が可能である。専用のSQL関数を使って、データの学習、推論、根拠の説明(どの列が結果にどの程度影響を与えたか)が可能である。

 Oracle CloudWorld 2022直前の2022年9月13日には、Amazon Web Services(AWS)上で動作する「MySQL HeatWave on AWS」も発表している(関連記事日本オラクル、「MySQL HeatWave on AWS」を発表、インメモリー分散DBをAWSで利用可能に)。MySQL HeatWave for Azureとは異なり、Oracle Cloud上ではなくAWS上でMySQL HeatWaveが動作する。

関連キーワード

MySQL HeatWave / CSV / Oracle / RDBMS

関連記事

トピックス

[Sponsored]

CSV/ParquetファイルをSQLで分析可能な「MySQL HeatWave Lakehouse」、2023年前半に提供日本オラクルは2022年12月16日、CSV/Apache Parquetファイル向けSQLエンジン「MySQL HeatWave Lakehouse」について説明した。オブジェクトストレージ上にあるファイル形式のデータに対してSQLで分析をかけられる。SQLエンジンには、高速データベース「MySQL HeatWave」を使う。2022年10月に開催したプライベートイベント「Oracle CloudWorld 2022」で発表したサービスであり、現在ベータ版を提供中。2023年前半に一般提供開始を予定している。

PAGE TOP