SAPジャパンは2023年3月22日、クラウド型データ統合サービス「SAP Datasphere(データスフィア)」を提供開始した。複数のデータソースを仮想統合して多目的に使えるようにするデータ統合プラットフォームである。現行サービス「SAP Data Warehouse Cloud」の次世代版に相当し、「データ活用環境をシンプルにする」(同社)としている。
SAPジャパンの「SAP Datasphere(データスフィア)」は、クラウド型のデータ統合プラットフォームである。現行サービス「SAP Data Warehouse Cloud」の次世代版に相当する。
企業が抱える各種データを業務部門が自由に活用するための機能群として、データ収集、メタデータ整備、データモデリングなど、データマネジメントの各機能を網羅する。SAP S/4HANAのアプリケーション開発・実行プラットフォーム「SAP Business Technology Platform(BTP)」上で開発している(図1)。
拡大画像表示
SAPは、「従来、伝統的なデータ活用の姿は、データを1カ所に物理的に集めて整形済みの標準データを作り、レポートの用途ごとにデータ変換や集計処理を済ませたデータマートを用意し、バッチ処理でデータセットを用意する、というものだった」と説明。この手法の問題点は、データソースに更新がかかってから分析用のデータセットに反映されるまでのリードタイムが大きいことだという。
この課題に対して、現行のSAP Data Warehouse CloudやSAP Datasphereでは、複数システムに分散する実データを仮想テーブルで統合する手法をとえい、データを物理的に収集したり変換したりすることなく統合可能である(関連記事:SAPジャパン、SAP HANA Cloudを日本のデータセンターから提供開始)。
具体的には、SAP Datasphere上に、複数のデータソースを仮想的に統合したデータアクセス層を定義する。この層を介してデータソースに直接アクセスして最新のデータを参照する。レスポンス性能を要求する場面では、物理的にデータをコピーして統合することも可能である。こうして収集したデータは、インメモリーデータベースで高速にアクセス可能である。
また、SAP Datasphereでは、SAP Data Warehouse Cloudにはなかった機能として、分析モデルを作成するモデリング機能やデータカタログ機能が備わっている。データカタログ機能では、ビジネス用語やKPIを定義し、システム上のデータとひもづけて管理できる。「あるKPIが、どのシステムのどのデータから成り立っているかを管理することで、ビジネス用語やKPIを元にデータを活用できる」(同社)。
データソースとの連携機能も強化した。SAP Data Warehouse Cloudではデータソース側にデータ接続用のエージェントモジュールを導入する必要があったが、これを不要にした。ネットワーク接続用のモジュールは提供するが、個々のデータソースへのデータアクセス機能はSAP Datasphere側で実装している。