SAP、企業データを高速に集計・加工するミドルウェア「SAP Data Hub」を発表

2017年11月7日(火)日川佳三（IT Leaders編集部）

リスト

SAPジャパンは2017年11月7日、WebログやSNSデータなどの日々発生するビッグデータやDWHに格納されている業務データなど、様々なデータを引っ張ってきて集計・加工して活用できるようにするミドルウェア「SAP Data Hub」を発表した。ビッグデータ処理用のインメモリー型分散処理エンジンとして「SAP Vora」のコンポーネントを組み込んでいる。

　SAP Data Hubは、企業内の様々なデータを引っ張ってきて集計・加工して活用できるようにするミドルウェアである。個々の部門の業務ユーザーが必要とするデータを、GUIベースの簡単なデータ設計ツールによって、個々の部門の業務ユーザーに提供できるようになる。

図1●SAP Data Hubのシステム構成。インメモリー型の分散処理エンジン「SAP Vora」を組み込んでいる。ETLソフトと組み合わせることでビッグデータ以外の各種データもSAP Vora上で扱えるようになる（出所：SAPジャパン）
拡大画像表示

　特徴は、インメモリーで動作する分散データ処理エンジンであるSAP Voraをデータ処理のエンジンとして使っていること。これにより、高速に集計・加工できる。また、機械学習ライブラリをデータ処理のフローに組み込むなど、データ処理のパイプラインを設計できる。データ処理は、トリガー駆動やスケジュール駆動ができる。

図2●SAP Voraの概要。Hadoop上のデータやAmazon S3上のデータソースに対して、Dokerコンテナを使ってインメモリーで分散処理する（出所：SAPジャパン）
拡大画像表示

　ビッグデータのデータソースとして、SAP VoraのデータソースであるHadoppとAmazon S3ストレージを利用できる（今後、Azure Data Lakeに対応予定）。別途ETL（抽出／加工／格納）ソフトである「SAP Data Services」と組み合わせることで、RDBMS（リレーショナルデータベース管理システム）など各種のデータを引っ張ってきてSAP Vora上で処理できる。

　SAP Data Hubを提供する背景について同社は、マーケティング部門やビッグデータ分析部門を介することなく、これらの部門が扱っているビッグデータにアクセスして活用できるようにしたいという需要を挙げる。「業務部門は、SAP Data Hubを使うことで、これらビッグデータと業務データを組み合わせて分析できるようになる」（同社）。

リスト

トピックス

[Sponsored]

SAP、企業データを高速に集計・加工するミドルウェア「SAP Data Hub」を発表

おすすめのホワイトペーパー

トピックス