SAPジャパンは2017年11月7日、WebログやSNSデータなどの日々発生するビッグデータやDWHに格納されている業務データなど、様々なデータを引っ張ってきて集計・加工して活用できるようにするミドルウェア「SAP Data Hub」を発表した。ビッグデータ処理用のインメモリー型分散処理エンジンとして「SAP Vora」のコンポーネントを組み込んでいる。
SAP Data Hubは、企業内の様々なデータを引っ張ってきて集計・加工して活用できるようにするミドルウェアである。個々の部門の業務ユーザーが必要とするデータを、GUIベースの簡単なデータ設計ツールによって、個々の部門の業務ユーザーに提供できるようになる。
拡大画像表示
特徴は、インメモリーで動作する分散データ処理エンジンであるSAP Voraをデータ処理のエンジンとして使っていること。これにより、高速に集計・加工できる。また、機械学習ライブラリをデータ処理のフローに組み込むなど、データ処理のパイプラインを設計できる。データ処理は、トリガー駆動やスケジュール駆動ができる。
拡大画像表示
ビッグデータのデータソースとして、SAP VoraのデータソースであるHadoppとAmazon S3ストレージを利用できる(今後、Azure Data Lakeに対応予定)。別途ETL(抽出/加工/格納)ソフトである「SAP Data Services」と組み合わせることで、RDBMS(リレーショナルデータベース管理システム)など各種のデータを引っ張ってきてSAP Vora上で処理できる。
SAP Data Hubを提供する背景について同社は、マーケティング部門やビッグデータ分析部門を介することなく、これらの部門が扱っているビッグデータにアクセスして活用できるようにしたいという需要を挙げる。「業務部門は、SAP Data Hubを使うことで、これらビッグデータと業務データを組み合わせて分析できるようになる」(同社)。