日立製作所のデジタルイノベーション部門は、分析するデータを整備するデータプレパレーション(データ前処理)の仕組みを構築した。ツールとして「Paxata」(パクサタ)を採用した。DataRobotやTableauによるデータ分析の前処理として利用している。Paxataを提供したアシストが同年3月3日に発表した。
日立製作所のデジタルイノベーション部門は、事業部門の担当者みずからデータを分析できる環境を整備済みである。マシンラーニング(機械学習)を自動化するツール「DataRobot」や、BI(ビジネスインテリジェンス)ソフトウェア「Tableau」を使ってデータを活用している。
一方、データ活用が進むにつれて、データの消費は早くなり、求められるデータの種類や量、回数が増えてきた。こうした中で、いくつかの課題が挙がった。例えば、IT部門へのデータの作成依頼が急増した。これにより、データ分析に時間がかかるようになった。
一方で、データレイクやデータウェアハウス(DWH)から取り出したデータを業務部部門の担当者みずから加工するのは難しい。Excelなら比較的容易に使えるが、大量のデータを扱うことが難しく、作業が属人化しやすい。
こうした背景の下、ITの専門知識を持たないユーザーでも簡単にデータを加工できる手段として、セルフサービス型のデータプレパレーションに注目し、Paxataを採用した(図1)。これにより、みずからデータを加工する担当者が増えた。
拡大画像表示
日立製作所では、Paxataについて、簡単な操作で必要なデータ加工ができること、DataRobotやTableauとの親和性が高いこと、拡張性が高くスモールスタートできること、――などを評価している。
●Next:Paxataが提供するデータプレパレーション機能
会員登録(無料)が必要です