多くの企業が新たなビジネス価値創造をテーマにIoTデータの活用に向かっているが、その効果的な実践を支えるデータマネジメントが確立されているとは言い難い。そこでSASが提唱しているのが「IoTアナリティクス・ライフサイクル」である。発生したデータをリアルタイムに処理し、迅速に分析結果を得る手法に加え、高精度なモデル作成をサポートする機能をすべて取り揃え、シングルプラットフォームとして提供していくという。「データマネジメント2017」のセッションで解説した内容をレポートする。
ビジネス課題にIoTを適用するためには高精度のモデル作成が必須
装置に搭載されたセンサーがリアルタイムに発したデータを扱うIoTは、従来の定期検査などと比べて格段に粒度の細かい時系列データの収集を可能とし、プロセスの全体の状況変化を把握することに役立つ。ただ、当然のことながらそのデータは非常に大規模なものとなり、また、故障の予兆検知といったビジネス課題にIoTを適用するためには、高精度のモデル作成も必須となる。
SAS Institute Japan株式会社 ソリューション統括本部 シニアプリセールスコンサルタントの川上智史氏は、「IoTデータというとリアルタイム性に注目しがちだが、過去分を含めた全量データやその他の属性データを利用したバッチによる分析も欠かせない」と語る。
そこでSASが提唱しているのが、「Sense(適切なデータの取得)」「Understand(正確な特徴の理解と客観的データ表現=Analytics)」「Act(適切なタイミングで施策の実行、最適化された情報の提供)」のステップからなるIoTアナリティクス・ライフサイクルであり、その回転数を上げるほど精緻な分析が可能となる(図1)。
そして、IoTアナリティクス・ライフサイクルを支える重要な取り組みがデータマネジメントである。川上氏は「分析作業の約40%がプアなデータのせいで失敗している」という調査結果を引き合いに出し、「データマネジメントによって適切なデータを整備することで、はじめて正しい分析結果を得ることができる」と説く。
分析にいたる前のコードの整備や標準化には多大な労力を費やしているのが実情だが、裏を返せば「データの整備が終われば分析はほぼ完成」といっても過言ではない。その意味からもデータマネジメントの改善こそが分析の品質向上、ひいてはより良い意思決定につながっていくことをしっかり理解しておく必要がある。
データマネジメントを効率よく実施する重要要素~5つの「S」とは
では、データマネジメントを効率よく実施するためには何が必要だろうか。
データソースには正規化されたデータベースデータ、センサーデータなどのリアルタイムデータ、ログデータなどが混在している。ビジネスユーザーが求めているのは、このように多様な形式で散らばったデータが収集・結合され、標準化がなされ、さらにビジネスユーザー自身での集計や加工が実施された、「Analytics Ready Data=アナリティクス用に最適化されたデータ」である。
これを実現するのがアナリティクスのためのデータマネジメントであり、川上氏はその鍵を握る要素として、次の5つの「S」を挙げる。
- Simplify:データアクセス・データ移動の最適化
- Strengthen:プロファイル・統計分析・相関分析
- Scrub:クレンジング・品質向上
- Shape:セルフサービスによるデータ加工
- Share:データ・プロセスの一元管理と共有
SASは、これらのベストプラクティスとなる製品を提供しているのである。
まずSimplifyでは、従来型のETL製品の他にも、「リアルタイムに発生するイベントデータをさばく、ストリーミング処理」と、「分散したデータをそのまま移動させることなく仮想化し、1つのデータベースに見せるデータフェデレーション」のテクノロジーを提供している。
ストリーミング処理を実現するのが「SAS Event Stream Processing」で、「発生するイベントに対して、分析モデルを埋め込んだリアルタイム処理を実現する」と川上氏は強調する。一方のデータフェデレーションに対しては「SAS Federation Server」を提供。ETL開発などでデータ作成するのではなくSQLビューによる簡易な定義が可能であり、要件変更やプロトタイピングなどの試行錯誤にも対応している。
StrengthenとScrubで求められるデータ品質の把握・向上に対応するのが「SAS Data Quality」だ。「データ品質を定量的に把握するプロファイリング、その評価に応じて必要な補完や修正を行うクレンジング、標準化されたデータの統合(名寄せ)の3つのタスクをサポートし、Plan-Act-Monitorのデータ品質改善プロセスを確立する」と川上氏は語る。
さらにShapeに向けては、「SAS Enterprise Guide」と「SAS Data Loader for Hadoop」の2つのセルフサービスツールを提供している。
「SAS Enterprise Guide」は、ビジネスユーザー自身によるデータ加工、すなわち、セルフサービスに最適化されており、データ加工から分析、レポーティングまで同じGUIのプロセスフロー上で実現できるのが特徴だ。GUIでの直感的で容易な操作性に加え、データ準備や分析のプロセスが可視化され、属人化を防止した共有化の促進が可能となる。
「SAS Data Loader for Hadoop」は、Hadoopデータの加工機能をシンプルなGUIで提供する。データの意味や内容を把握しているビジネスユーザーであれば、難易度の高いHadoopスキルを一切必要とせずに、ビッグデータの活用が可能となる。
「SASでは、データの統合から分析、レポーティングまで、分析に必要な全てのテクノロジーを、一気通貫したシングルプラットフォームで提供している(図2)。製品ごとに、目的・用途に特化された様々な機能を提供するが、メタデータはすべて共通化されているため、製品間のデータ連携をスムーズに実施するとともに、アクセス権限についてもシステム全体で一元管理できる。すなわちメタデータの一元管理、ツール間でのモデル・データの共有、セキュリティ・アクセス管理をキーワードとするShareが実現する。」と川上氏は総括し、「IoT活用だけでなく、分析やデータマネジメント、可視化でお困りの際には、是非SASまでご相談いただきたい」と呼びかけた。
●お問い合わせ先
SAS Institute Japan株式会社
マーケティング本部
TEL:03-6434-3700
Email:JPNSASInfo@sas.com
URL:https://www.sas.com/jp