「ビッグデータを本格的に活用したい」─。そう考える企業は日々増え続けているが、決して簡単なことではない。しかも、既存のデータ活用環境とうまく連携を図らなければ、せっかくの取り組みも成果が限定的となる。日本テラデータでは、こうした課題を解決する新たなデータ活用アーキテクチャーを提唱している。
ビッグデータで加速するデータの利活用
~新しい活用プラットフォームの必要性と実例~
ビッグデータには、リレーショナルデータベース(RDB)で扱う構造化データだけでなく、文書や動画などの非構造化データや、Webアクセスログやセンサーデータといった準構造化データなど、多様なデータが含まれる。そのため、データの分析・活用は、従来のRDBやビジネスインテリジェンス(BI)を利用した形だけでなく、より広範なものとなる。
分析業務の範囲拡大について山本氏は、「ビッグデータに含まれるデータには、構造が定義されていなかったり、構造が異なったりするものも含まれるため、事前のデータ加工も作業に含まれる。また、経路分析やグラフ分析などの新しい分析手法や、対話型/探索型の分析が必要になるほか、それぞれのデータを統合する必要も出てくる。分析の目的は変わらず企業業績に貢献することだが、実施する分析業務の範囲は変わってきている。」と説明する。
こうした処理を効率化するものとして注目される1つが、大規模データの並列分散処理を実現するオープンソースソフトウェア(OSS)の「Hadoop」である。分散ファイルシステムを使用すると共に、スキーマの定義が不要といった特性から、大量データを高速にロードできる。また、MapReduceプログラムを各ノードに配置して並列実行するため、多構造化データの大規模バッチ処理には向いている。
しかし、その反面、インデックスが存在せず、処理ごとにデータ形式を解析しなければならない上に、プログラムを各ノードに配置するのに時間がかかるため、対話的/探索型の分析には適していないという問題がある。
こうした問題を解決するためにテラデータが提供しているのが、超並列型RDBによってMapReduce処理を実現する対話的/探索型分析用プラットフォーム「Teradata Aster」である。これによって、多構造化データをRDBに保持し、SQLで分析処理を実現することが可能になり、処理容量はペタバイト規模にまで拡張することができる。また、SQL-MapReduceと呼ばれる特許取得済の技術を提供しており、事前定義済みの約80のMapReduce処理をSQLから関数として呼び出して実行することができる。
ビジネスの価値を高めるデータ活用アーキテクチャーを提唱
テラデータでは、Hadoopベースのデータプラットフォームと、Teradata Asterによるディスカバリープラットフォーム、既存のRDBベースの統合データウェアハウス「Teradata Database」の3つを連携させて、統合的なデータ活用を実現するアーキテクチャー「Teradata UDA (Unified Data Architecture)」を提唱している。
UDAを利用すれば、3つのプラットフォームを単一のアーキテクチャーで統合的に動作させることができる。例えば、Teradata DatabaseやTeradata AsterからSQLでHadoopデータにアクセスすることができるほか、プラットフォーム間でのデータ移動や統合管理が容易になる。
UDAを使って実際にどのような分析が可能になるのか。例えば、航空機のベアリング部品の事例。構造化データとして蓄積された保守履歴のデータと、航空機内から得られた膨大なセンサーデータをUDA上で統合・分析し、故障の発生件数をビジュアルに表示させた結果、急な着陸や離陸を行った時や、エンジンの急激な温度上昇が起きた時に、故障が頻発していることが分かった。通信会社の事例では、UDAによって経路分析と従来の統計解析を組み合わせ、解約する可能性の高い顧客を正確に特定することができたという。
UDAの活用によって生み出されるビジネス価値について山本氏は、「UDAは既存の構造化データとビッグデータを組み合わせ、さらに従来からの分析手法と新たな分析手法を組み合わせて利用できる。あらゆるデータ、あらゆる分析手法を用いることによって、顧客や製品の動向をより深く、正確に理解することができるようになり、より高いビジネス価値を生み出すことが可能になる」と説明している。
問い合わせ先
日本テラデータ株式会社
http://www.teradata.jp/
E-mail:event@teradata-j.com
- データ活用に取り組む企業や自治体の最前線に迫る(2014/05/12)
- 情報アーキテクチャに目を向け、全社を挙げたコラボレーションと業務に沿った情報共有の実現を(2014/05/12)
- データを経営資源として統合管理し最大限に活用するための最適解とは(2014/05/12)
- リアルタイムなビッグデータ活用を実現するSAP HANAテクノロジー(2014/05/12)
- オープンソースでビッグデータ統合を実現、データに基づいた経営でビジネスを変える(2014/05/12)