ビッグデータ活用への取り組みが広がる、データ管理基盤としてのNoSQLデータベースへの関心が高まっている。こうした中で、既存のRDB(リレーショナル型データベース)からNoSQLへのデータ移行を支援するために、データ統合ツールベンダーの仏Talendと、NoSQLデータベースを提供する米Basho Technologiesが協業した。これを受けて、両者の日本法人も同様の協業を開始し、RDBからNoSQLへの以降サービスを展開する。Talendの日本法人が2014年4月17日に発表した。
ビッグデータの文脈では、これまでに企業などが保有してきたPOS(販売時点情報管理)データや顧客情報など、RDBに蓄積・管理されているデータだけでは、「まったくビッグではない」と指摘されることがある。物理的なデータ量はもとより、自社との実際の取引関係に基づく過去のデータだけでは、自社と取引がない顧客のニーズの把握や、将来の予測に必要なトレンドなどが把握できないという、そもそもの課題があるからだ。
この課題を乗り越えるために、政府などが保有するオープンデータや、ソーシャルネットなどの非構造データ、さらには機械学習や自動認識を前提にした動画や音声など、様々なデータを組み合わせて利用しようとする動きが強まっている。
ただ問題になるのが、非構造データに代表される新しいデータの管理・蓄積だ。利用方法も見えない段階からデータを蓄積しようとすれば、構造を決めなければデータを扱えないRDBを利用することは無理がある。そこで登場するのが、NoSQLデータベースである。
しかし、NoSQLデータベースを導入したとしても、データ分析を考えれば、既存のRDBにあるデータもNoSQLデータベース上にあることが望ましい。だが、RDBからNoSQLへのデータ移行は、個別のAPI開発を含め、負荷やリスクが伴う。この負荷とリスクを軽減するためにTalendとBashoが協業するという。
具体的にはどういうことか。まずBashoが、OSS(Open Source Software:オープンソース・ソフトウェア)のNoSQLデータベースである「Riak」を提供する。Riakは、Amazon Dynamoをルーツにもち、分散アーキテクチャによって可用性を高めている。単一障害点(SPOF)のないマスターレス構成を持ち、データやアクセス量の増加に対するスケールアウト型の拡張を容易にしている。
一方、Talendは、データ統合用のアダプタなどを提供する。Talendは、データクレンジングやESB(Enterprise Service Bus)、MDM(Master Data Management)などの機能を持つ製品群を持っており、これらの一環でアプリケーションやデータベース、ファイルシステムなどを統合するための接続用コンポーネントを多数保有しているという。
両者のソフト/ツールを利用することで、RDBからRiakへのデータ移行だけでなく、Riakに蓄積したデータを種々のBIツールで分析するために、Talend製のツールで抽出するといったことも可能になるとしている。