インターネットイニシアティブ(以下、IIJ)が2012年10月から提供を開始した「IIJ GIO Hadoopソリューション」は、ビッグデータ活用のためのHadoopクラスタ環境をクラウド上で提供するサービスだ。プラットフォームの提供だけにとどまらない、同サービスの概要と特長について話を聞いた。
ビッグデータ活用のためのアプリ開発まで個別対応
提供されるHadoopディストリビューションは、ニーズに応じて3種類。オープンソースの「Cloudera's Distribution including Apache Hadoop(Cloudera)」「Cloudera Enterprise(Cloudera)」「GreenplumMR(EMCジャパン)」から選択することが可能。利用内容や価格、可用性など、システム要求レベルによって利用すべきディストリビューションは異なる。なお、オープンソース版であっても、DRBD+PacemakerクラスタによるMasterNodeのHA構成も可能だ。
オプションとしては、一般的にHadoopの活用実績が多い「バッチ高速化」と「大規模ログ解析」アプリケーションのSI開発・構築を用意している。
バッチ高速化は、基幹業務などで運用されているバッチプログラムをHadoopクラスタ環境に移行。日立ソリューションズおよびノーチラス・テクノロジーズとの協業のもとに「AsakusaFramework」を活用して、バッチ処理の高速化を実現する。
大規模ログ解析では、ソーシャルメディアやWebサイトのアクセスログなど、大容量のログデータ解析環境をHadoopクラスタへ構築する。
「もちろん、ビッグデータには、多種多彩な活用方法が考えられます。そのほかの利用法についてもお客様と相談しながら、アプリケーションまでトータルで構築します」(岡田氏)
なお、IIJでは、Hadoopソリューションを利用して解析を行うツールやパッケージを提供しているベンダーとの協業を積極的に進めており、今後も多様なオプションを拡充していく計画だ。
ビッグデータ活用の鍵は導入後今後も積極的に展開
「ビッグデータの活用においては、導入後が肝だと言えます。データ活用のサイクルを回して、精度を向上していくことが必要です」と山口氏は語る。
ビジネスの拡大にしたがって処理すべきデータはますます増加していく。それにシステムの拡張やチューニングを伴わなければ、ビッグデータ活用のメリットを最大化することはできない。
「IIJ GIO Hadoopソリューション」では初期構築の段階でチューニングや設定を行うのはもちろん、運用していくなかでビジネスの拡大に応じたチューニングや拡張を行い、常に最適な環境を提供する。プラットフォームだけ、アプリケーションだけ、運用だけのサービスでは、こうしたサイクルでの精度向上は難しい。すべてをワンストップで提供する「IIJ GIO Hadoopソリューション」の強みがここにある。
お問い合わせ先
株式会社インターネットイニシアティブ
電話:03-5205-4466
メール:info@iij.ad.jp
http://www.iij.ad.jp/GIO/