Linux関連ソフトウェアなどを開発・販売するクラスキャットは2015年9月1日、OSS(Open Source Software)の分散処理フレームワーク「Apache Spark」をベースにしたビッグデータ解析基盤「ClassCat Analytics Stack for Spark」の提供を開始したと発表した。IBMのクラウドサービス「SoftLayer」のベアメタル(物理サーバー)上で動作させ、サービスとして提供する。
「ClassCat Analytics Stack for Spark」は、Apache Sparkを軸にHadoopエコシステムを使って構築したOSS(Open Source Software)のソフトウェアスタック。データ解析エンジンとしてApache Sparkの最新ステーブル版「1.4.1」を使用することで、処理速度が向上しているほか、対話型の操作が可能だ。SQLや、ストリーミング、機械学習に対応したライブラリも提供する。
クラスターマネージャーとして、Apache Spark標準の仕組みのほか、「Hadoop YARN」「Apache Mesos」を利用できる。入力ソースとしては、HDFS(Hadoop Distributed File System)のほかに、Key-Valueデータストア「HBase」とNoSQLの「Cassandra」を配備している。
データ解析言語「R」に対応する。インタラクティブシェル「sparkR」を利用できるほか、Rスクリプトのジョブも実行できる。
ClassCat Analytics Stack for Sparkは、米IBMのクラウドサービスである「SoftLayer」のベアメタル(物理サーバー)から提供する。インフラの知識は不要で、データサイエンティストも手軽に利用できる。拡張性が高く、ベアメタル1台から始められる。