EMCジャパンは2010年5月26日、データ・バックアップ用途に重複排除機能を備えたNASストレージ「Data Domain」のOS新版「DD OS 4.8」を発表した。新たに、米Symantecのバックアップ・ソフトに組み込むエージェント「DD Boost」を用意して、重複排除プロセスをエージェント側にオフロードできるようにした。
DD Boostは、データ・バックアップ・ソフトがストレージにバックアップするデータを、重複排除によって削減するソフトである。Data Domainストレージのエージェントとして動作し、重複排除処理をData Domainストレージとの間で分担する。現状では米Symantecのバックアップ・ソフト(NetBackupとBackup Exec)専用であり、これらのソフトにプラグイン・ライブラリのかたちで組み込んで使う。
従来、Data Domainストレージにはエージェントが存在しなかった。バックアップ・ソフトから転送されてくる重複排除前のデータ・ストリームを受け付け、Data Domainストレージ側で重複を排除していた。今回、エージェントを用意したことで、重複データをネットワーク転送する必要がなくなった。また、エージェントを組み込むことで、バックアップ・ソフト側からData Domainストレージの遠隔レプリケーション機能を制御できるようになった。
■重複排除処理の一部をエージェントにオフロード
重複排除プロセスにおける、DD BoostとData Domainストレージの役割分担は、以下の通り。
(1)DD Boost側で、バックアップ・データを4K~16Kバイトの可変長セグメントに分割し、それぞれにID(識別子)を割り振る。このIDをData Domainストレージに送り、指示を待つ。
(2)Data Domainストレージは、DD Boostが送ってきたIDを基に、既にバックアップ済みのデータか否か(重複しているか否か)を判別し、判別結果をDD Boostに回答する。
(3)DD Boostは、重複していないデータに限って、実データをData Domainストレージに転送する(転送前にデータ・セグメントを圧縮する)。
なお、DD Boostを使うことで、Data Domainストレージのコントローラ・ヘッドを最大2台まで同時にアレイ構成で使うことも可能になる。DD Boost側でデータのバックアップ先を2つに割り振り、それぞれ別のData Domainストレージ・ヘッドにデータを問い合わせて転送する。これにより、Data Domainストレージのスループットが2倍に向上する(1時間あたり12.8Tバイト)。
DD Boostの稼働環境と価格は以下の通り。米SymantecのNetBackupおよびBackup Execが動作する環境であれば、全OSで動作する。DD Boostの価格は、12万円(税込)から。前提となるData Domainストレージの価格は、エントリ機「Data Domain 140」で440万円(税込)から。
図 Data Domainストレージの重複排除プロセスの一部をDD Boostにオフロードすることで、重複データのネットワーク転送を排除した。