[クラウド分解辞典−Amazon Web Services編]
ストレージサービスはデータタイプに応じて使い分ける─Amazon S3、Glacier、Storage Gateway、Elastic File System:第4回
2015年7月22日(水)佐々木 大輔(クラスメソッド)
第3回では、AWS(Amazon Web Services)でシステムを構成する際の基本的なコンポーネントである、仮想サーバーサービスの「Amazon EC2」と、仮想ロードバランサーの「Elastic Load Balancing」を紹介した。今回は、EC2と連携して利用できる、各種データストレージサービスを紹介する。
近年、情報システムが取り扱うデータ量は加速度的に増加しており、それに応じてサーバーの台数も増加傾向にある。かつての情報システムでは1台のサーバーが複数の役割をこなしていたが、今ではシステムの機能やアプリケーションソフトウェアごとにサーバーが立てられるのが一般的だ。
しかし、システム間のデータ連携やコンテンツ管理など、複数のサーバーで同一のデータにアクセスしたいケースが多々ある。バックアップやBCP(Business Continuity Plan:事業継続計画)対策としてのデータアーカイブなど、サーバーに接続されたストレージだけでは満たせない要件も少なくない。
これらの理由から、固有のサーバーに依存せず複数のサーバーから利用可能なデータストレージが必要になる。AWS(Amazon Web Services)では、ユースケースに応じて利用可能な、種々のデータストレージサービスを提供している。
具体的には、Webベースのデータストレージサービスである「Amazon S3」、低コストでデータアーカイブに適した「Amazon Glacier」、オンプレミス環境のサーバーやEC2からAmazon S3やAmazon Glacierをシームレスに接続する「AWS Storage Gateway」、そして最新サービスの「Amazon Elastic File System」である。
Webインタフェースで利用するAmazon S3
Amazon S3はWebベースのデータストレージサービスである。AWSのサービスとして最初にリリースされた。シンプルで使い易いWebインタフェースが提供され、ユーザーはどこからでもデータの保存や取り出しができる。料金は使った分だけが課金される。最低料金や初期料金はない。「使いたいデータを使いたい時にすぐ使える」データストレージサービスである。
保存できるファイルの数には制限がない。ただし、1つのファイルサイズは最大5TB までに制限されている。オンプレミスのストレージ装置では、データ保存領域が不足するとストレージデバイスを追加購入し増設する必要があるが、S3では無限にスケールが可能だ。
特に用途は制限されない。動画や画像などのメディアデータやソフトウェアのインストーラなどを配信したり、データアーカイブの蓄積場所としたり、あるいはバックアップデータの保管場所としたり、様々なシーンで活用できるだろう。
S3の特徴は大きく3つある。(1)高い堅牢性の確保、(2)セキュリティを高めるための機能、(3)Webサーバーとしての動作、である。
■高い堅牢性
データストレージサービスには高い信頼性が要求される。S3は99.999999999%の堅牢性を持つと言われる。そのためにデータは、複数のデータセンターおよびデータセンター内の複数のデバイスに冗長的に保存される。必ず3カ所以上に複製されており、仮に2カ所のデータセンターが災害によって壊滅した場合でもデータは失われない。計画停止はなく、いつでも利用できるサービスとして提供されている。
過去のデータを保持する「バージョニング」の機能も持つ。バージョニングを有効にした場合、データに変更があると、過去データが古いバージョンとして保存される。誤ってデータの削除や上書きを実行した場合にも、保存された過去データから復旧することが可能だ。データストレージサービスでは、ユーザーの誤操作によるデータの消失がよく発生する。誤操作からデータを保護するために、バージョニング機能は有用だ。
■セキュリティを高めるための機能
データには常に、盗聴行為や不正アクセスによる漏えいのリスクが伴う。S3では、そうしたリスクからデータを保護するためのセキュリティ機能が複数用意されている。それらセキュリティ機能を、保存するデータの重要性に応じて設定すれば、オンラインストレージサービスを、より安全に使用できる。
S3ではデータは「バケット」という保存場所にアップロードする。バケットに対する、すべての通信はSSLによって暗号化されている。バケットにはポリシーが設定でき、アクセスを詳細に制御できる。アップロードされたデータの自動暗号化機能もある。これらにより、通信経路上でデータを盗み見ることも、許可されていないユーザーが不正にデータを入手することも、また例え入手できたとしても参照できない。
■Webサーバーとしての機能
S3は、Webサーバーとしても機能する。すなわち、アップロードされたデータをそのままコンテンツとして提供できる。スクリプト言語やデータベースの導入はできないため、動的なコンテンツでは利用できないが、HTMLファイルや画像ファイルなどで構成された静的なコンテンツであれば、信頼性の高いWebサイトを安価に構築できる。動的コンテンツ中心のWebサイトでも、静的なコンテンツをS3に移設すれば、Webサーバーへのアクセス負荷の軽減が可能になる。
一般にWebサーバーを構築する場合、可用性を高めるために冗長化を検討したり、バックアップを考慮したり、大量に発生するトラフィックにも耐えられるように高い性能を求めたりしなければならない。しかしS3を使えば、上述したように堅牢性が高いため、可用性やバックアップを心配する必要がない。大量トラフィックが発生してもWebサイトにアクセスできなくなるようなこともない。
データの長期保管用途に向くAmazon Glacier
Amazon Glacierは「アクセス頻度は少ないが、必要な時に確実にアクセスしたいデータを低価格で長期保存する」ことに向いたデータストレージサービスである。システムのバックアップや一定期間保存しなければならないデータなどの保存に向いている。オンプレミスでいえば、DAT(Digital Audio Tape)やLTO(Linear Tape-Open)などの外部媒体に相当するといえる。
GlacierもS3同様、高い堅牢性を持ち、保存できるデータ容量に上限はない。通信はすべてSSLによって暗号化され、自動暗号化機能もある。最大の違いは、その料金だ。使った分だけ課金されるが、1カ月間の料金は1GB当たり0.0114ドル(東京リージョンでの2015年6月時点)と、S3の3分の1程度である。ただだし、S3のようにリアルタイムなデータアクセスはできず、データの取り出しに3〜5時間がかかる。
Glacierの利用方法として最も多いのがS3のバックアップだ。そのためS3は、アップロードから指定した期間が経過したデータをGlacierに自動的に移動させる機能を持っている。例えば、データをS3に定期的にバックアップしながら、1年を経過したバックアップはGlacierに移し5年間保存。Glacierに移動して5年が経ったデータは自動的に削除するといった使い方ができる(図1)。S3とGlacierを組み合わせることでデータアーカイブにかかるコストの最適化を図るわけである。
拡大画像表示
会員登録(無料)が必要です
- 1
- 2
- 次へ >
- 【最終回】ユーザーニーズに沿い、フルマネージド化とサーバーレス化が進む(2016/01/27)
- 【第9回】IoTやモバイル、アナリティクスにも対応—AWS IoT、AWS Mobile Hub、Amazon Elastic MapReduceなど(2015/12/22)
- DevOpsによるアプリケーション開発への集中を可能に─AWS Elastic Beanstalk、OpsWorks、CodeDeploy、CloudFormation:第8回(2015/11/25)
- 【第7回】インフラだけではない、オフィスのデスクトップ環境も用意─Amazon WorkSpaces、Amazon WorkDocs、Amazon WorkMail(2015/10/28)
- 【第6回】Webにつながらない事態を徹底回避−Amazon Route53、Amazon CloudFront(2015/09/24)