[Sponsored]
生成AI時代に欠かせないデータの集約管理をFlashBladeが具現化する
2024年4月24日(水)
生成AIの企業利用が本格化する中、その事前学習に用いるデータ準備の煩雑さが大きな課題となりつつある。2024年3月8日に開催された「データマネジメント2024」(主催:日本データマネジメント・コンソーシアム〈JDMC〉、インプレス)のセッションにピュア・ストレージ・ジャパンの正見卓司氏が登壇し、課題解消のアプローチとともに、そこでのストレージに求められる要件などを詳細に解説した。
提供:ピュア・ストレージ・ジャパン株式会社
38%と45%──。「これはとある調査会社が算出した、日本とグローバルにおける生成AIの現状の企業導入率です」と、ピュア・ストレージ・ジャパンのマーケティング本部でフィールドマーケティングマネージャーを務める正見卓司氏は解説する。OpenAIが世界に先駆けて生成AI「ChatGPT」を発表したのは2022年11月のこと。以来、わずか1年余りでこれほど普及したツール/サービスは稀であり、生成AIの秘める“変革力”の大きさからも、今後の一層の利用拡大は確実な状況だ。
生成AIの活用を阻むデータの“サイロ化”
「ただし、その活用に向け企業には大きな“宿題”が残されています。長らく指摘されてきたデータ管理の問題がそれです」と正見氏。生成AIの利用において、事前の学習がとても重要であることは多くが知るところだ。高品質かつ大量のデータで学習するほど生成AIは賢さを増し、それだけ大きな成果が期待できる。
しかし、それが一筋縄ではいかないことは、企業でのデータ管理の現状から理解できるはずだ。データはオンプレミスやクラウド、各種の業務システムなどに分散管理されており、必要なデータの集約やクリーニング作業に少なからぬ手間と時間を要してしまう。「一般的なデータ活用の観点からも、本来、データはひとまとめで管理するのが望ましい。ただし、それぞれのシステムにおいては『バックアップ』『データアナリティクス』『ストリーミング分析』などの目的別に異なる要件のストレージを採用しており、それらで管理するデータを集約することは、極めて困難とされてきました」(正見氏)。
多様なシステム要件に対応する最新ストレージ
生成AI活用を軌道に乗せるには、この厄介な問題の打開が不可欠だ。その中での“現実解”として正見氏が紹介したのが、ピュア・ストレージの非構造化データ・ストレージ「FlashBlade」だ。正見氏は、FlashBladeについて、「次の6つの要件を実現した、様々な要件に対応する超高速オールフラッシュストレージです」と強調する。
- 複数の同時ワークロードへの高いスループットとパフォーマンスを両立した「多次元パフォーマンス」
- オンプレミス制御によるクラウドのような敏捷性、柔軟性、およびリソース消費の選択を実現した「クラウド対応」
- 容量、パフォーマンス、メタデータ、ファイル数、オブジェクトのシームレスなスケーリングによる「動的なスケーラビリティ」
- シンプルな展開、管理、アップグレードのためにフラッシュ用に構築した「インテリジェントアーキテクチャ」
- 無停止のアップグレードとデータ保護による高可用性を通じた「常時稼働」
- NFS、SMB、およびS3プロトコル全体での卓越したパフォーマンスと機能を実現した「マルチプロトコルサポート」
「FlashBladeが『データハブ』として、あらゆるアプリにストレージサービスを提供することで、長年の懸案であったストレージのサイロ化が一気に解消します。のみならず、その高い機能性による処理高速化や、ストレージの統合による運用効率化なども実現します」と正見氏は話す(図1)。FlashBladeはすでにMeta(旧Facebook)やカカオトークのAI基盤にも採用された実績があるとのことだ。
拡大画像表示
従来からの保守を一変させる「Evergreen」
FlashBladeで採用されているSSDはHDDよりも処理が高速な反面、高価だととらえられてきたが、今となっては過去の話だ。ストレージ価格はギガバイト(GB)あたり26円にまで低下。結果、国内の企業向けストレージ市場におけるSSDの出荷比率も約65%に達するなど、すでにHDDと逆転している。
「企業が扱う非構造化データの量は2030年までに現在の10倍に増加すると見込まれ、SSDを全面採用したFlashBladeは、その中での大量データ処理や生成AI活用のための現実的な選択肢と位置付けられます。加えて、SSDは集約性と省電力性の面でもディスクより格段に優れ、電力・スペース効率を2〜5倍に高められ、環境にも優しい。ひいては、TCOを50%以上も削減できます」(正見氏)。
一方で、ピュア・ストレージは製品が陳腐化しない独自の保守サービス「Evergreen」を提供することでも注目されている。一般にストレージ製品は老朽化対策として平均4〜5年ごとにリプレースし、ユーザーは都度、高額な初期コストを負担するのが通例だった。これに対しEvergreenは、3年に1度の最新コントローラへの継続的な交換などを通じて、従来からのリプレース作業が生じないようにする仕組みだ(図2)。
拡大画像表示
電源やブレードなどの保守部材も、契約内容を基に最新のものを提供する。新規に拡張された機能についても永久に無料で利用可能であり、長い目で見てどちらの保守に分があるかは明白だろう。
ランサムウェアの被害を食い止める仕組み
近年における情報セキュリティの脅威の最上位に挙げられるのがランサムウェアだ。その対応支援に向けピュア・ストレージでが用意しているのが、オンラインストレージ上に暗号化できないスナップショットを作成する機能「SafeMode スナップショット」だ。
万一、ランサムウェアの侵入を許した場合、社内ネットワーク経由でランサムウェアが拡散し、あらゆるシステムが被害に遭う。対してSafeMode スナップショットの利用を通じ、管理者権限を奪われてもスナップショットへの被害は食い止められる(図3)。
拡大画像表示
ピュア・ストレージの担当者に連絡すれば、スナップショットの安全性の確認が取れ次第、サポートを受けつつ全社データのリストアに着実に乗り出せる。この時、FlashBladeの高速READ性能が、短期復旧を大きく後押しする。ランサムウェア攻撃の手法は年々、巧妙さを増しており、侵入後の潜伏期間も長期化する傾向にある。その点を踏まえ、SafeMode スナップショットによるバックアップデータやDBダンプなどの保護期間は、最長で400日まで設定できる。
生成AI活用の推進のみならず、SSDによる省電力化と多角的なコスト削減、さらに、リスクが高まり続けるセキュリティ被害への対策など、データにまつわる多様な課題の策として、ピュア・ストレージのFlashBladeの利用は今後、さらに拡大することになりそうだ。
●お問い合わせ先
ピュア・ストレージ・ジャパン株式会社
- データドリブン経営の成否はデータの信頼性に左右される(2024/06/03)
- MDMをスモールスタート・アジャイル型で! NTTコム オンラインが提唱するデータマネジメントのアプローチ(2024/05/31)
- DX支援のための先進技術は自社を“実験場”に─データ仮想化や生成AIの意義と効果とは?(2024/05/09)
- 「おもてなしDX」の推進で、財務データを活用したITコスト最適化に臨む(2024/04/25)
- 階層別ダッシュボードによる意思の共通化は組み込みBIで実現する(2024/04/23)