ピュア・ストレージ・ジャパンは2018年4月5日、ディープラーニング(深層学習)などのAI(人工知能)にデータを学習させる用途に適した垂直統合システム「AIRI(アイリ)」を発表した。米NVIDIAのGPUコンピュータ「DGX-1」と、米Pure Storageのスケールアウト型ストレージ「Pure Storage FlashBlade」を組み合わせた。現在国内のパートナーを探しており、2018年第3四半期をターゲットに出荷する。
ピュア・ストレージ・ジャパンの「AIRI」は、AIにデータを学習させて学習モデルを作成する用途を狙った、垂直統合システムである。NVIDIAのGPUコンピュータに、外部ストレージとしてPure Storage FlashBladeを組み合わせた。ソフトウェアは、NVIDIAのディープラーニング用フレームワークのほかに、AIRIのためにマルチノード型のジョブ実行制御ソフト「AIRI Scaling Toolkit」を新規に用意して搭載した。
拡大画像表示
拡大画像表示
「AIの学習用途では、NVIDIAのDGX-1とPure Storage FlashBladeを組み合わせて使っているユーザーが多い。だから協業した」──。商品を企画した背景について、米Pure Storageの製品・ソリューション・マーケティング部門で副社長を務めるマット・キックスモーラー(Matt Kixmoeller)氏はこう説明する。
キックスモーラー氏は、あらかじめ構築済みの垂直統合システムとして提供することのメリットを特に強調する。「インフラの構築に時間がかかってしまうと、AIの開発で後れをとってしまう。AIRIなら構築済みのインフラが手に入るので、AIの技術者が本来の仕事に注力できる」。
「サーバーを増設すれば学習時間を短縮できる」
AI学習用のソフトウェアライブラリや開発環境は、NVIDIAがあらかじめ用意しているフレームワークを搭載した。これらのソフトウェアスタックは、Dockerコンテナイメージで動作する。これによりAI開発者は、ソフトウェア環境を構築して整備する手間が要らなくなる。AIRIではさらに、両社の製品を組み合わせてパッケージ化しただけでなく、新規にマルチノード型のジョブ実行制御ソフト(AIRI Scaling Toolkit)を提供する。
AIRI Scaling Toolkitは、マルチノード対応のジョブスケジューラであり、複数の計算ノードにジョブを割り振って実行させるオーケストレーション機能を備える。これを使うことで、複数ノードを並列で動作させて学習を短時間に終わらせるといったことができる。「DGX-1を増やれば性能がリニアに伸びる。DGX-1×1台で1カ月かかる処理を、DGXを増やすことで数日で終わらせられる」(キックスモーラー氏)。
発表会では、AIRIを導入して成果を挙げた海外事例をいくつか紹介した。コールセンターを運営するGlobalResponceは、顧客の感情を分析するためにAIRIを使っている。コンサルティング会社のELEMENT AIは、自社内だけでなく顧客向けにもAIRIを使ってAI環境を構築している。医療分野のPAIGEは、がんの調査レポートを発行するペースを大幅に改善したという。
なお、NVIDIA DGX-1は、1台につき米NVIDIAのGPU「NVIDIA Tesla V100」を8個搭載するGPUコンピュータである。ディープラーニングなどのAI用途に合わせて製品化した。GPUは複数のコアで浮動小数点演算を並列処理させる用途に適しており、元々はCADなどのグラフィックス処理で使われてきた。その後、HPC(ハイパフォーマンスコンピューティング)などのスーパーコンピュータ用途に使われるようになり、最近ではディープラーニングなどのAI用途で使われている。
一方のPure Storage FlashBladeは、非構造化データの格納に適したファイル/オブジェクトストレージである。複数のノードにまたがった単一のストレージを運用できるようにする分散ストレージソフトを搭載しており、ブレード型のノードを増設することによって容量を拡張できる。ノードは専用のハードウェアであり、1から設計した。ソフトウェアはXeonベースのSoCとARMコアを搭載したFPGAで処理する。フラッシュメモリーはメイン基盤にPCI Express経由で接続している。
拡大画像表示