[市場動向]

Oracle Cloud、低遅延ネットワークによるHPC環境のスケーラビリティをアピール

2020年11月6日(金)日川 佳三(IT Leaders編集部)

日本オラクルは2020年11月6日、Oracle Cloudの機能について会見した。Oracle Cloudで使える高性能コンピューティング(HPC)機能と、Oracle Cloudで使える運用管理機能群「Oracle Cloud Observability and Management Platform」を説明した。Oracle CloudのHPCの特徴として、低遅延ネットワークとベアメタルサーバーを組み合わせていることをアピールした。

 会見ではまず、Oracle Cloudで使える高性能コンピューティング(HPC)機能をアピールした。Oracle Cloudで提供するHPC環境の特徴として同社は、低遅延ネットワークとベアメタルサーバーを組み合わせている点をアピールした(図1)。

図1:Oracle CloudのHPC環境の特徴。低遅延ネットワークとベアメタルサーバーを組み合わせてユーザーが要求する性能などを確保している(出典:日本オラクル)図1:Oracle CloudのHPC環境の特徴。低遅延ネットワークとベアメタルサーバーを組み合わせてユーザーが要求する性能などを確保している(出典:日本オラクル)
拡大画像表示

低遅延ネットワークとベアメタルサーバーでHPC環境を提供

 ノード間のインターコネクトには、イーサネット上で低遅延・高スループットを実現するRoCE(RDMA over Converged Ethernet)v2を採用している。遅延時間は数マイクロ秒であり、オンプレミスのInfiniBand並みとしている。

 流体計算のベンチマークでは、クラスタを構成するノードを増やしていった際に、東京大学や九州大学、大阪大学などの100Gビット/秒InfinBandを使ったオンプレミスHPCクラスタと同等の拡張性があった(図2)。

図2:低遅延ネットワークにより、流体計算のベンチマークにおいて、ノードを増やしていった際の性能の拡張性が、オンプレミスのInfiniBand環境並みだったとしている(出典:日本オラクル)図2:低遅延ネットワークにより、流体計算のベンチマークにおいて、ノードを増やしていった際の性能の拡張性が、オンプレミスのInfiniBand環境並みだったとしている(出典:日本オラクル)
拡大画像表示

 サーバー機にはベアメタルサーバーを採用している。ユーザー自身でサーバー機をチューニングしたり、トラブル発生時にトラブルを解決したりできる。この上で、仮想サーバーのように数分でサーバーを立ち上げたり削除したりできる。

 直近でリリースしたベアメタルサーバーインスタンスの例として、2020年9月30日にNVIDIA A100を8基搭載したサーバー機がある。メモリーは2Tバイト、ローカルストレージはNVMe接続で26Tバイト。クラスタリングによって最大512 GPUまで拡張できる。価格は、1時間あたり366円。

 日本は製造業が多いことから、HPCの需要は大きいと日本オラクルは指摘する。この上で、HPCは常時使うわけではないため、使いたい時だけ使えるクラウドが適する。ユーザー事例の1社でレンダリング処理サービスを手がけるYellowDogは、急な需要に対して19万8000コアを30分だけ使っている。

Oracle Cloudで運用管理機能群を提供

 会見では、Oracle Cloud上で利用できる運用管理ソフトウェア群「Oracle Cloud Observability and Management Platform」についても説明した(図3)。オンプレミス環境やマルチクラウド環境のITリソースを管理できる。提供する主なソフトウェア機能は、表1の通り。

図3:運用管理ソフトウェア群「Oracle Cloud Observability and Management Platform」をOracle Cloudで提供する(出典:日本オラクル)図3:運用管理ソフトウェア群「Oracle Cloud Observability and Management Platform」をOracle Cloudで提供する(出典:日本オラクル)
拡大画像表示
表1:Oracle Cloud Observability and Management Platformの主な機能
ツール名 ツールの機能
Logging ログを収集し(fluentdを使用)、管理する
Logging Analytics マシンラーニング(機械学習)でログのパターンと外れ値を可視化し、システムの異常を特定する
Application Performance Monitoring アプリケーション性能とユーザーの満足度を可視化する
Database Management Oracle Databaseの使用状況を監視・管理する
Operations Insights 将来のリソース需要とアプリケーション性能を予測する
Service Connector Hub サードパーティ製サービスとのデータ連携機能を提供する
関連キーワード

Oracle Cloud / HPC / RoCE

関連記事

Special

-PR-

Oracle Cloud、低遅延ネットワークによるHPC環境のスケーラビリティをアピール日本オラクルは2020年11月6日、Oracle Cloudの機能について会見した。Oracle Cloudで使える高性能コンピューティング(HPC)機能と、Oracle Cloudで使える運用管理機能群「Oracle Cloud Observability and Management Platform」を説明した。Oracle CloudのHPCの特徴として、低遅延ネットワークとベアメタルサーバーを組み合わせていることをアピールした。

PAGE TOP