日本オラクルは2020年11月6日、Oracle Cloudの機能について会見した。Oracle Cloudで使える高性能コンピューティング(HPC)機能と、Oracle Cloudで使える運用管理機能群「Oracle Cloud Observability and Management Platform」を説明した。Oracle CloudのHPCの特徴として、低遅延ネットワークとベアメタルサーバーを組み合わせていることをアピールした。
会見ではまず、Oracle Cloudで使える高性能コンピューティング(HPC)機能をアピールした。Oracle Cloudで提供するHPC環境の特徴として同社は、低遅延ネットワークとベアメタルサーバーを組み合わせている点をアピールした(図1)。

拡大画像表示
低遅延ネットワークとベアメタルサーバーでHPC環境を提供
ノード間のインターコネクトには、イーサネット上で低遅延・高スループットを実現するRoCE(RDMA over Converged Ethernet)v2を採用している。遅延時間は数マイクロ秒であり、オンプレミスのInfiniBand並みとしている。
流体計算のベンチマークでは、クラスタを構成するノードを増やしていった際に、東京大学や九州大学、大阪大学などの100Gビット/秒InfinBandを使ったオンプレミスHPCクラスタと同等の拡張性があった(図2)。

拡大画像表示
サーバー機にはベアメタルサーバーを採用している。ユーザー自身でサーバー機をチューニングしたり、トラブル発生時にトラブルを解決したりできる。この上で、仮想サーバーのように数分でサーバーを立ち上げたり削除したりできる。
直近でリリースしたベアメタルサーバーインスタンスの例として、2020年9月30日にNVIDIA A100を8基搭載したサーバー機がある。メモリーは2TB、ローカルストレージはNVMe接続で26TB。クラスタリングによって最大512GPUまで拡張できる。価格は、1時間あたり366円。
日本は製造業が多いことから、HPCの需要は大きいと日本オラクルは指摘する。この上で、HPCは常時使うわけではないため、使いたい時だけ使えるクラウドが適する。ユーザー事例の1社でレンダリング処理サービスを手がけるYellowDogは、急な需要に対して19万8000コアを30分だけ使っている。
Oracle Cloudで運用管理機能群を提供
会見では、Oracle Cloud上で利用できる運用管理ソフトウェア群「Oracle Cloud Observability and Management Platform」についても説明した(図3)。オンプレミス環境やマルチクラウド環境のITリソースを管理できる。提供する主なソフトウェア機能は、表1の通り。

拡大画像表示
ツール名 | ツールの機能 |
---|---|
Logging | ログを収集し(fluentdを使用)、管理する |
Logging Analytics | マシンラーニング(機械学習)でログのパターンと外れ値を可視化し、システムの異常を特定する |
Application Performance Monitoring | アプリケーション性能とユーザーの満足度を可視化する |
Database Management | Oracle Databaseの使用状況を監視・管理する |
Operations Insights | 将来のリソース需要とアプリケーション性能を予測する |
Service Connector Hub | サードパーティ製サービスとのデータ連携機能を提供する |