日立製作所は2020年10月2日、企業のIT運用の継続的な改善を支援するサービス「IT運用最適化サービス」を強化した。AIの適用範囲を拡大し、稼働データをAIで分析することで、中長期的なシステムリソース不足の時期を自動で予測できるようにした。
日立製作所は2017年7月から、企業のIT運用の継続的な改善を支援するサ「IT運用最適化サービス」を提供している(関連記事:日立、「IT運用最適化サービス」を強化、DevOpsプロセス標準化やセキュリティ自律化の新メニュー)。(1)運用のコンサルティングや初期構築を担う「立ち上げ支援サービス」、(2)運用開始後の定期的なアセスメントなどを行う「継続支援サービス」、(3)AIを用いたIT運用機能セット(システム稼働分析、イベント分析、能障害分析など)を提供する「AI for IT Operations - Platform」、――で構成する。
今回、(3)の「AI for IT Operations - Platform」で提供する機能のうち、システム稼働分析について、AIの適用範囲を拡大した(図1)。稼働データをAIで分析することによって、中長期的なシステムリソース不足の時期を自動で予測できるようにしたほか、稼働データからAIが抽出した傾向の変化から、レポートで報告すべき重要度の高い問題点を自動で絞り込めるようにした。
拡大画像表示
問題点の絞り込みにあたっては、運用エンジニアのノウハウに基づき、システムごとの報告基準をあらかじめ設定している。例えば、「CPU使用率の最大値の前月比が5%以上」、「いつもの傾向より超過している箇所のうち、最大値を含むものに限定」、「ディスク空き容量不足に到達する予測日が90日以内」、――といった基準で絞り込める。従来はノウハウに頼って人手で都度行っていた絞り込み作業を、高い精度で自動化できる。
今回の機能強化にあたり、日立システムズにおいてシステムの運用を担当するエンジニアがレポートを作成する際に問題点を抽出して絞り込むノウハウを、サービスに取り込んだ。日立システムズが先行して実施した事前検証では、過去18カ月分のシステム稼働データをAIで分析し、レポートで報告すべき重要度の高い問題点を絞り込んだ結果、過去に運用を担当するエンジニアが月ごとのレポートで報告した問題点と比較して、最大97%の精度で問題点を抽出できた。
従来、日立システムズでは、自作ツールを利用し、過去の稼働データとの比較や障害の兆しの抽出を行っていた。しかし、ツールで抽出しきれない障害の兆しの確認や、将来のリソースの増強提案に向けたリソース不足時期の予測、および顧客ごとに異なる観点を考慮した報告すべき問題点の選定は、熟練のエンジニアが手動で行っていたため、負担が大きくなっていた。日立製作所は、こうした課題に対応するため、今回、「システム稼働分析」を強化した。