New Relicは2021年4月7日、クラウド型のシステム性能監視ツール「New Relic One」のAIデータ分析機能を強化すると発表した。ログデータのパターンと外れ値を検出するために、ログデータを分析対象に加えるほか、インシデントの根本原因の分析などができるようになる。
New Relic Oneは、クラウド型のシステム性能監視ツールである。監視対象のシステムやアプリケーションからデータを収集して可視化する(関連記事:New Relic、システム性能監視ツール「New Relic One」の製品体系をシンプル化)。
(1)データの収集・蓄積、(2)可視化、(3)AI分析の3つの用途別に製品を体系化している。
(1)Telemetry Data Platform:監視データを1カ所に集める製品
(2)Full Stack Observability:収集したデータをもとに、フロントエンドからバックエンドまでアプリケーションをエンドツーエンドで可視化する製品
(3)Applied Intelligence:AIを使ってデータを分析する製品
今回、AI分析のApplied Intelligenceを強化すると発表した。これは、収集したすべてのデータにマシンラーニング(機械学習)を適用して分析する製品である。New Relicはこれまで、異常な振るまいを自動で検出する機能「Proactive Detection」と、大量のインシデントを自動の相関分析によってサマリー化する「Incident Intelligence」の機能を提供してきた。
ログデータを機械学習し、外れ値を検出可能に
Applied Intelligenceの強化ポイントの1つは、ログデータのパターンと外れ値を検出するために、ログデータを分析対象に加えたことである。膨大なデータから異常パターンを迅速に発見できるとしている。ダッシュボードやアラートなどを定義することで、ログデータのトレンドを迅速に分析してトラブルシューティングにあたれるようになる。
強化ポイントの1つは、インシデントの根本原因分析機能である。インシデント発生時に、推定できる根本原因について、憶測を排除し、問題をより迅速に解決できるようになるとしている。未解決の各問題の発生理由、影響を受けているサービスとシステム、解決に向けた必要な対策を把握できるとしている。それぞれの問題を解決するのに最適な対応者は誰かについても提案する。
強化ポイントの1つは、Service Nowなど外部の主要なインシデント管理ツールとの連携を強化したことである。複数のツールをまたがってインシデントを管理する手間を省くことができる。New Relic内の相関する問題のステータスを、Service NwoやPager Dutiyなどのインシデント管理ツールと双方向に同期させられる。