NTTデータグループは、国内グループ会社約70社、200拠点、8万ユーザーが利用する自社基幹ネットワークを管理するため、システム性能監視ツール「New Relic」の運用を2024年8月に開始した。PoCから監視設計、導入、運用まで担当するNTTデータ先端技術が同年10月10日に発表した。
NTTデータグループは、2021年からの4カ年計画で、国内200拠点を結ぶ基幹ネットワークの最新化を進めている。トラフィックが増えても安定的にサービス提供できるように設計を見直し、NFV(汎用サーバーで動作するネットワーク仮想化機能)、ローカルブレイクアウト、ゼロトラスト型セキュリティなどの技術を採り入れている。
新しい基幹ネットワークは5000台規模のネットワーク機器で構成し、国内グループ会社およそ70社、8万ユーザーが利用している。運用管理を担当するNTTデータ先端技術によると、レジリエンス強化の観点では、ハイブリッドクラウド構成によって複雑化したネットワークをいかに可視化し、問題検知と復旧を迅速化するかが課題だったという。
また、これまではネットワークの帯域監視、トラフィック監視、経路監視、接続監視などの監視対象ごとに専用のツールを利用していた。今回、これらの監視機能を、New Relicの性能監視ツール「New Relic Network Performance Monitoring(NPM)」で統合した(関連記事:システム性能監視ツール「New Relic」でソフトウェアの脆弱性管理が可能に)。
New Relicの導入により、基幹ネットワークのオブザーバビリティ(Observability:可観測性)を向上させている。NTTデータ先端技術によると、従来の性能監視ツールでは5分間隔でメトリクスを収集していたが、トラフィック量が瞬間的に跳ね上がったとき、肝心なデータを取りこぼしてしまたったり、問題がないように見えてしまったりする問題があったという。New Relic NPMは30秒間隔で収集・可視化するため、詳細な原因調査に基づいたトラブルシューティングが可能になった。
また、操作が容易であることも評価しており、ツールの習熟に要する期間が想定より短く、運用担当者のスキルに依らずに基幹ネットワークを監視できるようになったという。
NTTデータ先端技術は今後、New Relicのダッシュボードを関係者で共有することで、原因特定から解決までのフローの高速化に取り組む。また、監視対象をネットワークだけでなく社内サービスの利用状況にまで広げる予定である。