[調査・レポート]
データセンター障害の発生頻度と深刻度は4年連続で減少も、セキュリティ事故は増加─米Uptime Institute調査
2025年5月8日(木)IT Leaders編集部
米Uptime Instituteは2025年5月6日、ITインフラ/データセンターにおけるシステム障害の原因、コスト、影響などを分析した年次レポート「2025年版データセンター障害分析レポート」を発表した。調査によると、障害の発生頻度と深刻度は4年連続で減少傾向にあるが、セキュリティインシデントは増加しており、影響は深刻かつ長期に及ぶ傾向にあるという。
米Uptime Instituteは、データセンターの可用性とパフォーマンスに関するグローバル指標であるTier認証システムの運営で知られている。その同社が、ITインフラ/データセンターにおけるシステム障害の原因、コスト、影響などを分析した年次レポート「2025年版データセンター障害分析レポート(Annual Data Center Outage Analysis 2025)」を発表した。
調査によると、障害の発生頻度と重大度(深刻度)は4年連続で減少傾向にあるが、セキュリティインシデントは増加しており、影響は深刻かつ長期に及ぶ傾向にあるという。
データセンター事業者を取り巻く現在の状況について、「電力網の制約、異常気象、通信事業者側での障害、サードパーティ製ソフトウェアの不具合など、自身では制御できない外的リスクの増加に直面している。その一方で改善が進んでいる領域もある」と説明する。以下は、レポートに記された主な調査結果のトピックである。
- データセンターにおけるシステム障害の発生頻度と深刻度は、デジタルインフラの急速な成長に比べて減少傾向にある。この傾向は数年にわたって続いており、業界におけるリスク管理と信頼性向上の進展を示している。
- 深刻な障害の主な原因は、依然として電源関連である。ITとネットワークに起因する障害は2024年に増加し、全体の23%を占めた。この傾向はコロケーションプロバイダーやクラウド、その他のサードパーティサービスへの長期的な移行を反映している
- アウトソーシングによって一部の企業ではリスクが軽減される場合もあるが、依然として重大な障害は発生しており、ときに深刻な影響をもたらしている。障害の増加は、ITとネットワークの複雑化によって、変更管理や設定ミスに関する問題が発生していることが主な原因と考えられる
- ソフトウェアベースや分散型のレジリエンスツールが拡大している。これらのシステムは、稼働時間の向上に寄与する一方、新たなリスクや複雑さを伴う可能性もある。ソフトウェアベースのレジリエンス戦略と、物理的なフェイルオーバーや冗長化を併用することで可用性は向上する。しかし、こうした複雑性の増加は新たな課題をもたらす。障害発生時の責任の所在が不明確になりやすく、根本原因の分析や障害の分類を複雑にする可能性がある
- 業界の変革スピードが加速している。急増するAI需要が電力や冷却を中心とした既存のインフラ設計に大きな負荷をかけている。一方、電力網の制約や世界的な貿易摩擦が、サプライチェーンや拡張計画に新たな不確実性をもたらしている。これらの圧力が重なることで、現在の信頼性の改善傾向にも、いずれ影響を及ぼす可能性がある
Uptime Instituteは、手順を順守しなかったことによる人為的ミスが原因となったデータセンターのシステム障害の割合が、前回(2024年)と比べて10ポイント増加していることを挙げ、対策として、トレーニングの強化や作業プロセスの見直しによってインシデントを減らせる可能性が高いことを示している(写真1)。

「人為的ミスによる障害の圧倒的多数は、手順の無視または不備に起因している。過去3年間で、約40%の組織が人為的ミスによる重大な障害を経験している。こうしたインシデントの85%は、従業員が手順を守らなかったこと、あるいは手順やプロセス自体に欠陥があったことが原因である」(同社)
●Next:大手クラウド/データセンター事業者に起因する障害は減少
会員登録(無料)が必要です