ベリタステクノロジーズは2018年1月31日、顧客企業の実際のデータ構成情報を収集してまとめた年次レポートの最新版「Data Genomics Index 2017」日本語版を公表した。個人情報の保護が重要になる中、データを可視化する必要に迫られているとしている。
ベリタステクノロジーズは、データバックアップ時にファイルの属性情報をクラウドで収集して可視化する仕組みを持っている。こうして集めたデータから、企業が保有するファイルの傾向を分析したレポートを作成している。特徴の1つは、8000種類のファイルタイプを識別していることである。
レポートによると、平均ファイルサイズは2016年比で23%増えており、データ量は2016年比で48.7%増えている。
個人情報保護法にとって課題となる傾向として、全データの50%以上を、開発者ファイル、データファイル、画像ファイル、不明なファイル形式、などが構成している。特に、不明なファイルが2016年比で51%増えている。
不明なファイルが増える要因は、デジタルビジネスにある。顧客データから価値を引き出す新しいアプリケーションが増えた結果、これらのアプリケーションごとに独自のファイル形式が作られている。
良い傾向もある。少なくとも3年以上触っていない陳腐化したデータの割合は、2016年の41%に対して33%にまで減っている。陳腐化したデータを企業が積極的に管理し始めている兆候だという。
Data Genomics Index 2017日本語版は同社のWebサイトよりダウンロードして入手が可能だ。