データ活用を競争力に昇華させるには、目的に合致した信頼し得るデータに素早くアクセスできることや、権限などに応じてデータを適切に管理できることなどが不可欠だ。そこで耳目を集めているのが「データカタログ」である。2024年3月8日に開催された「データマネジメント2024」(主催:日本データマネジメント・コンソーシアム〈JDMC〉、インプレス)のセッションにNTTデータ バリュー・エンジニアの平田勝義氏が登壇し、データカタログの構築と運用のポイントを解説した。
提供:株式会社NTTデータ バリュー・エンジニア
「データカタログとは組織の膨大なデータ資産を対象にメタデータを管理する仕組みであり、そのメタデータとは、いわば『データに関するデータ』のことです。メタデータがあってはじめて、そのデータが『何を意味しているのか』を理解できるようになり、逆にメタデータがなければ、誤ったデータ活用につながりかねません(図1)」──。こう指摘するのは、NTTデータ バリュー・エンジニアでデータマネジメント事業本部グループマネージャを務める平田勝義氏だ。つまり、データ活用の第一歩は「データを知ること」なのである。
拡大画像表示
データ活用の礎となるメタデータ管理
その文脈で大事な役割を果たすのが「データカタログ」だ。データカタログは、いち早くデータを発見し、深く理解し、一方ではガバナンスを強化することを支援する。平田氏は事例を挙げながら、メリットを説明した。
1つは、属人化なデータのやり取りから脱却した企業事例だ。その企業では従来、従業員が必要なデータを入手する際に、個人的な伝手に頼っていたという。使えそうなデータの所在が分かった段階で、そのデータオーナーとの間で直接データをやり取りしていたのだ。データの機密度や使用権限は曖昧な状態だったので、最悪の場合は外部流出の懸念も拭いきれなかった。
「そこにデータカタログを導入することで問題を解決しました。社内にあるデータをいち早く確認できるようになったことに加え、アクセス権限に照らしながら利用が許可されているものをデータ管理部門経由で提供できるようになったのです」(平田氏)
もう1つは、当該のデータに関する情報を確認するのに多大な手間ひまがかかる問題を解消した事例だ。データを取り寄せてみたものの、値が入っていなかったり、そもそもの意味が判然としなかったりと分析が進まない。やむなく、データの来歴や信頼度といった「データに関する情報」、すなわちメタデータを自ら確認することに手を取られていたという。この企業は、データ品質測定結果を含めたデータカタログを作成することで問題を一掃することに成功した。
「スモールスタートで挑んだことが奏功しました。まずは対象データを最小限にとどめて、Excelでデータカタログを整理・共有することから始めました。その結果、効果を実感できたので、あらためて専用のデータカタログツールを導入し、対象データも拡充させました」と平田氏は話す。
歴史を振り返ると、IT部門が業務システムを開発する際は、事業部門が扱っているデータを正しく理解する一助としてメタデータ管理の仕組み(=データカタログ)を活用していた。その後、データカタログはデータ活用のためのメタデータ管理へと発展し、検索・閲覧にとどまらず、カタログを用いてユーザー間で知識を共有したり、AIを介してデータを探索したり、さらには生成AIを用いてメタデータやSQLクエリを作成したりするなど、様々なユーザーの多種多様なニーズに応えられるツールとして進化した。
データカタログの価値を持続させるポイント
では、そんなデータカタログをどのようにして構築していけばよいのか。「ツールを導入しても、肝心の中身や最適化された運用が伴わなければ、宝の持ち腐れとなってしまいます」と平田氏は警鐘を鳴らす。
データカタログの構築にあたっては、ツールを導入すれば終わりではなく、利用方法の整理をはじめ、人手を介する必要があるメタデータの作成をどのように現場に定着させるのかなど、検討すべきことは枚挙にいとまがない(図2)。 ここで平田氏は、NTTデータ バリュー・エンジニアが手掛けているデータカタログ推進の例を紹介した。
拡大画像表示
平田氏のあげたデータカタログ構築のポイントは「要件」「品質」「運用」の3つである。
要件:「利用者に合わせた」メタデータ設計
必要な情報は人それぞれのため、誰が使うのかを想定して管理するメタデータを決定する。これにより、利用者が必要とする情報を確認し、信頼性の高いデータを業務で活用できるようになる。
品質:利用者が「分かりやすい」メタデータ
利用者が分かりやすいメタデータを実現するためには、実データを理解するとともに、あらかじめ定めたルールに従って作成することが基本になる。そのためには、データオーナーの協力が必要不可欠である。また、実データを確認するとともに、登録ルールを整備していかなければならない。
運用:利用者に継続的に「使ってもらえる」データカタログ
利用者に継続的に「使える」と感じてもらうためには、情報の最新性、正確性を保つこと、そして、カタログの利便性向上が重要となる。これらの取り組みにあたっては、利用者への教育や周知、業務の是正、および継続的な運用を実現するための運用設計が不可欠となる。
欲張らずに無理ない範囲で効果を検証していく
「理想を追い求めすぎるとパンクしてしまう」(平田氏)という点にも注意が必要だ。まずは品質要件に対して優先度をつけるなど小さく始めることを心がける(図3)。メタデータ作成の意識改革も地道に進めなければならない。現場の担当者に本業以外の業務をこなしてもらうにあたっては、管理者側があらかじめ叩き台を用意するなどして負荷軽減を図ることも重要だ。熱意のある担当者に委任できればなおのことよい。
拡大画像表示
最後に平田氏は、「メタデータはデータ活用の礎にほかなりません。そのメタデータを高品質なデータカタログで運用することでデータ活用の成熟度を上げられますし、ひいては組織の活力、企業の競争力へと実を結ぶことになります。取り組んでいく上での悩みや疑問があれば、ぜひ当社にご相談ください」と力強く訴えた。
●お問い合わせ先
株式会社NTTデータ バリュー・エンジニア
- データドリブン経営の成否はデータの信頼性に左右される(2024/06/03)
- MDMをスモールスタート・アジャイル型で! NTTコム オンラインが提唱するデータマネジメントのアプローチ(2024/05/31)
- DX支援のための先進技術は自社を“実験場”に─データ仮想化や生成AIの意義と効果とは?(2024/05/09)
- 「おもてなしDX」の推進で、財務データを活用したITコスト最適化に臨む(2024/04/25)
- 生成AI時代に欠かせないデータの集約管理をFlashBladeが具現化する(2024/04/24)