データマネジメント データマネジメント記事一覧へ

[Sponsored]

[データマネジメント2022]

急拡大するデータマネジメントの現実と理想、海外最新事例から読み解くベストプラクティス

2022年3月30日(水)

データドリブンなビジネスを実践し、企業が継続的な成長を遂げていていくためには、将来をも見据えたデータ活用基盤の構築が不可欠となる。しかし、将来的な障壁となるであろう課題も見定めつつ、最適なデータ活用基盤を具現化していくことは至難の業だ。「データマネジメント2022」のセッションに、インフォマティカ・ジャパンの森本卓也氏が登壇し、先進企業の事例を紹介しながら、理想となるデータマネジメントの姿について解説が行われた。

先々を見据えたデータマネジメント基盤の構築が不可欠

 冒頭、インフォマティカ・ジャパンのソリューションアーキテクト & エバンジェリストを務める森本卓也氏は、「データマネジメントの活動は一過性のシステム構築プロジェクトではない。また、将来的に直面するであろうデータマネジメントの課題を知ることで、今すぐに対策が打てるようになる」と訴えかけた。

インフォマティカ・ジャパン株式会社 セールスコンサルティング本部 CoE ソリューションアーキテクト & エバンジェリスト 森本卓也氏

 森本氏は、往年の映画のタイトルになぞらえ、現状のデータマネジメントに関する4つの課題を順番に解説した。

  1. 今そこにあるデータ分析基盤
  2. データ品質戦線異状なし
  3. データカタログの不都合な真実
  4. 沈まぬデータガバナンス

1. 今そこにあるデータ分析基盤

 まず森本氏は、「データ分析基盤はスケジュールや予算、リソースや性能など“今そこにあるもの”ではなく、“将来”にフォーカスすべき」と説明する。

 データは単体では意味をもたず、情報、知識、知恵へと洗練させながら適切な組み合わせを見つけることによって、はじめて価値へと昇華させることができる。将来的に取り扱うデータの種類が変更・増加していく中で、将来にわたって、価値あるデータの組み合わせについて、仮説検証を繰り返しながら探求していくことが求められる。

 また、クラウドの利用拡大に伴い、現在、ほぼすべての企業はオンプレミスだけでなく複数のクラウドサービス上にデータを分散・管理している。つまり、将来取り扱うデータはマルチ/ハイブリッドクラウド上にあり、膨大なデータを迎え入れる準備をしておく必要がある。

 「データ分析基盤は作って終わりではなく、作ってからが本番。しかし、新しいデータ利活用シナリオが生まれる都度、毎回データを調査し開発していく方法では、スピードもコストも人的リソースも足りない」と森本氏は警鐘を鳴らし、これらの課題に対してベストプラティクスとなる事例を紹介した。米国のヘルステック企業であるメディデータ社は、あらゆるデータのあらゆる集配信のパターンを部品化し、それらを組み合わせるだけであらゆるデータを収集可能な、高速で柔軟なデータパイプラインを保有したデータ分析基盤を構築したという(図1)。

図1 将来的なデータ活用の変化も見据え、高速で柔軟なデータパイプラインを構築

2. データ品質戦線異状なし

 「データ品質やデータクレンジングの重要性については多くの企業は理解している。しかし、国内企業でその標準化に取り組めている企業はほとんどない」と森本氏は強調する。

 なぜなら、データ品質向上には何から取り組むべきかイメージできていないからだ。また、データ品質の改善がビジネスにどのような影響を与えるのか、ROIを見極めるのが難しいこともこの問題に拍車をかけている。

 対して海外企業は、ビジネスの健全性を確認するための明確なKPIを持っており、ビジネスに寄与するデータ品質とその重要性について十分に理解していると森本氏は言う。例えばフィリピンのユニオンバンクでは、顧客満足度のKPIにローン承認の審査期間が影響していた。そこで同社は、関連する審査のプロセスで用いる顧客データ品質の向上に着手。結果、ローン承認の審査期間が6週間から3分に短縮され、顧客満足度も向上、売上を12倍に伸ばすことができたという。

 森本氏は、「日本企業の場合、各ビジネスのKPIが現場と共有できていないケースが多い。そうした場合、KPIの定義からスタートしなければ、データ品質の重要性の見極めが困難になる」と述べ、品質管理プロセスの構築に際して、次のような取り組みを紹介した(図2)。

図2 データ品質管理プロセスの概要図

 はじめに、BIツールを活用しているユーザーにヒアリングを行い、重要なレポートで使われているKPIに関連するデータを特定、そこから守るべきデータ品質をポリシーとして定義し、データ品質の指標をツールで監視する。もし問題があれば、そのデータを保有している部署に伝え、改善を促すようにするという流れだ。すでにこの取り組みを行っている企業ではデータカタログを活用している。データの大元となるソースを、リネージを用いて確定できるため、関連するデータの品質を根本から改善できるからだ。

 このほか、森本氏は「マスターデータおよびリファレンスデータはデータ分析の屋台骨を支えている」として、その重要性についても言及、事業やシステムの枠を超えた、マルチドメインのマスターデータ管理の確立が重要だと述べた。

3. データカタログの不都合な真実

 近年、メタデータは、従来のテーブル定義に該当するような「受動的メタデータ」ではなく、「どのデータが、どのような業務で使われているのか」といった実業務を反映した「活動的なメタデータ」が活用されるようになっている。そうした背景を踏まえ、今後データカタログはどのような進化の方向性を辿り、どのような運用を行っていくべきなのか。データカタログ運用のベストプラクティスについて、森本氏は、「まず、メタデータの登録・更新は原則自動化し、どうしても人手によるメンテナンスが必要な場合にはワークフロー化して運用に組み込むことが重要」と説明する。

 また、メタデータの活用でも、データ統合作業を通じてマスキングすべきデータについてAIのアドバイスに利用したり、データ品質管理におけるクレンジング作業実施の判断有無に利用したりするなど、他データ管理の作業プロセスに組み込んでいくことも肝要だという。

 そうした中、森本氏は、データマーケットプレイスの中でデータカタログを導入する企業が増えていると述べる。

 「データマーケットプレイスは、“欲しいデータが見つかるAmazonのようなもの”と想像すればわかりやすい。つまり、価値あるデータの組み合わせを誰もが簡単に検索し、口コミ、データ品質、使用ポリシーを参照したうえで、利用したい場合にはショッピングをするようにワンクリックで使用申請を行い、データオーナーのレビューを経たうえで活用権限が付与される仕組みだ」(森本氏)。

図3 活動的なデータカタログ運用のベストプラクティス

4. 沈まぬデータガバナンス

 データガバナンスの実現には、多方面にわたった活動が必要となる。しかし、これらの一連の取り組みにおいて、戦略立案や組織/人材育成に悩んでいる日本企業は多い。対して、データガバナンスに成功している米ニューヨークライフインシュランスは、「データガバナンスは最初から完璧にゴールが見えるものではなく、実践していく中で軌道修正をしながら進めていくものだ。すなわち、あきらめずに前に進み続けることが重要だ」と述べている。

 森本氏は、データガバナンスを支援するための技術の1つとして、前項でも述べたデータマーケットプレイスの利用を推奨している(図4)。「データマーケットプレイスが提供する機能群を活用することで、攻めと守りのデータガバナンスを技術面から実現していくことが可能になる」という。

図4 データマーケットプレイスの利用により攻めと守りのデータガバナンスを実現

 最後に森本氏は、これまで説明してきた一連の課題を解決していくためには、あらゆるデータマネジメントが連動する次世代のデータ管理基盤が必要だと強調、「皆さまには、将来を見据えた次世代の管理基盤を目指して頂くとともに、その実現に必要な機能をすべて備えたインフォマティカのデータマネジメントクラウドをぜひ検討していただきたい」と述べ、セッションの幕を閉じた(図5)。

図5 データマネジメントクラウドはマルチクラウド環境であらゆるユーザーを支援

●お問い合わせ先

インフォマティカ・ジャパン株式会社
URL: http://www.informatica.com/jp/
TEL:03-6403-7600
E-mail:info-jp@informatica.com

バックナンバー
データマネジメント2022一覧へ
関連記事

トピックス

[Sponsored]

急拡大するデータマネジメントの現実と理想、海外最新事例から読み解くベストプラクティスデータドリブンなビジネスを実践し、企業が継続的な成長を遂げていていくためには、将来をも見据えたデータ活用基盤の構築が不可欠となる。しかし、将来的な障壁となるであろう課題も見定めつつ、最適なデータ活用基盤を具現化していくことは至難の業だ。「データマネジメント2022」のセッションに、インフォマティカ・ジャパンの森本卓也氏が登壇し、先進企業の事例を紹介しながら、理想となるデータマネジメントの姿について解説が行われた。

PAGE TOP