データ活用の動きが広がりながらも、国内でのB2Bにおける成功事例を聞くことは少ない。その理由は、データ量もさることながら社内のどこに、どんなデータが、どのような形式で管理されているかの把握が、B2Cよりも進んでいないことにある。「データマネジメント2021」のセッションでは、自身でB2Bのデータ活用に取り組んだセゾン情報システムズの木村裕之氏(テクノベーションセンター 先端技術部 DX Initiative)が、データマネジメントの在り方を提言した。
B2Bのデータ活用が進まない理由とは
データ活用の国内での成功事例は、B2Cでは数多く見受けられるが、B2Bではあまり多くはない。その理由を、セゾン情報システムズの木村裕之氏(テクノベーションセンター 先端技術部 DX Initiative)は「データマネジメントの欠如」と指摘する。
「私も、『データがある』との現場の声を踏まえ、B2Bでのデータ分析プロジェクトに乗り出しました。しかし、B2Cに比べてB2Bで利用できるデータは格段に少なく、管理方法もバラバラで、データの状況が大きく異なりました。必然的に、活動を軌道に乗せるまで多大な苦労が強いられました」(木村氏)。
そこでの経験を踏まえ、木村氏はB2Bでのデータ活用のポイントを、機械学習プロジェクトのプロセスモデルである「CRISP-DM」を基に説明する。
- STEP1. ビジネス理解
- STEP2. データ理解
- STEP3. データ準備
- STEP4. モデル作成
- STEP5. 評価
- STEP6. 実装
まずポイントとなるのは、データ理解のための仕組みの用意だ。データ活用に向けてデータは貴重な資産であり、正確なデータをどれだけ大量に用意できるかが、データ分析の成果を大きく左右する。そこで必要となるのが、データの意味や鮮度、粒度、複数データソースを利用する場合にデータを結合するためのキー情報の有無などの把握だ。
だが、B2Bではそれが極めて困難だったと木村氏は振り返る。その理由には「担当者によるファイルの個別管理」「部門独自仕様のデータの存在」「担当者の頭の中でのデータと現場の紐づけ」「データ責任者の不在」などがある。
「社内データは活用以前の、理解さえ困難な状況にあるということが明らかになりました。この経験から言えるのは、データ活用では、データを客観的に把握するための事前の仕組み作りが欠かせないということです」(木村氏)。
分析モデルの作成の鍵はプロセスの可視化
ポイントの2つ目は、データ準備の難しさの理解だ。データ準備はそもそも各種ソースからデータを抽出する手間暇を要す作業だ。併せて、セキュリティに配慮したアクセス制限などの仕組みを併せて用意する必要がある。
木村氏も同じ問題に直面した。そこで選択したのは、受注管理システムなどで全社的に管理されたデータを自社製データ連携ツール「DataSpider」で抽出し、クラウド上にデータレイクを用意する方法だった。
ただし、データ準備にSaaSを利用する場合には思わぬ落とし穴もあるようだ。木村氏は「画面と異なるかたちでデータが格納されている場合、分析のためのデータ加工が別に必要となり、それだけ工数が増すことなどには注意が必要です」と警鐘を鳴らした。
ポイントの3つ目が、分析のためのモデル作成と評価における、成果物の可視化と共有だ。
モデル作成はデータ分析のいわば本丸と言え、近年になりAI自動化製品も少なからず登場している。木村氏は、「高難度の分析でないのなら自動化製品の利用も現実的な選択肢」だとして、DB接続やファイルアップロードにより自動で分析モデルを構築する「DataRobot」を採用した。ただ、満足できるモデルが出来上がるまでには約2カ月を要したという。データ理解が十分ではなく、データの再準備とエンジニアリングでの反復が何度も生じたためだ。
「もっとも、モデル作成時での試行錯誤は程度の差はあれ必ず生じるものです。その期間を短縮するためには、反復のサイクルを速めるための成果物の可視化と共有が非常に効果的でした」(木村氏)。
負の連鎖からの脱却のためにメタデータ管理を
これらの実体験を通じ、木村氏はB2Bでのデータ活用における負のスパイラルに気づかされたのだという。「データ品質が低ければ分析をしても成果が上がらず、データ品質を高めようという意欲も当然湧きません。結果、データの品質向上と活用が進まないままです。この負の連鎖から抜け出すために、まずはデータの品質向上に着手すべきなのです」と木村氏は強調する。
では、どう行動を起こすべきか。そこでの策として、セゾン情報システムズの吉崎智明氏(テクノベーションセンター 製品開発部)は「メタデータ管理」を提案する。メタデータとはデータを説明するための情報だ。データマネジメント知識体系ガイド「DMBOK」によると、その管理がデータマネジメント全体を改善する出発点となる。
「メタデータ管理を通じて、社内データのすべてが目録化され、データの種類や場所、データ同士の関連性、さらに意味や構造、更新履歴、管理者などが可視化されるのです」(吉崎氏)。
データの活用効果を最大化するために
メタデータ管理のためにセゾン情報システムズが提供するのが、2020年12月にリリースしたメタデータ管理基盤「HULFT DataCatalog」だ。吉崎氏は製品の特長としてまず「高い操作性」を挙げる。具体的には、カタログ化の対象となる接続先を登録するだけで、テクニカルメタデータを自動収集できる。
また、「DataSpider Servistaとの連携」もポイントだ。DataSpider Servistaは異なるシステムのデータやアプリケーションを、ノンプログラミングでつなぐためのデータ連携基盤。連携を通じてデータのパイプライン情報を収集することで、データの発生からデータ連携を「データリネージュ」として可視化が可能。データの出自を確認できれば、データの信頼性を判断できる。
HULFT DataCatalogではメタデータの参照や書き込み以外に、データのプレビューやダウンロードも可能だ。その際にはユーザー権限によりデータ利用を制御できるなど、セキュリティにも配慮済である。
「HULFT DataCatalogの利用を通じ、セルフサービスでデータを発見できるだけでなく、データを正確に理解したうえで、ノンプログラミングでの取得/変換により分析用データを準備することができます。つまり、データ分析の多様なニーズに、柔軟かつ簡単に応えられるようになるわけです」(吉崎氏)。
データ活用では、どこに、どんなデータがあるかというデータの透明性が求められている。信頼できるデータでの意思決定を支援するHULFT DataCatalogにより、B2Bでのデータ活用は今後、さらに加速することになりそうだ。
●お問い合わせ先
株式会社セゾン情報システムズ
URL: https://www.hulft.com
- 経営革新の核となるデータ活用の考え方~経営・顧客・設計・製造が連動したDX基盤のグランドデザインを描く(2021/05/06)
- MDMの効果を経営層に納得させるために―ROI可視化に効く3つの観点とは?(2021/04/26)
- データマネジメントで見過ごしがちな重要ポイント! 今こそ“ストレージ”を再考すべき時期(2021/04/21)
- データ駆動経営を実現する組織の在り方とは? 事例で学ぶデータアーキテクトのミッション(2021/04/20)
- 点在するデータリソースをワンストップで利用できる「データ仮想化プラットフォーム」の実力(2021/04/16)