データマネジメント データマネジメント記事一覧へ

[データマネジメント2022]

データ分析の緩慢さと非効率さをデータガバナンスで一掃せよ! マイクロソフトが提案する分析環境の新標準

2022年5月9日(月)

データドリブン経営が広がる中、指摘されるようになった課題が、従来からの分析手法の緩慢さや非効率さだ。その対応が他社との新たな差別化に向け急務となっている。3月10日に開催された「データマネジメント2022」のセッションに、日本マイクロソフトの樋口拓人氏と比嘉義人氏が登壇。分析手法を刷新するための考え方と具体的なアプローチを披露した。

データドリブン経営で直面する課題とは?

 不確実性が増す今後のビジネス環境における意思決定の羅針盤として、多くの企業が注力しているデータ活用。“データドリブン経営”に取り組む企業の多くが、売り上げや顧客満足度の向上、商品リードタイムの削減に成果を上げており、企業の未来はデータ活用にかかっていると言っても過言ではないだろう。

日本マイクロソフト株式会社 Azureビジネス本部 プロダクトマーケティングマネージャー 樋口拓人氏

 ただし、日本マイクロソフトの樋口拓人氏は、「現状のデータ活用は大きな課題も抱えています」と指摘する。

 企業のデータ活用の現状を概観すると、情報システム部門やデータサイエンティストなどの専門家が企業全体で集中管理された環境で、都度、データ抽出/加工といった下準備から分析機能の準備まで行う「エンタープライズ型」と、現場自らが使い勝手の高い分析ツールでそれら作業を行う「セルフサービス型」に大別される。

 「このうち前者は、意思決定に速さがより強く求められるなかにあって、専門家の介在により現場で分析するまでに時間を要すことが問題となります。後者は、自身での作業のため迅速さは得られる反面で、他部署においても同様の分析が生じやすく、分析の自由度を高めるほどデータやツールがサイロ化し、二重の意味で分析から効率性を削いでしまいます」(樋口氏)。

企業におけるデータ活用の「エンタープライズ型」と「セルフサービス型」分析法には課題も残されている
拡大画像表示

迅速な洞察獲得で鍵を握るデータガバナンス

 樋口氏が提案するこの状況の打開策が、両者を組み合わせたハイブリッドな分析環境の整備だ。具体的には、データウェアハウス(DWH)やデータマートの整備といったデータの下準備までは社内データに精通した専門家が実施することで、重複作業を排した全社レベルでのデータ統合を行い、「信頼できる唯一の情報源(SSOT)」を用意する。それを基に、現場は分析作業に自身の知見を取り入れることで、より迅速なビジネスに直結する洞察獲得を目指すのである。

 こうした仕組みの運用では、データスチュワードなどが主体となってデータ管理のルールの適切な実行をサポート・監督する「データガバナンス」が鍵になると樋口氏は言う。

 「これを取り入れたデータ管理基盤では、全データに対するスキャンとメタデータによるカタログ化により、データの場所や現状の使われ方、業務用語とシステム用語の関連性が明確化され、データの活用効率を確実に効率化できます」(樋口氏)。

ハイブリッドな仕組みを運用するデータガバナンス統合
拡大画像表示

 その実践に向けたデータ管理法が「メダリオンアーキテクチャ」だ。同アーキテクチャでは、生データを「Bronze」、最低限度のETL処理が行われたデータを「Silver」、BIツールでの利用に耐えうるデータを「Gold」に分類。それぞれの用途の明確化と管理の分離を通じて、状況に応じた利用データの的確な見極めとデータガバナンスの向上を支援する。

データガバナンスに向けたデータ管理手法「メダリオンアーキテクチャ」
拡大画像表示

Purviewでデータの最新状況を全社で可視化

 マイクロソフトのAzureソリューションでは、企業のデータ活用の支援に向けた各種分析ツールとともに、メダリオンアーキテクチャの実現に向けたガバナンス基盤も提供する。

 その代表がデータ統合サービス「Azure Data Factory」、データレイクとDWH、ビッグデータ分析が1つになったデータ分析サービス「Azure Synapse Analytics」などだ。これらの活用を通じ、あらゆる場所のデータを統合しながら、さまざまなスキルセットのユーザーによる統制のとれた分析が実現できるというわけだ。

Azureソリューションでは「Azure Data Factory」「Azure Synapse Analytics」「Azure Data Lake Storage Gen2」など、データ活用ツールを幅広く提供する
拡大画像表示
日本マイクロソフト株式会社 マイクロソフトテクノロジーセンター テクニカルアーキテクト 比嘉義人氏

 続いて、日本マイクロソフトの比嘉義人氏が、ユースケースを基にデモを交えながら具体的な実施法を披露した。最初は、「データのカタログ化を通じたガバナンス基盤の構築」であり、用いるのはオンプレミス、マルチクラウド、SaaS上のデータ管理と制御を支援する統合データガバナンスサービス「Microsoft Purview(旧 Azure Purview)」だ。

 Purviewではデータ検出や機密データの分類、エンド・ツー・エンドのデータ系列の把握を通じ、データ環境全体の状況を示すマップを作成する。その結果を参照することでデータ・キュレーターはデータ資産の管理と保護が可能となり、ユーザーは必要かつ信頼性の高いデータを容易に発見できるようになる。

 「データマップの管理画面ではデータソースの一覧をテーブルとマップの双方のビューから参照できます。また、データのチェック機能に関しては『電話番号』『クレジットカード番号』などのルールが事前にいくつも用意され、各国の法制に応じて自由に変更できます」(比嘉氏)。

 前述したSynapse Analyticsなども管理下に置くことができ、吸い上げたデータを基にデータ統合での一連の処理や、レポート作成に利用した各種データの来歴も管理することで、データガバナンスの強化やデータ統合での各種の見える化なども支援する。

Microsoft Purview(旧 Azure Purview)による統合データガバナンス
拡大画像表示

ツールから使いこなしまで一貫支援

 次に披露されたのが、「データの集約と統合によるSSOTの構築」である。Synapse Analyticsのポータルには「データ」「開発」「統合」「モニタ」「管理」の5つのハブが用意され、データ統合に必要な機能を一元的に提供。パイプライン作成はGUIとコードベースを選択でき、前者であればデータソースからの抽出や処理をデータフロー機能で設定することで、後者であればデータのエキスポート後、ノートブック機能で処理を構築することで実施できる。

Azure Synapse Analyticsで分析エンジンを構築
拡大画像表示

 最後が機械学習プロジェクトのライフサイクルの加速/管理のためのAzure Machine Learningを用いた「統合データによる高度な分析」だ。Azure Machine Learningはモデル構築法として、コードベースやGUIのほか、利用データなどを設定すれば、あとはアルゴリズム選択やパラメータチューニングを自動的に実施する方法も用意しており、知見が乏しくとも機械学習の利用に乗り出せるようになっている。また、作成した機械学習モデルをWebサービスとして手軽に展開できる点も魅力なのだという。

Azure Machine Learningによりアナリティクスを拡張
拡大画像表示

 Microsoft Azureによるデータ活用を推進する企業はすでに数多い。例えば、ヤマト運輸では従来IaaSで構築していた分析基盤をSynapse Analyticsで刷新し、システムとともにデータのメンテナンスの手間も抜本削減したという。このほか、田辺三菱製薬や小売業のFrancfrancの事例も紹介された。

 マイクロソフトではMicrosoft Azureによるデータ活用の内製化支援に向けた各種プログラムも提供している。ツールだけでなく作業の高度化も支援するマイクロソフトは、データ分析が当たり前になる近年において、新たな差別化に向けた右腕となりそうだ。


●お問い合わせ先

日本マイクロソフト株式会社
URL:https://www.microsoft.com/ja-jp

クラウドスケール分析でデータ活用に無限の可能性を「Find new value on Azure

バックナンバー
データマネジメント2022一覧へ
関連記事

Special

-PR-

データ分析の緩慢さと非効率さをデータガバナンスで一掃せよ! マイクロソフトが提案する分析環境の新標準データドリブン経営が広がる中、指摘されるようになった課題が、従来からの分析手法の緩慢さや非効率さだ。その対応が他社との新たな差別化に向け急務となっている。3月10日に開催された「データマネジメント2022」のセッションに、日本マイクロソフトの樋口拓人氏と比嘉義人氏が登壇。分析手法を刷新するための考え方と具体的なアプローチを披露した。

PAGE TOP