多くの企業では、既存の基幹システムの構造化データに加え、SNSやIoTなどから集められた非構造化データが、オンプレミスやクラウド上の様々なデータ管理基盤に散在している。これらのデータを横断的に活用するための基盤整備が急務だ。同時にあらゆる階層や役割の利用者が、必要なデータに安全にアクセスできるガバナンスとセキュリティを確保することが、「データの民主化」を進める上での重要な要件となる。
散在するデータからいかにしてインサイトを得るか
企業の保有するデータは多様だ。基幹システムなどで扱われる構造化データに加え、WebアクセスやSNSから収集した非構造化データ、IoTの仕組みによって多様なデバイスから生成されたセンサーデータなどが、オンプレミスやクラウド上の様々なインフラに個別に蓄積されている。また、運用もそれぞれの用途に特化したデータ管理基盤に委ねられている。
異なる場所に散在したデータから有益なインサイト(洞察)を得ることは困難であり、データを横断的に統合する基盤の整備が必要となる。そうした中で叫ばれているのが「データの民主化」であり、加えて要求が高まっているのがデータの鮮度だ。
インサイトテクノロジー 代表取締役社長 CEOの森田俊哉氏は、「以前であれば各システムから夜間バッチでデータを集めて分析し、ダッシュボードなどを通じて経営者に提示する形が一般的でした。しかし昨今は、現場の人たちがすぐに行動に移せるように、リアルタイムに近いデータが求められています。最たるものがIoTのセンサーデータで、翌日に参照しても意味はありません」と語る。そして、「誰もがいつでも、新鮮なデータを迅速に活用できる仕組みが必要です」と強調する。
では、どうすればオンプレミスからクラウドまで、複数の基盤に散在するデータを収集することができるだろうか。それには大きく2つの方法がある。1つは様々なデータソースからデータをコピー(レプリケーション)してデータウェアハウスに統合する「同期方式」。もう1つは、データをもとの場所に置いたままリンクする「仮想方式」だ。
それぞれに長所と短所があるが、「データが大量になった場合も対応しやすい」という観点からインサイトテクノロジーが採用したのが、同期方式によるQlik社の「Qlik Replicate™」だ。同ツールは日本国内でも大手企業を中心に約124社、680ライセンスと導入実績を拡大しており、「約30種のデータソースおよび約50種のターゲットを幅広くサポートしているのが特長です。オンプレミスとクラウドを問わず、異種データ基盤間のアルタイムデータ連携を実現します」と森田氏は述べる。
データの民主化で必須のセキュリティリスク対策
ただし、誰もがいつでも、新鮮なデータを迅速に活用できるようになれば、その一方では情報漏洩リスクが高まるという別の課題が起こる。森田氏は、「実際に、2020年11月から2021年2月までの4カ月でも国内で36件の個人情報漏洩が発覚しており、そのうち不正アクセスが過半数の21件を占めています。したがって、データの民主化を進めるためには、同時にセキュリティリスク対策が欠かせません」と強調する。
もっともセキュリティ課題の解決は容易なことではない。もともと個人情報などの機微なデータは、社員や部署ごとに厳格なアクセス権限が付与されて制限されており、そのままではアジャイル的なデータ活用はできない。この“矛盾”を乗り越えなければ、データの民主化とセキュリティを両立させることはできないのである。
そこでインサイトテクノロジーが注力しているのが、「ログ監査」および「マスキング/暗号化」のソリューション展開である。
ログ監査とは、行われたデータアクセスの4W(who/when/where/what)1H(how many)を改竄されない形で記録し、不正行為を素早く追跡する仕組みだ。インサイトテクノロジーでは「Insight PISO」というツールを提供しており、「マルチベンダーのデータベースに対応した監査ツールで、国内データベース監査市場において712社/5680ライセンスの導入実績があり、データベースアクセス監査ツールでは10年以上連続のシェアNo.1となっています。データベースのパフォーマンスに影響を与えることなく、特権ユーザーも含めたあらゆるアクセス経路のログを取得・保全します」と森田氏は説明する。
このInsight PISOを活用することで、企業はJ-SOXやHIPAA、DISA、PCI DSS、GDPRなどの法規制に対応したセキュリティ監査や内部統制を確立することができる。また、データの管理者や利用者に対しても、Insight PISOを使用して作業証跡を残すことで、自らの正しさを積極的に証明できるというメリットを提供し、組織全体のセキュリティ意識向上につなげられるというわけだ。
守るべきデータをAIで自動認識する機能をリリース予定
一方のマスキング/暗号化は、アルゴリズムに基づいてデータ内に含まれる個人情報の匿名化や機密情報の秘匿化を行う仕組みで、インサイトテクノロジーは「Insight Data Masking」というツールを提供している。
「そもそもマーケティングなどの分析を行う上で、個人の名前やクレジットカード番号などの個人データは必要ないはずです。Insight Data Maskingはデータの種別や分布を変えることのないマスキングを行うことで、個人情報や機密情報を保護しながら自由な分析を可能とします」(森田氏)。
もっとも、数多く存在するどのデータベースのどのテーブルに、どんな個人情報や機密情報が格納されているのかといった構造を理解しているのは設計者のみで、データの運用側がそこまで把握できているケースは多くない。そのため「どこにマスキングをかければよいのかわからない」という課題に直面するのも現実だ。これは前述したログ監査についても同様で、どのデータを監査の対象とすればよいのかを運用側で判断するのは困難だ。
インサイトテクノロジーではそうした課題を解決するべく、守るべきデータを自動識別する機能の開発を進めている。「AIを活用してデータソースの中身をスキャンし、個人情報や機密情報らしきものを検出したら、自動的にマスキングするとともにログ監査の対象に設定します」と森田氏は語る。同機能は2021年度内にもリリースを予定しているという。
こうしたQlik Replicate™とInsight PISO、そしてInsight Data Maskingの緊密な連携により、セキュリティ対策とデータ活用の両立が可能となるわけだ。
「SNSやIoTを含めたデータソースから発生する膨大なデータをリアルタイムで安全に集約することがデジタルトランスフォーメーション(DX)実現における重要ポイントです。また、不必要なアクセスや公開を避けながら、誰もがいつでも活用できる形でデータを提供することで高度な分析が可能となります」と森田氏は改めて訴え、散在するデータの活用と民主化の実践をより強力に後押ししていく意向を示した。
●お問い合わせ先
株式会社インサイトテクノロジー
URL: https://www.insight-tec.com/
- 経営革新の核となるデータ活用の考え方~経営・顧客・設計・製造が連動したDX基盤のグランドデザインを描く(2021/05/06)
- MDMの効果を経営層に納得させるために―ROI可視化に効く3つの観点とは?(2021/04/26)
- データマネジメントで見過ごしがちな重要ポイント! 今こそ“ストレージ”を再考すべき時期(2021/04/21)
- データ駆動経営を実現する組織の在り方とは? 事例で学ぶデータアーキテクトのミッション(2021/04/20)
- 点在するデータリソースをワンストップで利用できる「データ仮想化プラットフォーム」の実力(2021/04/16)