【Special】

データ分析チームの課題に正対した実直な機能拡充、DBを核とした強力なプラットフォームの最新像

2021年1月19日(火)

企業が社内外から入手できるデータは種類も量も桁違いに増えている。コンピューティングパワーの性能向上も目をみはるばかりだ。つまりは、データ活用の可能性が格段に拡がったわけだが、実際には様々な課題が露呈して“消化不良”を起こす例も散見されている。データ分析チームが直面しがちな問題に正対し、解決するためのソリューションを拡充してきたのがインターシステムズだ。InterSystems IRIS data platformが提供するデータ分析機能についてキーパーソンに話を聞いた。

市場競争は熾烈さを増すばかり。企業が少しでも有利なビジネスを展開する上で、データの巧みな利活用は不可欠な条件だ。先駆的な企業は社内に専任のデータ分析チームを組織して、今日もまた新たな洞察を得ようと、あの手この手で取り組んでいる。そのデータ分析チームは、どのようなメンバーで構成されているだろうか。これという正解があるわけではないが、すでに実績を挙げている事例に照らすと、以下のような顔ぶれが典型的だ。

まず数理科学や統計解析の専門家としてビジネスアナリストやデータサイエンティストなどがいる。一方で業務側の立場からロジックを組み立て、アプリケーション開発に軸足を置いているのがデータモデラーやデベロッパー、データエンジニアといった要員たち。さらに「どこに、どんなタイプの、どのようなデータが存在するのか」を極めている“データギーク”がいて、先の面々に的確にアドバイスする。彼ら彼女らを統括しチーム全体を取り仕切るのがマネージャだ。それぞれの使命を果たすべく眼前のタスクに取り掛かるが、時として壁が立ちはだかることがある──。

図1 先駆的企業におけるデータ分析チームの典型例
拡大画像表示
インターシステムズジャパンでSEマネージャーを務める堀田稔氏

実はここにインターシステムズの製品戦略に対する基本的な考え方がある。「データ分析を考えた時、BIやAIといった技術的チャレンジだけでビジネス上の課題を解決できるわけではありません。私たちは組織内で様々な役割を担っているデータの専門家やエンジニアのペルソナを設定し、仮説を⽴てることにこだわっています。それぞれの立場で直面する課題を明らかにし、それをどのように解決するかという観点から必要なソリューションを拡充しているのです」。こう話すのはインターシステムズジャパンでSEマネージャーを務める堀田稔氏だ。こうしたアプローチで見えてきた代表的な3つの課題に照らしながら、インターシステムズのソリューション「InterSystems IRIS data platform」の詳細を掘り下げていこう。

インターオペラビリティでデータとプロセスのサイロを解消

まずは第1の課題。データサイエンティストは「Pythonを使った数理モデル構築作業とビジネスプロセスの連携機能が足りない」「モデリング環境からソースデータにもっと直接的にアクセスしたい」といった要望を持っている。一方でデータモデラーやデベロッパー、データエンジニアは「データサイエンティストが活用するデータの準備に手間ひまかかってしょうがない。もっと業務を効率化するためにも自動化を図りたい」と考えている。

この課題を解決するものとしてInterSystems IRISが備えているのが、データとプロセスのサイロを解消する「インターオペラビリティ(相互運用性)機能」だ。具体的にはデータ変換のほか、ビジネスロジックをビジュアルに定義して実行可能なコードを生成したり、ビジネスルールを定義したり、メッセージの流れを視覚的にトレースするといった機能が実装されている。

図2 データとプロセスのサイロを解消するインターオペラビリティ
拡大画像表示

また、Pythonのエコシステムを取り込み、AIやIoTなどの豊富なライブラリとInterSystems IRISの⾼性能データベース、インターオペラビリティ、スクリプト実⾏環境を緊密に連携させる。「この仕掛けにより、データサイエンティストと業務アプリケーション側のエンジニアをシームレスにつなぎます」と堀田氏は語る。なお、インターシステムズは新たにInterSystems IRISとAlteryx社の「APAプラットフォーム」との連携機能を開発。これによりデータの準備(SQLによるデータ抽出)から前処理(クレンジング)、機械学習のモデル構築、モデルの組み込みまで一連のプロセスを⾃動化することが可能となった。

ビジネスユーザーにセルフサービス型のBI機能を提供

第2の課題はデータモデラーに関するものだ。データモデラーは「埋め込み・リアルタイムBIを使って業務分析を自動化したい」と考えており、 加えて「ビジネスユーザーによるセルフサービスBIの必要性」を感じている。このニーズの高まりを受けてインターシステムズが新たに発表したのが「InterSystems IRIS Adaptive Analytics」である。

Adaptive Analyticsの注目すべき機能としては、以下が挙げられる。

  • ETLが不要:データ準備としてのExtract/Transform/Loadを必要としない
  • 事前にキューブを構築する必要がない:用途に応じたキューブを設計し用意しておく必要がない
  • ⾼パフォーマンス・スケーラビリティ:何度も聞かれるクエリーをキャッシュし、何⼗億件のデータに対してミリ秒のオーダーで応答する
  • 仮想キューブを迅速に準備:ビジネスユーザーはデータ構造を気にせず、Tableauで使われたクエリーをExcel上でも使える
図3 Adaptive Analyticsの注目点
拡大画像表示

同製品はAtScale社との協業により開発されたソリューションで、ライブデータの可視化・分析・照会を行い集中管理する。これによりデータモデラーは、データサイエンティストの手を借りることなくビジネス上の意思決定に必要な情報をタイムリーに獲得し、ビジネスユーザーに対して使いやすいセルフサービス型のBI機能を提供することが可能となる。Adaptive Analyticsを活用することで、InterSystems IRISのライブデータとTableau、Microsoft Power BI、Microsoft Excelなど主要なBI製品を統合することができるのだ。

「InterSystems IRIS Adaptive Analyticsによって、データモデラーはより迅速かつ容易に分析データモデルを作成・管理できます。また、ビジネスユーザーはIT部門などのサポートを受けることなく自分自身でBIダッシュボードを作成・修正できるようになります。そしてInterSystems IRISのスケーラビリティをさらに拡張し、大規模なデータセットでの分析ワークロードの実行を可能とします」と堀田氏は訴求する。

機械学習を利用したアプリケーションをより簡単に実用化

第3の課題は、「データサイエンティストは機械学習のモデルを構築するツールに習熟しているが、それをデベロッパーがアプリケーションにうまく組み込めない」というものだ。一方ではデータギークもまた「予測モデル構築のニーズが増えるが、データサイエンティストのリソースが足りない」「 基本的な機械学習のタスクを使い慣れた環境で実行できれば助かるのに…」といった課題を抱えている。

実際、分析を行う際のデータ加⼯や整形などの前処理には膨⼤な工数がかかり、データサイエンティストの80%の作業時間がこうしたデータラングリングに費やされているとも⾔われている。こうしたことが機械学習などの⾼度な分析スキルをもったエンジニアの⼈材不⾜にもつながっているのだ。この課題解決に向けて提供しているのが「InterSystems IntegratedML」である。デベロッパーはInterSystems IRISに格納されているデータを使って機械学習モデルの学習から予測まで、SQLライクな構文のみで実行できる。モデルの作成や学習はAutoMLプロバイダが行い、機械学習を実行する時に必要なハイパーパラメータチューニングや特徴量エンジニアリングなどのプロセスを自動化し、機械学習を利用したアプリケーションをより簡単に実用化できるように支援する。現在、AutoMLプロバイダとして、InterSystems自社開発、H2O、DataRobotの3つをサポートしている。DataRobot社とはグローバルレベルで提携しており、大量の業務データをInterSystems IRISに格納しながら、DataRobot社のAutoML機能をシームレスに連携させるソリューションの提供が可能になっている。

「IntegratedMLは、InterSystems IRISに保存されているデータを利用し、SQLライクな構文でのモデル作成や学習、さらには予測や回帰まで一貫して行うことができます。機械学習のアルゴリズムやそのフレームワークを学ぶ必要はなく、普段利用しているデータベースとSQLさえ使えれば、機械学習を活用したアプリケーションを開発できるのです」(堀田氏)。

図4 IntegratedMLの概要
拡大画像表示

振り返れば、インターシステムズがInterSystems IRIS data platformを日本でリリースしたのは2018年2月のこと。同社が30年以上にわたって提供してきたオブジェクトデータベース技術を基盤として発展させたもので、リレーショナルデータのみならずオブジェクトやJSONなどスキーマを持たないデータも格納できるマルチモデル対応を大きな特長としてきた。こうした「あらゆるデータ形式を扱えるデータベース」という構造が、現在のようなデータ分析のプラットフォームとしての進化をもたらしたのである。

そして今後に向けてもInterSystems IRIS data platformは高パフォーマンスのデータベース管理、相互運用性、分析機能を統合した次世代のデータプラットフォームとして進化を続け、要求の厳しいデータ集約型アプリケーションのニーズに応えていく。すべての企業がデジタルの追い風を受けられるようにとの強い想いが、すべての製品群に通底しているのだ。


●お問い合せ先

インターシステムズジャパン株式会社

https://www.intersystems.com/jp/

InterSystems IRISについて
https://www.intersystems.com/jp/products/intersystems-iris/

お問い合せはこちら
https://www.intersystems.com/jp/who-we-are/contact-us/

関連記事

Special

-PR-

データ分析チームの課題に正対した実直な機能拡充、DBを核とした強力なプラットフォームの最新像企業が社内外から入手できるデータは種類も量も桁違いに増えている。コンピューティングパワーの性能向上も目をみはるばかりだ。つまりは、データ活用の可能性が格段に拡がったわけだが、実際には様々な課題が露呈して“消化不良”を起こす例も散見されている。データ分析チームが直面しがちな問題に正対し、解決するためのソリューションを拡充してきたのがインターシステムズだ。InterSystems IRIS data platformが提供するデータ分析機能についてキーパーソンに話を聞いた。

PAGE TOP