[Sponsored]
データ活用高度化に向け進化するデータベース
その価値を最大化させるIT基盤のあり方とは?
2016年8月15日(月)
世界情勢が目まぐるしい変化を続ける一方で、経済のグローバル化はとどまることなく進んでいる。競争が激化する市場で生き残るには、スピーディな意思決定が欠かせない。データを処理して蓄積することが主な役割だったデータベースサーバーも、データからビジネス価値を引き出すという新たな役割が求められるようになっている。新時代を迎えた今、データベースサーバーと、それを支えるITインフラストラクチャーに求められる要件とは何か。シスコシステムズとマイクロソフトのエンジニアに話を聞いた。
データ活用に向けた新機能を搭載した
Microsoft SQL Server 2016
2016年6月に日本マイクロソフトがリリースした「Microsoft SQL Server 2016」。インメモリ機能の強化による高速化や、常時データを暗号化することによる安全性の向上など、様々な新機能を盛り込んだ意欲作だ。ここでは、データベースのビジネス価値を高めるための強化点として、より高度で、より迅速、より広範囲なデータ活用を可能にする新機能に焦点を当ててみよう。
筆頭として挙げられるのが、新たに組み込まれたR実行環境「R Services」だ。R言語は、ほかの様々な商用分析ツールもサポートしている、統計解析向け言語のデファクトスタンダードとも呼べる存在だ。SQL Server 2016は、このR実行環境を標準機能として搭載している。Transact-SQLの文中にRの文を挿入して、データベースエンジンで実行することができ、高度なアルゴリズムを使った分析を高速に処理できる。
もう1つ注目したい機能が、「動的データマスク」(図1)。データベースに蓄積したデータを、より広い範囲で活用するには、データベース管理者に限らず、データアナリストやアプリケーション開発者などもデータに自由にアクセスできるようにする必要がある。しかし、トランザクションデータは、個人情報など取り扱いに注意を要する情報を含んでいることが多く、情報流出を防ぐにはそのままの形で誰でも使えるようにはしにくい。そこで、機密性の高いデータをダミーデータで置き換える“匿名化”をしてから、利用者に提供するということが少なくなかった。動的データマスクは、この匿名化を自動化する機能であり、クエリを発行した利用者の情報に応じて隠すべきデータをマスクして返す。
拡大画像表示
新機能の効果について、日本マイクロソフトの北川剛氏(クラウド&エンタープライズビジネス本部 クラウド&サーバー製品マーケティング部 エグゼクティブプロダクトマネージャー)は、「データベースはトランザクションを貯めこむだけでは不十分です。従来、OLTP用とOLAP用のデータベースシステムは別々に構築するもので、OLTPデータベースからOLAPデータベースに夜間バッチでデータを移すという運用が普通でした。しかし、データをリアルタイムに分析してビジネスに活かすには、1つのデータベースでOLTPとOLAPの両方に対応する必要があります。R Servicesと動的データマスクを搭載するSQL Server 2016なら、本番データを使った高度な分析を、安全かつ迅速に実行できます」とOLTPシステムとOLAPシステムの統合、つまりデータプラットフォームを統合する必要性を訴える。
データの価値を引き出すために
余力のあるシステムプランニングを
ただし、データプラットフォームを統合するには、従来型のシステムサイジングは通用しないと、北川氏は注意を促す。「これまでのシステム構築では、リソースに過不足のないサイジングが良しとされてきましたが、トランザクション処理だけで常時80%の負荷がかかるような状態では、分析のために充分なコンピュータリソースを割けません。データ分析は、1回分析して何らかの結論を得たら、それを土台に次の分析でより精度を高めるという具合に終わりのない作業です。型通りの分析を1回やってみるだけでは、ビジネス的に価値のある情報は得られません。トライ&エラーを繰り返すことが大切です。そのために、余力を持ったシステムプランニングが必要となるのです」(北川氏)。
もちろん、いくら余力を持たせると言っても、コストパフォーマンスを度外視するわけにはいかない。この点について、シスコシステムズの畝高孝雄氏(システムズエンジニアリング SDN応用技術室 コンサルティングシステムズエンジニア)は、コストパフォーマンスの高い2ソケットや4ソケットのラックマウントサーバーでも十分にエンタープライズクラスの大規模データベースを運用できると強調する。
「Cisco UCS(Unified Computing System)シリーズのラックサーバーは、2ソケットおよび4ソケットのモデルが中心ですが、現行製品は4ソケットでも72個のCPUコアを集積できます。CPUとメモリのバランスを考慮すると、8ソケットクラスの高価なハイエンドサーバーでなくても大半の大規模データベースに対応できる時代になったと言えるでしょう。いずれにせよ、アプリケーションごとにデータベースを用意するような積み上げ型のシステム構築では、データが分散してしまい柔軟な活用はできません。データプラットフォームを統合することがデータ活用の第一歩になります」(畝高氏)。
そのデータプラットフォームの統合を実現するという観点において極めて有効となるのが、サーバーのみならずネットワークも含めて、柔軟かつ動的にリソースを制御するシスコ独自のアプローチ「ACI(Application Centric Infrastructure)」であり、それを包含する形で機能強化を進めている統合管理の仕組みである。
◇ ◇ ◇
SQL Server 2016には、オンプレミスとクラウドにまたがって動的な連携を図る「Stretch Database」など、本記事では触れていない注目機能が実装されている。マイクロソフトが最新テクノロジーを凝縮し、満を持して市場投入したデータベースの価値を最大化させるインフラにはどのような要件が求められるのだろうか。
ホワイトペーパー「新しいMicrosoft SQL Serverに最適なインフラとは」では、北川氏と畝高氏が、さらに深く議論を展開。Stretch Databaseを1つの題材としつつ、ハイブリッドクラウド時代におけるデータプラットフォームのあり方や、そこで有望視されるACIをはじめとするテクノロジーについて言及している。データベース周りの抜本的見直しは、ビジネススピードを加速する上での重要な足がかり。自社ITインフラの今後の方向性を見定めるのに極めて参考になる内容だ。是非、ダウンロードして、明日からの具体的アクションにつなげてほしい。