クラウド型データウェアハウス(DWH)「Snowflake」を提供するSnowflakeは2023年3月24日、Snowflakeのユーザー事例を紹介する説明会を開いた。ユーザーとして、GENDA、ノバセル、truestarの3社が登壇し、Snowflakeの導入効果などを説明した。GENDAは、Excelによる集計業務を高速化した。ノバセルは、データ分析処理を退避してDBMSの負荷を下げた。truestarは、オープンデータを加工・整備して利用しやすくする基盤を構築した。
クラウド型データウェアハウス(DWH)「Snowflake」のユーザー3社が説明会に登壇し、Snowflakeの導入効果を説明した。(1)GENDAは、Excelによるデータ集計・分析基盤を刷新。(2)ノバセルは、データベースで管理していたデータ群の維持コストを減らした。(3)truestarは、政府などが公開しているオープンデータを加工・整備して利用しやすくする基盤を構築した。
GENDA:データ集計にかかる時間を2分から5秒に短縮
GENDA(本社:東京都港区)は、ゲームセンターなどのアミューズメント施設を運営する企業である。オンラインクレーンゲーム事業も提供している。業務のデジタル化に取り組んでおり、会員アプリを通じて個人のプレイ履歴を蓄積できるようにしている。
同社は2022年にSnowflakeを導入し、データ分析基盤を刷新した。社内のデータをSnowflakeで一元化し、これを各部署それぞれの用途に合わせて活用する。旧いデータ基盤はExcelをメインで使っていたが、「Excelでやれる限界に近いことをやっていため、Excelの処理が重く、日常業務に支障が出ていた」(GENDAのプロダクト開発部でデータエンジニアを務める小宮山紘平氏、写真1)。
Snowflakeの導入効果として、データの集計に要する時間が2分から5秒へと大幅に短くなった。また、そもそもExcelでは不可能だった集計も可能になった。さらに、データ基盤を維持するための運用工数がほぼゼロになった。以前は1週間あたり1人日(1人が1日働く労働量)を要していたが、これがなくなった。
Snowflakeの活用例の1つは、景品発注のためのデータ分析である(図1)。店舗の売上データ(Excel)やPOSデータをSnowflakeに集約し、BI(ビジネスインテリジェンス)ツールのRedashで参照している。データのサイロ化を解消するとともに、集計処理を高度化・高速化している。
拡大画像表示
活用例の2つめは、店舗の運営を改善するためのデータ活用である。施設の運営に必要なデータを閲覧するツールを社内で開発している。この用途では、Snowflake上で加工したデータをAmazon RDSに戻して参照する構成を採っている。
活用例の3つめは、オンラインクレーンゲームへのML(マシンラーニング)の導入である。プレイ履歴などから、顧客の好みのクレーンゲームをリコメンド(推奨)する。
データ基盤としてSnowflakeを選んだ理由として小宮山氏は、利用コストやクラウド間のデータ転送の手間などが要件に合致したことを挙げる。業務システムはAmazon Web Services(AWS)上で稼働しており、「AWSとの連携が容易で、料金体系が分かりやすいことからSnowflakeを採用した」(小宮山氏)。
ノバセル:データ分析処理をDBMSから退避してコストを削減
ノバセル(本社:東京都品川区)は、運用型TVCM事業を行っている。TVCMをWeb広告のように分析し、配信を管理する。TVCMがどれだけ検索行為につながったかなどを調べる。同社は、「Snowflakeを用いたデータ基盤を導入したことで、事業が急成長した」(ノバセルのシステム開発部でエンジニアを務める山中雄生氏、写真2)という。
Snowflake導入前の主な課題は、顧客からもらっている大規模データや集計済みの分析結果データなどすべてのデータを、データベースサーバー(DBMS)上で管理していたこと。ストレージ費用が高額になっていたほか、アドホック分析時に性能も低下した。「データを利用する業務アプリケーションやデータ分析業務が互いに影響を及ぼし合う危険な状態だった」(山中氏)という。
大きなデータについてはデータレイク(Amazon S3を利用)に格納することで、ストレージ費用を1/8に削減した(図2)。データ分析結果についても、データベースサーバーからSnowflakeにコピーして、Snowflake上で分析できるようにした。これにより、分析性能を高めるとともに、データベースサーバーの負荷を下げた。
拡大画像表示
2022年には、Snowflakeで実現したデータ分析性能を活用する形で、競合他社のTVCMを分析する新サービス「ノバセルトレンド」もリリースした。同ツールは、システムに要求する性能が高かった。数千万行クラスの大規模データの分析・集計が必要だったほか、外部データとの連携も必要だった。
●Next:加工・整備後のデータ共有基盤にSnowflakeを活用した事例
会員登録(無料)が必要です
- 1
- 2
- 次へ >