アシストは2018年11月13日、DataRobot Japanとの間で、両社の製品を組み合わせてユーザーに提案することで協業したと発表した。DataRobot Japanは、機械学習を自動化するソフト「DataRobot」を販売している。アシストは、DataRobotの学習データを整備する目的に適したデータ・プレパレーションソフト「Paxata(パクサタ)」を提供している。
アシストは、データ分析の前処理として、データを実際に使える状態へと加工・変換するデータプレパレーションソフト「Paxata」(パクサタ)を提供している。Apache Hadoop/Sparkをベース技術としており、企業内外にある生データを収集して加工・変換し、分析できる状態に整える機能を提供する。
拡大画像表示
Paxataの特徴は、分析用のデータを業務ユーザーみずからノンプログラミングで用意できることである。利用したいデータを表形式で表示しながら、マウス操作で作業できる。また、精度の高いデータに加工する作業を支援する仕掛けとしてマシンラーニング(機械学習)を採用している。表記ゆれの統一など、データ加工の推奨パターンを提示する。
一方のDataRobotは、機械学習を用いた予測モデルの作成を自動化するソフトである。学習データ(教師データ)さえ用意すれば、データサイエンティストでなくても、簡単に機械学習を用いて予測モデルを作成できる。複数のアルゴリズムを使ってモデルを生成し、より精度の高いモデルを自動で採用する。
今回、アシストとDataRobot Japanは、互いの製品を組み合わせて使うことをユーザーに提案することで協業した。DataRobotの学習データをPaxataで整備するという使い方になる。PaxataからDataRobotへのデータの受け渡し手段として、Amazon S3などを利用できる。
製品提供の背景について同社は、機械学習を自動化できても、学習データの整備に時間がかかっていることを挙げている。アシストによれば、ユーザーの声として、「DataRobotにデータを入れると10分で予測モデルを作成できるのに、データの準備に80時間もかかっている」という。これをPaxataで解決する。