AI予測モデルの自動生成ツールを提供する米dotDataは2022年12月7日、同社が持つ特徴量自動抽出技術が米マイクロソフトのデータ分析サービス「Azure Synapse Analytics」上で利用可能になったと発表した。Azure Synapseを使う際に、データから特徴量を迅速かつ自動的に発見・抽出できるようになる。以前よりも精度の高いマシンラーニング(機械学習)モデルを構築可能になるとしている。
AI予測モデルの自動生成ツールを提供する米dotDataは、同社が持つ特徴量自動抽出技術が、マイクロソフトのデータ分析サービス「Azure Synapse Analytics」上で利用可能になったと発表した。Azure Synapseを使う際に、データから特徴量を迅速かつ自動的に発見・抽出する。以前よりも精度の高いマシンラーニング(機械学習)モデルを構築可能だとしている。
dotDataは、特徴量の発見と抽出に時間がかかるマシンラーニングの処理を自動化する技術を持つ。数十億のローデータ、数百のカラム、数十のテーブルからなる大規模なデータセットにおける関係性を自動で探索し、人間では見つけることができない隠れた特徴量を、手間と時間をかけずに発見するとしている。
今回、同社の特徴量自動抽出技術を、PythonライブラリとしてAzure Synapse上で利用可能にした。Azure Synapseユーザーは、データベースで管理しているトランザクションデータのほか、時系列データ、位置情報データ、テキストデータなど各種のデータから、数百万におよぶ特徴量のパターンを自動で探索可能になる。
「数十億のレコードを含んだ、複雑に関連している数十のテーブルから、数時間ほどでマシンラーニングモデルの構築に必要な特徴量テーブルを作成する。従来のような、仮説と検証を繰り返す面倒な手作業から解放される」(dotData)。ユーザー事例として米国のオートローン会社、Exeter Financeを挙げ、同社が重要な特徴量を1日足らずでデータから自動的に導き出したことを紹介している。