米dotDataは2024年9月18日、AIモデル開発支援プラットフォームの新版「dotData Ops 1.4」を発表した。学習用データの前処理、特徴量の自動発見・抽出、予測スコアの算出といったAIモデルの開発・運用パイプラインに必要な機能群を提供する。新版では、データエンジニアやデータサイエンティスト向けのPython連携機能を強化。SQLでのデータ加工や特徴量抽出、Pythonライブラリを用いたマシンラーニング/AIモデル開発をdotData Ops上で行えるようにした。
米dotDataの「dotData Ops」は、マシンラーニング/AIモデルの開発・運用支援プラットフォームである。分析チームがデータ加工、特徴量設計、マシンラーニングのパイプラインをセルフサービスでデプロイしてビジネス価値を検証可能なプラットフォームを提供している。学習用データの前処理、特徴量の自動発見・抽出、予測スコアの算出といったAIモデル開発・運用パイプラインに必要な機能群を備えている(画面1、図1)。
拡大画像表示
拡大画像表示
新版の「dotData Ops 1.4」では、市民開発による予測モデルの構築に加えて、データエンジニアやデータサイエンティスト向けのPython連携機能を強化している。SQLベースのデータ加工や特徴量抽出、Pythonライブラリを用いたマシンラーニング/AIモデル開発を実行し、dotData Opsの開発・運用パイプラインに統合することができる。
SQLで記述されたデータ前処理や特徴量抽出をdotData Opsで実行可能にしたことで、ドメイン知識に基づく独自の特徴量と、dotDataのAIが自動で抽出する特徴量の両方をパイプラインに組み込めるようになる。
PythonベースのAIモデルのサポートでは、独自作成の特徴量とdotDataによる特徴量を組み合わせ、Pythonライブラリを活用してモデルへの学習が可能。学習したモデルはONNX(Open Neural Network eXchange、注1)形式に変換し、dotData Opsで運用可能になる。
注1:ONNX(Open Neural Network eXchange、オニキス)は、マシンラーニング/ディープラーニングフレームワークのオープン標準フォーマット。TensorFlow、PyTorchなどの各種フレームワークのモデルをONNX形式にエクスポート/変換できる。
このほか、データサイエンティストの生産性向上を目的に、Python SDKを用意。Pythonから直接dotData OpsのAPIにアクセスし、データの前処理、特徴量生成、予測までのライフサイクルを自動化できる。