米dotDataは2023年7月13日、AIデータ分析ソフトウェアの新版「dotData Enterpriseバージョン3.2」をリリースしたと発表した。新版では、ビジネスインテリジェンス(BI)ツールを使ってデータを分析しやすくするため、JDBC経由でデータを出力できるようにした。また、自動化ワークフローに組み込んで利用しやすいように新たなAPIを導入した。さらに、説明性を高めるため、サンプル単位で予測値や特徴量を説明する機能を追加した。
米dotDataの「dotData Enterprise」は、予測モデル生成の自動化などが行えるAI分析ソフトウェアである。これまでであればデータサイエンティストが実施していた、データの準備、仮説の立案、機械学習、分析結果の説明、などを自動化する。同ソフトウェアをSaaS化した「dotData Cloud」もある(関連記事:AIデータ分析「dotData Cloud」がユーザーのAWS/Azure環境で利用可能に)。
今回、新版となるバージョン3.2をリリースした。主な強化機能点は、以下の通り。
BIプラットフォームとの連携が容易に
JDBCインタフェースを介してdotData Enterpriseからデータを抽出できるようにした。特徴量テーブルや予測結果など各種の分析結果を、ビジネスインテリジェンス(BI)ツールで利用しやすくなった。データから洞察を得るダッシュボードを、これまでよりも作成しやすくなったとしている。
APIによる自動化機能の強化
特徴量の自動設計やマシンラーニング(機械学習)自動化を含む、新たなAPIを追加した。ユーザーは、自動化ワークフローにdotData EnterpriseのAI機能を組み込み易くなった。データのクレンジングからAI予測モデルの作成までのライフサイクルの効率が上がる。
サンプル単位の特徴量説明性
特徴量と予測に対する透明性と説明性を強化するため、サンプル単位で予測値や特徴量を説明する機能を追加した。ユーザーは、個々の予測に影響を与える主な要因を理解しやすくなった。AIモデルの全体的な動きを把握するだけでなく、特定の予測値に対するビジネス戦略を立てやすくなった。
特徴量とモデルの品質を向上させるリーク自動検出機能
モデルや特徴量の品質を高めるため、「特徴量リーク」を自動で検出する機能を追加した。各特徴量におけるリークの可能性を評価し、リークが疑われる場合には、GUI上でユーザーに表示する。ユーザーは、潜在的なリークを事前に特定し、特徴量やモデルの品質を保てるようになる。
大規模データの可視化
新たなデータ可視化機能を追加した。同機能の最大の利点は、大規模なデータを扱えること。例えば、回帰誤差分析チャートでは、数百万件といったデータサンプルを可視化する。ターゲットエンコーディングのマッピング機能では、何十万といったカテゴリー値を扱える。これにより、データや結果を詳細なレベルで分析できるようになった。