米dotDataは2025年10月15日、データ構造化・加工ツール「dotData TextSense」を発表した。CSVデータとしてアップロードしたテキストから生成AIが意味を抽出してラベルを付与して、活用・分析しやすい構造化データにする。VOC(顧客の声)データに対する「価格不満」や「配送遅延」といった抽出すべき意味ラベルを自動で提案する。
米dotDataの「dotData TextSense」は、テキストデータから意味を抽出してラベルとして付与して分析に適した構造化データにするデータ構造化・加工ツールである。1行1レコードのCSV(カンマ区切り形式)データとしてクラウドにアップロードすると。生成AIがテキストから意味を抽出してラベルを付与する(画面1)。

拡大画像表示
抽出する「意味ラベル」もAIが自動で提案する。例えば、サポート分野のテキストなら「再現手順不足」や「既知不具合」、VOC(顧客の声)分野なら「価格不満」や「配送遅延」、1on1ミーティングなら「燃え尽き兆候」などである。
「非構造化データを分析用の構造化データに変換・加工する場合、データプレパレーション(前処理)として、形態素解析やストップワード設定、同義語辞書の整備などが必要だった。TextSenseでは、生成AIが文脈を理解するため、テキストをそのままで解析可能な状態にする」(dotData)
データを加工する際に使う生成AIへの指示文(プロンプト)は、加工結果に対してOK/NGのフィードバックを与えるだけでチューニングが可能という。否定表現や言い換え、業界特有の記述にも順応し、また、繰り返して使うことでラベル抽出の精度が向上するとしている。
プロンプトが確定したら、TextSenseが全量データに対してラベルを推論し、テキストデータに意味ラベルを付与する。こうして生成した構造化データをダウンロードして使う。集計、可視化、要因探索、予測まで、各種のユースケースで利用可能である。