米dotDataは2025年10月15日、データ構造化・加工ツール「dotData TextSense」を発表した。CSVデータとしてアップロードしたテキストから生成AIが意味を抽出してラベルを付与して、活用・分析しやすい構造化データにする。VOC(顧客の声)データに対する「価格不満」や「配送遅延」といった抽出すべき意味ラベルを自動で提案する。
米dotDataの「dotData TextSense」は、テキストデータから意味を抽出してラベルとして付与して分析に適した構造化データにするデータ構造化・加工ツールである。1行1レコードのCSV(カンマ区切り形式)データとしてクラウドにアップロードすると。生成AIがテキストから意味を抽出してラベルを付与する(画面1)。
画面1:「dotData TextSense」の画面イメージ。アップロードしたCSV形式のテキストデータから意味を抽出してラベルとして付与する(出典:米dotData)拡大画像表示
抽出する「意味ラベル」もAIが自動で提案する。例えば、サポート分野のテキストなら「再現手順不足」や「既知不具合」、VOC(顧客の声)分野なら「価格不満」や「配送遅延」、1on1ミーティングなら「燃え尽き兆候」などである。
「非構造化データを分析用の構造化データに変換・加工する場合、データプレパレーション(前処理)として、形態素解析やストップワード設定、同義語辞書の整備などが必要だった。TextSenseでは、生成AIが文脈を理解するため、テキストをそのままで解析可能な状態にする」(dotData)
データを加工する際に使う生成AIへの指示文(プロンプト)は、加工結果に対してOK/NGのフィードバックを与えるだけでチューニングが可能という。否定表現や言い換え、業界特有の記述にも順応し、また、繰り返して使うことでラベル抽出の精度が向上するとしている。
プロンプトが確定したら、TextSenseが全量データに対してラベルを推論し、テキストデータに意味ラベルを付与する。こうして生成した構造化データをダウンロードして使う。集計、可視化、要因探索、予測まで、各種のユースケースで利用可能である。
dotData / データプレパレーション / アナリティクス / 生成AI
- 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



