[新製品・サービス]
マクニカ、非構造化データをRAG/LLM向けに変換するデータ整備ソフトウェア「Unstructured」を販売
2026年3月30日(月)日川 佳三(IT Leaders編集部)
マクニカは2026年3月30日、RAGシステム向けデータ整備ソフトウェア「Unstructured」を販売すると発表した。企業内に存在する営業資料や技術文書といった非構造化データを、大規模言語モデル(LLM)が扱いやすい形へと自動的に整備する。データ整備によってRAG(検索拡張生成)の検索精度が向上する。開発会社は、米アンストラクチャード・テクノロジーズ。
マクニカが販売を開始した「Unstructured(アンストラクチャード)」(米アンストラクチャード・テクノロジーズが開発)は、企業内に存在する営業資料や技術文書といった非構造化データを、大規模言語モデル(LLM)が扱いやすい形へと自動的に整備するデータ整備ソフトウェアである(図1)。データ整備によって、RAG(検索拡張生成)の検索精度と安定性が向上する。
図1:「Unstructured」によるデータ整備の概要(出典:マクニカ)拡大画像表示
1つの文書内に含まれる段落や見出し、表、画像などの構造を保持したまま、JSON形式(データを「項目名」と「値」の組み合わせで表現するデータ記述形式)に変換する。RAGに必要な前処理を統合的に提供することにより、これまでRAGシステムの設計担当者が文書ごとに行っていたチューニングや文書更新時の対応といった作業が減る。
データ変換の処理フローとしては、まず文書ファイルのレイアウトを解析し、見出し、段落、表などの要素に分割する。次に、OCR(光学文字認識)で文字情報を抽出し、検索やAI処理の対象となる要素を適切な長さのブロックに分割するチャンク処理を実行する。さらに、必要に応じて元資料のページ位置や属性情報などのメタデータを付与する。
使い勝手については、エンジニアでなくてもノーコードのGUIでデータを整形できるとしている。また、また、複数のファイルを一括で処理したり、ファイル内容が更新された際に追従して対応したりすることも可能である。データソースとの連携コネクタも用意しており、クラウドストレージやデータベース、文書管理システムなどと接続し、これらのデータを取り込んで変換できる。なお、HIPAA、SOC 2 Type 2、GDPR、ISO 27001などのデータ保護・情報セキュリティ関連の法令・規制・業界標準に準拠している。
マクニカは、Unstructuredのライセンス販売に加え、企業がすでに利用しているデータ基盤やコンテンツ管理基盤との連携設計から導入までを一貫して支援する。
背景として同社は、「企業には営業資料や技術文書など各種の非構造化データが存在するが、ドキュメントの形式が多岐にわたるため、段落や見出し、表、画像といった構造をAIが正確に把握できず、RAGの検索精度が上がらないケースが多い」と指摘する。PoC(概念検証)では問題なく動作しても、本番環境では精度が安定しないといった課題が顕在化しているという。
非構造化データをAI活用に適した形へと整備する必要があるが、一般的には、設計担当者が文書ごとにチャンク設計や情報抽出ルールを設計・調整する必要がある。さらに、文書量の増加や内容更新のたびに再調整が発生する。「データ整備と運用の負荷がボトルネックとなり、生成AIの活用が本格展開に至らないケースも少なくない」(マクニカ)としている。
マクニカ / Unstructured / RAG / ETL
- 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
-
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



