Box Japanは2026年1月16日、重要データ自動抽出ツール「Box Extract」を提供開始した。大規模言語モデル(LLM)を使って、契約書や製品仕様書などの非構造化コンテンツから必要なデータを抽出・構造化する。これまで手作業に依存してきたデータ処理を自動化する。
Box Japanの「Box Extract」は、契約書や報告書などの非構造化コンテンツから必要なデータを抽出して構造化するツールである(画面1)。抽出した情報は、メタデータとして非構造化コンテンツとともにBoxに保存する。これにより、Boxユーザーは、コンテンツを検索して発掘しやすくなる。
画面1:非構造化文書から重要データを自動で抽出するツール「Box Extract」の画面(出典:Box Japan)拡大画像表示
従来のOCR(光学文字認識)は、単にテキストを抽出することに重点を置いていた。これに対してBox Extractは、Gemini 3、Claude Opus 4.5、GPT 5.2などの大規模言語モデル(LLM)を使い、段落、表、図表などの構成要素に分解したうえで重要な情報を抽出する。業務要件に合った情報を抽出するカスタムエージェントも作成可能である。
「組織のナレッジは、日常業務に関わる非構造化コンテンツの集積に存在する」と同社は指摘。しかし、これまで非構造化データから知見を引き出す試みは手作業で行われており、維持コストが高く、拡張性に欠けていた。Box Extractは、こうした課題を解決するとしている。
Box Extractでは、「標準」と「強化」の2種類の抽出エージェントを用意している。標準版は、単純なデータ取得を効率化する。強化版では、「マルチモーダルの文書構造に基づいた専門的な処理を実施し、より深い推論を適用し、大規模・複雑・可変性の高い文書からデータを抽出する」(同社)としている。
事例の1つ、金融サービス業の米Valmark Financial Groupは、口座申込書、保険商品説明書、手数料明細書などから情報を抽出している。別の事例として、テキサス州自動車局は、テキサス州民向けサービスの提供にあたり、フォームや記録から重要な情報を自動で抽出し、手動レビューを減らしている。
- 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



