[新製品・サービス]

Box Japan、非構造化文書からデータを抽出する「Box Extract」を提供

2026年1月16日(金)日川 佳三(IT Leaders編集部)

Box Japanは2026年1月16日、重要データ自動抽出ツール「Box Extract」を提供開始した。大規模言語モデル(LLM)を使って、契約書や製品仕様書などの非構造化コンテンツから必要なデータを抽出・構造化する。これまで手作業に依存してきたデータ処理を自動化する。

 Box Japanの「Box Extract」は、契約書や報告書などの非構造化コンテンツから必要なデータを抽出して構造化するツールである(画面1)。抽出した情報は、メタデータとして非構造化コンテンツとともにBoxに保存する。これにより、Boxユーザーは、コンテンツを検索して発掘しやすくなる。

画面1:非構造化文書から重要データを自動で抽出するツール「Box Extract」の画面(出典:Box Japan)
拡大画像表示

 従来のOCR(光学文字認識)は、単にテキストを抽出することに重点を置いていた。これに対してBox Extractは、Gemini 3、Claude Opus 4.5、GPT 5.2などの大規模言語モデル(LLM)を使い、段落、表、図表などの構成要素に分解したうえで重要な情報を抽出する。業務要件に合った情報を抽出するカスタムエージェントも作成可能である。

 「組織のナレッジは、日常業務に関わる非構造化コンテンツの集積に存在する」と同社は指摘。しかし、これまで非構造化データから知見を引き出す試みは手作業で行われており、維持コストが高く、拡張性に欠けていた。Box Extractは、こうした課題を解決するとしている。

 Box Extractでは、「標準」と「強化」の2種類の抽出エージェントを用意している。標準版は、単純なデータ取得を効率化する。強化版では、「マルチモーダルの文書構造に基づいた専門的な処理を実施し、より深い推論を適用し、大規模・複雑・可変性の高い文書からデータを抽出する」(同社)としている。

 事例の1つ、金融サービス業の米Valmark Financial Groupは、口座申込書、保険商品説明書、手数料明細書などから情報を抽出している。別の事例として、テキサス州自動車局は、テキサス州民向けサービスの提供にあたり、フォームや記録から重要な情報を自動で抽出し、手動レビューを減らしている。

関連キーワード

Box / 大規模言語モデル

関連記事

トピックス

[Sponsored]

Box Japan、非構造化文書からデータを抽出する「Box Extract」を提供Box Japanは2026年1月16日、重要データ自動抽出ツール「Box Extract」を提供開始した。大規模言語モデル(LLM)を使って、契約書や製品仕様書などの非構造化コンテンツから必要なデータを抽出・構造化する。これまで手作業に依存してきたデータ処理を自動化する。

PAGE TOP