東芝デジタルソリューションズは2019年1月31日、読み取り位置を事前に設定しなくても、受発注伝票や見積書など様々な書式・レイアウトの非定型文書から、必要な項目を探し出して読み取る文字認識サービスの販売を開始した。文字認識とRPA(ロボットによる業務自動化)の連携で働き方改革を支援する。
今回商品化した文字認識サービスは、専用のスキャナは不要で、オフィスの複合機などで作成した紙文書のイメージデータから、簡単な操作で必要な文字を認識するサービスである(図1)。読み取り位置の詳細定義は不要で、キーワード(読み取りたい項目)を登録することによって、該当する項目を探して活字を読み取る仕組み。様々な書式の非定型文書で利用できる。
図1:項目サーチ機能(非定型文書から該当項目を探し出して活字を読み取り)の概要(出典:東芝デジタルソリューションズ)
拡大画像表示
拡大画像表示
特に、請求書については、合計金額や請求番号などの主なキーワードを事前登録(プリセット)してあるので、すぐに利用できる。合計金額、総合計、御合計などの言葉の「ゆらぎ」にも対応している。定型文書にも対応しており、読み取り位置をマウス操作で簡単に設定でき、活字だけでなく手書きも読み取れる。
複数の文書をまとめて処理する一括読み取りや、読取後のチェック・訂正の利便性も強化している。利用形態は、クラウドサービス、オンプレミス(今後提供予定)、APIを選択可能だ。