キヤノンマーケティングジャパンは2010年11月17日、EMCジャパンとECM分野における協業を発表。EMCのキャプチャソフト「Captiva InputAccel」に、キヤノンのOCRエンジンを組み込んで提供する。企業における紙文書のデータ化を後押しし、紙の輸送コスト削減や業務効率化を支援する。
「Rosetta-Stone-Components」と呼ぶOCRエンジンを組み込み、紙文書をデータにするまでの作業を効率化する。
「日本語のOCR機能を備えるほか、スキャンした画像を補正したり帳票を識別/分類したりする機能も備える。画像内の文字とテキストが正しいかどうかは、最終的にはオペレーターによる確認作業を要するが、エンジンを搭載したことで画像とテキストの整合性をチェックしやすくなり、大量の紙文書を高速かつ確実にデータ化できる」(キヤノンマーケティングジャパン BSマーケティング統括本部 ドキュメントソリューション企画部 ECM企画課 橋本博幸氏)。なお、OCRによる文字の認識率は「英数文字なら7~8割程度。日本語はそれより若干低くなる」(橋本氏)という。
書類別、業務別に紙文書を適切なファイル形式に変換して保存することも可能。「契約部門が申込書をスキャンするのか、経理部門が経理関連の帳票をスキャンするのかにより、異なる処理プロセスを実施できる。顧客ごとのプロセスを設定して納品するが、テンプレートを活用して顧客がGUI画面からプロセスを変更することもできる」(橋本氏)。
ソフトウェアのほか、サーバーやストレージも含めて文書キャプチャソリューションとして提供する。価格は構築費用も含めて約1000万円から(1日に約2500枚の紙文書をデータ化する場合)。2011年4月より提供を開始する。