ウイングアーク1stは2019年12月23日、OCR(光学文字認識)機能を備えた文書管理ソフトの新版「SPA Ver.10.2.3」を発表した。同日提供を開始した。新版では、OCR時の目視による確認を減らすデータコンペア機能を実装した。価格(税別)は、パッケージ版が379万5000円から、クラウド版「SPA Cloud」が月額5万円(10ユーザー)から。
ウイングアーク1stの「SPA」は、OCR機能を備えた文書管理ソフトウェアである。紙の書類のデータ化を支援する。特徴は、種類が異なる複数のOCRエンジンを備えており、読み取る項目単位で切り替えられること。それぞれが得意とする領域を使い分けることで、全体の認識率を高めている(関連記事:ウイングアーク1st、4つのOCRエンジンを持つ文書管理ソフト、誤認識の修正画面も用意)。
4つのOCRエンジンは、自社開発の「WingArc Data Capture」、ABBYYジャパンの「ABBYY FineReader Engine」、EduLabの「DEEP READ」、Cogent Labsの「Tegaki」である。このうち、DEEP READとTegakiはディープラーニングを活用しており、手書き文字を認識できる。
OCRエンジンのうち、DEEP READは、年間30万画像まで標準で利用でき、年間30万画像を超える分は従量課金となる。また、Tegakiはこれまで従量課金だった。新版では、これまで従量課金の有料オプションとして提供してきたTegakiを標準機能とし、DEEP READと同様に年間30万画像まで標準で利用できるようにした。
新機能も搭載した。OCR時の目視による確認を不要とする新機能として、データコンペア機能を実装した(画面1)。同一の項目を異なる複数のOCRエンジンで読み取り、これらの読み取り結果がエンジン間で一致していたら正解とする仕組みである。
拡大画像表示
ユーザーは、複数のOCRエンジンを指定し、文書をプレビューしながらデータの確認・修正作業を行える。文書内の読み取った場所のイメージ画像とOCRで取り込んだデータを一覧で表示することも可能。これらにより、目視で行う確認・修正作業を効率化する。
製品提供の背景について同社は、手書き文字をデータ化するAI-OCRの精度は高いものの100%ではなく、目視による確認とデータの修正が必要になっていることを挙げる。