ウイングアーク1stは2019年2月28日、OCR(光学文字認識)機能を備えた文書管理ソフトの新版「SPA Ver.10.1」を発表、同日提供を開始した。新たに4番目のOCRエンジンとして「DEEP READ」(EduLab製)を追加し、標準機能として提供する。誤認識を修正しやすくする画面も新規に用意した。価格(税別)は、パッケージ版が379万5000円から、SaaS版「SPA Cloud」が月額5万円(10ユーザー)から。
SPAは、OCR機能を備えた文書管理ソフトである。書類のデータ化、業務の自動化、データの活用、などを支援する。紙の書類をデータ化することによって、検索できるようになるほか、ETLやRPAとの連携も可能になる。種類が異なる複数のOCRエンジンを搭載しており、読み取る項目単位で切り替えられる。それぞれが得意とする領域を使い分けることで、全体の認識率が高まる。
新版では、これまで提供してきた3種類のOCRエンジンに加えて、新たに第4のOCRエンジンとして「DEEP READ」(EduLab製)を用意した。ディープラーニングを用いたOCRエンジンであり、手書き文字をテキスト化できる。金融、教育、官公庁など各種業界の3万件以上のデータを学習しているという。クラウドサービスとして利用できるが、オンプレミスでも提供できる。
DEEP READは、年間30万画像までは標準で利用でき、これを超えた分は従量課金となる。この他のOCRエンジンは3つある、標準で、自社開発の「WingArc Data Capture」と、ABBYYジャパンの「ABBYY FineReader Engine」の2つを利用できる。有料オプション(従量課金)で、Cogent Labsの「Tegaki」を利用できる。
SPAの新版ではまた、OCRの読み取り時の精度が100%ではないことを踏まえた機能として、誤認識したデータに対して、画面上のイメージを見ながら、認識した値を修正できる機能を用意した(画面1)。修正しやすいように、誤認識が多い箇所をハイライトし、正確度に合わせて色をつけて表示できる。
拡大画像表示
新版ではさらに、各種申込書類やアンケートに手書きで記入した「丸囲い」をデータ化する機能を追加した。アンケートの集計が容易になった。