ウイングアーク1stは2020年12月21日、OCR(光学文字認識)機能を備えた文書管理ソフトウェア「SPA」をクラウド型で提供するサービス「SPA Cloud」をバージョンアップした。新版では、AI機能を強化し、手書き文字の読み取りだけでなく、レイアウトが定まっていない非定型帳票を読み取れるようにした。今後、パッケージ版のSPAにも同機能を追加する予定である。価格(税別)は、月額5万円(10ユーザー)から。
SPAは、OCR(光学文字認識)機能を備えた文書管理ソフトウェアである(関連記事:ウイングアーク1st、OCR付き文書管理ソフト「SPA」新版、AI-OCRのログを出力可能に)。特徴は、認識率を高める方策として、4種類のOCRエンジンを切り替えて利用できることである。それぞれが得意とする領域に応じて、読み取る項目の単位でOCRエンジンを切り替えられる。これにより例えば、ディープラーニング(深層学習)を活用して手書き文字を認識できる。
今回のバージョンアップでは、文字認識に使うAI機能を高めた。これまでのバージョンでは、AIを使うことによって、活字だけでなく手書き文字を認識できるようにしていた。今回の新版では、手書き文字を認識できるだけでなく、レイアウトが定まっていない非定型フォーマットの帳票についても項目と値を認識して情報を読み取れるようにした。
SPA Cloudが備えていた従来のAI OCR機能では、文書を読み取る際には、読み取り対象となる領域を座標で指定する必要があった。同じ項目を持つ帳票であっても、取引先ごとにレイアウトが異なっている場合、それぞれ別個にOCRの定義を作成する必要があった。
今回の強化では、非定型フォーマットの帳票を読み取る機能として、指定したテキストを記載したセルに隣接するセル内のテキストを読み取れるようにした。