ハンモックは2021年5月10日、帳票や書類のデータ入力を代行するクラウドサービス「WOZE(ウォーゼ)」を発表した。同年7月から提供する。OCR(光学文字認識)とクラウドワーカーを併用して帳票をテキスト化し、CSV(カンマ区切り形式)ファイルに出力するサービスである。価格(税別)は、月間5000枚のプランが月額20万円(1枚あたり40円)で、5000枚を超過した分も1枚あたり40円。
ハンモックの「WOZE(ウォーゼ)」は、帳票や書類のデータ入力を代行するクラウドサービスである(図1)。OCR(光学文字認識)とクラウドワーカーを併用して帳票をテキスト化し、CSV(カンマ区切り形式)ファイルに出力する。サービス開始当初は、活字の帳票が対象。
拡大画像表示
ユーザーは、テキスト化したい帳票(PDFまたは画像)をWOZEにアップロードするだけで、テキストデータを記載したCSVファイルを得られる。データ化に必要な時間は「30分以内」(ハンモック)としている。データの信頼精度は99.97%をうたう。
クラウド上では、まず第1段階として、OCRで機械的にテキスト化する。特性が異なる2つのOCRエンジンを使って、読み取り結果が正しいかどうかをチェックする。確認が必要となったデータ(全体の15%)については、クラウドワーカーが人手で確認してデータ化する。
OCRを補完するクラウドワーカーが、国内に多数在籍している。クラウドワーカーを活用することにより、短時間でまとまった処理ができる。セキュリティも確保した。クラウドワーカーは、元の帳票をそのまま参照するのではなく、項目ごとに分離した確認用の画像を参照する。
WOZEを提供する背景として同社は、テレワークやペーパーレスが進む中でも、受注業務や請求業務など、各種の業務で帳票や書類が発生している実態を挙げる。帳票の画像をアップロードするだけでデータをテキスト化するサービスの需要があるという。