[新製品・サービス]
PFU、給与支払報告書の読み取りに特化したAI-OCR「DynaEye給与支払報告書OCR」
2023年11月9日(木)日川 佳三(IT Leaders編集部)
PFUは2023年11月9日、OCR(光学文字認識)ソフトウェア「DynaEye」シリーズの新製品として、自治体の給与支払報告書の読み取りに特化した「DynaEye 給与支払報告書OCR V1.0」を発表した。GPUを搭載したPCで動作する。自治体および自治体の業務を請け負うBPO事業者に向けて同年12月中旬から販売する。価格(税別)は枚数単位の従量制で1枚20円。別途、1ユーザーあたり年額10万円のサポート料がかかる。
PFUの「DynaEye」シリーズは、PCで動作するOCRソフトウェアである。ライセンスは定額制で有効期限内は枚数制限なく利用できる。オンプレミスで動作することから個人情報などの漏洩を抑えられる(関連記事:PFU、OCR「DynaEye 11」に低価格版、年間6000枚制限で半額の50万4000円)。
今回、同シリーズの新製品として、企業が自治体に提出する給与支払報告書の読み取りに特化した「DynaEye 給与支払報告書OCR V1.0」をラインアップに追加した。自治体や、自治体の業務を請け負うBPO事業者に向けて販売する。GPUを搭載したPCで動作する。料金は枚数単位の従量制で1枚20円。別途、1ユーザーあたり年額10万円のサポート料がかかる。インストール可能なPC台数の制約はない。
拡大画像表示
新製品投入の背景として、電子申告を未導入の企業は給与支払報告書を紙帳票で自治体に提出しており、手動でのデータ化や誤入力・入力漏れの修正など、一連の作業に多大な手間がかかる問題を挙げている。「自治体の業務特性上、特定の時期に業務が集中し、データ化のための人員の確保が難しい」(同社)。
上記の問題を既存のDynaEyeシリーズでは解決できなかったとしている。既存製品は事前に指定した読み取り位置に対してOCRで読み取るが、給与支払報告書はフォーマットが統一されておらず、どの位置に何が記載されているのかが定まっていない。「自治体によって採用しているフォーマットが異なるほか、提出する事業者が独自のフォーマットを利用しているケースがある。また、印字サイズも小さく、活字と手書きが混在するなど、OCRで読み取りにくい要素が多い」(同社)という。
そこで、DynaEye 給与支払報告書OCRでは、BPO事業者の協力を得て、フォーマットの異なる各種の給与支払報告書をAIに学習させて開発し、同報告書の電子化に特化した製品として提供する。どのフォーマットに対しても事前の設定なく読み取れ、同報告書にある65種類の項目を認識するという(図1)。
前処理として紙の給与支払報告書をスキャナで画像化してからOCR処理を行い、CSVデータを出力して後続システムに連携させる仕組みを持つ。OCRはコマンドプロンプトから実行する(図2)。
なお、紙帳票には総括表、仕切紙(特別徴収、普通徴収)、個人別明細書の3種類があるが、これらをまとめて読み取ることで必要な書類(個人別明細書)のみをデータ化するので、事前の仕訳作業が不要である。
拡大画像表示
活字と手書き文字の両方を読み取り、同一項目内に複数の値が記載されている場合は、必要な情報のみを取得する。PFUの基準帳票を用いた項目認識率(65項目平均)は製品販売前の11月7日時点で98.10%を達成したという。1枚あたりの処理時間は、推奨スペックのGPU搭載PC(注1)で5秒以内を想定している。今後、同社が入手している帳票すべてで5秒以内の読み取りを目指すとしている。
注1:PC推奨スペックは、CPUがIntel Core i7 4.7GHz以上(第12世代以降)、GPUがNVIDIA GeForce RTX 3060以上、メインメモリーは32GB。