PFUは2024年6月4日、OCRソフトウェア「DynaEye 11 Entry AI-OCR」において、非定型帳票の認識精度を向上させたと発表した。フォーマットが決まっていない請求書などの非定型帳票に対してもAI-OCRエンジンを利用するようにした。新版ではなく機能強化にあたり、無料で機能をアップデート可能である。価格(税別)は初期費用が201万6000円、次年度以降の継続ライセンスが年額33万6000円。
PFUの「DynaEye 11 Entry AI-OCR」は、Windows 10/11で動作するOCR(光学文字認識)ソフトウェアである。ライセンスは定額制で、有効期限内は枚数の制限なく利用可能である。クラウドではなくオンプレミス/スタンドアロンのPC環境で動作することから、個人情報などの機微情報の漏洩を抑える(関連記事:PFU、OCR「DynaEye 11」に低価格版、年間6000枚制限で半額の50万4000円)。
申込書などのレイアウトが同じ定型帳票用の「標準アプリケーション」と、取引先や案件ごとにレイアウトが異なる非定型帳票用の「エントリーアプリケーション」の、2つの独立したアプリケーションを用意している。1つのライセンスで、どちらも利用可能である。定型帳票は読み取り位置をあらかじめ定義して読み取る。非定型帳票は項目名を定義するだけで、読み取り位置を指定することなく自動で読み取ってくれる(図1)。
拡大画像表示
今回の機能強化では、標準アプリケーションだけでなく、エントリーアプリケーションにもAI-OCRエンジンを適用し、認識率が向上している。また、OCR結果の確認時間を短縮する「ベリファイOCR」機能(従来型OCRとAI-OCRの2つのOCRエンジンによる認識結果を突合し、異なる結果になった項目をピックアップして確認を促す機能)も非定型帳票で使えるようになった(図2)。
拡大画像表示
なお、エントリーアプリケーションでは、読み取りたい帳票ごとの項目名の定義が必要である。PFUは項目定義のテンプレート3種類(請求書用、注文書用、納品書用)を用意しており、これらの帳票の項目名をユーザーが定義しなくても使い始められる。「項目名定義の情報量は多く、テンプレートを一から作成しようとすると5日くらいかかる」(PFU)という(図3)。
拡大画像表示
帳票によっては、項目名と値の組み合わせを間違えて読み取ってしまうこともある。その場合は、間違えた項目の読み取り位置をユーザーが指定して学習させる「レイアウト学習」機能を用いることで、次回以降、類似の帳票(同じ会社から届いた同じフォーマットの帳票)については読み取り位置ベースで、正しい項目名と値を読み取れるようになる。スタンドアロン環境で動作することから、学習内容を即座に反映し、自社に特化した学習データとして利用可能である(図4)。
拡大画像表示
価格(税別)は、初期費用が201万6000円、次年度以降の継続ライセンスが年額33万6000円。年間の上限枚数を6000枚(月500枚相当)で半額の「Lite版ライセンス」は、初期費用が100万8000円、次年度以降の継続ライセンスが年額16万8000円。