NECは2018年11月27日、紙面の文字情報を読み取るOCR(光学文字認識)にAIを活用したソフト「NEC AI-OCRサービス」を発表した。2019年3月から提供する。最大の特徴は、マシンラーニング(機械学習)によって、帳票書式(読み取り位置や項目)を事前に設定しなくても使えるようにしたこと。価格(税別)は個別見積だが、読取項目数20項目の帳票を年間24万枚処理した場合の参考価格は年額480万円となっている。
NEC AI-OCRサービスは、マシンラーニング(機械学習)を採用したOCRソフトである(図1)。帳票の書式(読み取り位置や項目)をリアルタイムに機械学習し、帳票内の文字データを自動で読み取る、としている。あらかじめ帳票の書式を設定しておく必要がないため、扱う帳票の種類が多くても手間をかけずに導入できる。
拡大画像表示
従来型のOCRは、読み取り専用の帳票書式を用いる必要があった。定義していない新しい帳票を読み込むためには、OCR特有の設定ツールを使って、その都度帳票を定義する必要があった。複数の帳票を定義するには、多くの時間と労力がかかっていた。
今回開発したサービスでは、人間が入力した文字の位置と項目を、機械学習を使ってリアルタイムに学習するようにした。これにより、事前に帳票書式を定義することなく、ただ人間が文字を入力することを繰り返すだけで、同一書式の帳票を自動で読み取れるようになる。また、個々の端末で学習した帳票書式データは、システム全体で共有できる。
NECが伝票処理業務に適用した効果検証では、人がすべてデータを入力した場合と比べて、帳票入力に要する作業時間を75%削減した。
なお、2019年3月の提供開始に先立ち、一定期間利用可能な試用環境を2018年12月下旬から提供する。NEC AI-OCRサービスのソフトをインストールした貸出用PCを最大1カ月間利用できる。ユーザーは、自部門での導入効果を事前に検証できる。