Cogent Labsは2022年12月22日、AI-OCRサービス「SmartRead」の機能をアップデートしたと発表した。読み取り結果の確認・修正にかかる時間を短縮する「スマートベリファイ」機能が加わった。確信度が高いとAIが判断した読み取り結果を一括で確認済みにできる機能である。同社の検証では、手入力と比べて約90%、スマートベリファイなしと比べて約50%のデータ化作業時間を短縮した。
Cogent Labsの「SmartRead」は、AI-OCR(光学文字認識)サービスである。AI-OCRの中核機能である文字画像のテキストデータ化に加え、文書を分類して仕分ける機能などを備える(関連記事:Cogent Labs、AI-OCR「SmartRead」で給与支払報告書を読み取り可能に)。
文書画像のアップロード、傾き補正などの前処理、分類と仕分け、データの抽出、確認と修正、出力まで、紙文書からデータを抽出するプロセス全体を自動化する。「AI-OCRにおいて文字認識精度を100%とすることは現実的に不可能である。目視ですべてのOCR結果を確認する必要があり、この確認修正の工程をいかに効率化できるかが、文書データ化における業務効率を向上させる上でのカギである」(同社)
今回の機能アップデートで、読み取り結果の確認・修正にかかる時間を短縮する「スマートベリファイ」が備わった。確信度が高いとAIが判断した読み取り結果を一括で確認済みとして処理する機能である。ユーザーは、確信度が低い読み取り結果のみを確認・修正すればよくなる。同社の検証によれば、手入力と比べて約90%、スマートベリファイなしと比べて約50%、データ化作業時間を短縮したという。
加えて、「読み取り項目ごとの確認」と「文書レイアウト上での確認」のいずれかを選択できるようにした。読み取り項目ごとの確認では、文書内の読み取り項目と読み取り結果を、画面右側にリストで表示する。アクティブ(入力可能状態)なフィールドを常にリストの最上部に表示する。読み取り結果に問題がなければ、Enterキーで確認済みになり、次のフィールドがアクティブになる(画面1)。
拡大画像表示
一方、文書レイアウト上での確認は、文書レイアウト上に読み取り結果を重ねて表示する。各読み取り項目を個別に確認することなく、文書全体をすばやく確認したい場合や、数値表など多くの情報を含む密度の高い文書の確認に適する。読み取り結果を、レイアウト内の文字のすぐ上に表示する(画面2)。
拡大画像表示
また、文書レイアウト上の読み取り位置にマウスを移動させると読み取り結果をツールチップの形で表示させることもできる。読み取り項目が小さいケースや、互いに近接しているケースなどに適する。読み取り結果の修正が必要な場合は、読み取り箇所をクリックすると入力フィールドを自動的に表示する(画面3)。
拡大画像表示