AI insideは2024年8月26日、AI-OCRクラウドサービス「DX Suite」に、修正内容を自社環境内で学習して読取精度を高める新機能「Few-shot学習」を追加したと発表した。大量データの学習とは異なり、1枚の帳票の読取結果を参照して学習するため、独自の帳票などの学習データが少ないケースでも精度を高められるとしている。
AI insideの「DX Suite」は、AI-OCRクラウドサービスである。ディープラーニング(深層学習)による画像認識と、文章の前後関係を判定する自然言語解析を併用している。手書き文字のほか、読み取り時のズレや罫線などを含んだ画像を認識する。大量の帳票を同一フォーマットごとに仕分ける機能も備えている(関連記事:AI-OCR「DX Suite」、非定型帳票の項目を設定/学習レスで自動判定する機能)。
発行元によってレイアウトが異なる非定型帳票でも項目を抽出可能である。1000種類以上の非定型帳票のプリセットを用意しているほか、プリセットに含まれない独自フォーマットの帳票に対しても、読み取りたい情報のキーワードや項目を登録することで対応する。
今回、項目の読取精度を高める新機能「Few-shot(フューショット)学習」を追加した。過去にチェック済みの「読取結果の正解」データを参考にして、読取精度を高める。従来のような大量データの学習とは異なり、1枚の帳票の読取結果を参照して学習する仕組みで、独自帳票などの学習データが少ないケースでも精度を高められるとしている。
設定でFew-shot学習をオンにするとただちに利用を始められる。各社の環境内で完結する仕組みのため、学習時にデータが外部企業に漏れることがない(画面1)。

拡大画像表示