AI insideは2024年1月17日、AI-OCRクラウドサービス「DX Suite」のAI機能を強化したと発表した。各種フォーマットの文書を事前設定/学習不要で読み取り、項目を自動判定したうえで、Excelに自動で転記するようにした。処理速度を従来より60%向上させたほか、ユーザー専用のリソース拡張可能なクラウド環境を必要に応じて即時提供できるようにした。
AI insideの「DX Suite」は、AI-OCRクラウドサービスである。ディープラーニング(深層学習)による画像認識と文章の前後関係を判定する自然言語解析を組み合わせている。手書き文字認識のほか、読み取り時のズレや罫線などを含んだ画像を認識する。大量の帳票を同一フォーマットごとに仕分ける機能も備えている(関連記事:AI-OCR「DX Suite」が履歴書を読み取り可能に、人材データベース構築を支援)。
今回、AI機能を強化し、事前学習や読み取り箇所の指定を行わずに、非定型フォーマットの文書を読み取れるようになった。項目名の指定のみで、該当項目に合致する文字・数値をデータ化する。従来は大量の書類を学習させて専用のAIモデルを構築しなくてはならないうえ、抽出する項目の設定作業も必要だったが、これらの工程を不要にする(画面1)。
拡大画像表示
加えて、OCR処理後のデータ処理を自動化し、読み取った書類データをExcelファイルに転記する「ファイル転記」機能を追加した。データの項目を自動判定したうえでExcelに転記する(画面2)。
拡大画像表示
機能強化と共にアーキテクチャを刷新し、処理速度が従来比で60%向上したという。また、ユーザー専用のリソース拡張可能なクラウド環境を、必要に応じて即時提供できるようにしている。
同社は今後、ファイル転記のほかにも、読み取ったデータの要約や、文面からのクレーム有無の判定など、生成AIを活用した機能を順次追加する。また、取り扱えるデータとして、Office文書や音声ファイルにも対応する予定である(図1)。
拡大画像表示