アプリケーション アプリケーション記事一覧へ

[新製品・サービス]

Cogent Labs、AI-OCR「SmartRead」を発表、文字認識に加えて文書の仕分けが可能に

紙文書からデータを抽出する処理の全体をカバー

2021年10月27日(水)日川 佳三(IT Leaders編集部)

Cogent Labsは2021年10月26日、AI-OCRサービス「SmartRead」を発表した。同年12月から提供する。既存のAI-OCRサービス「Tegaki」の機能上位版にあたり、手書き文字と活字の読み取りに加えて、文書を分類して仕分ける機能を追加している。紙文書からデータを抽出する処理の全体をカバーする。クラウドサービスとして提供を開始し、今後、オンプレミス版の提供も予定している。

 Cogent Labsの「SmartRead」は、クラウド型AI-OCR(光学文字認識)サービスである。同社の既存AI-OCRサービス「Tegaki」の機能上位版として提供する(関連記事Cogent Labs、AI-OCR「Tegaki」に年額36万円の低価格プラン、月1500枚利用可能)。

 AI-OCRの中核機能である文字画像のテキストデータ化に加えて、文書を分類して仕分ける機能などを備えている。文書画像のアップロード、傾き補正などの前処理、分類と仕分け、データの抽出、確認と修正、出力まで、紙文書からデータを抽出する処理の全体をカバーする(図1)。

図1:SmartReadの概要。文字データを抽出するAI-OCRの基本機能に加えて、文書を分類して仕分ける機能を備えている。紙文書からデータを抽出するプロセス全体をカバーする(出典:Cogent Labs)図1:SmartReadの概要。文字データを抽出するAI-OCRの基本機能に加えて、文書を分類して仕分ける機能を備えている。紙文書からデータを抽出するプロセス全体をカバーする(出典:Cogent Labs)
拡大画像表示

 AI-OCR部分は、Tegakiと同様に、手書き文字と活字をテキストデータ化する。ディープラーニング(深層学習)で作成したAIアルゴリズムを活用することで、手書き・活字を問わず、ひらがな、カタカナ、漢字、数字、アルファベット、記号、印刷でかすれた文字など、さまざまな種類・状態の文字を認識する。

 各種の申込書など帳票フォーマットがあらかじめ固定されている定型文書を読み取れるだけでなく、レポートや契約書などのフォーマットが固定されていない非定型文書にも対応。テンプレート(読取定義)を作成することなく、AIが文書内の文字を自動で検出して読み取る。

 AI-OCRの基本機能に加えて、文書を分類して仕分ける機能を追加している。事前に登録したテンプレートを元に文書の種類を分類できる。あらかじめ文書を仕分けておくことによって、後続のプロセスであるAI-OCRで文書画像からデータを抽出しやすくなる。

 SmartReadのユーザーインタフェースから文書処理の一連の作業を進められる。テンプレート作成、文書仕分け結果の確認、タスク結果一覧画面での処理状況の把握などが行える。

 今後の機能強化では、文書のレイアウトは異なるが抽出したい項目が同じである準定型文書への対応を強化する。その後、抽出したい項目を簡単に指定できる機能や、文書処理を自動化する機能などを順次提供する。クラウド版に加えてオンプレミス版も提供する予定である。

関連キーワード

Cogent Labs / AI-OCR / SmartRead

関連記事

Special

-PR-

Cogent Labs、AI-OCR「SmartRead」を発表、文字認識に加えて文書の仕分けが可能にCogent Labsは2021年10月26日、AI-OCRサービス「SmartRead」を発表した。同年12月から提供する。既存のAI-OCRサービス「Tegaki」の機能上位版にあたり、手書き文字と活字の読み取りに加えて、文書を分類して仕分ける機能を追加している。紙文書からデータを抽出する処理の全体をカバーする。クラウドサービスとして提供を開始し、今後、オンプレミス版の提供も予定している。

PAGE TOP