東芝デジタルソリューションズは2021年1月21日、クラウド型のOCR(光学文字認識)サービスの新版「AI OCR文字認識サービス V2.5」の提供を開始した。アプリケーションにAPIを組み込んで利用する。新版では、文字を認識できるだけでなく帳票を識別できるようにした。また、文字を認識する精度を高めた。
AI OCR文字認識サービスは、クラウド型で使えるOCR(光学文字認識)サービスである。OCR機能をWeb APIの形で提供する。アプリケーションにAPIを組み込むことによって、アプリケーションの中でOCR機能を利用できるようになる。
新版では、文字認識用のAPIのほかに、帳票識別用のAPIを新たに用意した。APIを介して、帳票の種類(申請書や届出書など)を識別できる。従来は、別途専用のWeb画面で帳票識別設定を行った上で文字認識機能を利用する必要があった。これを改め、アプリケーションからAPI経由で帳票を識別できるようにした(図1)。
図1:帳票識別APIの概要。(A)イメージファイルと識別情報(識別したい画像中の座標、用語)を送信すると、識別結果が返る。(B)イメージファイルと帳票識別番号を送信すると、合致する識別番号が返る(出典:東芝デジタルソリューションズ)拡大画像表示
新版ではまた、ディープラーニング(深層学習)の適用範囲を広げた。文字の認識だけでなく、画像の処理(罫線の除去、取り消し線の判別、訂正印の判別)にも利用する(図2)。取り消し線や訂正印を読み飛ばせるようになったほか、イメージスキャン時に画像が劣化しても、ある程度は読み取れるようになった。
図2:ディープラーニングの適用範囲を拡大し、読み取り精度を高めた(出典:東芝デジタルソリューションズ)拡大画像表示
誤読を抑制する技術も適用した。申込書や申請用紙などで広く見られる「1枠1文字」の書式に対する認識精度を高めた。認識過程で誤読の可能性がある個所は「?」で結果を返す(図3)。「?」以外の部分の文字認識精度は99.7%としている。実運用においては、認識結果の「?」部分だけを確認・訂正するだけで済む。
図3:誤読抑制OCR技術の仕組み(出典:東芝デジタルソリューションズ)拡大画像表示
価格(税別)は、 クラウドサービスの場合、1カ月1万枚または10万項目のいずれかに達するまでの読み取りで月額30万円。初期構築費用は90万円。オンプレミス版は都度見積もり。
東芝デジタルソリューションズ / OCR / API
- 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



