伊藤忠テクノソリューションズ(CTC)は2019年6月26日、手書き文字を含んだ紙帳票をテキスト化するクラウドサービス「DEEP READ」を発表した。ディープラーニング(深層学習)とOCR(光学文字認識)を組み合わせたAI-OCR技術を採用している。製造業を中心に金融や官公庁などに向けて提供する。販売目標は、関連するシステム販売を含めて3年間で5億円。開発会社はEduLab。
伊藤忠テクノソリューションズ(CTC)の「DEEP READ」は、ディープラーニングを用いて手書き文字をテキストデータ化するクラウドサービスである(画面1)。特徴は、複数の文字を一括して読み取り、文章の流れや前後の文字の関係などから類推して手書き文字を認識すること。これにより、9割以上の認識精度を達成したとしている。
拡大画像表示
使い方として、あらかじめ、文字を記入していない帳票をアップロードして、読み取る範囲を指定する。これにより、手書きで文字を記入した帳票のスキャンデータをテキストデータ化できる。情報漏洩を防ぐオプション機能として、スキャンした画像を分割して暗号化する機能も提供する。
CTCは、SIベンダーとして、AI-OCR分野でのシステム構築の実績がある。これを利用して、DEEP READの導入支援サービスや保守サービス、システム連携機能の構築サービスなどを提供する。特に、RPA(ロボットによる業務自動化)との組み合わせでは、紙文書のデータ化から業務システムへの入力までの一連の作業を自動化する。
製品投入の背景として同社は、製造業の多くにおいて、工場や作業場における作業日報や品質検査の報告書などを、定型フォームに手書きで記入した紙文書で管理している状況を挙げる。「また、注文書や請求書などについては、製造業に限らず多くの企業が膨大な紙文書の管理に課題を抱えている。通常、文書のデータ化は、従業員による手入力や外部委託によって行われており、多くの手間やコスト、入力ミスのリスクが発生する」(同社)