トッパン・フォームズは2018年1月11日、手書き帳票をOCR(光学文字認識)で読み取るサービス「手書き帳票AI-OCR変換サービス」を発表した。2018年4月に提供開始する。手書き文字を認識するためのAIエンジンとして、Cogent Labsの「Tegaki」を使う。販売目標は、2018年度に1億円、2020年度に3億円。
手書き帳票AI-OCR変換サービスは、手書き文字の入力業務を効率化するサービスである。OCRの精度を高めるための前工程や後工程の処理をパッケージ化し、これをクラウドサービスやアウトソーシングサービスの形で提供する。
手書き文字をOCR処理できるように、トッパン・フォームズの帳票設計ノウハウや、BPOで得た機微情報の入力業務のノウハウ、AI技術を組み合わせた。
前処理では、対象の手書き帳票を受付後、帳票の種類ごとに識別し、仕分けを行う。その後、傾斜補正や縮尺補正、罫線除去などの画像補正を行い、AIエンジンが読み取りやすい画像へと加工する。
AIエンジンのTegakiは、前処理で仕分け・加工をした画像データをテキストデータ化する。
後処理では、変換データを修正・出力する。ユーザーは、変換結果と元の帳票イメージを見比べながら、データの相違点を補正入力できる。
サービスの提供方法は、大きく3つある。(1)「クラウドモデル」は、前処理、OCR処理、後処理のすべてをクラウドサービスで提供する。(2)「オンプレミス+クラウドモデル」は、前処理と後処理をオンプレミスで実施し、OCR処理をクラウドサービスで提供する。(3)「BPOモデル」は、トッパン・フォームズのBPOセンターで一括で受託する。