エヌジェーケー(現NTTデータNJK)は2017年7月18日、ユーザーが開発するアプリケーションにおいてOCR(光学文字認識)機能を使えるようにするソフトウェア開発用ライブラリの新バージョン「活字文書OCRライブラリ v.9.5」を発表、同日販売を開始した。Windows環境で利用できる。新版では、アジア圏の認識言語を増やしたほか、外国語の認識機能を高めた。
活字文書OCRライブラリは、非定型の活字文書の画像に対して文字認識を行い、認識した文字コードを出力するDLL(ダイナミックリンクライブラリ)である。ユーザーが開発したアプリケーションや業務システムなどから利用できる。認識した結果は、テキストのほか、Office文書や透明テキスト付きPDFなど各種フォーマットで出力できる。
新版では、認識可能な言語として、アジア言語(タイ語、ベトナム語、マレー語、インドネシア語)を追加した。言語オプションを追加することで利用できる。アジア諸国へ進出する企業や、現地企業とのつながりがあってアジア言語の文書を多く取り扱う企業などに向く。
さらに、基本機能として以前から認識できていた英語、中国語(簡体字および繁体字)、韓国語についても、認識の精度を高めた。例えば、中国語と英語が混在する文書や、韓国語と英語が混在する文書を認識できるようになった。
追加言語オプションとして、タイ語、ベトナム語、マレー語、インドネシア語、欧米語の5つのオプションを利用できる。欧米語オプションでは、ドイツ語、フランス語、スペイン語、イタリア語、オランダ語、スウェーデン語、ノルウェー語、フィンランド語、デンマーク語、ポルトガル語、ロシア語の11言語を認識できる。
稼働環境は、通常版がWindows 7/8.1/10。サーバーOS対応版が、Windows 7/8.1/10およびWindows Server 2008/2012/2016。アプリケーションの開発環境は、Visual C++ VC 9.0/10.0/11.0/12.0またはC#(.NET Framework 4.5.2)。
価格(税別)は以下の通り。通常版は50万円で年間保守サービスが10万円。サーバーOS対応版は75万円で年間保守サービスが15万円。言語オプションは、アジア言語(タイ語、ベトナム語、マレー語、インドネシア語)がそれぞれ20万円で、年間保守サービスが4万円。欧米語の言語オプションの価格は要問い合わせ。