NTTコミュニケーションズは2020年4月23日、長い文章から自然な要約文を自動生成する機能を提供するAPI「COTOHA Summarize」を提供開始した。アプリケーションに組み込んで利用できる。同APIを組み込んだツール(アプリケーションプログラム)も順次提供する。COTOHA Summarizeを含む「COTOHA API」の価格(税別)は月額13万円。同料金の範囲で、原文約520万字まで要約できる。
COTOHA Summarizeは、長い文章から自然な要約文を自動生成するAPIサービスである。同APIをアプリケーションに組み込むことによって、文章を要約する機能をアプリケーション内で容易に実現できる。指定した文字数に近い長さの要約文を作成できる。日本語だけでなく、英語の要約もできる。
特徴は、元の文章から重要な文章を抽出するだけの使い方に加えて、抽出した結果をもとに自然な要約文を自動で生成する使い方ができることである。要約精度については、人間が作成した要約とシステムが作成した要約との一致度を測る指標である「Rouge」のスコアが高いとアピールしている。
同APIを組み込んだツールも順次提供する。最初に提供するツールの1つは、閲覧しているWebサイトの内容を要約するツールである(図1)。Webブラウザの機能を拡張するプラグインとして提供する。市場調査やマーケティングにおいて、効率的に情報を収集できるようになる。
拡大画像表示
もう1つのツールは、ビジネス文書などを入力すると、要約した文書を出力するWebアプリケーションである。社内向けのWebサイトに組み込むことで、社内文書を要約できる。まずはテキストデータを入力できるようにした。今後、Office文書ファイルを要約できるようにする。
今後提供を予定しているツールの1つが、RPAと連携して情報を自動収集して要約するツールである。RPAソフトと自動で連携し、閲覧したサイトの要約文を自動で生成する。
今後提供を予定しているもう1つのツールが、講演・演説などの音声データから自動で要約文を作成するツールである。音声認識APIと組み合わせることによって、講演や演説などを文書として要約できる。文字起こしの稼働を削減でき、確認作業だけで講演や演説の要約を作成できる。