NTTコミュニケーションズ(NTT Com)は2018年9月5日、NTTグループの自然言語解析技術の研究成果を利用できるAPIサービス「Communication Engine “COTOHA API”」を発表、同日提供を開始した。
NTT Comは2016年10月から、日本語による対話が可能なAIエンジン「Communication Engine “COTOHA Virtual Assistant”」を提供している。NTTグループが蓄積・精錬した日本語辞書とAI関連技術「corevo(コレボ)」と、NTT Comが独自開発した自然言語解析技術を使っている。
拡大画像表示
今回、COTOHA Virtual Assistantに実装している自然言語解析技術を、さまざまなサービスに組み込めるように、「Communication Engine “COTOHA API”」としてAPIサービス化した。サービス開始時には7個のAPIを提供する。今後も、「言いよどみ除去」「誤り箇所検知」「誤り箇所訂正」など、順次新しいAPIをリリースする。
API | 概要 |
---|---|
構文解析 | 日本語テキストの構造と意味を解析 |
固有表現抽出 | 人名や地名などの固有表現を抽出 |
照応解析(β版) | 「あれ」「これ」「それ」「そこ」などの指示語・省略語を検知し、指し示す対象を特定 |
キーワード抽出 | 文章からキーワードを抽出 |
類似度算出 | 2つの文章の類似性を数値化し出力 |
文タイプ判定 | 挨拶や同意、約束などの発話行為のタイプ判定および叙述文、命令文、質問文などの文タイプを出力 |
ユーザー属性推定(β版) | 文章からユーザーの年代、職業などの属性を推定 |
認識精度を高めるため、個別辞書の設定やAPIパラメーターの設定ができる。辞書は、すべてのユーザーに共通の辞書だけでなく、ユーザー専用の個別辞書を設け、ユーザー自身で編集できる。また、解析の目的に応じて、参照する辞書の選択や出力するキーワード数など、APIのパラメーターをカスタマイズできる。
COTOHA APIの特徴としてNTT Comは、日本語辞書の規模の大きさをアピールする。基本語辞書と専門用語辞書を合わせて210万語を超える用語を収録している。専門用語辞書はCOTOHA APIにあわせて新たに追加したもので、企業や団体の固有名詞、経済や法令に関する用語、製造業や情報通信業などさまざまな業界の用語を収めたとしている。
さらに、単語の意味を正確に捉えた上で、文脈に応じて変化する言葉の意味も理解できるとしている。要素技術として、日本語構文解析技術と、単語を3000種の意味属性に分類できる日本語語彙大系を用いている。
メニューとして、検証用として無料で利用できる「for Developers」と、商用の「for Enterprise」を用意した。for Enterpriseの価格(税別)は、初期費用が無料で、利用料はAPIコール数に応じた従量課金で月額13万円から。