[新製品・サービス]
アドバンスト・メディア、Web API型の音声認識エンジン「AmiVoice Cloud Platform」を公開
2019年12月3日(火)日川 佳三(IT Leaders編集部)
アドバンスト・メディアは2019年12月3日、音声認識エンジンをWeb APIの形で提供する開発基盤サービス「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」を公開した。リアルタイム版のAPIとバッチ版のAPIを用意した。価格(税別)は、毎月60分まで無料、以降は1秒あたり0.025円、音声データのログを残さないプランは1秒0.04円。
AmiVoice Cloud Platformは、Web APIの形で利用できる音声認識エンジンである(図1)。Web APIを呼び出すだけで利用できるため、アプリケーションに音声認識機能を簡単に組み込める。音声の文字化、音声対話、音声制御、音声翻訳など、音声を扱う各種の用途で利用できる。
拡大画像表示
アドバンスト・メディアはこれまで、アプリケーションに組み込むソフトウェアライブラリの形態で、音声認識エンジン「AmiVoice」を提供してきた。今回、同等の音声認識エンジンをより簡便に使えるように、Web API化し、汎用エンジンを公開した。今後は、領域特化型の音声認識APIの公開を予定している。
用途に合わせて、リアルタイム認識API(WebSocketベースのAPI)と、バッチ認識API(HTTPベースのREST API)を用意した。リアルタイム認識APIは、HTML5でマイク音声を取得できるWebブラウザなどを使い、都度リアルタイムに音声データを文字化する用途に適する。一方、バッチ認識APIは、音声をまとめて一括処理して文字化する用途に適する。リアルタイム認識APIとバッチ認識APIともに、APIを利用するサンプルプログラムを公開している。
シーンや運用に合わせて、音声データのログ保存の有無を選択できる。セキュリティポリシーや社内規定に準じながら、音声認識機能をアプリケーションに組み込める。要望に応じて、プライベートクラウドやオンプレミスにAPIサーバーを設置する使い方もできる。個別カスタマイズも請け負う。
価格(税別)は、初月は無料で使い放題となる(20日以降の申込は、翌月まで無料)。次月移行は、毎月60分まで無料で利用できる。60分を超えた部分については、従量課金制となる。発話区間に対する秒あたりの単価で計算し、無音やノイズ区間など、人の声が無い区間は料金がかからない。価格は、音声データのログを残すプランが1秒あたり0.025円、音声データのログを残さないプランが1秒あたり0.04円。
特徴の1つは、ビジネス利用に向いたフィルタリング機能を備えること。ビジネスで使うことがない不適切な用語や有害な用語を省いた、ビジネスユースに強い言語モデルを使っているとしている。不要語を省くことによって誤認識が減っているという。また、製品名や固有名詞など、単語をカスタマイズ登録できるようにしている。