アドバンスト・メディア、Web API型の音声認識エンジン「AmiVoice Cloud Platform」を公開

2019年12月3日(火)日川佳三（IT Leaders編集部）

リスト

アドバンスト・メディアは2019年12月3日、音声認識エンジンをWeb APIの形で提供する開発基盤サービス「AmiVoice Cloud Platform（アミボイスクラウドプラットフォーム）」を公開した。リアルタイム版のAPIとバッチ版のAPIを用意した。価格（税別）は、毎月60分まで無料、以降は1秒あたり0.025円、音声データのログを残さないプランは1秒0.04円。

　AmiVoice Cloud Platformは、Web APIの形で利用できる音声認識エンジンである（図1）。Web APIを呼び出すだけで利用できるため、アプリケーションに音声認識機能を簡単に組み込める。音声の文字化、音声対話、音声制御、音声翻訳など、音声を扱う各種の用途で利用できる。

図1：AmiVoice Cloud Platformの概要（出典：アドバンスト・メディア）
拡大画像表示

　アドバンスト・メディアはこれまで、アプリケーションに組み込むソフトウェアライブラリの形態で、音声認識エンジン「AmiVoice」を提供してきた。今回、同等の音声認識エンジンをより簡便に使えるように、Web API化し、汎用エンジンを公開した。今後は、領域特化型の音声認識APIの公開を予定している。

　用途に合わせて、リアルタイム認識API（WebSocketベースのAPI）と、バッチ認識API（HTTPベースのREST API）を用意した。リアルタイム認識APIは、HTML5でマイク音声を取得できるWebブラウザなどを使い、都度リアルタイムに音声データを文字化する用途に適する。一方、バッチ認識APIは、音声をまとめて一括処理して文字化する用途に適する。リアルタイム認識APIとバッチ認識APIともに、APIを利用するサンプルプログラムを公開している。

　シーンや運用に合わせて、音声データのログ保存の有無を選択できる。セキュリティポリシーや社内規定に準じながら、音声認識機能をアプリケーションに組み込める。要望に応じて、プライベートクラウドやオンプレミスにAPIサーバーを設置する使い方もできる。個別カスタマイズも請け負う。

　価格（税別）は、初月は無料で使い放題となる（20日以降の申込は、翌月まで無料）。次月移行は、毎月60分まで無料で利用できる。60分を超えた部分については、従量課金制となる。発話区間に対する秒あたりの単価で計算し、無音やノイズ区間など、人の声が無い区間は料金がかからない。価格は、音声データのログを残すプランが1秒あたり0.025円、音声データのログを残さないプランが1秒あたり0.04円。

　特徴の1つは、ビジネス利用に向いたフィルタリング機能を備えること。ビジネスで使うことがない不適切な用語や有害な用語を省いた、ビジネスユースに強い言語モデルを使っているとしている。不要語を省くことによって誤認識が減っているという。また、製品名や固有名詞など、単語をカスタマイズ登録できるようにしている。

リスト

トピックス

[Sponsored]

アドバンスト・メディア、Web API型の音声認識エンジン「AmiVoice Cloud Platform」を公開

おすすめのホワイトペーパー

トピックス